人工智能 - 超腾开源博客 - 第7页 | 了解网站最新动态,分享最新技术

本文全面解析深度学习里程碑模型ResNet的核心原理与应用。详细阐述ResNet如何通过残差学习和捷径连接解决深度网络的梯度消失和网络退化问题,分析基本残差块与瓶颈块的结构差异,介绍ResNet-18到ResNet-152等经典架构设计特点。内容涵盖ResNet的历史突破意义、训练优势以及在实际项目中的实施要点,为开发者提供从理论到实践的完整技术指导。
1054
0
创建于2024年6月21日
生成对抗网络(GAN)是一种由生成器和判别器构成的深度学习模型,通过零和博弈机制相互对抗训练。生成器试图制造逼真假数据,判别器则努力区分真假,两者在对抗中共同提升。训练过程交替优化:先固定生成器训练判别器区分真假,再固定判别器训练生成器以欺骗对方,最终生成器可输出与真实数据几乎无差异的结果。GAN优势在于生成质量高、无需显式建模、灵活性强,但面临训练不稳定、模式崩溃和评估困难等挑战。广泛应用于图像生成、风格迁移、超分辨率、数据增强等领域,代表变体包括DCGAN、WGAN、CycleGAN和StyleGAN。
463
0
创建于2024年6月21日
本文提供了一套用于测试大模型能力的实用技巧与题库。测试技巧部分介绍了从跨语言理解、上下文连贯性、逻辑推理、代码生成、多模态输入、创造力、情感识别、陷阱辨识到专业知识的六个维度八种评估方法。题库包含多组测试题:如九个涉及语言理解与常识的考题、十九个易错的逻辑推理与概念关联题、三道数学题(弹跳距离、水果换算、三棱柱表面积),以及三十道涵盖笑话理解到高级逻辑的推理题。这些内容旨在全面评估大模型在自然语言处理、逻辑推理和知识应用上的表现。
1781
0
创建于2024年6月21日
本文提供了一套用于测试AI大模型能力的考题,涵盖语言理解、逻辑推理、常识判断等多个领域。题目包括中文谦辞“哪里哪里”的含义、成语使用正误、双胞胎家庭孩子数量推论、根据天气预报推算星期几、名著常识判断、搬运花瓶破损数量的数学计算、天文学与物理学的错误选项辨别,以及一篇关于周末计划的英语阅读理解。这些题目旨在评估大模型在自然语言处理、逻辑推理和知识应用方面的表现。
835
0
创建于2024年6月21日
这篇文章总结了19个用于测试大模型能力的易错问题,分为多步逻辑推理和概念间接关联两类。逻辑推理类问题考察模型对数字关系、平均智商变化、水分含量变化、日期推断、过河难题、代数运算及物理运动等复杂情境的推理准确性,其中一些问题通过调整参数(如蜘蛛腿数量改为青蛙腿或美国州数)或语言变体(如数字表达)来误导模型。概念关联类问题则测试模型对看似无关事物(如香蕉与呕吐、佛罗里达与皱纹)之间隐藏联系的理解能力。这些题目旨在揭示大模型在逻辑连贯性与常识推理上的弱点。
466
0
创建于2024年6月21日