人工智能 - 超腾开源博客 - 第12页 | 了解网站最新动态,分享最新技术
本文使用PyTorch实现了三种手写数字识别模型:线性神经网络(98.08%准确率)、卷积神经网络CNN(99.28%)和Vision Transformer ViT(98.30%)。实验表明,CNN在MNIST数据集上表现最佳,能有效提取图像局部特征;ViT虽可捕捉全局依赖,但受限于小图像尺寸,表现中等;线性网络结构简单,适合快速验证。文章还提供了数据加载、模型训练代码及性能对比,并建议通过增加Dropout、学习率调度或数据增强来优化泛化能力。
274
0
创建于2024年6月21日
本文全面介绍了PyTorch张量的核心操作,包括张量的定义(如zeros、ones、rand创建方法)、元素访问(类似NumPy的索引方式)、基本数学运算(加减乘除、矩阵乘法、转置)、与NumPy数组的互转、GPU加速计算(通过.cuda())以及自动求导机制。文章通过代码示例展示了各类操作,并重点解析了动态计算图与梯度计算过程。掌握这些基础知识是使用PyTorch进行深度学习开发的重要前提。
214
0
创建于2024年6月21日
本文系统介绍了PyTorch生态系统中的官方工具包及其用途。核心包torch提供张量计算、自动微分、神经网络模块和优化器等基础功能。torchvision用于图像与视频处理,包含常用数据集和预训练模型;torchaudio专注于音频信号处理;torchtext支持NLP任务的数据集和预处理;torchdata实现可组合的数据加载流水线。此外还介绍了torchmetrics、torchserve、torchrec、torchtune等扩展工具,覆盖模型评估、部署、推荐系统和LLM微调等场景。这些官方包共同构成从数据处理到训练部署的完整闭环,满足不同领域开发需求。
198
0
创建于2024年6月21日
本文通过PyTorch实现Fashion MNIST图像分类,对比了两层和三层卷积网络(CNN)以及BatchNorm层对模型性能的影响。实验表明,三层CNN整体表现优于两层,最佳准确率达92.45%。BatchNorm在充分训练后能提升准确率,但初期无BatchNorm收敛更快。训练轮数需适度,过多可能导致过拟合。最佳方案为CNN-3Conv加BatchNorm训练25轮。文章提供了完整的数据加载、模型定义、训练测试代码及结果分析,结论可扩展至更复杂的图像分类任务。
171
0
创建于2024年6月21日
本文整理了PyTorch机器学习库的入门资源与实战经验,涵盖官方地址、基础教程、数据集介绍、开发实战及常见问题。基础部分包括Windows系统安装、张量操作、神经网络层、激活函数、损失函数和优化器详解。实战案例涵盖线性回归、手写数字识别、Fashion MNIST分类、猫狗图像识别(对比CNN与VGG16迁移学习)以及IMDB电影评论情感分类(LSTM达88.76%准确率)。此外还提供GPU利用率优化、文档离线编译、生态项目汇总等实用信息,并附有Hugging Face、动手学深度学习等扩展学习资源。
572
3
创建于2024年6月21日