深度学习——大规模图像分类经验 - 代码天地

深度学习——大规模图像分类经验

企业开发 2023-09-08 17:22:01 阅读次数: 0

参考博客

大规模图像分类（MXNet教程中文翻译版）

笔记：故障排除指南

验证集准确率

实现合理的验证准确率通常非常简单，但是要达到最新的论文中的结果有时却会非常困难。为了实现这个目标，你可以尝试下面列出的几点建议。

使用数据增广常常可以减少训练准确率和验证准确率之间的差别。当接近训练末期的时候，数据增广应该减少一些。
训练开始的时候使用较大的学习率，并保持较长一段时间。例如说，在CIFAR10上进行训练时，你可以在前200轮都使用0.1的学习率，然后将其减少为0.01。
不要使用太大的批次，尤其是批次大小远远超过了类别的数目。

速度

分布式训练在大大提高训练速度的同时，每个批次的计算成本也都很高。因此，请确保你的工作量不是很小（诸如在MNIST数据集上训练LeNet），请确保批次的大小在合理的范围内较大。
请确保数据读取和预处理不是瓶颈。将--test-io选项设置为1来检查每秒钟工作集群可以处理多少张图片。
通过设置--data-nthreads来增加数据处理的线程数（默认为4）.
数据预处理是通过opencv实现的。如果你所使用的opencv编译自源码，请确保它能够正确工作。
通过设置--benchmark为1来随机的生成数据，和使用真实的有序数据相比，能够缩小一部分瓶颈。
在本页中你可以获取到更多相关信息。

显存

如果批次过大，就会超出GPU的容量。当发生这种情况是，你可以看到类似于“cudaMalloc failed: out of memory”的报错信息。有几种方式可以解决这一问题。

减小批次的大小。
将环境变量MXNET_BACKWARD_DO_MIRROR设置为1，它可以通过牺牲速度来减少显存的消耗。例如，在训练批次大小为64时，inception-v3会用掉10G的显存，在K80 GPU上每秒钟大约可以训练30张图片。当启用镜像后，使用10G的显存训练inception-v3时我们可以使用128的批次大小，但代价时每秒钟能够处理的图片数下降为约27张每秒。

猜你喜欢

转载自blog.csdn.net/s000da/article/details/89486004

深度学习——大规模图像分类经验

用深度学习解决大规模文本分类问题

基于深度学习的大规模多标签文本分类任务总结

用深度学习（CNN RNN Attention）解决大规模文本分类问题 - 综述和实践

用深度学习（CNN RNN Attention）解决大规模文本分类问题

用于大规模图像识别的深度卷积网络

用深度学习（CNN RNN Attention）解决大规模文本分类问题 - 综述和实践（转载）

IBM Watson Machine Learning Accelerator 加速深度学习和大规模、高分辨率的图像处理

干货超大规模深度学习在美团的应用

大规模并行分布式深度学习

外卖广告大规模深度学习模型工程实践

面向大规模计算的深度学习框架设计与实现

使用R语言深度学习实现大规模语音转录

大规模机器学习

2020-2-29 深度学习笔记12 - 深度学习应用 1（大规模深度学习）

MXNet官方文档中文版教程(9)：大规模图像分类

文本处理（七）——用深度学习（CNN RNN Attention）解决大规模文本分类问题 - 综述和实践

深度学习之图像分类

大规模图像检索深度特征：Large-Scale Image Retrieval with Attentive Deep Local Features

【论文泛读06】学习交通图像：一种用于大规模交通网络速度预测的深度卷积神经网络

【论文阅读】Learning Traffic as Images: A Deep Convolutional ... [将交通作为图像学习: 用于大规模交通网络速度预测的深度卷积神经网络]（3）

【论文阅读】Learning Traffic as Images: A Deep Convolutional ... [将交通作为图像学习: 用于大规模交通网络速度预测的深度卷积神经网络]（2）

【论文阅读】Learning Traffic as Images: A Deep Convolutional ... [将交通作为图像学习: 用于大规模交通网络速度预测的深度卷积神经网络]（1）

大规模机器学习（二）

大规模机器学习（一）

大规模文本分类参考（转发）

【数据科学赛】大规模细粒度建筑分类 #图像分类 #建筑分割和高度预估 #$1,6000

大规模分布式深度网络

雅虎如何在Hadoop集群上实现大规模分布式深度学习

深度学习中超大规模数据集的处理

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)