基于AI的数据增广：生成数据作为训练样本 - 代码天地

基于AI的数据增广：生成数据作为训练样本

企业开发 2023-07-29 12:33:30 阅读次数: 0

Benchmarking and Analyzing Generative Data for Visual Recognition

大型预训练生成模型的进展，扩展了它们作为有效数据生成器在视觉识别中的潜力。本研究深入探讨了生成图像的影响，主要比较了使用外部数据（即生成 vs. 网络检索 vs. 原始）的范式。

主要贡献是：1）GenBench构建：设计了GenBench，一个包含22个数据集和2548个类别的广泛基准，以评估在各种视觉识别任务中的生成数据。2）CLER分数：为了解决现有度量指标（如FID，CLIP分数）与下游识别性能之间的不足相关性，提出了CLER，一种无需训练的度量，用于指示生成数据在训练前对于识别任务的效率。3）新的基线：将生成数据与从同一外部数据池中检索的数据进行比较，有助于阐明生成数据的独特特点。4）外部知识注入：通过通过文本逆映射对每个类别进行特殊token嵌入微调，除了处理低分辨率参考图像时之外，在17个数据集上性能都有所提高。详尽的基准和分析聚焦于生成数据在视觉识别中的潜力，同时确定未来研究中的关键挑战。

Deep Learning Approaches for Data Augmentation in Medical Imaging: A Review

深度学习已成为医学图像分析的常用工具，但训练数据的有限可用性仍是一个主要挑战，特别是在医学领域，数据获取可能成本高且受隐私法规限制。数据增强技术通过人工增加训练样本的数量来解决这个问题，但这些技术通常产生有限结果。

为解决这个问题，越来越多的研究提出使用深度生成模型生成更真实和多样化的数据，以符合数据的真实分布。这篇综述着重介绍三种用于医学图像增强的深度生成模型：变分自编码器、生成对抗网络和扩散模型。

概述每个模型的当前最新技术，并讨论了它们在医学影像的不同下游任务中的潜力，包括分类、分割和跨模态转换。还评估每个模型的优点和局限性，并提出了未来研究方向。目标是提供一个全面的关于深度生成模型在医学图像增强中的应用，并突显这些模型在改善医学图像分析中深度学习算法性能方面的潜力。

关注公众号【机器学习与AI生成创作】，更多精彩等你来读

卧剿，6万字！30个方向130篇！CVPR 2023 最全 AIGC 论文！一口气读完

深入浅出stable diffusion：AI作画技术背后的潜在扩散模型论文解读

深入浅出ControlNet，一种可控生成的AIGC绘画生成算法！

经典GAN不得不读：StyleGAN

戳我，查看GAN的系列专辑~！

一杯奶茶，成为AIGC+CV视觉的前沿弄潮儿！

最新最全100篇汇总！生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

ICCV 2021 | 35个主题GAN论文汇总

超110篇！CVPR 2021最全GAN论文梳理

超100篇！CVPR 2020最全GAN论文梳理

拆解组新的GAN：解耦表征MixNMatch

StarGAN第2版：多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云：独学而无友，则孤陋而寡闻

点击一杯奶茶，成为AIGC+CV视觉的前沿弄潮儿！，加入 AI生成创作与计算机视觉 知识星球！

猜你喜欢

转载自blog.csdn.net/lgzlgz3102/article/details/131950442

基于AI的数据增广：生成数据作为训练样本

LLNet模型实现——训练数据准备之抽取训练样本

sklearn学习--读取mysql数据源进行训练样本和预测文本分类

Tensorflow基础知识---训练样本的batch_size数据的准备

防止过拟合（三）：数据增强（增加训练样本）

Python随机选择一部分训练样本作为测试样本

MTCNN创建训练样本

深度学习训练中关于数据处理方式--原始样本采集以及数据增广

MTCNN中用celebA样本生成landmark训练样本python代码解读

第003篇：ArcGIS中基于矢量样本点制作分类训练样本和测试样本的方法。

图像识别训练样本集

opencv训练样本分类器

制作theano可用的训练样本

从LabelImg建立TFRecord格式的训练样本

深度学习caffe(3)——批量处理图片生成训练样本label的TXT文件

基于电影知识图谱的智能问答系统（六） -- 问题训练样本集敲定

JAVA验证码识别：基于jTessBoxEditorFX和Tesseract-OCR训练样本

Chartify.ai：基于人工智能的AI生成数据可视化信息图表工具

目标检测里正负样本和数据增广

揭示CTGAN的潜力：利用生成AI进行合成数据

生成数据

生成数据评估

批量生成数据

随机生成数据

人脸检测：MTCNN训练数据正负样本生成

caffe数据层数据增广 caffe数据层相关学习以及训练在线数据增广

DL之DCGNN：基于TF利用DCGAN实现在MNIST数据集上训练生成新样本

用作者提供的net1->net2生成MTCNN的训练样本(positive,negative,part,landmark)

目标检测训练数据旋转python代码——数据增广（一）

深度学习训练数据python代码——数据增广（三）

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)