PaddlePaddle情感分析的dome，怎么用自定义的训练集和测试集？ - 代码天地

PaddlePaddle情感分析的dome，怎么用自定义的训练集和测试集？

其他 2019-03-06 12:02:07 阅读次数: 0

关键字：自定义训练集 自定义测试集
问题描述：
情感分析demo的例子是用的 imdb 的数据集，我想用自己的数据集。请问怎么把训练集和测试集运用到demo里面？
解决方法：
首先要熟悉你想使用的数据集的结构，熟悉了结构后，才能编写对应的处理代码，整体的逻辑其实简单，通常将数据2-8分成测试集与训练集，然后定义一个方法，在每一轮都返回一batch的数据，让trainer去处理则可。

因为实例中的情感分析Demo其实是文本分类问题，所以在使用自定义数据时，处理好输入的文本以及该文本对应的标签的关系则可，具体细节可以参考PaddlePaddle Model中文本分类的代码，https://github.com/PaddlePaddle/models/blob/59adc0d6f38cd2351e16608d6c9d4e72dd5e7fea/fluid/text_classification/train.py
问题拓展：
因为PaddlePaddle中的各种示例代码以演示PaddlePaddle用法为主，所以通常使用的都是简单的训练数据，而且封装好了处理这些数据的接口，让使用者不必关系数据是如何被有效组织的，只需关注此时构建神经网络的结构。但这也就导致了很多人想替换自己的数据集遇到点困难。

其实只要你熟悉自己要使用数据集的结构，要让PaddlePaddle使用这些数据来训练模型还是很简单的，你完全可以模型PaddlePaddle示例代码中处理数据方法的内部实现，其实实现逻辑都不复杂，以情感分析使用的imdb数据集处理逻辑为例，其处理的方法为在movielens.py文件中，其实都是对python内置结构的使用。
问题研究：
最简单的情感分析其实就是一个文本二分类问题，将一句话划分为正面情绪还是负面情绪，而复杂点的其实就是文本的定义分类问题，研究情感分析时，处理要理解其自然语言处理方面的内容，还有就是文本多分类的内容。

猜你喜欢

转载自blog.csdn.net/PaddlePaddle/article/details/88105432

PaddlePaddle情感分析的dome，怎么用自定义的训练集和测试集？

Keras训练自定义数据集

HRNet 训练自定义数据集

MMDetection训练自定义的数据集

PyTorch 自定义 Dataset 及训练集、测试集划分方法

03【mmaction2 slowfast 行为分析(商用级别)】训练自定义ava数据集评估 demo测试

训练集、验证集和测试集怎么设置？

darknet测试自定义数据集

pytorch自定义训练vgg16和测试数据集微调resnet18全连接层

paddle2.0高层API实现自定义数据集文本分类中的情感分析任务

用Mask-RCNN训练自定义大小的数据集

mmdetection使用自定义的coco格式数据集进行训练及测试

yolov7目标检测：基于自定义数据集完成检测、训练、测试

paddleseg数据集自定义比例划分为测试集test.txt，训练集train.txt，验证集val.txt

《我的PaddlePaddle学习之路》笔记十——自定义图像数据集实现目标检测

《我的PaddlePaddle学习之路》笔记四——自定义图像数据集的识别

《PaddlePaddle从入门到炼丹》额外篇一——自定义图像数据集识别

《PaddlePaddle从入门到炼丹》十一——自定义图像数据集识别

《PaddlePaddle从入门到炼丹》十二——自定义文本数据集分类

darknet yolov3 训练自定义数据集

机器学习13:Caffe训练自定义数据集

COCO 2017 自定义 darknet 训练集（二）

pytorch 训练maskrcnn 自定义数据集出错

YOLOv4训练自定义数据集

YOLOv3训练自定义数据集

DINO在Windows环境下训练自定义数据集

YOLOv7训练自定义数据集

YOLOv8训练自定义数据集

YOLO V5 训练自定义数据集

Pytorch 自定义数据集的加载训练

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)