达观杯文本分类比赛 | (1) 比赛介绍 - 代码天地

达观杯文本分类比赛 | (1) 比赛介绍

编程语言 2020-01-26 12:04:34 阅读次数: 0

目录

1. 竞赛信息

3. 评分标准

1. 竞赛信息

自然语言处理一直是人工智能领域的重要话题，而人类语言的复杂性也给 NLP 布下了重重困难等待解决。长文本的智能解析就是颇具挑战性的任务，如何从纷繁多变、信息量庞杂的冗长文本中获取关键信息，一直是文本领域难题。随着深度学习的热潮来临，有许多新方法来到了 NLP 领域，给相关任务带来了更多优秀成果，也给大家带来了更多应用和想象的空间。

达观杯文本分类比赛，是篇章级别的长文本分类。输入一段长文本，输出与其对应的类别。

2. 数据

数据包含2个csv文件：

train_set.csv：此数据集用于训练模型，每一行对应一篇文章。文章分别在“字”和“词”的级别上做了脱敏处理。共有四列：第一列是文章的索引(id)，第二列是文章正文在“字”级别上的表示，即字符相隔正文(article)；第三列是在“词”级别上的表示，即词语相隔正文(word_seg)；第四列是这篇文章的标注(class)。

注：每一个数字对应一个“字”，或“词”，或“标点符号”。“字”的编号与“词”的编号是独立的（没有明文，用数字字符串做了编码）！

test_set.csv：此数据用于测试。数据格式同train_set.csv，但不包含class。注：test_set与train_test中文章id的编号是独立的。

训练集和测试集的数据量均为102，277，共19个类别，平均长度大约1000+词。

3. 评分标准

评估指标选用macro-f1_score,即每个类别F1_score的算术平均数：

其中，Pi是表示第i个类别对应的Precision， Ri是表示第i个类别对应Recall。

更多分类问题评估指标可以查看我的另一篇博客：https://blog.csdn.net/sdu_hao/article/details/103533115。

CoreJT

发布了364 篇原创文章 · 获赞 712 · 访问量 13万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/sdu_hao/article/details/104086214

达观杯文本分类比赛 | (1) 比赛介绍

达观杯文本分类比赛

达观杯文本分类比赛 | (2) 单模型融合(机器学习模型)

面向文本分类的特征工程——kaggle文本分类比赛

达观杯_比赛简介

达观杯比赛总结

人流密度检测比赛(MCNN实现)(1)——比赛及数据集介绍

达观杯文本处理比赛（二）

达观杯文本处理比赛深度学习实践

达观杯文本处理比赛(一)

文本分类(二) | (1) 项目介绍

机器学习二：文本分类（比赛实例）

达观杯比赛复盘专题

蓝桥杯嵌入式比赛介绍

比赛题解（1）—— 思维

比赛

达观杯文本分类竞赛 0

各类比赛作品

目标检测类比赛

猫十二分类比赛--PaddleX图片分类

区块链比赛模块1

2018.08.17达观杯比赛历程（一）LR_V0

图像分类比赛[举一反三]

天池心跳信号分类比赛-模型融合

关于codeforces比赛规则介绍

细粒度分类，比赛，和相关模型介绍

文本分类(三) | (1) 项目介绍(基于预训练语言模型)

比赛-6月Round1

比赛-Round 1 (12 Jul, 2018)

17-比赛1 F - 较小元素

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)