COVID-19社交数据共享平台,用数据为疫情研究贡献力量

新冠(COVID-19)疫情自去年 12 月开始至今,已有三个月余,国内疫情经历了扩散、爆发直至目前已逐渐稳定,但国外疫情却又迅速蔓延,并有爆发的趋势,形势不容乐观。随着新冠疫情在国内外的发展,各类社会媒体信息层出不穷,其中诸如新闻、谣言等,对于分析社会舆情、打击虚假信息和预测疫情风险具有重要的研究意义。

在此背景下,清华大学自然语言处理与社会人文计算实验室制作了 COVID-19 社交数据共享平台(COVID-19 Social Data Collection,CSDC),用数据为疫情研究贡献力量。

 

COVID-19 社交数据共享平台致力于开放共享新冠疫情期间的社交媒体数据,助力疫情信息的分析研究,不得用于商业用途,平台网址为: 

https://covid19.thunlp.org/

 

目前 COVID-19 社交数据共享平台收集整理了疫情相关的新闻微博不实信息法律文书数据集,供学术界和业界的学者研究分析。这些数据集合将会持续更新敬请关注

 

同时,也欢迎各位研究者共享疫情相关数据,一起用数据为疫情研究贡献力量!(请通过数据平台提供的联系方式联系我们)

 

相关数据介绍如下:

  • 疫情相关微博谣言 CSDC-Rumor

    内容:自 2020 年 1 月 22 日开始微博等社会媒体不实信息数据,包括被认定为不实信息的微博的内容、发布者,以及举报者、审理时间、结果等信息。

    贡献者:王聿中、朱泽宇、刘一芃

    来源:新浪微博

 

  • 疫情相关中文新闻 CSDC-News

    内容:自 2020 年 1 月 1 日开始的疫情相关新闻数据,包含新闻的标题、内容、关键词等信息。

    作者:钟皓曦

    来源:新浪新闻等

 

  • 疫情相关法律文书 CSDC-Legal

    内容:中国裁判文书数据集 CAIL(Chinese AI and Law challenge dataset)中与疫情相关的法律文书数据,共 1203 条,每条数据包含了文书标题、案号以及文书全文。

    作者:王聿中、钟皓曦

    来源:中国法研杯司法人工智能挑战赛

 

点击阅读原文进入COVID-19社交数据共享平台

????

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

发布了424 篇原创文章 · 获赞 575 · 访问量 93万+

猜你喜欢

转载自blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/104980545