1. Project Application Brief
project name |
Big data analysis platform based on bullet screen comments |
|||||||||||||||
item Eye kind do not |
Undergraduate |
Postgraduate |
||||||||||||||
Academic subject project fill-in mark Remember (√) |
( ) A. Natural science academic papers (√ ) B. Scientific and technological invention production ( ) C. Social science papers and survey reports |
category mark ( ) |
( ) A. Academic research projects ( ) B. Social survey projects ( ) C. Innovative practice projects |
|||||||||||||
Innovation and entrepreneurship Item fill mark (√) |
(√) Information technology ( ) E-commerce ( ) Health care ( ) New energy and new materials ( ) Cross-border e-commerce ( ) Intelligent manufacturing ( ) Cultural creativity ( ) Tourism fashion ( ) Modern agriculture |
|||||||||||||||
Application Amount |
30000 |
Start and end time |
2018-5-3 to 2018-6-20 |
|||||||||||||
state Please person |
Team leader |
Name |
Du Shikang |
gender |
male |
date of birth |
1997.1 |
nationality |
Chinese |
|||||||
profession |
computer science and Technology |
Admission time |
2015.8 |
|||||||||||||
College |
Computer Science and Engineering |
contact number |
17793147249 |
|||||||||||||
Principal members (excluding applicants) |
Name |
Major and grade |
Division of labor in the project |
signature |
||||||||||||
Liu Dan |
Computer Science and Technology Year 3 |
Backend development |
Liu Dan |
|||||||||||||
Wang Jingya |
Computer Science and Technology Year 3 |
Backend development |
Wang Jingya |
|||||||||||||
Li Yuying |
Computer Science and Technology Year 3 |
Backend development |
Li Yuying |
|||||||||||||
Yin Nan |
Computer Science and Technology Year 3 |
Database Design |
Yin Nan |
|||||||||||||
Cao Yingwen |
Computer Science and Technology Year 3 |
System front desk design |
Cao Yingwen |
|||||||||||||
|
|
|
|
|||||||||||||
Overview of research project content |
The "big data analysis platform based on bullet screen comments" uses the well-known domestic live broadcast platform - Douyu to crawl massive bullet screen data through its bullet screen server third-party access protocol as the basis for an experiment. Do a big data analysis for the bullet screen data, and display the experimental data on the big data analysis platform through echarts.
|
|||||||||||||||
2. Argument basis (project positioning)
随着互联网的不断发展和推进,网络在线直播视频,已经在人们观看视频过程中占据了主要地位,“弹幕”因其高互动性和娱乐性已经流行开来,而弹幕自身包含的丰富文本信息和与视频内容相关的时序性特征为数据挖掘提供了可能。而目前计算机领域对于弹幕研究的主要应用可概括为垃圾弹幕的识别和过滤,视频流行程度的预测,视频的自动标记,视频精彩片段的抽取等。
|
||||||||||||||||
三、研究方案
1、研究目标、研究内容和拟解决的关键问题 “基于弹幕评论的大数据分析平台”,利用国内知名的直播平台-斗鱼,通过其弹幕服务器第三方接入协议来爬取海量弹幕数据,作为一个实验的基础。预期的目的是利用Java多线程编程实现实时获取弹幕并能够通过大数据分析出一些基本的指标并直观展示出来,做一些简单的数据挖掘,如果进展顺利,也可以做类似精彩视频片段推荐这样更有意义的事!
2、拟采取的技术路线 拟定的技术路线为首先利用Java多线程编程来实时爬取海量斗鱼弹幕数据,其次利用Spginmvc,Spring data,H-ui搭建本次项目的主体框架并集成数据可视化工具Echarts体现大数据分析结果,最后利用Python制作数据诊断工具来了解特征的分布及基本的统计指标值,再有目的性的选择一些聚类,分类,文本挖掘算法对于弹幕数据做一个大数据的分析,并将实验数据通过echarts展示在大数据分析平台上。
3、项目进度时间安排 (文献查阅): 2018 年 5 月 3 日至 2018 年 5 月10日 (方案设计): 2018 年 5 月10日至 2018 年 5 月20日 (实验研究): 2018 年 5 月20日至 2018 年 5 月31日 (数据处理): 2018 年 5 月31日至 2018 年 6 月 5 日 (研制开发): 2018 年 6 月 5 日至 2018 年 6 月15日 (撰写论文或研究报告): 2018 年 6 月15日至 2018 年 6 月20日
|
||||||||||||||||
四、预期成果
对斗鱼平台的弹幕做一个大数据分析,自身定位是提供服务的第三方平台。目标用户可以是直播平台自身,通过海量弹幕数据去做针对斗鱼弹幕用户的用户分析,直播视频的推荐,深入点也可以精彩片段的推荐等,服务对象是直播平台自身。如果各大直播平台都提供开放的弹幕获取接口,预计用户量可以是各大直播平台。目标用户也可以是平台主播,例如:通过对弹幕数据的分析,做一个粉丝礼物贡献排行榜,弹幕活跃粉丝排行版,去增强主播和这些铁粉的联络互动。还可以通过弹幕文本分析指出主播的优缺点,再例如,对于爱看唱歌类直播的粉丝一般弹幕会刷歌名去要求主播献唱,而把这样的信息反馈给主播可以说是非常有价值的。这时候的服务对象就是各大主播了,而预计用户数量则不可估计
|
二、立项书github 地址: https://github.com/LWDLYC/xixi