requirement_analysis

1.引言
1.1 编写目的

随着Web2.0技术的不断普及,弹幕视频逐渐兴起,主流视频网站开始增加弹幕功能.

利用情感分析技术提取弹幕评论中包含的情感数据并对其进行可视化,获取网络视频的情感特征及走势.

暂时先将弹幕情感分析作为一个单独的产品,后期可并入其他复杂的产品,继续放光发热。


1.2 预期读者和阅读建议
预期参考人员包括开发人员、测试人员、项目管理人员、质量管理人员、研发部门经理和需要阅读本报告的高层经理。


1.3 术语定义
包括但又不限于如下:

算法(Algorithms):可以完成某种数据分析的数学公式。

批量处理(Batch processing):尽管从大型计算机时代开始,批量处理就已经出现了。由于处理大型数据集,批量处理对大数据具有额外的意义。批量数据处理是处理一段时间内收集的大量数据的有效方式。

商业智能(Business Intelligence): 分析数据、展示信息以帮助企业的执行者、管理层、其他人员进行更有根据的商业决策的应用、设施、工具、过程

数据分析师(Data analyst):从事数据分析、建模、清理、处理的专业人员。

数据集(Data set):大量数据的集合。

Hadoop:一个开源的分布式系统基础框架,可用于开发分布式程序,进行大数据的运算与存储。

HDFS:Hadoop分布式文件系统(Hadoop Distributed File System);是一个被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。

自然语言处理(Natural Language Processing):是计算机科学的一个分支领域,它研究如何实现计算机与人类语言之间的交互。

情感分析(Sentiment Analysis):通过算法分析出人们是如何看待某些话题。

网络挖掘/网络数据挖掘(Web Mining / Web Data Mining):使用数据挖掘技术从互联网站点、文档或服务中自动发现和提取信息。


1.4 参考资料

百度百科,百科学术,CSDN技术论坛

2需求概述
2.1 原始需求

弹幕情感分析是文本分类的一个分支,是对带有情感色彩(褒义贬义/正向负向)的主观性文本进行分析,以确定该文本的观点、喜好、情感倾向。

根据项目的投入和资源,客户等来限制边界范围的,产品的边界确定为文本情感分析,着重点在弹幕情感分析

2.2 找用户

被研究的主观性文本包括顾客对某个产品的评论,大众对某个新闻热点事件的观点等。通过这些文本,商家可以为消费者提供决策参考,相关机构也可以了解舆情,但人工分析耗费大量成本。再深入一想就知道,这些概念很虚 且很难衡量。因此需要用一种方法能够将文本中的信息挖掘出来解决办法,那么将会有很大的帮助。 这也是 该产品介入的领域.

2.3 问目的

情感分析是自然语言处理中常见的场景,比如斗鱼弹幕,B站弹幕等,对于指导产品更新迭代具有关键性作用。通过情感分析,可以挖掘产品在各个维度的优劣,从而明确如何改进产品。比如对up主评价,可以分析up主的个人喜欢,性格丰富度等多个维度的用户情感指数,从而从各个维度上改进up主的直播内容。

分析场景
3.1 原系统分析
全新产品开发
3.2 产品开发总流程图
 

3.3 产品经理参与开发总流程图

3.4产品功能实例化


依照主要功能需求,经过以上的分析,拆成三个相对独立的功能(主要目的是为了开发和测试形成条理性),并尽可能总结各个功能的验收准则。

猜你喜欢

转载自blog.csdn.net/weixin_45316122/article/details/109240894