科技政策综合设计系统任务书

1、究背景及现状。

科技政策是为了规范科技领域正常运转而制定的有计划、有组织的科技方针,体现了国家对于当前科技发展方向和产业规模的有效调控。随着科技政策文本的逐年增多,如何对科技政策文本进行有效的组织与管理,帮助政策研究人员快速获取其中的有价值信息,成为当前亟需解决的问题。

近年来,通过量化科技政策,建立经典的计量模型来客观评估中国科技政策对于技术绩效乃至经济绩效的影响的研究越来越多,随着自然语言处理领域的快速发展,文本挖掘技木日趋成熟,能量化分析政策的语义特征、演化路径,具有其他政策分析技术难以比拟的作用。

本系统期望实现的效果是通过对科技政策进行多维度的挖掘,探究科技政策的导向性和创新性,联系科技本体数据,挖掘科技本体数据变化背后起作用的科技政策,分析科技政策对科技进步和科技创新的影响。

2、设计内容。

本系统围绕着建立科技政策和科技本体之间的关联关系进行功能的设计和开发。科技本体的数据包括科技人才、科技资金投入、科技项目等,常常作为科技进步以及科技创新评价的指标,通过对科技政策深度挖掘,透过科技实体数据的变化,探究背后发挥作用的科技政策。

系统包含四个功能模块:

(1)       科技政策文档管理

科技政策文档管理是系统进行科技政策挖掘和分析的基础,为了保证政策的完整性和分布均匀性,科技政策要能可扩充,可管理。

(2)       政策热点导向分析

挖掘科技政策中的关键词,使用政策工具以及科技活动类型等作为分类依据,建立科技政策量化的空间模型,对不同时间段或不同地域科技活动类型的差异、变化等进行分析。

 

 

(3)       科技政策深度挖掘

通过探究科技政策对科技领域的调整方式,定义科技政策文本挖掘公式,结合用户反馈,文本相似度对比,挖掘科技政策对某一科技领域调整的详细描述。

(4)       政策影响力分析

使用政策挖掘的结果,针对不同年份、对不同地域的政策,探究科技政策投入力度,资金支持力度,科技政策数量等数据作为评价指标,以时间和地域作为基本维度,针对某一领域,综合科技政策投入力度的变化与该领域科技实体数据的变化,探究是否前者对后者带来了促进作用。


         

 

 

3、重难点分析
详细的系统架构图如下所示:

(1)       科技文档爬取

科技政策文档管理是系统进行科技政策挖掘和分析的基础,为了保证分析结果具有说服力和可靠性,就要保证政策文档要全面,包括多个部门出台的相关政策。爬取的各地域政策数量分布要均衡。

 

(2)       科技政策关键词提取

政策中有很多专业性的特定词汇,而现有的通用词库难以涵盖,也并未有权威的政策词库,所以程序需要对政策文档中的新词能够发现和识别(通过与用户交互,可以持久化到词典)。政策中通常涉及多个调整领域,因此提取的关键词要有较高的专业化,代表性和区分度。

(3)       科技政策导向分析

以时间和地域作为两个基本维度来看,不同地域结合地方特色,科技政策调整领域的侧重面往往有所差异。国家在发展的不同阶段,科技政策的大方向与科技目标也有差异。如何建立合理的分析模型,将这种差异直观的展示出来,是本系统的难点。

(4)       科技政策影响力分析方法

如何找到影响科技本体数据的变化,在背后发挥作用的科技政策,是本系统的一个难点。当挖掘出背后科技政策的关键描述,在政策数量、资金或人才投入力度方面来做量化分析,探究政策在科技创新方面起到的作用以及政策执行效果。

 

4、设计要求。

 

(1)           要求学生对科技政策的相关知识有一定的了解,了解主流的政策分析工具以及量化的方法。

 

(2)           科技政策文档管理是系统进行科技政策挖掘和分析的基础,科技政策要能可扩充,可管理。

 

(3)           对不同时间段或不同地域科技活动类型的差异、变化等进行分析。

 

(4)           通过探究科技政策对科技领域的调整方式,挖掘科技政策对某一科技领域调整的详细描述。

 

(5)           针对某一领域,综合科技政策投入力度的变化与该领域科技实体数据的变化,探究是否前者对后者带来了促进作用。

 

(6)           探究政策在科技创新方面起到的作用以及政策执行效果。

 

(7)           毕业论文内容合理,字数在1-2万字,按时完成毕业论文各阶段工作,不突击,不抄袭。

 

5、设计参数。

 

(1)       政策工具是政策实施的具体手段,也是政策成功与否的关键。政策工具分三种类型,分别是供给型、环境型和需求型。科技政策在不同层面的投入力度有一个合理的比例,将政策工具作为科技政策量化分析模型的一个维度是政策分析常见的方法。

 

(2)       调整领域是根据三大产业对科技政策分类的一个维度,三大产业包括农业、工业和服务业。彼此之间相互依赖,相互制约。可以作为科技政策分析的参考一个维度。

 

(3)       科技活动类型是指技术发展的不同阶段主要的表现形式,包括基础研究,研究开发和产业化。

 

(4)       文本挖掘是指从多种来源、大量的文本中找出有价值的信息。

 

(5)       科技本体包括科技人才、科技企业、财政资金、专利等实体数据,常作为对一个地区的创新指数、科技进步等进行量化和排名。

6、应遵守的法规及主要参考文献。

[1] 郑捷. NLP汉语自然语言处理原理与实践[M]. 北京: 电子工业出版社, 2017: 1-532.

[2] 基于政策工具公共科技政策分析框架研究. 赵筱媛,苏 竣.

[3] 中国科技服务业政策的量化与演变. 张 骁,周 霞,王亚丹.

[4] 中国技术创新政策演变与绩效实证研究(1978-2006). 彭纪生,孙文祥,仲为国.

[5] 基于统计数据的山东科技创新政策实施效果评估分析. 袭著燕,赵 慧,张 弛.

[6] 基于创新型社会的地方科技创新政策评估理论研究. 肖士恩.

[7] 2012-2015京津冀科技进步监测统计数据

 

 

 

猜你喜欢

转载自www.cnblogs.com/w-honey/p/11832331.html