自然语言处理入门---学习方法概述

       今日,学习的资料来源为:如何在NLP领域第一次做成一件事

      自然语言处理的研究内容:1,句法语义分析(主要对句子进行分词,词性识别,命名实体识别,句法分析,语义角色分析,多义词消歧等)2, 信息抽取(从文本中抽取重要的信息,主要涉及到了实体识别,时间抽取,因果关系抽取等关键技术)3,文本挖掘(对文本数据进行聚类,分类,信息抽取,摘要,情感分析等主流的统计机器学习)4,机器翻译(把输入的源文本自动翻译获得另一种语言的文本)5,信息检索(对大规模的文档进行索引,可以先在索引中找到候选文档,然后根据排序机制把候选文档排序,最终输出排序得分最高的文档)6,问答系统(给一个问题,然后给出一个精确的答案)7,对话系统(系统通过一系列的对话,跟用户进行聊天,回答,完成一项任务,甚至可以基于用户进行个性化回复)

       学习NLP的过程:找一个开源项目,然后理解任务,跑通源码,然后尝试着自己实现,然后与源码相对照,找优势,找不足。

       选择NLP课题:先确定一个研究领域,然后调研该研究领域的一些发展状况,包括方法方面,是否有清晰的数学体系和机器学习体系;数据方面,是否有公认的数据集;研究团队,是都有著名的团队和人士参加,然后找到本领域的一些开源项目或工具,多读文章,最后要进行比较好的对比,与已有的算法进行比较,是否可以得到比较一般的结论。

        如何写出一篇NLP的论文:论文题目具体,有深度,突出算法;论文摘要说明本文针对什么问题,提出什么方法,跟已有的工作相比有什么优势,实验结果表明,达到什么水准,解决了什么问题;引言,要说本项工作的背景,对于这个问题的定义,有什么重要性,本问题中,现有方法有哪些,优缺点,存在什么问题,本文针对这个问题,受什么方法的影响,提出了什么新的方法,并做了以下几个方面的研究,然后对几个方面加以叙述,最后说明实验的结论,文本的贡献,最后说一下文章的章节组织以及本文的重点;论文相关工作,对相关工作做一个梳理,按照流派划分,对主要的最多三个流派做简要的介绍,介绍其原理及其局限性;论文主干主要是对于算法的描述,对于实验的介绍;论文结论,对本文的贡献再一次总结,既要从理论,方法上加以总结和提炼,也要在实验上的贡献和结论说明,同时也需要指出未来的研究方向;论文参考文献,要把重要的相关工作的论文写全。

猜你喜欢

转载自blog.csdn.net/angela2016/article/details/83339408