如何读/写论文???

原文:https://mp.weixin.qq.com/s?__biz=MzIyNjM2MzQyNg==&mid=2247484407&idx=1&sn=c0d78a59c41109fba9dd2faf46c93982&chksm=e870d2badf075bacf11887c572b780a295292366aaa2584ca11e89e68991df2bae6e2a66b45d&mpshare=1&scene=23&srcid=

如何读论文:

收录科学文献预印本的在线数据库访问地址:https://arxiv.org/

略读和精读

略读:关注摘要。论文摘要是很结构化的东西,一般会告诉我们三件事,我研究了什么问题,我用什么方法解决这一问题,以及用该类方法解决这类问题的结果怎么样。作者在每期的文章中会将泛读部分的摘要翻译下来附在文章的末尾,大家可以直接阅读找到自己感兴趣的问题。读完摘要就知道这篇文章自己是否感兴趣,是否值得精读了。

精读。精读会在略读的基础上选取自己感兴趣的论文进行精读,主要关注点仍然是解决什么问题,用什么方法和结果三类。其中对解决的问题和所用方法更加注重。

如何写一篇合格的论文:(以NLP为例)

扫描二维码关注公众号,回复: 6036045 查看本文章

 NLP 论文的典型结构:

学术会议(甚至包括期刊)论文已经形成比较固定的结构。绝大部分论文由以下六大部分构成:摘要(Abstract)、介绍(Introduction)、相关工作(Related Work)、方法(Method)、实验(Experiment)、结论(Conclusion)。少数论文会根据创新成果形式不同而略有不同,例如提出新数据集的论文,可能会把 Method 部分调整为 Dataset 的标注与分析,但不影响论文整体构成。每个部分作用不同:

  • 摘要:用 100-200 词简介研究任务与挑战、解决思路与方法、实验效果与结论。

  • 介绍:用 1 页左右篇幅,比摘要更详细地介绍研究任务、已有方法、主要挑战、解决思路、具体方法、实验结果。

  • 相关工作:用 0.5-1 页左右篇幅介绍研究任务的相关工作,说明本文工作与已有工作的异同。

  • 方法:用 2-3 页篇幅介绍本文提出的方法模型细节。

  • 实验:用 2-3 页篇幅介绍验证本文方法有效性的实验设置、数据集合、实验结果、分析讨论等。

  • 结论:简单总结本文主要工作,展望未来研究方向。

注意:

(1)学会换位思考。要始终站在审稿人或读者的角度审视论文,思考如何更清晰地表达。这是初学者最容易忽视的问题:作为研究成果的亲历者,论文作者掌握所有细节,如果不多加留意,写作中就会出现新概念没有被明确定义就被使用等情况,很多描述和分析缺少逻辑衔接。对作者而言,这些省去的东西并不影响他对这些文字的理解;但对并不了解这份工作的读者而言,这无疑是一场噩梦,因为他们并没有作者脑中的那套背景信息。因此,写作时要时时留神,读者读这句时能否理解,所需要的背景知识前文是否已经介绍

(2)注意逻辑严谨。严谨是学术论文的底色,从引用格式、公式符号到谋章造句,虽不至于美国法学期刊的 Bluebook 那么变态,都力求风格统一,行文严谨。引用、公式、拼写等方面都容易学,初学者更需要注意行文严谨,力求全文从章节、段落、句子等不同级别都逻辑严密,争取做到没有一句话没来由,没有一句话没呼应

  • 章节层面,Introduciton 提到已有方法面临的几个挑战,就要对应本文提出的几个创新思路,对应 Method 中的几个具体算法,对应 Experiment 中的几个实验验证。

  • 段落和句子层面,段间要注意照应,是并列、递进、转折还是总分关系,需要谋划妥当,要有相应句子或副词衔接。段内各句,有总有分,中心思想句和围绕论述句分工协作。

Abstract 和 Introduction 怎么写

Abstract 可以看做对 Introduction 的提要,所以我们先介绍 Introduction 的写法,然后再说如何写 Abstract。Introduction 是对整个工作的全面介绍,是决定一篇论文能否被录用的关键。一般 Introduction 这么写:起手介绍研究任务和意义;随后简介面向这个任务的已有方法;接着说明已有方法面临的关键挑战;针对这些挑战,本文提出什么创新思路和具体方法;最后介绍实验结果证明本文提出方法的有效性。这几个部分各挡一面,同时又有严密的内在逻辑。每个部分也各有章法,下面分别介绍对各部分的建议:

(1)研究任务。介绍本文的研究任务及其在该研究领域的重要价值和意义。如果是领域公认的重要任务的话,则可以不用详细论述其研究价值/意义;如果是新提出的研究任务,则需要花费比较多篇幅论证该任务的价值。

(2)已有方法。从研究任务递进一步,介绍这个任务的已有代表方法。需要注意,这个已有方法需要是目前最好、最具代表性的,也是本文工作准备改进的。所谓站在巨人的肩膀上,一篇值得发表的论文需要找到那个最高的巨人。

(3)面临挑战。已有方法一定仍然存在某些不足或挑战,才需要进一步研究改进。因此,需要总结已有方法面临的挑战。这是 Introduction 的关键部分,起着承上启下的作用。初学者特别注意,这部分涉及对已有工作的评价,务必保证精准客观。要知道,当论文投稿至 NLP 国际会议后,是通过同行评审决定是否录用发表,评审人一般是小同行,有很大概率是已有工作的作者。所以这部分论述一定要做到客观公正,让这些工作作者本人也能信服。

先介绍已有方法面临的挑战,并且通过举例直观呈现。面对这个挑战,已有一些相关工作,还需说明他们各自有什么不足和挑战,为引出本文创新思路做好铺垫。

(4)创新思路。水来土掩,兵来将挡,既然已有方法有这些不足和挑战,就需要有新的创新思路和方法。这部分需要注意与上面的」挑战「部分严丝合缝,密切呼应,让读者清楚领会到这些创新思路与方法的确能够解决或缓解这些挑战问题。

介绍创新思路和方法。可以看到,一般」面临挑战「和」创新思路「部分还配图示,更直观地展示本文要解决的挑战问题和创新思路。大部分论文都会在 Introduction 中提供图示。

5)实验结论。除了在」创新思路「部分图文两开花地说明本文创新工作外,还要通过合理的实验验证方法的有效性。一般要得到」our method achieves significant and consistent improvement as compared to other baselines「的结论,从而验证本文工作的创新性。

有些论文最后还会体贴的总结本文的主要贡献,一般说」In summary, the key contributions are x-fold: (1)...(2)...(3)...「。这样做的好处是,可以帮助审稿人总结本文的创新点放在审稿意见中,节省不少工作量。但需要注意,这些创新点要简洁明了,不能是前文的简单重复,也不能 overclaim。如果要说」首次「提出或发现,一般也要前置」to the best of our knowledge「。此外还有论文最后一段会介绍接下来几个 Section 结构,对一篇 8 页论文可能并不需要。

对于 Abstract,可以看做对 Introduction 的简介,最简单的做法是,以上每部分都精简为 1-2 句话组成 Abstract 皆可。

Method 怎么写:

这部分要详细介绍本文创新方法的具体细节,由于涉及非常艰涩的细节,要采用「总-分」结构来介绍。

这部分起手「总」的部分要介绍本文任务的符号定义,以及本文方法的框架组成,或者按步骤来介绍或者按模块来写,让读者对本文方法有全景式的理解。

然后进入「分」的部分,则需对应「总」中的框架,分别介绍各关键模块/步骤。

读者在」总「的部分已经对方法有全景式的了解,有的放矢,就比较容易理解每个模块的具体细节。而每个」分「的部分中,又可以进一步采用」总-分「结构进行介绍。为了更清晰地体现」总-分「结构,可以将各「分」的部分命名并加粗。

初学者特别注意,(1)Introduction 中对创新思路与方法的介绍,不要在 Method 中简单重复,否则会让认真通读全文的审稿人颇感厌烦。要做到前后照应,有所递进,前略后详,不妨使用「as mentioned in Section 1」来做关联。(2)Method 部分往往包含大量公式,需要保证公式风格和符号使用前后统一,新符号使用均需显式解释。

Experiment 怎么写:

这部分要详细介绍与实验相关的具体细节。一般先介绍实验数据、评测标准和比较方法等基本信息。以论文 [2] 为例,实验部分首先介绍实验数据与评测标准(4.1 Datasets and Evaluation Metrics)、实验比较的已有代表方法(4.2 Baselines)、实验方法的参数设置(4.3 Experimental Settings)等基本信息。

在介绍完实验基本信息后,主要开展两种实验:

(1)主实验。目的是证明本文方法与已有方法相比的有效性。一般需要选取业界公认的数据集合或已有工作采用的实验验证方式,提升实验的可信性。对于学术论文而言,并不需要比该任务上最好的方法相比,只要证明采用本文创新方法与不采用本文方法相比更有效即可,也就是说,实验中尽量控制其他变量,只聚焦于本文关注的挑战问题即可。当然,如果能够因为本文创新思路,得到该任务上的最好效果,会更有吸引力,但不必总是强求。

一般实验结果用图表展示,然后在正文进行观察分析。例如,论文 [2] 的主实验部分先介绍不同 Selector 和 Reader 对实验效果的影响(4.4 Effect of Different Paragraph Selectors、4.5 Effect of Different Paragraph Readers),接着介绍主实验结果和观察分析(4.6 Overall Results)。其中表格中会把最好效果加粗显示,一般应大部分位于本文提出的方法;为了更加清晰明了,观察分析结论可用(1)(2)(3)列出,其中第 1 条一般要得出主要结论,即本文方法要显著优于已有方法。

(2)辅助实验。目的是展示本文创新方法的优势和特点。例如,不同超参数对本文方法的影响(Hyper-Parameter Effect),不同模块对本文方法效果的贡献(Ablation Test),不同数据划分对本文方法的影响(如 Few-shot Learning 相关工作比较常见),本文方法的主要错误类型(Error Analysis),本文方法能够改进效果的典型样例(Case Study)等。这些实验需要根据论文创新工作特点而有针对性的设计,一切要为体现本文的创新价值而服务。

例如,论文 [2] 的辅助实验包括 4.7 Paragraph Selector Performance Analysis、4.8 Performance with different numbers of paragraphs、4.9 Potential improvement、4.10 Case study 等,从各方面呈现本文提出方法的特点。

Experiment 部分的特点是要图文并茂,注重通过多个表格和图示来呈现本文方法的优势和特点,需要注意图表风格统一。初学者特别注意,要做到仅凭图表下方的说明文字就可以理解每张图表内容,不要让读者还要到跑到正文寻找相关说明。因为,很多有经验的审稿人在看完 Introduction 后,会直接跳到 Experiment 图表中寻找对比效果。

Related Work 怎么写

这部分主要是介绍本文任务和方法的相关工作,目标是通过对已有工作的梳理,凸显本文工作的创新价值。对已有工作的梳理,不应是对每个工作的简单介绍,而应当注意汇总、分类、分析,或者按照时间发展顺序,或者按照技术路线划分,例如论文 [2] 就是按照时间脉络介绍。

在对相关工作的介绍中,要注意暗合本文创新思路要解决的挑战,不应是单纯的介绍,而是夹叙夹议,时刻注意与本文工作的照应。在 Related Work 的最后,应该落脚到本文工作与已有工作相比,有什么新的思路,解决了什么挑战问题。

初学者特别注意,Introduction 和 Related Work 部分是特别需要导师或其他有经验学者帮助把关的。一是,不能遗漏重要相关工作,这点需要论文作者对相关领域工作保持跟踪;二是,与 Introduction 要求类似,对已有工作的评述务必精准客观。

Related Work 一般放在 Introduction 之后,或者 Conclusion 之前,这一般取决于论文工作的特点。对于那些与已有工作联系紧密、创新精微的工作,一般建议放在 Introduction 之后,方便读者全面了解本文工作与已有工作的关系,然后开始在 Method 介绍本文方法。而对于有些框架性创新工作,如果主要是对已有方法的组合,一般建议 Related Work 放在 Method、Experiment 之后即可。这点并无成法,完全根据行文方便来定。

Conclusion 怎么写

在论文最后会有总结展望,一般用一段来再次总结和强调本文的创新思路和实验结果,然后说明未来建议的研究方向和开放问题。这部分相对来讲比较固定。稍微留意的是,在准备论文最后阶段,如果发现论文有哪些应当做还没来得及做的,可以写作本文的未来工作。至少可以向审稿人表明你也想到这个问题了,赢得一点同情分。

原文:清华大学刘知远:如何写一篇合格的NLP论文

https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650758382&idx=1&sn=94343b3015615bba868b6dd741060b8a&chksm=871a9890b06d1186a41df21f864fbe81d4de0bb583ca1a0d521d04a2bd82145fb98a49864e19&scene=21#wechat_redirect

猜你喜欢

转载自www.cnblogs.com/datou-swag/p/10779017.html