以CVPR顶会论文为例,探讨AI论文的阅读方法

作为一个科研工作者,每天必做的事情就是阅读论文进行输入,但是面对海量的文献,如何做到高效输入且不遗漏信息?这个过程中需要我们掌握一些文献阅读技巧。

常说文献精读,但是如何去做精读?怎么去理解一篇论文的展开逻辑?作者究竟是怎么表达自己的核心工作?


一、为什么要读论文

☞阅读论文的重要性

①吸收作者的idea:找到论文里的新内容

其实阅读论文的过程就是我们吸收作者idea的过程,我们首先得先知道现有的研究是什么样的,再去看论文里面提出了哪些新的内容,有了这些之后才能为我们想自己的idea做好铺垫,这是我们idea的来源之一,

②快速了解一个领域:通过相关工作和参考文献,明确后续学习方向

通常我们是通过研究方向内的以及与研究方向相关的最新论文,来了解这个领域的最新现状;通常论文中会总结出当前这个问题下的研究现状,并且把与之相关的工作都列出来,包括每个工作各自用了什么方法等等,通过这些能够帮助我们去明确我们研究方向的最新状况。

那么,如何获取更多的文献呢?比如我们在读论文的过程中,会忽然发现一个感兴趣的点,原来某一个问题可以用一种我们没想到的方法去解决,就仿佛忽然打开了一个新的窗口,那我们就可以“顺藤摸瓜”去找更多的相关文献来读。我们可以去看论文的参考文献部分,再到参考文献的参考文献,然后参考文献的参考文献的参考文献……不断套娃,这样我们就能够通过这种方式去做一个回溯。通过这种方法可以把一个方向的背景知识、发展脉络整理清楚。这个过程可能会非常耗时间,但是又很有必要,因为你会学习到很多的新知识,背景知识也好,理论知识也好,可以快速了解一个领域。

当然想快速了解一个领域,看文献综述是最快的一种方式,文献综述会更详细的去介绍相关的方法,包括我们关心的数据集这些也会包含在内。

③学实验设置:数据集、评测指标、SOTA性能、消融实验、可视化

在阅读论文的过程中,还能够学习作者如何设计实验;作者在解决这个问题的时候,用到了哪些数据集,设立了哪些评测指标,包括现有的研究的问题,作者提供的SOTA方案的性能到哪一步了,还有作者是如何设计消融实验的——作者是如何一步一步的通过实验去验证,方法里的每一个流程都是怎么对最终的结果起作用的,这些都会在实验部分呈现。

还有一点就是一些可视化的分析,因为图表相对文字要来得更清晰,更直观,更容易抓住人的眼球,所以说我们也可以通过论文学习别人是怎么去怎么呈现自己的工作的。

④学写作逻辑:引言如何展开、相关工作如何分类、方法如何突出重点、如何引导读者

学习论文的写作逻辑也是阅读论文中很重要的一点,我们去看那些最发表在顶会或者顶级期刊上的论文,我们能看到的版本其实是作者经过多次修改迭代之后得到的,同时可能经历过多轮结合审稿人意见的修改和完善,所以经历过这么多次完善之后的相对完美的一版论文,能让你学到的东西也很多。

比如作者在引言部分是怎么去展开阐述的,怎么能很快的抓住读者的眼球;相关工作部分是如何去做分类的;方法部分怎么突出它的重点、核心、idea;包括怎么通过整体论文的排版和图表等一系列协作方式,去引导读者……这些其实都是可以学习的。所以阅读一篇论文,能从中学习到很多东西。

☞弄懂论文为何如此困难?
 

①语言障碍:英文阅读能力不足

每个人的英语水平都不一样,有的人可以很快的就直接上手读英文论文,有些人可能需要借助翻译软件,还有些人可能用了翻译软件之后,还是一知半解。

②背景知识:基础背景知识欠缺、理论水平不足

尤其是初学者刚开始读论文的时候,可能会非常的痛苦,因为缺乏背景知识的积累,作者写的大量的专业词汇和术语,很可能你完全不知道是啥意思,有些时候理解论文还需要一些理论知识,因为作者默认你掌握了这些理论,或者由于文章的篇幅的限制,不可能把所有的理论都写上,只会写一些跟这篇工作相关的,但是你在阅读的时候就会欠缺大量的背景支持。想要把一篇论文读懂会花非常多的时间,而且效果也不一定好。

③阅读方法:精读、泛读方法不清楚,抓不住重点

怎么精读/泛读?怎么抓取重点信息?这些都有逻辑和方法。如果没有掌握这些方法,读论文的时候就抓不住重点。

④量变到质变:大量阅读论文本身就很耗时,需要坚持并养成习惯

我们常说要阅读大量的文献,但是这个大量到底是多“大量”?这个其实因人而异。
可能很多人其实只能说是泛读,对于很多论文都没有读得很透,当然你也不需要把每一篇论文都读得很好,但是在你的研究方向上非常重要的论文是需要花大量时间去读透的,因为这会直接影响到你能想到的idea的质量,在读透论文的过程中,你会有一些自己的理解,这种读透就是你去深度的思考,深度的理解。

这里的量变到质变,就是当大家去大量阅读论文,然后在这个过程中渐渐能做到对论文深度理解。

⑤交流讨论:论文中遇到不清楚的地方缺乏及时的交流和指导

当你在读论文的时候遇到不清楚地方,可能你没有能及时的跟别人交流,去解决疑惑;又或者对于同一个问题,可能每个人都有自己的见解和思路,如果你只是囿于自己的思维而没有去听取他人的理解,那么就无法拓宽你的思维领域。

我们在读论文的过程中肯定会遇到很多问题,如果你身边刚好有比你经验丰富很多的师兄或者师姐,就可以去跟他们交流请教;他们可能会给你一些指导,会让你很轻松地读懂论文,而且师兄师姐们对某些问题可能会有一些更深度的理解,在交流的时候,你就会获得一些启发和收获。

论文精读tips——

在我们读论文的时候,要带着问题去读论文。这样才能从阅读论文中补足基础,了解方案或者方法。我们可以带着以下七个问题开始我们的阅读:

  1. 这篇论文要解决什么问题?要验证一个什么科学假设?
  2. 这篇论文有哪些相关研究,这些研究是怎么分类的?有哪些研究员值得关注?
  3. 论文中提到的解决方案是什么?关键点在哪?
  4. 论文中的实验是如何设计的?各个实验分别得到了什么结论?
  5. 用于定量评估的数据集是什么?(代码开源的话找到链接)
  6. 这篇论文到底有什么贡献?(三句话内说明)新在什么地方?
  7. 下一步还能基于它做什么?有什么工作可以继续深入?

通过这七个问题,我们可以评估一下自己阅读论文的过程中,对论文的理解程度到底到哪一步。如果在读论文的时候,你能把每一个问题都能回答得很清楚的时候,你其实对一篇论文就已经理解得算比较深刻了。

二、典型论文结构

对于一篇研究性论文,主要会分为以下这几部分:

·标题

包含这篇文章要研究问题以及它的核心idea。

在论文的题目部分,一定要用最简洁的语言把文章最重要的点凸显出来。

·作者

每一位作者的名字,按第一作者、第二作者……往后排列

·单位
作者所属单位

·摘要

摘要,是对一篇文章的精华的浓缩,所以每一句话都是有作用的。比如我们来看一下这篇论文的摘要部分。

以一篇CVPR的论文为例,我们来看一下他是怎么写的。

 首先阐述要解决的问题难在哪儿,基于此分析我们可以从什么角度去解决,同时简要提及现有的解决方案,再自然引出本论文的核心idea,最后展开核心idea,突出优点和贡献。

在这个过程中,关注作者用到了哪些衔接词,来在每一层意思之间做转折、递进……

不论是我们做论文的精读还是泛读,摘要部分都是我们需要重点关注的,因为从摘要,我们就可以看出来这篇工作的核心重点。梳理出它在前人的基础上做出了哪些贡献。

·引言

同样用这篇文章为例。我们来看看作者在引言部分是如何展开故事线的。

作者是按照总分的结构来写。

作者先借助图例说明要解决的问题这篇工作的主要idea,通过adding an intermediate domain m来达到效果。

接着在第一段引出问题并分析解决问题的角度:SFSU→DA。

 第二段说明问题的第一类解决方案及其中仍存在的问题:DA×。

 第三段说明问题的第二种解决方案及其中存在的不足:Fog(defog/add fog)×。

 第四段承接上一个解决方案中的问题,并提出自己idea:Fog+Style

第五到第七段用一个实验发现来证明自己idea的合理性:Fog+Style

第八细化自己的idea,指出方法的设计原则:disentanglement+relationship→SFSU。

 第九段,总结论文的贡献:idea、关系、性能、泛化性。

·方法/实验/材料

通过这里,我们会非常清晰的知道作者到底在干什么事,他准备怎么去干这件事?以及具体实验部分一整套流程是怎么样。我们会看到作者是怎么去验证他提出的核心的想法,他把他的核心想法又进一步做了说明和细化

·结果与讨论

·结论

在这一部分,作者会再次回顾自己的核心idea,所用方法及效果,以及可能的改进方向。

猜你喜欢

转载自blog.csdn.net/m0_73122726/article/details/128253431