提高阅读文献能力

一、如果你的老板放羊,那属于比较坑爹型,但还没有到天都塌了的地步。这种情况下,你需要如下的自救:

你首先要意识到,几乎没有完全原创的工作,最起码任何论文都是有参考文献的吧?做科研灌水当然是不好的,但是一开始就好高骛远也同样是不对的。科研的基本功需要扎实地训练,而这种训练需要你从模仿开始做起。一开始的时候idea的新颖程度低一些,工作量夯实一些,是完全可以理解的,因为你需要这样的几次完整的科研周期的训练,才能成为一名合格的研究生。

  1. 首先选择一个你感兴趣/有前途/有钱途/有人能带你的大方向。优先阅读该方向里最近五年的survey(太老的可以不看)。鉴于计算机领域的发展速度太快,只阅读survey是远远不够的。你需要自行整理该方向相关的近三年的顶级会议(一般也就三四个),以关键词搜索出所有的论文,然后尽可能阅读一些你能懂的/和你想做的相关的/热门的论文,增加对该领域发展现状和顶级会议论文应该有的样子的初步了解。
  2. 你最好能找到可以和你一起学习的同学/可以和你讨论的其他老板。idea的诞生是需要相互启发和相互质疑的。在完全没有任何科研经验的时候,最好要找到高年级的学长学姐或者其他小老板讨论,他们可以帮你确定一个小方向。这一点我深有体会,一个完全没有经验的新手是最需要有人可以带着入门的,事实上,这也是老板不放羊的最大的好处。你需要做的,就是在前辈的带领下,快速地从一个小方向切入进去,然后慢慢地自己开始发现新天地。
  3. 最开始的时候阅读论文,最好能细致一点,把论文之间的引用关系理清楚,把近几年的发展脉络理清楚。我当年开始第一个工作的时候,就是把我论文需要引用的二十多篇论文的主要思想、方法都写了下来,把引用关系画成了一个DAG图。当你入门之后,你需要有快速阅读一篇文章并掌握其核心贡献点的能力,而不要再花费很多时间来标注。
  4. 如果你不会设计实验/写论文,请模仿和你的工作最相关的论文。把他们的论文好好读几遍,从结构到段落到句子都可以模仿。我当年的第一篇论文,我的老板就说我写的不错,其实我也是吃透并模仿了好几篇参考文献而已。
  5. 写论文的时候切记:逻辑第一!这种逻辑是贯穿全文的,段落层面的逻辑、句子层面的逻辑、甚至一句话里的逻辑,都是非常关键的。一篇好的论文要循循善诱,有理有据,让人读起来不要废太多脑子,就觉得你说的很有道理。这里面要着重注意各种句子层面的关系:转折、因果、递进等。一句话可以有无数种表达方式,你要做的就是在脑子里把各种方式过滤一遍,选择最流畅的那一种。
  6. 在研究生学术生涯中,导师不是最关键的,最关键的是你的目标、决心和努力。一名合格的研究生,应该是全栈研究生,也就是阅读参考文献,想idea,修正idea,设计实验,跑实验,写论文,修改论文,做presentation,这一整条技术栈你都要可以独立进行。如果你缺失了任何一个环节,你都会受制于你的导师。这个问题下的回答已经非常多了,大道理你也都看过,也都明白,问题是,你是否真的做到了背水一战的决心和努力?

二、回答

1.多看专业领域顶刊,而不是综合性顶刊。就我的阅读体验来讲,我们研究领域Nature或Science上的期刊偏综合和概述,对研究的启发性远远没有PRL的启发性大。

2.有问题,找最专业的科学家和最专业的论坛。我通过researchgate联系到了领域很多厉害的科学家,跟他们有些学术上的合作,获益匪浅。

3.避免无意义的学术会议。我参加过的国际国内会议大多数都很垃圾,很多都是浪费时间,如果当做散心旅游倒是不错的选择。

4.保持开放的心态,多跟周边的同学师兄弟交流,可能会产生好的idea。5.不要玻璃心,被人指正错误,或者被期刊拒稿都是很常见的,虚心接受建议并及时改正,寻求新的突破。

三、

毕业有论文要求,但老板帮助不大(如研究方向不同或忙于行政事务)
虽然毕业无论文要求,但希望通过发表论文来提升自己的职场竞争力(尤其是特定学科)
希望通过做研究和发表来争取国外的博士机会(论文已经是某些学科的申请必备品)
我们可以把问题简化为:如何「独立」在1-2年的时间中做出可发表的科研成果。如果可能,最好在高水平的会议或期刊上发表文章。此处的独立更多指的是没有导师或资深研究员指导,但我依然建议尽可能与其他小伙伴合作讨论、互相鼓励,比如朋友同学,甚至是知乎上认识的网友,原因见后文。在明确了主题后,我们就可以把问题继续分解为三个子问题:
如何选题
如何研究,
如何投稿。
1.如何选题
选择适合的研究方向是成功的一半,不要单纯因为兴趣而选定研究方向。因为要做独立研究,首先要避开所有重器材的方向,比如做深度学习你作为个人是刷不过集团军的你没有那么多计算资源。同理,粒子对撞啊、高能物理、基因测序这类实验性研究都不适合独立研究,所以本文更适合轻资源学科的同学参考(如计算机科学中的特定方向、应用数学等)。

第二点就是选择适合自己的方向。
大部分基础学科如数学、物理等都需要多年的知识积累以及导师指导,因为导师的轻轻一点就可以省掉了数天甚至数个月的瞎想因此尽量选择一些参考材料丰富,个人知识积累较多,且容易入门的方向。以计算机领域为例,大部分理论性的方向都很难啃做系统也很难(周期很长)。所以要想能做的动的话,建议选择应用型和交叉型方向。比如A算法在B领域的应用,如何将C算法改良后应用于D问题上。类似的包括“推荐系统在xx方向上的应用”“用xxx算法来解决推荐系统中的xxx题”。尤其对于编程能力很强的朋友来说,复现经典算法的过程中就很容易想到新的点子。

选题的第三点就是要读几篇该领域的经典文章,试试水深。
换句话说,就是看看自己能不能大概读懂,知识的空缺有多大,离能够独立成文还有多远。如果某一领域的文章都有大量的公式推导且你的数学功底有限,那么就不建议选择这类方向读综述文章一般也是个很好的思路,这样可以快速看到领域的边界,也有助于缩小选题范围。

当然,兴趣依然是一切的源头,也是能不断激励你的后盾。总结来看,选题是一个平衡过程,是硬件资源+知识背景+个人兴趣的综合后的产物。其中任意一项如果是绝对短板的话,就很容易影响最后的产出。综合要选择一个自己有兴趣,有一定的相关知识,资源要求不高,且写作水平和领域论文不会相差太远的方向。

2.如何研究
当我们有了一个适当的选题后,应该先读该领域的经典教科书或者综述文章,比如推荐系统就读推不荐系统的入门教科书。教科书的定义是由外国大家写的科研导向的教科书,不是那种“30天包会个大Python。这类书的特点都是作者对领域有很深的把握,而且提供了足够多的文献供你独立思考和拓展。我个人的经验是:

一边读一边记下自己天马行空的点子,先不用想是否成熟,记下来再说。
大行一边读一边看能不能和其他领域结合,比如用集成学或是 graph mining做推荐系统
一边读一边缩小自己的选题范围,通过阅读了解自己更擅长在哪个(章节)主题上发力大部分教科书都是分章节介绍内容,而章节在一定程度上前后独立。因此你可以着重挑自己读着有趣的内容深入了解。假设我们现在确定了一个小主题:“如何利用「集成学习来提升「推荐系统」的「鲁棒性」 那么找到新的方向其实并不难,你需要:
找到该领域常用的数据集(benchmark datasets)
找到其他基线算法的实现(baseline algorithm implementation),一般在 GitHub上搜索算法名就可以。可以找最近的相关论文的 related works来追踪领域进展。
找一本集成学习的教科书
第一步就是重现基准算法在常用数据集上的表现,这个将会是进行研究的重要参照物。如果某些基准算法没有现成的实现,你可以尝试着动手写一个-实现算法的过程。往往就是找灵感改进的过程等以上步骤做完后,你就可以考虑如何用集成学习来改进推荐系统。这个时候就可以参考集成学习教科书,分析不同算法的优劣,找到哪些方法有助于提高鲁棒性再,应用到推荐系统上去。跨领域交叉往往比在特定领域创新要容易,这个思路特别适合独立研究者。

3.如何投稿
首先一般投稿有期刊和会议,期刊一般内容更加完善,但会议一般更加前沿,不同领域在意的不同。期刊一般是单盲(即审稿人知道你的身份,而你不知道谁是审稿人)。会议可能是单盲、双盲甚至三盲(比如CDM)。考虑到独立研究没有老板的背书,那么尽量避开单的投稿,因为你可能会从中吃亏。

第二点就是考虑审稿周期,大部分会议的审稿都在-3个月内,而大部分期刊的第一轮意见都需要3个月以上才会出现。所以时间敏感的话,建议优先投会议,而非期刊。另一个常见的操作是会议论文在发表后经过扩展(>30%)的新内容再重投期刊,可以同时兼顾时效性和完整性。

选择投稿渠道也是对于新手非常不友好的环节,建议多问问周围的资深人士新手投稿,尤其是独立研究我一般会推荐投1)主会短文(short paper)2)专题研讨会论文(workshop paper)

如果非要投长文,建议把档次选的低一些。比如计算机领域的独立研究者第一次投稿可以选择CF推荐的C类会议长文,或者A或者B类会议短文或者研讨会。般来说从难度上看,长文短文>研讨会。切勿一上来就想搞个大新闻,一举拿个A会长文,99.99%的情况下新手独立写稿是没希望的。

这一切的前提都是你的英文足够好,这点是一切的前提。而写作思路可以参考刘知远老师的「刘知远:如何写一篇合格的NLP论文」和刀熊说说:怎样构建有条理的学术论文?。最佳情况还是要和别人合作,即使他们和你一样是新手也没关系,毕竟是人多力量大,心理上有个依靠还有一点就是新手独立发文,在单盲的情况下更容易被拒稿,增加1-2个共同作者有助于减轻这种偏见,原因非常明显就不赘述了。论文被拒稿是很常见的事情,为独立新手就更无法避免了,我建议大家好好读读「李丁:论文被拒之后该干嘛」,从中学习如何根据审稿建议不断修正和改进自己的文章。

4.总结
理论上只要你方向选的合适,自身条件尚可,在坚不懈的实验、写作、投稿、被拒、修改、重投后,总能慢慢走上正轨。如果幸运的话,说不定还能在你的研究小领域打开一点局面,有一点知名度。

独立研究最大的成就感来自于「独立」,在这个过程中,你会不断的怀疑自己甚至否定自己,这也是为什么我建议大家能有人一起同行。但当你有所推进时,比如发出了第一篇不错的文章,你会非常激动。因为你完成了自己的博士入门训练,避开了民科式科研,在艰苦的环境中打开了一片局面,甚至还微微推动了科学发展。这比发表论文本身更有意义,你应该为自己感到自豪。

这是锻炼或检验是否有独立研究能力的一个科研过程。简单的说,我推荐的思路是:

脑中先存个思维,毕竟思维大于方法和技巧啊。这个思维就是首先要了解一个好的科研想法所具备的关键要素:创新、重要、具体、完整、(有趣)、落地且喜欢。
对于被放羊的孩子,只能默默地开始调研文献了。不然,导师直接给个好想法,瞬间变高大上。调研从哪开始?当然是理解基本概念开始,最好的途径就是经典教材,英文一般的同学那就先看中文教材,再英文教材。之后再阅读英文综述类论文和学位论文,这样基本的研究大方向就有了,接下去就是期刊论文,也不要忘记国际会议论文,特别是主题发言的大牛,经常会总结过去,把脉现在,预测未来。
阅读论文时,先不急,先来个筛选和整理论文,挑出高度相关和质量高的论文,find out “wow” research paper,分类归档,精读他们,再加上一些泛读。阅读时,首先理解内容,其次理清作者的研究思路,最后消化成自己的东西,为我所用。
记笔记的重要性就不要多说了,关键是用自己话提问、记录、思考、质疑、总结和提炼想法。
阅读的速度也是关键的,但是理解是第一位的,先把高水平的密切相关的论文读个稀巴烂,练好基本功,后面长进特别快。
最后祝各位被放羊娃整出天才科研想法。

原创文章 101 获赞 9 访问量 8370

猜你喜欢

转载自blog.csdn.net/weixin_44523062/article/details/106045696