生信基础(三)——统计分析工具R语言

原创: hxj7

关键词:R; 统计; 美图

作为一个生信er,光会处理文本数据是不够的,还要能进行统计分析。作为一个开源软件,R在统计社区“大行其道”,在生信分析人员中更是“一家独大”。为啥?因为R语言就是一群统计学家开发的,统计函数齐全,新的统计方法很快就会有相应的包被开发出来。复杂的统计分析往往两三行代码就可以完成,那个方便呦,谁用谁知道!

(不过,也有许多学计算机专业出身的同学很不喜欢R,各种不顺眼…。比如,R的数组下标是从1开始的,而诸如C、Python等语言都是从0开始,光这一点就让他们抓狂。他们迫不及待地就去拥抱numpy、pandas了!)

在这里插入图片描述
图1:lm函数进行线形回归分析,一行代码即可实现

那如何学习R呢?方法很多,我个人是看着《R语言实战》这本书自学的。相信很多生信人都知道它,诚如作者在书中说,当时国内R语言的资料很少,许多想学习R语言的人都备受煎熬。以至于这本书一问世,便广受好评(像不像做广告的~)

在这里插入图片描述
图2:《R语言实战 第二版》

上面讲了那么多,还有一点不得不提。其实R为众多行业的人广泛接受,不止因为它强大而便捷的统计分析功能,还因为用R可以轻松画出专业而精美的图片(外貌协会的人有福了)。我认识的一些学经济、金融的同学都是R的高手,据他们说,商业报表中的很多精美图片都是用R做出来的。另外,正如黄小仙童鞋《我是如何“被逼无奈”开始学R的》一文中所展示的那样,生物学文献中统计结果的图大部分都是用R画出来的。R,就是集美貌与才华于一身的翩翩少年!

在这里插入图片描述
图3:R可以轻松画出基因表达的箱线图

至此,“生信基础”系列就告一段落了。简单来说,生信人员常用的三种语言Shell、Python/Perl、R最好都能熟练掌握。无论以后的工作内容/研究方向是什么,这三种语言都是基础。比如,现在很火的机器学习,其在生信领域也是应用广泛。不同于很多计算机专业的人选择用Python/C++来实现机器学习算法,你会发现生信人更多地用R来进行机器学习算法分析。如果你已经掌握了Python或者R,那么入门机器学习的时候在编程语言这一关你会少了很多阻碍。

下一篇我会分享一下生信工作中会遇到的一些琐碎但又很重要的事情。咱们下期再见!

公众号:生信了
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/biocity/article/details/83152072