DuangDuangDuangDuang
今天上午见了韩先生,心情很帅气٩(๑>◡<๑)۶
R语言最常用的语言包:
下载语言包现在掌握了两种,更喜欢在编辑栏里输入install.packages(),需要用程序包之前要调用它library()然后运行就可以使用里面的函数liao。!!!R语言区分大小写。
数据可视化
ggplot2最常用的作图工具,作图美观漂亮,更能涵盖很多复杂的信息。
lattice与ggplot2可以相提并论,虽然ggplot2作图漂亮但入门比较难,lattice更适合新手使用,作图速度比较快可以制作3维图。
gridExtra可以把几张图合并在一张图里制作,而ggplot2不具备这个功能。
统计分析
forecast 适合分析时间序列数据
spatstat 适合空间分析,eg某病毒发病率在地理空间上的分布特征等
zoo 在forecast中有很多好用的内置函数但有时候需要更简单易行的计算移动平均、移动标准差的函数,now zoo就是一个非常好的补充。
lme4 或 nlme 如果需要做一些复杂的数据,实验分了好几个层,有好多亚组,亚组下面还有亚亚组,eg要做好几种细胞,检测好几个指标每个指标有不同的观察时间点…可以用这两个包其中之一即可将复杂的数据轻松的组织起来。(在药物临床实验中,一般一个临床试验都会有个最主要的研究目标,围绕这个中心问题会收集很多资料,利用其中资料也能得出一些有意义的结论,但不是主要的研究目标,这些次要研究称为亚组研究,其涉及的资料称为亚组。)
数据整理
dplyr 可以很好地把数据随意分解、整合,但这个包会比较难上手。但熟悉后会形成成本。
生物信息学
Bioconductor 对于做基因组或芯片分析,陈列,基因流等是个很好地选择。它还有个很活跃的用户社区,可获得及时的反馈,每年更新两次,还有丰富的学习资源,eg http://www.bioconductor.org/help/course-materials/这里的一系列教程
展示
虽然数据可视化也是展示的一种但接下来介绍的是通过更丰富的方式展现其他多内容。
knitr 除了分析成果,还有分析过程中的代码,运行过程,文本说明等,都可以通过knitr生成网页,幻灯片,pdf等形式展示出来。适合教学,报告等场合。
shiny 和knitr一样可以做出漂亮的网页,此外还可以快速搭建动态的交互网页App。它最大的优势就是不需要学习其他编程语言(css js等)纯靠R。
stringr 字符串处理神器。可在作图,网页编辑,数据清洗等操作中起到很好地辅助作用,对字符串进行拼接、匹配、交换等。(数据清洗是指发现并纠正 数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。)
以上
以上是一些我查到比较常用的包,尤其是ggplot2、lattice、dplyr。在写代码的时候还要用到一些函数不在你安装的包里,而且还不知道在哪个包,这时要在help里搜索,一些不明包的函数也可以在这里搜索不过英文需要过硬的基础。返回的结果中看到“一串字母::你搜索的函数”前面的那串字母就是包的名字了。下载安装即可使用。
数据的R语言表示-数据框
数据框是一种矩阵形式的数据但数据框中各列可以是不同类型的数据。数据框录入的限制条件:
- 分量必须是向量(数值,字符,逻辑)、因子、数值矩阵、列表或者其他数据框。
- 矩阵、列表和数据为新的数据框提供了尽可能多的变量,因为它们各自拥有列、元素或者变量。
- 数值向量、逻辑值、因子保持原有格式,而字符向量会被强制转换成因子并且它的水平就是向量中出现的独立值。
- 在数据框中以变量形式出现的向量长度必须一致,矩阵结构必须有一样的行数。
eg:
由x1和x2构建数据框
X=data.frame(x1,x2) 还可以赋予数据框新的列标签
X=data.frame(‘身高’=x1,‘体重’=x2)
多元数据R语言调用
- 选择需要进行计算的数据块,拷贝,在R中使用dat<-read.table(’‘clipboard’’,header=T)
- 读取名为data的txt格式文档X=read.table(‘data.txt’,header=T)当第一行作为标题时。
- 读取CSV格式的文档X=read.csv(‘data.csv’)
- 读取Excel格式,先下载读取Excel文件的包“readxl”,调用包:library(readxl),最后读取文件:X=read_excel(“data.xls”)
多元数据简单的R语言分析
- 直方图 hist()
- 散点图 plot()
- 显示数据前几行 head(X)
- 绑定数据 attach(X)
- 一维列联表 table(想要了解的数据列的数据名称)
- 条形图 barplot(table(),col=1:7)col=1:7 7种颜色,根据数据个数设置
- 饼图 pie(table())
- 以某指标分组的某指标条图 barplot(table(指标1,指标2),beside=T,col=指标1 1:指标1个数)
- 以指标1、2排列的指标3频数三维列联表 ftable(指标1,指标2,指标3)注:括号中顺序
- 解除绑定 detach(X) 当数据框不使用时一定要解绑数据框。