R_基础_01

R语言介绍:R是一种区分大小写的解释型语言。R中有多种数据类型,包括向量、矩阵、数据框(与数据集类似)以及列表(各种对象的集合),广泛用于数据统计。

R的特点:一次交互式会话期间的所有数据对象都被保存在内存中。一些基本函数是默认直接可用的,而其他高级函数则包含于按需加载的程序包中。R语句由函数和赋值构成。R使用<-,而不是传统的=作为赋值符号。路径使用“\”反斜杠。

输入:source("filename")输入一个脚本文件;

文本输出:函数sink("filename")将输出重定向到文件filename中。默认情况下,如果文件已经存在,则它的内容将被覆盖。使用参数append=TRUE可以将文本追加到文件后,而不是覆盖它。参数split=TRUE可将输出同时发送到屏幕和输出文件中。不加参数调用命令sink()将仅向屏幕返回输出结果。

图像输出:

bmp("filename.bmp")     BMP 文件
jpeg("filename.jpg")       JPEG 文件
pdf("filename.pdf")      PDF 文件
png("filename.png")         PNG 文件
postscript("filename.ps")    PostScript 文件
svg("filename.svg")         SVG 文件
win.metafile("filename.wmf")  Windows 图元文件

包介绍:下载地址:http://cran.r-project.org/web/packages

  install.packages() 列出CRAN镜像站点可用的所有

  install.packages("packages_name")

  installed.packages()列出已经安装的包

  update.package()更新包

  library("packages_name")包的载入

  help(package="package_name")包内容描述

 数据集:数据集通常是由数据构成的一个矩形数组,行表示观测,列表示变量。不同的行业对于数据集的行和列叫法不同。统计学家称它们为观测(observation)和变量(variable),数据库分析师则称其为记录(record)和字段(field),数据挖掘和机器学习学科的研究者则把它们叫作示例(example)和属性(attribute)。

向量:向量是用于存储数值型、字符型或逻辑型数据的一维数组。执行组合功能的函数c()可用来创建向量。

矩阵:矩阵是一个二维数组,只是每个元素都拥有相同的模式(数值型、字符型或逻辑型)。可通过函数matrix()创建矩阵。

      myymatrix <- matrix(vector, nrow=number_of_rows, ncol=number_of_columns,byrow=logical_value, dimnames=list(char_vector_rownames, char_vector_colnames))

      其中vector包含了矩阵的元素,nrow和ncol用以指定行和列的维数,dimnames包含了可选的、以字符型向量表示的行名和列名。选项byrow则表明矩阵应当按行填充(byrow=TRUE)

      还是按列填充(byrow=FALSE),默认情况下按列填充。

 数组(array):数组与矩阵类似,但是维度可以大于2。数组可通过array函数创建,

      形式如下:myarray <- array(vector, dimensions, dimnames)

      其中vector包含了数组中的数据,dimensions是一个数值型向量,给出了各个维度下标的最大值,而dimnames是可选的、各维度名称标签的列表。

数据框:数据框每一列可以保存不同类型的值,可通过函数data.frame()创建:

      mydata <- data.frame(col1, col2, col3,...)其中的列向量col1、col2、col3等可为任何类型(如字符型、数值型或逻辑型)。每一列的名称可由函数names指定。

attach():将数据框添加到R的搜索路径中:detach():将数据框从搜索路径中移除:with()把所有的操作都限制在数据框中,即你进行赋值等操作都是在局部变量,若要用全局变量,使用<<- 代替<-

因子:变量可归结为名义型(列名)、有序型(生病的病情)或连续型变量(年龄)。名义型变量是没有顺序之分的类别变量。类别(名义型)变量和有序类别(有序型)变量在R中称为因子(factor);而使用函数factor(),可将所操作向量变为名义型或者有序型因子(需加入参数,order=TRUE)。

列表(list):列表是R的数据类型中最为复杂的一种。一般来说,列表就是一些对象(或成分,component)的有序集合。列表允许你整合若干(可能无关的)对象到单个对象名下。

      表达形式:mylist <- list(name1=object1, name2=object2, ...)

相关代码实践,参考 传送门

猜你喜欢

转载自www.cnblogs.com/hazy-star/p/9426945.html