【R 语言】对R语言初步的认识

[本节内容]

1.认识R语言
2.用R语言查看当前工作空间,并进行修改
3.对R 数据结构的基本操作
4.关于数据的导入和导出

1.认识R语言

R语言是一种统计绘图语言,也指实现该语言的软件。
在这里插入图片描述

1.1 R的特点

1.多领域的统计资源(涵盖了多种行业数据分析中几乎所有的方法)
2.跨平台(R可在多种操作系统下进行,如Windows,MacOS,多种Linux,UNIX等)
3.命令行驱动(R即时解释,输入命令即有相应的结果)
4.扩展性良好(十分方便编写函数和程序包)
5.GNU软件(免费、软件本身及程序包的源代码公开)

1.2 R的缺点

1.用户需要对命令很熟悉
2.所有的数据处理都在内存上进行,占用内存较大
3.因为即时编译,所以运行速度稍慢
4.不过相对鼠标点击进行操作,R仍能大大提高效率

1.3 程序说明

1.“#”为注释符号,它后面的一切命令都不执行,知识为了增强程序的可读性。
2.“<-”为赋值符号,相当于“=”
3.c()为连接函数,其内部数据表示向量。 x1<-c()表示用一组数据为变量赋值
4.mean()表示均值函数

# 例:计算六个数的平均数
> x1<-c(2,6,54,34,12,78)
> ave<-mean(x1)
> ave
[1] 31

2.查看当前工作空间并修改

2.1 查看—— getwd()函数
> # 查看当前工作空间
> getwd()
[1] "C:/Users/lenovo/Documents"
> 
2.2 修改 —— setwd(已存在的新路径)函数
> # 修改工作空间
> setwd("D:/R_Files")
> getwd()
[1] "D:/R_Files"
> 

3.对R数据结构的基本操作

3.1 基本运算

加(+)减(-)乘(*)除(/)乘方(^)整除(%/%)余除(%%)
运算优先级:先乘方,再乘除,最后加减
注意:如果一行无法全部输入可敲enter进入第二行,R会主动用+;
也可以在同一行输入多条命令,只要用 ;隔开即可

# 例
> 4+2
[1] 6
> 5/3
[1] 1.666667
> 5%/%3
[1] 1
> 5%%3
[1] 2
> 2^5
[1] 32
> 6/2;8/7
[1] 3
[1] 1.142857
> 1+2+
+ 3
[1] 6
>
3.2 函数运算

在这里插入图片描述

在这里插入图片描述

3.3 逻辑运算

在这里插入图片描述
返回值只有两种:“TRUE”真,“FALSE”假
在这里插入图片描述

3.4 数据对象

1. 数据对象的类型:
数值型:整数,浮点型
逻辑型:TRUE(T),FALSE(F)
字符型:用双引号“”或者单引号‘’引用
复数型:a+bi
原味型:即数据以二进制保存
2.判别与转换数据对象的函数

在这里插入图片描述
在这里插入图片描述

3.5 向量赋值
  1. 通过c()连接函数为变量赋值
  2. assign()为变量赋值
  3. 使用c()连接变量
    在这里插入图片描述
3.6 产生有规律向量

1.等间隔函数 seq()函数
其中参数,from 起始;to 终点;by 变化数值;length.out 间隔函数数值;along.with 等间隔函数与向量长度相同
若间隔为1,可直接通过输入 x<-1:10 ; x 得到间隔为1的等差数列
在这里插入图片描述
2.重复函数 rep()函数
其中参数,times 重复次数;length.out 重复后构成的向量长度;each 每个分量的长度
在这里插入图片描述
3.逻辑向量 只有TRUE和FALSE两种值
all() 判断是否所有向量都为真
any() 判断是否有一个向量为真
which() 判断哪些向量符合条件
logical() 初始化逻辑向量
在这里插入图片描述
4. 缺失数据 NA
is.na() 检测向量是否存在缺失数据(NA)
在这里插入图片描述
5. 字符型向量
paste() 可以将多个对象黏贴在一起
在这里插入图片描述
strsplit() 切割函数
noquote() 去掉字符型变量中的引号在这里插入图片描述
6.数值向量
最大值 最小值 范围

在这里插入图片描述
求和 求积
在这里插入图片描述
中位数 均值 方差 标准差 排序
在这里插入图片描述

3.7 矩阵

矩阵的创建 matrix()函数
其中,vector包含了矩阵的元素, nrow和ncol用以指定行和列的维数,dimnames包含了可选的、以字符型向量表示的行名和列名。选项byrow则表明矩阵应当按行填充(byrow=TRUE) 还是按列填充(byrow=FALSE) ,默认情况下按列填充。
例1:
1)创建一个6*5的矩阵mymatrix,按照1到30的等差数列填充该矩阵,行名称为“row1”、“row2”、……、“row5”、“row6”,列名称为“col1”、“col2”、……、“col4”、“col5”,要求按行填充;
在这里插入图片描述
2) 将该矩阵转为向量vector;
在这里插入图片描述
例2:
1)将表中的病例数据存储为数据框patientdata;
在这里插入图片描述
在这里插入图片描述

2) 将类别型变量diabetes和status分别指定为一个普通因子和一个有序型因子;
3) 使用函数str(object)显示该数据框的结构信息;
在这里插入图片描述
4) 使用summary(object)显示该数据框的统计概要;
在这里插入图片描述
例3:
1)创建一个列表list,列表标题为“My First List”,还包括mymatrix、vector、patientdata的组合,输出整个列表list。
在这里插入图片描述
例4:数据库的导入和导出
1) 将数据框patientdata分别保存为patientdata1.txt格式、patientdata2.csv格式和patientdata3.xlsx格式文件;
在这里插入图片描述
2) 将上一步所获得的三个文件导入保存在数据框mydataframe1、mydataframe2和mydataframe3中。
在这里插入图片描述
其他学习,之后会更新,别忘了关注我的博客哟~

猜你喜欢

转载自blog.csdn.net/ly_6699/article/details/88237614
R
R: