R语言中矩阵matrix和数据框data.frame的使用

R语言中矩阵matrix和数据框data.frame的使用

"一,矩阵matrix"

"创建向量"
x_1=c(1,2,3)
x_1=c(1:3)
x_2=1:3
typeof(x_1)==typeof(x_2)#查看目标类型
x_3=seq(1,6,length=3)#将1——6分为3个数

a<-rep(1:3,each=3)  #1到3依次重复
c<-rep(1:3,times=3)   #1到3重复3次
d<-seq(from=3,to=12,by=3)  #3为起点12为终点,步长为3
e<-seq(from=3,to=12,length=3.5) #3为起点,12为终点,个数


"创建矩阵"
x_1=matrix(1:10,nrow = 5,ncol = 2,byrow = FALSE,dimnames = list(c('a','b','c','d','e'),c('一','二')))
#data参数输入的为矩阵的元素,不能为空;nrow参数输入的是矩阵的行数,默认为1;ncol参数输入的是矩阵的列数,默认为1;
#byrow参数控制矩阵元素的排列方式,TRUE表示按行排列,FALSE表示按列排列,默认为FALSE;dimnames参数输入矩阵的行名和列名,可以不输入,系统默认为NULL。
x_1=matrix(1:10,nrow = 5,ncol = 2,byrow = TRUE,dimnames = list(c('a','b','c','d','e'),c('一','二')))
#byrow = TRUE会使得矩阵元素按照行顺序向下排列

#行列名称
rownames(x_1)#查看行名称
colnames(x_1)#查看列名称
rownames(x_1)=c('A','B','C','D','E')#改变行名称
colnames(x_1)=c('第一','第二')#改变列名称

#矩阵维度
dim(x_1)#查看矩阵维度(行数,列数)
dim(x_1)=c(2,5)#改变原矩阵维度
ncol(x_1)#返回列数
nrow(x_1)#返回行数

#元素获取
x_1[8]=0#对第八个元素重新赋值
x_1[1,2]
x_1[1,2]=7#对第1行第2列元素重新赋值
x_1[1,]
x_1[,2]
x_1[,'一']
x_1['a',]
x_1[c('a','b'),]
x_1[,c('一','二')]
x_1[c('b':'d')]


"二,Data.Frame"
#1.创建数据框
data_=data.frame(a=c(1,2,3,4),b=c('jack','bob','dali','smith'),c=c('boy'
  ,'girl','girl','boy'),e=c('2010-12-04','2011-03-23','2009-08-09','2010-09-1'))#通过直接输入行列创建数据框

#2.行列操作
names(data_)#查看列名
rownames(data_)#查看行名
names(data_)=c('A','B','C','D')#修改列名
rownames(data_)=data_$B#将B列作为行名

data_$d=c(545,6323,345,454)#添加新列
within(data_,{
    
    f=c(12,22,32,42)})#使用within添加新列

#3.访问元素
data_[1,]#查看第一行
data_[,2]#查看第二列
data_[3]#方位第三列
data_[2,3]#访问第二行三列

data_['a']#访问‘a’列
data_[['a']]#访问'a'列
data_[c('a')]#访问‘a’列
data_[c('a','b')]#访问‘a’‘b’列
data_[,c(1:3)]#访问1到3列

data_[c(1:3),c(1:2)]#访问1到3行,1到2列
data_[c(2:dim(data_)[1]),]

data_$b
with(data_,{
    
    print(data_$b)})#使用with函数打开b列

#4.条件访问元素
data_[which(data_$c=='boy')]#选出c列为boy的数据
data_$f=c(234,452,234,657)
data_[data_$f>200]#选出f列大于200的数据
subset(data_,data_$c=='boy'&data_$f>200)#选出c为boy且f大于200的数据


#5.基本操作
dim(data_)#查看维度(行,列)
typeof(data_)
str(data_)#查看各列数据类型
Sys.Date()#获得当前日期
format(Sys.Date(),'%Y-%m')#获得当前年份和月份

as.integer('2')#修改为整数型
toString(4)#修改为字符串

#6.修改数据类型
data_$e=as.Date(data$e)
data_$b=as.character(data_$b)
data_=data.frame(c('2','3','4'))
as.integer(data_[2,1])+as.integer(data_[3,1])
typeof(data_[1,1])
mode(data_)
class(data_)

#7.删除数据
data_[,-1]#删除第一列

#8.数据框组合拼接
data_1=data.frame(a=c(1,2,3),b=c('一','二','三'),c=c('one','two','three'))
data_2=data.frame(a=c(2,3,1),d=c('fjsk','fjs','jslf'),e=c(34,43,23))
data__=merge(data_1,data_2)#按照某一列元素拼接

data_1=data.frame(name=c('hia','ful','bob'),gender=c('boy','girl','girl'))
data_2=data.frame(name=c('ds','gui','sds'),gender=c('girl','boy','boy'))
data__=rbind(data_1,data_2)#上下拼接
data__=cbind(t(data_1),t(data_2))#左右拼接

#9.删除无效na值
na.omit(data)#将数据框当中拥有无效值NA的那一行全部删除

#10.序列排序
data=data.frame(a=rnorm(30,4,5),b=rnorm(30,2,43),c=rnorm(30,-9,34))
data[order(data$a,decreasing = TRUE),]#将a列数据降序排序
data[order(data$a,data$b,decreasing = TRUE),]#先将a列数据降序排序,再将其中b列数据降序排序

猜你喜欢

转载自blog.csdn.net/weixin_45590329/article/details/106159351