本章内容
探索数据结构/输入数据/导入数据/标注数据
数据集通常格式:
【矩阵】行为观测值,列为变量的
个人觉得你得看好 比如scan是按行读的,这个时候就变成行是变量,列是观测值了
R存储的对象类型有标量/向量/矩阵/数组/数据框(main)/列表,接下来一一介绍
如下:
##标量
c<-1 #可以是数字,‘a’字符,TRUE等
##向量
example1<-c(1,2,3,4) #可以是数字,‘a’字符,TRUE等
example1[c(2,4)] #访问第二个和第四个 和pthon语言的数字不一样哦 [2:4]表示连续取
##矩阵的创建
myymatrix<-matrix(vector,nrow,ncol,byrow=TRUE,dimnames=list(rownames,colnames)) #byrow=TRUE表示按列填充 即默认格式 row是行,col是列
##关于names:
rnames<-c(、、、)
cnames<-c(、、、)
##然后在创建矩阵的时候令dimnames=它们(dimension names缩写)
##注意第一个 vector可以先:
vector<-c(、、、) #然后在创建的时候直接代入就行
矩阵下标的操作直接上图
然后让我们继续:
##数组 (跟矩阵类似,但是它可以是三维或更多维的)
z<-array(series,c(n1,n2,n3,....),dimnames=list(dim1,dim2,dim3,...))
#经历过矩阵,这些应该比较熟悉 就是它每一维的n都可以不同,不过排列方式呢?看图吧
显然,顺序优先级是1-2-3
下标的用法和矩阵一摸一样,就不举例了。
## 数据框 数据存在多种模式(数值型/字符型)
# 矩阵/数组要求数据只能有一种类型(否则会全部识别成字符型“1”)
##数据框的创建:
mydata<-data.frame(col1,col2,col3,...) #此时每一列的名称是col1,col2...
如图
数据的拿取:
games[a,b] #这种方式和矩阵数组相似
只弄一个,没逗号 默认对列操作,其余相似 不举例了
##输出特定列的信息
games[c('names','age')]
games$age
#列联表
这样有点麻烦有没有 下一页讲代码的简化方法