一、 数据框的构成
数据框是一种矩阵形式的数据,但是数据框中的各列可以是不同类型的数据。
数据框每一列是一个变量,每一行是一个观测。
1、R中使用data.frame()函数构建数据框
(1)由x1、x2构建数据框
x1=c(171,175,159,155,152,160)
x2=c(57,64,41,38,35,40)
X = data.frame(x1,x2)
print(X)
(2)给数据框的列命名
Y = data.frame('身高' = x1,'体重' = x2)
print(Y)
二、数据框的组成
1、R中使用rbind()将两个或两个以上的向量、矩阵或数据框按行合并起来形成新的数据框
print(rbind(x1,x2))
2、R中使用cbind()将两个或两个以上的向量、矩阵或数据框按列合并起来形成新的数据框
print(cbind(x1,x2))
3、R中使用head()和tail()函数按行显示
①R中使用head()函数显示数据的前几行(默认六行)数据
head(X)
②R中使用tail()函数显示数据的后几行(默认六行)数据
tail(X,3)
三、数据框的应用
对数据框,通常使用应用函数**apply()**对行列进行统计计算:
apply(X,MARGIN,FUN)
其中:
X为数据框或者矩阵
MARGIN用来指定是对行还是对列进行操作运算,MARGIN=1表示对行,MARGIN=2表示对列
FUN用来指定运算函数
1、求和
X_R = apply(X,1,sum)
print(X_S)
2、按列求和
X_C = apply(X,2,sum)
print(X_C)
cbind(X,'行的和'= X_R)