R 3.31 数据框

  • 数据框是一种表格式的数据结构。数据框旨在模型数据集,与其他统计软件列如SAS或者SPSS中的数据集概念一致。
  • 数据集通常是由数据构成的一个矩形数组,行表示观测,列表示变量。不同的行业对于数据集的行和列叫法不同。
  • 数据框实际上是一个列表。列表中的元素是向量,这些向量构成数据框的列,每一列必须具有相同的长度,所有数据框是矩形结构,而且数据框的列必须命名。
  • 数据框形状上很像矩阵,其实是比较规则的列表,数据框的每一列必须为同一2类型,每一行可以不同
  • 数据框通过data.frame函数来创建
  • 数据框的访问
    同样用[]来进行索引,索引输出的包括行名和列名
    添加“-”索引代表去掉这部分内容,利用行和列的名字也可以对应取出
    data.frame的名字[,“列名”]注意加逗号
    data.frame的名字[“行名”,]
    也可用$符号取出
    eg用R中的内置数据集women进行访问并绘制plot图
women
plot(women$height,women$weight)

用lm进行线性回归的时候给出列名即可
eg

lm(weight~height,data=women)

如果一次访问多列用$符访问也比较麻烦
用attach绑定数据之后直接可在命令框输入列名不用 $符即可,使用完数据框要用detach函数解绑数据
同样with函数也可以完成相同的结果,无需 $符,直接敲列名
eg

with(women,{height})

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/m0_46445293/article/details/105218735