R语言数据集取子集 - 代码天地

R语言数据集取子集

编程语言 2018-11-10 16:34:40 阅读次数: 0

保留变量：

>newdata<-leadership[,c(6:10)]

或者

> myvars<-c("item1","item2","item3","item4","item5")
> newdata<-leadership[myvars]

丢弃变量：

> myvars<-names(leadership)%in%c("item3","item4")
> newdata<-leadership[!myvars]
> newdata
  managerID testDate country gender age item1 item2 item5 agecat
1         1 10/24/08      US      M  32     5     4     5  Young
2         2 10/28/08      US      F  45     3     5     5  Young
3         3  10/1/08      UK      F  26     3     5     2  Young
4         4 10/12/08      UK      M  39     3     3    NA  Young
5         5   5/1/09      UK      F  NA     2     2     1   <NA>

或者

> newdata<-leadership[c(-8,-9)]

选入观测：

> newdata<-leadership[1:3,]
//选择第一行到第三行观测

> newdata<-leadership[which(leadership$gender=="M"&leadership$age>30),]
//选择了所有30岁以上的男性

使用subset()函数：

> newdata<-subset(leadership,age>=35|age<24,select=c(item1,item2,item3,item4))
//选择了所有age值大于等于35或age值小于24的行，保留了变量item1到item4。

> newdata<-subset(leadership,gender=="M"&age>25,select=gender:item4)
//选择了所有25岁以上的男性，并保留了变量gender到q4（gender、item4和其间所有列)

随机抽样：

> mysample<-leadership[sample(1:nrow(leadership),3,replace=FALSE),]
//从leadership数据集中随机抽取一个大小为3的样本
//sample(1:nrow(leadership)参数是一个由要从中抽样的元素组成的向量
//3是要抽取的元素数量
//replace=FALSE表示无放回抽样

相关：抽取和校正调查样本的sampling包以及分析复杂调查数据survey包。

猜你喜欢

转载自blog.csdn.net/l1l1l1001/article/details/83927641

R语言数据集取子集

R语言子集

R语言数据集的基本操作（合并，添加行列，提取子集等）

R语言数据集分割

R语言内置数据集

R语言数据清洗

数据挖掘与R语言

R语言-数据框

R语言数据排序

R语言数据重塑

R语言--数据框

R语言的数据帧

R语言--编数据

R语言数据筛选

R语言数据排序

R语言数据的读写

R语言数据框

R语言缺失数据

R 语言数据导入

R语言数据集行列互换技巧

R语言——查看内置数据集

R数据分析：R语言编程

R语言的数据类型

R语言与数据分析

R语言数据导入与导出

R语言之数据操作

大数据之 R语言

R语言--数据预处理

R语言数据储存与读取

R语言-提取数据tips

今日推荐

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

对话Kaldi之父、小米首席语音科学家Daniel Povey：开源环境比金钱和荣誉更吸引我 | AGI技术50人...

Hugging Face全攻略：轻松下载Llama 3模型，探索NLP的无限可能！【实操】

阅读送书抽奖？玩转抽奖游戏，js-tool-big-box工具库新上抽奖功能

百度发布Comate代码知识增强2.0，国内首个支持实时检索智能代码助手

黑客利用扫雷游戏 Python 克隆隐藏恶意脚本，攻击欧洲和美国金融机构

微软对开源字体 Cascadia Code 进行重大更新

好书推荐《ChatGPT原理与架构：大模型的预训练、迁移和中间件编程》

Baidu Comate 智能编码助手：编程新伙伴，效率新飞跃

AI时代：人工智能大模型引领科技创造新时代

百篇博客 · 千里之行

周排行

Python模块之shelve

勇于承担责任

Hikyuu 1.1.0 发布，量化交易研究框架

字节跳动Java3面“凉凉”~不负韶华，努力复习备战“金三银四”

Linux下静态链接库与动态链接库的区别

spring boot架构改造

怎么理解AOP

文件不同步 --本地和eclipse

在linux配置nginx负载均衡

Linux Shell基础命令

每日归档

更多

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)