R 数据去重 - 代码天地

R 数据去重

其他 2020-01-19 22:34:13 阅读次数: 0

目录

1.which()
2.unique()
3.dplyr包
- select()
- filter()
- arrange()
- group_by()
- mutate()
- transmutate()
- summarize()
- setdiff()
- union()

1.which()

按条件筛选
筛选一些满足特定条件的数据

#搜索矩阵A和B相同行名时是哪一行，用which函数可以实现
#A是nxm的矩阵
#B是pxk的矩阵
搜索B中行名和A中行名相同的行,行号记录在向量a中
a<-vector()
for(i in 1:nrow(B))
{
a[i]<-which(colnames(A)==colnames(B)[i])
}

2.unique()

去重
主要是返回一个删除重复值或者重复行的向量 or dataframe or array。。

z<-c(1,2,2,3,4)
unique(z)
#[1] 1 2 3 4

3.dplyr包

select()

选择

filter()

过滤

arrange()

排序

group_by()

分组求。。

mutate()

增加新列保留原有列

transmutate()

增加新列删除原有列

summarize()

汇总求和，平均，中位数等

setdiff()

求交集

union()

求全集
可以参考笔记 dplyr包学习笔记

因为以前做数据处理不多，很多函数学过，但是用的少，用的时候容易想不起来，还是平时的时候要多思考，多练
熟能生巧，多积累，加油~~

猜你喜欢

转载自www.cnblogs.com/gaowenxingxing/p/12215738.html

R 数据去重

R语言数据去重

R语言数据去重函数

R 去重+计数

R语言预处理（去重去NA排序）

R语言去重操作unique duplicate filter

R语言的重编码

mysql数据去重

数据去重

海量数据去重

js 数据去重

HadoopMapReduce数据去重

oracle数据去重

Hadoop 数据去重

爬虫数据去重

线上数据去重

MapReduce数据去重

【项目】数据去重

List数据去重

数据筛选，去重

Oracle 数据去重

【pandas】数据去重

MongoDB数据去重

R数据分析：R语言编程

MySql数据查重、去重的实现

海量数据去重（上亿数据去重）

MR/hive 数据去重

数据库去重

数据表去重

大数据List去重

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)