R 数据去重

1.which()

按条件筛选
筛选一些满足特定条件的数据

#搜索矩阵A和B相同行名时是哪一行,用which函数可以实现
#A是nxm的矩阵
#B是pxk的矩阵
搜索B中行名和A中行名相同的行,行号记录在向量a中
a<-vector()
for(i in 1:nrow(B))
{
a[i]<-which(colnames(A)==colnames(B)[i])
}

2.unique()

去重
主要是返回一个删除重复值或者重复行的向量 or dataframe or array。。

z<-c(1,2,2,3,4)
unique(z)
#[1] 1 2 3 4

3.dplyr包

select()

选择

filter()

过滤

arrange()

排序

group_by()

分组求。。

mutate()

增加新列保留原有列

transmutate()

增加新列删除原有列

summarize()

汇总求和,平均,中位数等

setdiff()

求交集

union()

求全集
可以参考笔记 dplyr包学习笔记

因为以前做数据处理不多,很多函数学过,但是用的少,用的时候容易想不起来,还是平时的时候要多思考,多练
熟能生巧,多积累,加油~~

猜你喜欢

转载自www.cnblogs.com/gaowenxingxing/p/12215738.html