R语言之实现Excel的数据透视功能

这篇文章将持续更新。

首先,当我们拥有如下数据集b:

> b
                                V1                               V2 V4
1 7063b3d0c075a4d276c5f06f4327cf4a effb071415be51f11e845884e67c0f8c  1
2 0db66c0dd3993fd3504bb98c3beb15b3 f87ff481d85d2f95335ab602f38a7655  1
3 f8c065dc140ec74c6e44144164e618e3 8a27d9a6c59628c991c154e8d93f412e  2
4 2c6082cf0d68e244f2a10325e8d1b85b ecea5fe33e6817d09c395f2910479728  3
5 2c6082cf0d68e244f2a10325e8d1b85b 31a3d0420d89c9b121bb55dbdbbeda6b  3

我们希望统计以V1分组,每一组的V4变量各指标的计数,在Excel的透视表里我们需要这样做:
这里写图片描述
而在R中要达到同样效果,我们的代码如下:

> dcast(tmp,V1~V4)
Using V4 as value column: use value.var to override.
Aggregation function missing: defaulting to length
                                V1 1 2 3
1 0db66c0dd3993fd3504bb98c3beb15b3 1 0 0
2 2c6082cf0d68e244f2a10325e8d1b85b 0 0 2
3 7063b3d0c075a4d276c5f06f4327cf4a 1 0 0
4 f8c065dc140ec74c6e44144164e618e3 0 1 0

输出为Data.frame格式。(dcast函数需要载入reshape2包)

猜你喜欢

转载自blog.csdn.net/melon0014/article/details/51474003