MongoDB 聚合group、aggregate、Map Reduce

一:group   分组统计

语法:

{

key:<>,          #统计的字段

cound:{}         #筛选条件

reduce:function(current,result){}   #对文档进行聚合的函数 current(分组统计过程中的一个文档),result(聚合结果文档)

initial:{}                          #初始化聚合结果文档(先于reduce执行)

finalize:function(){}               #reduce函数执行完之后,返回之前执行的函数。可以用来修改result的值

}

准备数据:

扫描二维码关注公众号,回复: 216533 查看本文章

db.stu.insert({'name':'zhangsan',sex:'男',age:18});

db.stu.insert({'name':'lisi',sex:'男',age:22});

db.stu.insert({'name':'lucy',sex:'女',age:16});

db.stu.insert({'name':'lilei',sex:'男',age:17});

db.stu.insert({'name':'hanmeimei',sex:'女',age:17});

db.stu.insert({'name':'mayun',sex:'男',age:51});

db.stu.insert({'name':'tony',sex:'男',age:48});

db.stu.insert({'name':'dinglei',sex:'男',age:46});

db.stu.insert({'name':'dengzhiqi',sex:'女',age:33});

db.stu.insert({'name':'liuyifei',sex:'女',age:31});

db.stu.insert({'name':'zhangchaoyang',sex:'男',age:52});

db.stu.insert({'name':'zhangxiaolong',sex:'男',age:38});

db.stu.insert({'name':'panxiaoting',sex:'女',age:40});

db.stu.insert({'name':'dingjunhui',sex:'男',age:41});

db.stu.insert({'name':'yaoming',sex:'男',age:39});

db.stu.insert({'name':'gaoyuanyuan',sex:'女',age:37});

db.stu.insert({'name':'yangmi',sex:'女',age:35});

db.stu.insert({'name':'zhaowei',sex:'女',age:39});

db.stu.insert({'name':'shengteng',sex:'男',age:37});

db.stu.insert({'name':'mali',sex:'女',age:35});

根据性别分组统计学生数量

db.stu.group({

key:{sex:1},

cond:{},

initial:{num:0},

reduce:function(current,result){

result.num += 1;

}

});

按性别统计年龄大于30的总年纪数

db.stu.group({

key:{sex:1},

cond:{age:{$gt:30}},

initial:{sum:0},

reduce:function(current,result){

result.sum += current.age;

}

});

按性别显示最大的年龄

db.stu.group({

key:{sex:1},

cond:{},

initial:{max:0},

reduce:function(current,result){

if(current.age>result.max){

result.max = current.age;

}

}

});

按性别统计年龄大于30的平均年龄

db.stu.group({

key:{sex:1},

cond:{age:{$gt:30}},

initial:{sum:0,num:0},

reduce:function(current,result){

result.sum += current.age;

result.num += 1;  

},

finalize:function(result){

result.avg = result.sum/result.num;

});

官方文档:https://docs.mongodb.com/v2.6/reference/command/group/

注意:group 不支持分片集群,不能进行分布式运算。 

 

二:aggregate  简单聚合

语法:

 

 

准备数据:同group

根据性别分组统计学生数量

db.stu.aggregate([{$group:{_id:'$sex',total:{$sum:1}}}]);

根据性别分组统计年龄大于30的学生数量

db.stu.aggregate([{$match:{age:{$gt:30}}},

{$group:{_id:'$sex',total:{$sum:1}}}]);

根据性别分组统计年龄大于30,且总数大于7的学生数量

db.stu.aggregate([{$match:{age:{$gt:30}}},

{$group:{_id:'$sex',total:{$sum:1}}},

{$match:{total:{$gt:7}}}]);

按性别统计总年龄数

db.stu.aggregate([{$group:{_id:'$sex',total:{$sum:'$age'}}}]);

按性别统计总年龄数,且按年龄总数降序排序,且只取前一行数据

db.stu.aggregate([{$group:{_id:'$sex',total:{$sum:'$age'}}},

{$sort:{total:-1}},

{$limit:1}]);

按性别统计总年龄数,且按年龄总数降序排序

db.stu.aggregate([{$group:{_id:'$sex',total:{$sum:'$age'}}},

{$sort:{total:-1}}]);

按性别统计平均年龄,且从高到低排序

db.stu.aggregate([{$group:{_id:'$sex',avg:{$avg:'$age'}}},

{$sort:{avg:-1}}]);

官方文档:https://docs.mongodb.com/manual/reference/command/aggregate/index.html

     https://docs.mongodb.com/manual/reference/operator/aggregation-pipeline

 

 

三:Map Reduce

#原始数据
db.orders.insert({cust_id:"A123",amount:500,status:"A"});
db.orders.insert({cust_id:"A123",amount:250,status:"A"});
db.orders.insert({cust_id:"B212",amount:200,status:"A"});
db.orders.insert({cust_id:"A123",amount:300,status:"D"});

 

#按照cust_id分组统计amount之 且只统计 status是A的
db.orders.mapReduce(
	function(){emit(this.cust_id,this.amount);},
	function(key,values){return Array.sum(values)},
	{
		query:{status:"A"},
		out:"orders_totals"
	}
)



 

 

 

注意:

1,Map 函数必须调用emit(key,value) 返回键值对。

2,Reduce 函数接受的参数已经按照键聚合过一次,将Map返回的键值序列组合成{key,[value1,value2,...,valuen]}传递给Reduce,Reduce函数对values统计。

 

 

 参考官网文档:https://docs.mongodb.com/manual/core/map-reduce

                          https://docs.mongodb.com/manual/reference/command/mapReduce/#dbcmd.mapReduce

猜你喜欢

转载自wangshirufeng.iteye.com/blog/2389275
今日推荐