MongoDB系列之合并MongoDB子文档

   问题来源:https://groups.google.com/forum/#!topic/mongodb-user/BpgEaRqrKsA

   Collection C1的部分数据如下:



 

要求按name分组,每组数据是相同的name对应的子文档中的users字段,且数据不能重复。计算结果类似:



 

   集算器代码:



 

A1:连接MongoDB,连接字格式为mongo://ip:port/db?arg=value&… 。

A2: 使用find函数从MongoDB中取数并排序,形成游标。collectoinc1,过滤条件是空,取出_id之外的所有字段,并按name排序。集算器的find函数和mongdbfind+sort+limit函数类似,过滤条件的写法遵循mongodb规范。

A3: 循环从游标读数,每次取name字段相同的一组文档。A3的作用范围是缩进的B3B5,其间可以用A3来引用循环变量。

扫描二维码关注公众号,回复: 407037 查看本文章

 

 

 

B3:取出本组文档的所有users字段,如下:



 

         B4:合并本组各文档的users,并去除重复。

 

B5:B4不断地追加到B2中。B2如下:



 

B2就是本案例的计算目标。如果计算结果太多导致内存放不下,可以在B5中用函数export@jB4转为json串,再不断地追加到文本文件中。

 

A6:关闭MongoDB

猜你喜欢

转载自datamachine.iteye.com/blog/2226098