使用场景,我的某个表里有一百万条数据。在表里,有个property字段,这个字段是个属性。当然了,属性下面存在很多子类型。
目前的任务是,我就想要这些子类型,而且是不重复的,表中的数据有180万以上。如果我使用了distinct方法,结果会报错(超出内存阀值)。
我使用的方法是,直接看代码:
var find = db['mycollection'].find({});
var figure_set = new Set();
find.forEach(function(event) {
for(var item in event.property) {
figure_set.add(item);
}
})
figure_set.forEach(function (element, set) {
print(element);
});
注意:在自己使用过程中,需要把表名和字段替换成自己的相应的。
注:代码在自己的机器上测试过了,可能还是会存在错误和想给我建议的,email: [email protected]