MongoDB 极速本地复制collection (表复制) ,Count不准确

今天为了在mongo本地备份一下数据,总结几个方法。

1,Mongo 官方只提供了远程复制clone方法,不适用本地的

db.cloneCollection('mongodb.example.net:27017','profiles',{ 'active' : true } )

2 ,遍历插入方案

db.company.find().forEach(function(x){db.company_v1.insert(x)})

3 ,批量导入方案方案 (推荐,最快)

db.company.aggregate([{$match:{}},{$out:"company_v1"}])

这里用到了mongo的 $out 操作符,获取聚合管道返回的文档并将它们写入指定的集合。
如果当前数据库不存在,则该操作将在当前数据库中创建新集合
如果指定的集合已存在,则在聚合完成后,该$out 阶段将使用新结果集合原子替换现有集合

记录问题:

MongoDB在分片后的集合上进行db.collection.count()操作时,可能会出现结果不准确的现象,需要采用聚合的方法获取集合的count结果

db.collection.aggregate(
   [
      { $group: { _id: null, count: { $sum: 1 } } }
   ]
)

不准确的原因:

  1. 操作的是分片的集合(前提);
  2. shard分片正在做块迁移,导致有重复数据出现
  3. 存在孤立文档(因为不正常关机、块迁移失败等原因导致)

猜你喜欢

转载自blog.csdn.net/iamcodingmylife/article/details/85062710
今日推荐