solrcloud分布式索引与搜索

分布式索引参考:https://www.cnblogs.com/rcfeng/p/4082568.html

为了解决单个core索引过大的问题,从而设计了分片,将分片和备份分散到多台机器;
过程:
1.给一个32位地址散列,将散列位平均分配给多个分片;
2.在批量提交索引时,根据murmurHash算法算出docId的一个hash散列值,散列值分布在哪个散列区间,存储在对应的分片上,这里提交上去的doc满足负载均衡;
3.提交索引数据时,直接往leader提交可以减少路由成本;

猜你喜欢

转载自blog.csdn.net/my201110lc/article/details/82907330