1.概述
1.1 Shard是什么?
在下面的文档中进行了介绍
https://www.elastic.co/guide/cn/elasticsearch/guide/current/kagillion-shards.html
-
一个分片的底层即为一个 Lucene 索引,会消耗一定文件句柄、内存、以及 CPU 运转。
-
每一个搜索请求都需要命中索引中的每一个分片,如果每一个分片都处于不同的节点还好, 但如果多个分片都需要在
同一个节点上竞争
使用相同的资源就有些糟糕了。 -
用于
计算相关度
的词项统计信息是基于分片
的。如果有许多分片,每一个都只有很少的数据会导致很低的相关度。
在官方文档中介绍了clusters, nodes, and shards的关系