ElasticSearch分片与Lucene Index

在ES中一个索引有一个或者多个分片构成，在创建索引的时候可以设置主分片和副本分片的数量，当主分片确定之后就不可以再修改了(因为路由需要基于这个数量来分发请求)，而副本分片数量随时可以修改

PUT /myIndex
{
   "settings" : {
      "number_of_shards" : 2,    //该索引有2个分片
      "number_of_replicas" : 1   //每个分片都有一个副本
   }
}

这里我假设说是建立了两个节点，就是起了两个ES服务，shard1跟shard2就是创建的两个主分片，replica1和replica2就是两个副本分片，一般为了实现高可用，ES会将主分片和副本分片保存在不同的NODE节点中，这个动作由ES自动完成。

shard = Lucene Index

我们知道ElasticSearch是一个分布式可扩展的实时搜索和分析引擎，是一个建立在全文搜索引擎Apache Lucene基础上的搜索引擎。那么Shard本质上就是一个个的Lucene Index。

在lucene里面由很多小的segment，每个segment内部都有许多中数据结构，比如说经常听说的Inverted Index(倒排索引)，Sorted Fields，Document Values...，那么其中最重要的就是倒排索引了。

倒排索引主要包括两部分：

当我们进行搜索的时候，会将搜索的内容进行分词。然后在字典找到对应的term，从而就可以找到搜索相关的文件内容。

当想要查找包含某个特定的标题内容的文档时，就会用到这种结构。本质上它是一个简单的K-V集合，默认会存储整个文档的Json格式。

网图：

它是为了解决排序、聚合而诞生的。这种结构本质上是一个列式的存储。

网图：

为了提高效率、ES可以将索引下的某一个Document Vlaue 全部读取到内存中进行操作，以此来提高访问速度，但是会消耗内存空间。

这几种数据结构、Inverted Index、Sorted Fields、Document Values 以及缓存，都在Segment内部。

Lucene会搜索所有的segment，然后将每个segment的搜索结果返回，然后返回给客户端。

当ES搜索文档的时候，会给文档建立相应的缓存、并且每秒都去刷新缓存。

随着时间的增加，会有越来越多的segment，es会将这些segment合并，合并之后将原来的删掉，所以就会出现一种情况，你增加了更多的文档，索引占用的空间可能越来越小，因为引起了merge，从而有更多的压缩。

新建单个文档所需要的顺序步骤：

网图：

1，客户端向Node1发送新建索引或者删除请求。

2，节点使用文档的_id确定文档属于那个分片。请求会被转发到对应的Node。

3，在分片上面执行请求。如果执行成功了，那么请求会被转发到各个节点的副本分片上，如果都成功了，那么就会返回给客户端成功的信息。

整体流程，依然是妄(网)图。。。

1，请求发送后会先来到协调节点，默认使用文档的id计算出来由哪一个分片来处理请求。

shard=hash(_id)%分片数量

2，分片接受到请求后，会先将请求写道memory buffer，然后定时(默认1s)写入到Filesystem。从memory buffer 到Filesystem cache的过程就叫refresh。

3，Transaction Log是用来保证数据可靠性的，因为refresh过程数据是有可能数据丢失的。在shard接受到请求后，同时会把请求写入translog中，当Filesystem cache中的数据写入到磁盘中后，才会被清除掉，这个过程教flush。

4，在flush过程中，内存中的缓存将会被清除，内容被写入一个新的段，段的fsync将会创建一个新的提交点，并将内容刷新到磁盘，旧的translog将被删除并开始一个新的trabslog。flush的触发机制默认30分钟，或者translog太大。