【Elasticsearch5.0新特性】

一、ES5.0版本号跳跃原因

ELK吧,是Elasticsearch、Logstash、Kibana三个产品的首字母缩写,现在Elastic又新增了一个新的开源项目成员:Beats。由于现在的版本比较混乱,每个产品的版本号都不一样,Elasticsearch和Logstash目前是2.3.4;Kibana是4.5.3; Beats是1.2.3; 版本号太乱了有没有,什么版本的ES用什么版本的Kibana?有没有兼容性问题?

所以ES开发团队打算将这些的产品版本号也统一一下,即v5.0,为什么是5.0,因为Kibana都4.x了,下个版本就只能是5.0了,其他产品就跟着跳跃一把,因此ES5.0版本应运而生。

 

二、新版本特性

新特性问世有一段时间,去年16年九月份就研究过新版本Beta版本特性,鉴于Head插件和SQL插件原因一直没有更新使用在生产环境,最近发现Head插件和SQL插件成熟,安装方式和以前很不相同,因此决定写一篇安装记录blog

 

1、新增了一个Shrink API  --->质因数收缩分片

相信大家都知道elasticsearch索引的shard数是固定的,设置好了之后不能修改,如果发现shard太多或者太少的问题,之前如果要设置Elasticsearch的分片数,只能在创建索引的时候设置好,并且数据进来了之后就不能进行修改,如果要修改,只能重建索引。

现在有了Shrink接口,它可将分片数进行收缩成它的因数,如之前你是15个分片,你可以收缩成5个或者3个又或者1个,那么我们就可以想象成这样一种场景,在写入压力非常大的收集阶段,设置足够多的索引,充分利用shard的并行写能力,索引写完之后收缩成更少的shard,提高查询性能。

 

扫描二维码关注公众号,回复: 284186 查看本文章

2、新增了一个Rollover API。  --->自动创建新索引

一般我们按天来对索引进行分割(数据量更大还能进一步拆分),我们以前是在程序里设置一个自动生成索引的模板,大家用过logstash应该就记得有这么一个模板logstash-[YYYY-MM-DD]这样的模板,现在es5.0里面提供了一个更加简单的方式:Rollover API

 

 

3、新增:Reindex -->索引重建迁移数据,变相的可以扩容分片

另外关于索引数据,大家之前经常重建,数据源在各种场景,重建起来很是头痛,那就不得不说说现在新加的Reindex接口了,Reindex可以直接在Elasticsearch集群里面对数据进行重建,如果你的mapping因为修改而需要重建,又或者索引设置修改需要重建的时候,借助Reindex可以很方便的异步进行重建,并且支持跨集群间的数据迁移。

比如按天创建的索引可以定期重建合并到以月为单位的索引里面去。

当然索引里面要启用_source。

 

三、ES生态系统圈



 

猜你喜欢

转载自gaojingsong.iteye.com/blog/2359001