ElasticSearch简介
Elastic有一条完整的产品线及解决方案:Elasticsearch、Kibana、Logstash等,前面说的三个就是大家常说的ELK技术栈。
Elasticsearch具备以下特点:
- 分布式,无需人工搭建集群(solr就需要人为配置,使用Zookeeper作为注册中心)
- Restful风格,一切API都遵循Rest原则,容易上手
- 近实时搜索,数据更新在Elasticsearch中几乎是完全同步的。
1.elasticsearch5.x
1.1安装Java环境
yum -y search java
yum -y install java-1.8.0-openjdk*
1.2安装ElasticSearch
- 创建安装源文件
vi /etc/yum.repos.d/elasticsearch.repo
- 文件内容
[elasticsearch-5.x]
name=Elasticsearch repository for 5.x packages
baseurl=https://artifacts.elastic.co/packages/5.x/yum
gpgcheck=1
gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch
enabled=1
autorefresh=1
type=rpm-md
- 开始安装
yum install elasticsearch-5.0.1
我这里安装的时候选择了elasticsearch的版本为5.0.1,主要是analysis-ik中文分词插件更新慢,必须要跟elasticsearch的版本匹配,不然会有问题
- 启动elasticsearch服务
service elasticsearch start
- 测试elasticsearch是否安装成功
curl -X GET http://127.0.0.1:9200/
2.elasticsearch-analysis-ik
中文分词插件安装
- 下载5.0.1的版本,放到服务器上,也可以用git下载
github: https://github.com/medcl/elasticsearch-analysis-ik/tree/v5.0.1 - 解压之后,使用maven打包
unzip elasticsearch-analysis-ik-5.0.1.zip
cd elasticsearch-analysis-ik-5.0.1
mvn package
- 如果没有找到mvn的命令
wget http://repos.fedorapeople.org/repos/dchen/apache-maven/epel-apache-maven.repo -O /etc/yum.repos.d/epel-apache-maven.repo
yum -y install apache-maven
- 安装ik分词器
mkdir /usr/share/elasticsearch/plugins/ik
cp target/releases/elasticsearch-analysis-ik-5.0.1.zip /usr/share/elasticsearch/plugins/ik
unzip /usr/share/elasticsearch/plugins/ik/elasticsearch-analysis-ik-5.0.1.zip
- 重启elasticsearch
service elasticsearch restart
3.常见问题
3.1新建用户
- 出于安全考虑,elasticsearch默认不允许以root账号运行。
- 创建用户
useradd es
- 设置密码
passwd es
- 切换用户
su - es
3.2jvm.options
- Elasticsearch基于Lucene的,而Lucene底层是java实现,因此我们需要配置jvm参数。
- 编辑jvm.options:
vim jvm.options
- 默认配置如下:
-Xms1g
-Xmx1g
- 内存占用太多了,我们调小一些:
-Xms512m
-Xmx512m
3.3 elasticsearch.yml
vim elasticsearch.yml
- 修改数据和日志目录:
path.data: /home/leyou/elasticsearch/data # 数据目录位置
path.logs: /home/leyou/elasticsearch/logs # 日志目录位置
-
我们把data和logs目录修改指向了elasticsearch的安装目录。但是这两个目录并不存在,因此我们需要创建出来。
-
进入elasticsearch的根目录,然后创建:
mkdir data
mkdir logs
- 修改绑定的ip:
network.host: 0.0.0.0 # 绑定到0.0.0.0,允许任何ip来访问
-
默认只允许本机访问,修改为0.0.0.0后则可以远程访问
-
目前我们是做的单机安装,如果要做集群,只需要在这个配置文件中添加其它节点信息即可。
elasticsearch.yml的其它可配置信息:
属性名 | 说明 |
---|---|
cluster.name | 配置elasticsearch的集群名称,默认是elasticsearch。建议修改成一个有意义的名称。 |
node.name | 节点名,es会默认随机指定一个名字,建议指定一个有意义的名称,方便管理 |
path.conf | 设置配置文件的存储路径,tar或zip包安装默认在es根目录下的config文件夹,rpm安装默认在/etc/ elasticsearch |
path.data | 设置索引数据的存储路径,默认是es根目录下的data文件夹,可以设置多个存储路径,用逗号隔开 |
path.logs | 设置日志文件的存储路径,默认是es根目录下的logs文件夹 |
path.plugins | 设置插件的存放路径,默认是es根目录下的plugins文件夹 |
bootstrap.memory_lock | 设置为true可以锁住ES使用的内存,避免内存进行swap |
network.host | 设置bind_host和publish_host,设置为0.0.0.0允许外网访问 |
http.port | 设置对外服务的http端口,默认为9200。 |
transport.tcp.port | 集群结点之间通信端口 |
discovery.zen.ping.timeout | 设置ES自动发现节点连接超时的时间,默认为3秒,如果网络延迟高可设置大些 |
discovery.zen.minimum_master_nodes | 主结点数量的最少值 ,此值的公式为:(master_eligible_nodes / 2) + 1 ,比如:有3个符合要求的主结点,那么这里要设置为2 |
3.4错误:内核过低
- 修改elasticsearch.yml文件,在最下面添加如下配置,然后重启
bootstrap.system_call_filter: false