Elasticsearch介绍
ES,是基于Lucene开发的一个分布式全文检索框架,往ES中存储和从ES中查询,格式都是JSON;
- 索引:Index,相当于数据中的Database;
- 类型:Type,相当于数据中的table;
- 主键:Id,相当于数据库中的主键;
往ES中存储数据,其实就是往ES中的Index下的Type中存储JSON数据;
Elasticsearch安装:单机版
1.安装JDK(1.8)
2.上传解压Elasticsearch-5.4.3
3.创建一个普通用户,然后将对应的目录修改为普通用户的所属用户和所属组
#es启动时需要使用非root用户,所有创建一个fly用户:
useradd fly
#为hadoop用户添加密码:
echo 123456 | passwd --stdin fly
#将bigdata添加到sudoers
echo "fly ALL = (root) NOPASSWD:ALL" | tee /etc/sudoers.d/fly
chmod 0440 /etc/sudoers.d/fly
#解决sudo: sorry, you must have a tty to run sudo问题,在/etc/sudoer注释掉 Default requiretty 一行
sudo sed -i 's/Defaults requiretty/Defaults:fly !requiretty/' /etc/sudoers
#创建一个bigdata目录
mkdir /{bigdata,data}
#给相应的目录添加权限
chown -R fly:fly /{bigdata,data}
4.修改配置文件config/elasticsearch.yml
network.host: 192.168.100.211
5.启动ES,发现报错
bin/elasticsearch
#出现错误
[1]: max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]
[2]: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]
#用户最大可创建文件数太小
sudo vi /etc/security/limits.conf
* soft nofile 65536
* hard nofile 65536
#查看可打开文件数量
ulimit -Hn
#最大虚拟内存太小
sudo vi /etc/sysctl.conf
vm.max_map_count=262144
#查看虚拟内存的大小
sudo sysctl -p
6重启linux
shutdown -r now
7.通过浏览器访问ES
IP:9200
Elasticsearch安装:集群版
设置普通用户,ElasticSearch默认只能使用普通用户启动
###【在多台机器上执行下面的命令】###
#es启动时需要使用非root用户,所有创建一个fly用户:
useradd fly
#为hadoop用户添加密码:
echo 123456 | passwd --stdin fly
#将bigdata添加到sudoers
echo "fly ALL = (root) NOPASSWD:ALL" | tee /etc/sudoers.d/fly
chmod 0440 /etc/sudoers.d/fly
#解决sudo: sorry, you must have a tty to run sudo问题,在/etc/sudoer注释掉 Default requiretty 一行
sudo sed -i 's/Defaults requiretty/Defaults:fly !requiretty/' /etc/sudoers
#创建一个bigdata目录
mkdir /{bigdata,data}
#给相应的目录添加权限
chown -R fly:fly /{bigdata,data}
1.安装jdk(jdk要求1.8.20以上)
2.上传es安装包
3.解压es
tar -zxvf elasticsearch-5.4.3.tar.gz -C /bigdata/
4.修改配置
vi /bigdata/elasticsearch-5.4.3/config/elasticsearch.yml
#集群名称,通过组播的方式通信,通过名称判断属于哪个集群
cluster.name: bigdata
#节点名称,要唯一
node.name: es-1
#数据存放位置
path.data: /data/es/data
#日志存放位置(可选)
path.logs: /data/es/logs
#es绑定的ip地址
network.host: 192.168.10.16
#初始化时可进行选举的节点
discovery.zen.ping.unicast.hosts: ["node-4", "node-5", "node-6"]
#出现错误
[1]: max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]
[2]: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]
#用户最大可创建文件数太小
sudo vi /etc/security/limits.conf
* soft nofile 65536
* hard nofile 65536
#查看可打开文件数量
ulimit -Hn
#最大虚拟内存太小
sudo vi /etc/sysctl.conf
vm.max_map_count=262144
#查看虚拟内存的大小
sudo sysctl -p
5.使用scp拷贝到其他节点
scp -r elasticsearch-5.4.3/ node-5:$PWD
scp -r elasticsearch-5.4.3/ node-6:$PWD
6.在其他节点上修改es配置,需要修改的有node.name和network.host
7.启动es(/bigdata/elasticsearch-5.4.3/bin/elasticsearch -h查看帮助文档)
/bigdata/elasticsearch-5.4.3/bin/elasticsearch -d
8.用浏览器访问es所在机器的9200端口
http://192.168.10.16:9200/
{
"name" : "node-2",
"cluster_name" : "bigdata",
"cluster_uuid" : "v4AHbENYQ8-M3Aq8J5OZ5g",
"version" : {
"number" : "5.4.3",
"build_hash" : "eed30a8",
"build_date" : "2017-06-22T00:34:03.743Z",
"build_snapshot" : false,
"lucene_version" : "6.5.1"
},
"tagline" : "You Know, for Search"
}
10.停用es
kill `ps -ef | grep Elasticsearch | grep -v grep | awk '{print $2}'`
#查看集群状态
curl -XGET 'http://192.168.10.16:9200/_cluster/health?pretty'
http://192.168.10.16:9200/_cluster/health?pretty
参考来源:http://www.elastic.co/guide/en/elasticsearch/reference/current/setup-configuration.html
参考来源:https://github.com/elastic/elasticsearch