概念

Elasticsearch 简称ES，是一个分布式全文检索引擎。
比如github的代码检索就是用了ES，百度也有用ES。
由于Lucene的api相对比较复杂，所以ES其实是对Lucene的封装简化，并且提供了一套比较简单的api文档。
es官网

使用场景

主要是海量数据检索，关键词：海量。因为只有数据量大了才能体现ES的优势。

以下是我能想到的或者是之前有遇到过的场景：

1、常用的经典组合ELK（elasticsearch+Logstash+kibana ）做日志分析处理

elasticsearch：提供日志的分布式存储和全文检索
Logstash：传输日志
kibana：前端展示

2、项目中海量数据的存储和搜索

比如让你做一个类似于微博的后台服务，光检索这块，就可以考虑ES

3、项目中的关系型数据的前置缓存

如果你的项目，正在使用关系型数据库，有以下特点，就可以考虑用ES作一层缓存

数据量大，但数据结构又不太复杂
查询压力大，查询条件多样化，多变

举个例子，比如电商网站的，针对审核人员，客服人员专用的查询订单的接口
这类接口要求查询快，而且可查历史所有上亿级别的订单，而且不一定是一定根据订单号查，可能查询条件很多，有类似模糊匹配。那只用关系型数据库，怕是得好好下功夫了，但如果使用ES，那就非常简单了。

ES 优点

支持横向扩展
支持很多插件
其实说全文检索的核心优点，应该是要说Lucene的，所以如果要深挖，建议先学Lucene，比如lucene的数据和索引分离存储等，硬说成是ES的优点那也行。
总而言之，ES如果是一辆跑车，那Lucene就是引擎，就是核心。ES只不过是让这个引擎物有所用，真正被利用起来而已。

安装

安装单实例es

首先es版本有1.x，2.x，5.x，6.x，7.x
使用最新的，尽量避免使用5.x之前的

https://www.elastic.co/cn/downloads/elasticsearch
进入es官网下载，安装（需要有jdk环境，eg:1.8）
页面访问 localhost:9100

安装可视化页面-Head插件

下载：https://github.com/mobz/elasticsearch-head
需要有node环境，eg:8.2

npm install 安装
npm run start 启动

还有其他可视化插件，基本上都是下载安装，配置url就能用，请自行搜索吧

修改es配置，解决和head的跨域问题

es的config/elasticsearch.yml文件下
文件末尾加以下内容

http.cors.enable: true
http.cors.allow-origin: "*"

分别启动es和head
页面访问 localhost:9100

安装分布式集群es

1个master节点+2个slave节点

1、master节点配置
es的config/elasticsearch.yml文件下
文件末尾加以下内容,代表当前这个服务是master节点

# 集群名字
cluster.na zhangsan
# 节点名字为master
node.name: master
# 指定当前节点为master
node.master: true
# 绑定本地ip
network.host: 127.0.0.1

启动master
2、slave节点配置
复制安装包信息，作为slave
es的config/elasticsearch.yml文件下
文件末尾加以下内容,代表当前这个服务是slave节点

# 集群名字，这个必须和master节点的集群名字一致
cluster.na zhangsan
# 节点名字为slave01，多个节点就slave02，slave03...
node.name: slave01

# 绑定本地ip
network.host: 127.0.0.1
# 配置slave的端口，es默认端口是9200，我们让master是默认的9200
http.port: 9201
# 配置这个，为了能找到master
dicxovery.zen.ping.unicast.host: ["127.0.0.1"]

启动slave01,slave02

es的一些基础概念

索引

含有相同属性的文档集合
相当于mysql的数据库

类型

索引可以定义一个或多个类型，文档必须属于一个类型
相当于mysql的表，数据库里可以有一个或多个表，一行记录必须属于一个表

文档

文档是可以被索引的基本数据单位
相当于mysql的一行记录

分片

每个索引都有多个分片，每个分片都是一个lucene索引
es在创建索引时默认创建5个分片
分片数量必须在创建索引时指定，后面不能修改
相当于mysql的数据分片

备份

copy一份分片就完成了分片的备份
es在创建索引时默认创建1个备份
备份可以后期修改
相当于mysql的数据备份

集成spring-boot

es是提供了一套restful api接口
spring-boot集成，也是通过代码，去构建各个接口的参数再执行的。

还有安装分词器之类的，这其实都是lucene的知识点了。

最后要说

照着网上的教程，可以很快的搭起一套ES的服务，与项目的集成使用也不是很难。

难点在于要搞清楚为什么ES可以做全文检索，其实还是绕不开Lucene，学习Lucene索引才是重中之重。

对于应用来说，重点在于要知道ES能做什么，擅长做什么，什么时候用。

我总结了：就是海量数据的全文检索。

建议有本书可以看下：从Lucene到Elasticsearch全文检索实战
在这里插入图片描述

zhangSir134

发布了203 篇原创文章 · 获赞 186 · 访问量 21万+

私信关注

为什么要用Elasticsearch

概念