Elasticsearch7.X 入门学习第二课笔记----基本api操作和CRUD

原文: Elasticsearch7.X 入门学习第二课笔记----基本api操作和CRUD

本文链接： https://blog.csdn.net/qq_36697880/article/details/100539044

下面的操作都是是kibana 中的 dev Tools工具操作的

一、索引

一个索引就是一个拥有几分相似特征的文档的集合。比如说，你可以有一个客户数据的索引，另一个产品目录的索引，还有一个订单数据的索引。一个索引由一个名字来标识（必须全部是小写字母的），并且当我们要对对应于这个索引中的文档进行索引、搜索、更新和删除的时候，都要使用到这个名字。


   
   
    
    
     
     
      
      
     
     
     
     
      
      
       
       #查看所有索引相关信息
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       GET /_cat/indices?v
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       #创建索引
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       PUT customer
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       #查看所有索引相关信息
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       GET customer
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       #删除索引
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       DELETE customer
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       #查看索引的文档总数
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       GET kibana_sample_data_ecommerce/_count
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
       
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       #查看前10条文档，了解文档格式
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       POST kibana_sample_data_ecommerce/_search
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       }

二、文档CRUD

一个文档是一个可被索引的基础信息单元。比如，你可以拥有某一个客户的文档，某一个产品的一个文档，当然，也可以拥有某个订单的一个文档。文档以 JSON（Javascript Object Notation）格式来表示。

1 create 创建文档

_create 指定类型为create并不是type名称默认是_doc 指定 ID 如果已经存在，就报错


   
   
    
    
     
     
      
      
     
     
     
     
      
      
       
       #create document. _create 指定类型为create并不是type名称 默认是_doc 指定 ID 如果已经存在，就报错
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       PUT users/_create/
       
       1
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
            
       
       "user" : 
       
       "Jack2",
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
           
       
       "post_date" : 
       
       "2019-05-15T14:12:12",
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
           
       
       "message" : 
       
       "trying out Elasticsearch"
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       }

如果是id是1文档存在在创建就会报错

2 index 创建文档

index和 create不一样地方：index 如果文档不错，就索引新的文档。如果文档存在就覆盖原有的文档内容。版本信息+1

3 GET查询索引

get 根据文档id查询文档内容

4 Update 修改文档

update 修改文档不会删除原文档而是在文档的基础上更新文档中的字段内容

# _update 才会根据文档中字段信息在原文档上增加字段必须带有doc
POST users/_update/1/
{
"doc":{
"post_date" : "2019-05-18T14:12:12",
"message" : "trying out ElasticsearchOut",
"phone" : "1806185",
"pubtest":[1,2,3],
"pubtest2":"[1,2,3]"
}
}

5 DELETE 删除文档

### Delete by Id
# 删除文档
DELETE users/_doc/1

6 查看索引的 maping 信息

maping 相当于表的 schema

GET users/_mapping

三文档批量操作

bulk api 批量操作

1、bulk相当于数据库里的bash操作。

2、引入批量操作bulk，提高工作效率，你想啊，一批一批添加与一条一条添加，谁快?

3、bulk API可以帮助我们同时执行多个请求

4、bulk的格式：

action：index/create/update/delete

metadata：_index,_type,_id

request body：_source (删除操作不需要加request body)

{ action: { metadata }}

{ request body }

单条操作失败不会影响其他操作

5、bulk里为什么不支持get呢？

　　答：批量操作，里面放get操作，没啥用！所以，官方也不支持。

6、create 和index的区别

　　如果数据存在，使用create操作失败，会提示文档已经存在，使用index则可以成功执行。

7、bulk一次最大处理多少数据量？

　　bulk会把将要处理的数据载入内存中，所以数据量是有限制的，最佳的数据量不是一个确定的数值，它取决于你的硬件，你的文档大小以及复杂性，你的索引以及搜索的负载。

　　一般建议是1000-5000个文档，如果你的文档很大，可以适当减少队列，大小建议是5-15MB，默认不能超过100M，可以在es的配置文件（即$ES_HOME下的config下的elasticsearch.yml）中。


   
   
    
    
     
     
      
      
     
     
     
     
      
      
       
       ### Bulk 操作 批量操作,其中一步错误，不影响其他操作
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
       
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       PUT _bulk
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
       
       "index":{
       
       "_index":
       
       "test",
       
       "_id":
       
       "1"}}
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
       
       "name":
       
       "dukun",
       
       "post_date" : 
       
       "2019-05-18T14:12:12",
       
       "age":
       
       18,
       
       "phone" : 
       
       "1806185",
       
       "sex":
       
       "男"}
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
       
       "index":{
       
       "_index":
       
       "test",
       
       "_id":
       
       "2"}}
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
       
       "name":
       
       "dukun02",
       
       "post_date" : 
       
       "2019-05-18T14:12:12",
       
       "age":
       
       25,
       
       "phone" : 
       
       "19888",
       
       "sex":
       
       "男"}
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
       
       "create":{
       
       "_index":
       
       "test",
       
       "_id":
       
       "3"}}
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
       
       "name":
       
       "dukun03",
       
       "post_date" : 
       
       "2019-05-19T14:12:12"}
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
       
       "update":{
       
       "_index":
       
       "test",
       
       "_id":
       
       "3"}}
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
       
       "doc" :{
       
       "name":
       
       "dukun04",
       
       "phone" : 
       
       "1806185",
       
       "age":
       
       28,
       
       "sex":
       
       "男"}}
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
       
       "delete":{
       
       "_index":
       
       "test",
       
       "_id":
       
       "4"}}

mget 批量读取

批量操作可以减少网络连接所带来的开销，提供性能。


   
   
    
    
     
     
      
      
     
     
     
     
      
      
       
       ##批量查询mget
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       GET /_mget
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
         
       
       "docs":[
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
               {
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
                  
       
       "_index" : 
       
       "test",
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
                  
       
       "_id" : 
       
       "1"
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
               },
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
               {
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
                  
       
       "_index" : 
       
       "test",
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
                  
       
       "_id" : 
       
       "3"
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
               }
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
            ]
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       }
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       ##批量查询mget url中指定索引 可以简化如下 
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       GET 
       
       test/_mget
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
        
       
       "ids":[1,2,3]
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       }
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       #批量查询mget 中_source过滤默认_source字段会返回所有的内容，
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       你也可以通过_source进行过滤。
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       比如使用_source,_source_include 包含字段,_source_exclude 查询排除字段.   
       
       "_source" : 
       
       false 不显示字段
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       GET 
       
       test/_mget
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       {
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
        
       
       "docs":[
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
             {  
       
       "_id":
       
       "1",
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
              
       
       "_source" : 
       
       false
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
             },
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
               {  
       
       "_id":
       
       "1",
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
              
       
       "_source" : 
       
       true
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
             },
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
              {  
       
       "_id":
       
       "2",
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
              
       
       "_source" : [
       
       "name",
       
       "age"]
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
             },
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
             {
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
               
       
       "_id":
       
       "3",
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
               
       
       "_source":{
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
                 
       
       "include":[
       
       "name",
       
       "age",
       
       "sex"]
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
                }
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
             },
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
              {
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
               
       
       "_id":
       
       "3",
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
               
       
       "_source":{
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
                 
       
       "exclude":[
       
       "name",
       
       "age",
       
       "sex"]
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
                }
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
             }
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
            
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
           ]
      
      
     
     
    
    
     
     
      
      
     
     
     
     
      
      
       
       }

批量查询 _msearch

使用match_all进行查询，并且只返回第一个文档。如果没有指定size的值，则默认返回前10个文档
也可以指定返回从哪个文档开始，返回多少文档.

took —— Elasticsearch执行这个搜索的耗时，以毫秒为单位
timed_out —— 指明这个搜索是否超时
_shards —— 指出多少个分片被搜索了，同时也指出了成功/失败的被搜索的shards的数量
hits —— 搜索结果
hits.total —— 能够匹配我们查询标准的文档的总数目
hits.hits —— 真正的搜索结果数据（默认只显示前10个文档）