ElasticSearch - 基本类型与映射 (es5.x以上)

ElasticSearch支持的基本类型在 2.x -> 5.x 时进行了修改,将 string 类型拆分成 text 和 keyword

本文是基于ES 5.x以上所写


  • Elasticsearch支持的基本类型

    • 字符串 : text, keyword

      • text:存储数据的时候,会自动分词,并生成索引

      • keyword:存储数据的时候,不会分词,而是直接整个词拿去建索引

    • 整数 : byte, short, integer, long

    • 浮点数 : float

    • 布尔型 : boolean

    • 日期 : date

  • 自定义映射

    • index : 设置此字段能不能被查询,就是决定要不要将这个字段放进倒排索引裡

      • 若index设置为true(默认是true),则表示这个这个字段会被放进倒排索引裡,如果是text就是分词过后放进索引,如果是keyword、integer...就直接整段放进索引裡

      • 若index设置为false,则表示这个字段不放进倒排索引裡,因此不能查询这个字段(因为他不存在于倒排索引裡)

        • 通常这种被设成false的字段,可以想像成是属于一种附属的字段,就是不能被match、term查询,但是当该文档被其他搜索条件搜出来时,他可以附带的一起被找出来,因为他们同属于同一个文档

    • analyzer : 主要用在text类型的字段上,就是设定要使用哪种分词器来建立索引

      • 可以使用内建的分词器,或是使用自定义的分词器

      • 可以使用/_analyze测试分析器具体会将句子分词成什么样子,它能帮助我们理解Elasticsearch索引内部发生了什么

        GET 127.0.0.1:9200/_analyze
        {
            "analyzer": "standard",
            "text": "Text to analyze"
        }
    • 具体实例

      • mapping

        PUT 127.0.0.1:9200/mytest
        {
            "mappings": {
                "doc": {
                    "properties": {
                        "name": {
                            "type": "keyword",
                            "index": false
                        },
                        "uid": {
                            "type": "integer"
                        },
                        "nickname": {
                            "type": "text",
                            "analyzer": "standard"
                        }
                    }
                }
            }
        }
      • 搜索uid时,name会一起被找出来

        GET 127.0.0.1:9200/mytest/_search
        {
            "query": {
                "term": {
                    "uid": 1
                }
            }
        }
        {
            "uid": 1,
            "name": "1-hello",
            "nickname": "1-nickname"
        }
      • 搜索name,会报error

        GET 127.0.0.1:9200/mytest/_search
        {
            "query": {
                "term": {
                    "name": "1-hello"
                }
            }
        }
        "error": {
            "type": "illegal_argument_exception",
            "reason": "Cannot search on field [name] since it is not indexed."
        }
  • 更新映射

    • 当首次创建一个索引的时候,可以指定类型的映射,但假设后来想要增加一个新的映射字段,可以使用/_mapping把新的字段加进mapping映射裡

      • 可以增加一个新的映射,但是不能修改存在的映射,原因是因为这个映射可能有文档去用,如果改了映射的类型,可能会导致索引的数据出错,因此只能新加字段进去,不能修改

    • 具体实例

      • 在mytest映射中的doc类型增加一个新的名爲tag的keyword

        PUT 127.0.0.1:9200/mytest/_mapping/doc
        {
            "properties": {
                "tag": {
                    "type": "keyword",
                }
            }
        }

猜你喜欢

转载自blog.csdn.net/weixin_40341116/article/details/80608874
今日推荐