第40节：初识搜索引擎_query string的分词以及mapping引入案例遗留问题的大揭秘 - 代码天地

第40节：初识搜索引擎_query string的分词以及mapping引入案例遗留问题的大揭秘

其他 2019-03-05 10:11:25 阅读次数: 0

课程大纲

1、query string分词

query string必须以和index建立时相同的analyzer进行分词

query string对exact value和full text的区别对待

date：exact value

_all：full text

比如我们有一个document，其中有一个field，包含的value是：hello you and me，建立倒排索引

我们要搜索这个document对应的index，搜索文本是hell me，这个搜索文本就是query string

query string，默认情况下，es会使用它对应的field建立倒排索引时相同的分词器去进行分词，分词和normalization，只有这样，才能实现正确的搜索

我们建立倒排索引的时候，将dogs --> dog，结果你搜索的时候，还是一个dogs，那不就搜索不到了吗？所以搜索的时候，那个dogs也必须变成dog才行。才能搜索到。

知识点：不同类型的field，可能有的就是full text，有的就是exact value

post_date，date：exact value

_all：full text，分词，normalization

2、mapping引入案例遗留问题大揭秘

GET /_search?q=2017

搜索的是_all field，document所有的field都会拼接成一个大串，进行分词

2017-01-02 my second article this is my second article in this website 11400

doc1 doc2 doc3

2017 * * *

01 *

02 *

03 *

_all，2017，自然会搜索到3个docuemnt

GET /_search?q=2017-01-01

_all，2017-01-01，query string会用跟建立倒排索引一样的分词器去进行分词

2017

01

01

GET /_search?q=post_date:2017-01-01

date，会作为exact value去建立索引

doc1 doc2 doc3

2017-01-01 *

2017-01-02 *

2017-01-03 *

post_date:2017-01-01，2017-01-01，doc1一条document

GET /_search?q=post_date:2017，这个在这里不讲解，因为是es 5.2以后做的一个优化

3、测试分词器

GET /_analyze

{

"analyzer": "standard",

"text": "Text to analyze"

}

猜你喜欢

转载自blog.csdn.net/qq_35524586/article/details/88075472

第40节：初识搜索引擎_query string的分词以及mapping引入案例遗留问题的大揭秘

ElasticSearch最佳入门实践（四十一）query string 的分词以及 mapping 引入案例遗留问题的大揭秘

第41节：初识搜索引擎_什么是mapping再次回炉透彻理解

第43节：初识搜索引擎_手动建立和修改mapping以及定制string类型数据是否分词

第44节：初识搜索引擎_mapping复杂数据类型以及object类型数据底层结构大揭秘

第42节：初识搜索引擎_mapping的核心数据类型以及dynamic mapping

第39节：初识搜索引擎_分词器的内部组成到底是什么，以及内置分词器的介绍

第58节：初识搜索引擎_搜索相关参数梳理以及bouncing results问题解决方案

第51节：初识搜索引擎_上机动手实战如何定位不合法的搜索以及其原因

第53节：初识搜索引擎_解密如何将一个field索引两次来解决字符串排序问题

第36节：初识搜索引擎_用一个例子告诉你mapping到底是什么

第57节：初识搜索引擎_分布式搜索引擎内核解密之query phase

第56节：初识搜索引擎_分布式搜索引擎内核解密之query phase

第49节：初识搜索引擎_filter与query深入对比解密：相关度，性能

第48节：初识搜索引擎_上机动手实战常用的各种query搜索语法

第46节：初识搜索引擎_快速上机动手实战Query DSL搜索语法

第45节：初识搜索引擎_search api的基础语法介绍

搜索引擎基础---分词和倒排索引简述

搜索引擎的基本原理（以及MetaSeeker搜索引擎）

搜索引擎的原理以及倒排索引技术

搜索引擎初识

搜索引擎——反向索引原理揭秘及手写ik分词器

Elasticsearch由浅入深（七）搜索引擎：_search含义、_multi-index搜索模式、分页搜索以及深分页性能问题、query string search语法以及_all metadata原理

搜索引擎solr系列---solr分词配置

基于netty Lucene word分词的搜索引擎

Solr搜索引擎——中文分词器

关于es（搜索引擎）的分词器ik

Lucene搜索引擎-分词器

搜索引擎学习（四）中文分词器

搜索引擎（2）—— 查询理解 —— 分词

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)