Sphinx 与全文索引 - 代码天地

Sphinx 与全文索引

其他 2018-08-15 23:18:02 阅读次数: 0

全文索引创建过程

第一步：将源文档传给分词组件（Tokenizer）

分词组件做了以下事情：

将文档分成一个一个的单词
去除标点符号
去除停词：英文(the / a / this / that ....) 中文 ( 是、的...)
经过分词后得到的就是词元

第二步：将词元传给语言处理组件

语言处理组件做了以下事情（针对英文）：

将大小变成小写
将单词复数变成单数形式
将各种时态变成现在时，例如“drove”变成“drive”

第三步：将处理好的词传给索引组件（indexer）

根据词创建字典（字典的key是传过来的词，value是词对应的记录的id）
对字典进行排序

根据索引进行搜索：

第一步：用户输入查询语句

第二步：对输入查询的语句进行词法分析，语法分析及语言处理

第三步：将处理好的词组传给搜索引擎（Sphinx），搜索索引，得到符合语法的文档

第四步：根据得到文档和查询语句的相关性，进行排序

猜你喜欢

转载自www.cnblogs.com/xiaoliwang/p/9484533.html

Sphinx 与全文索引

全文索引sphinx+mysql

centos7 sphinx全文索引

Sphinx或coreseek做全文索引相关备忘三

Sphinx或coreseek做全文索引相关备忘

Sphinx logo 全文检索引擎 Sphinx

主流全文索引工具的比较（ Lucene, Sphinx, solr, elastic search)

【PHP征文】php 使用 sphinx 实现实时 innodb 全文索引

linux下安装sphinx-for-chinese 支持中文全文索引

sphinx全文检索引擎

全文搜索引擎介绍(sphinx)

Sphinx全文检索引擎的排序问题

MySQL中全文检索引擎--Sphinx

基于MySQL全文检索引擎—sphinx

搭建Sphinx全文搜索引擎

【全文检索之Sphinx】

全文检索使用sphinx

全文检索引擎 sphinx-coreseek中文索引

sphinx 增量索引

sphinx实时索引

sphinx创建索引命令

sphinx配置实时索引

sphinx增量索引

sphinx中文索引

sphinx索引工具的使用

Sphinx建立增量索引

sphinx 增量索引(id)

mysql 全文索引

MySQL全文索引

lucene全文索引

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)