Solr的运行原理

  1. 运行流程

    用户在网页中输入关键字进行检索,关键字被solr接收,会对关键字进行分词,然后检索solr库中的资源,将符合要求的数据返回给用户
    在这里插入图片描述

  2. 相关概念

  • **基本存储单元:**文档
  • 顺序扫描法: 根据需求挨个比较文档,找出所有符合要求的数据。效率低。
  • ** 全文检索法:基于字段的代拍索引表的检索方式,效率高,适合大量数据。**
  • ** 倒排索引:**根据某个字段分词后,产生的关键字和对应的文档之间的映射 关系表,称为倒排索引表(检索目录)
  • **倒排表:**存储了关键字和文档之间的映射关系的表
  • 词频: 关键字在该文档中出现的次数。
  • 组件: 词条化工具
  1. 数据存储流程:
    ①存储数据到solr索引库
    ②给字段创建索引目录
    ③调用分词工具将字段的值进行分词
    ④创建倒排索引表。
  2. 数据的检索流程:
    ①solr调用分词工具,对检索关键字进行分词
    ②根据关键字分词后的结果,查询倒排索引表 获取对应的文档ID
    ③将符合要求的数据返回。
发布了18 篇原创文章 · 获赞 6 · 访问量 236

猜你喜欢

转载自blog.csdn.net/penerx/article/details/103466280