solr学习日记···文本分析-filter - 代码天地

solr学习日记···文本分析-filter

其他 2018-07-23 14:08:16 阅读次数: 0

上一节简单介绍了一下tokenizer，那么接下来来了解一下filter。
tokenizer按照自定义的规则分解文本产生了token流，而filter就是对token流进行进一步的过滤，针对token流中的每一个token顺序检验，符合的保留，不符合的丢弃，然后生成新的token流。所以我们可以将多个filter连接起来使用，对token进行多重过滤。不过要注意filter的连接顺序，一般来说会将更通用的放在前面。就好像垫在一起的几张鱼网，网格大一些的会放在上面。
与tokenizer类似，所有的filter工厂类都是继承了同一个父类：TokenFilterFactory

可以看到它与TokenizerFactory继承自同一个父类(关于这些类的关系，之后会做一个分析总结),它的子类就是filter元素class属性的取值。而它的作用如最后一行英文所说：创建TokenFilter实例的工厂类的抽象父类
因为solr定义的filter比较多，就不一一介绍了，可以在官网查看：
https://lucene.apache.org/solr/guide/7_2/filter-descriptions.html

猜你喜欢

转载自blog.csdn.net/qq_19656425/article/details/78962661

solr学习日记···文本分析-filter

solr学习日记···文本分析-charfilter

solr学习日记···文本分析-tokenizer

solr学习日记···文本分析-analyzer

solr学习日记···文本分析-相关类梳理

Solr文本分析剖析【文本分析、分词器详解、自定义文本分析字段及分词器】

舆情文本分析

文本分析

python 文本分析

文本分析笔记

python文本分析

文本分析总结

NLP 文本分析

机器学习 - 文本分析案例 - 新闻分析

数据分析学习总结笔记09：文本分析

solr学习日记···索引

NLTK学习之一：简单文本分析

机器学习之文本分析（jieba分词，词云图）

CentOS 7 Minimal学习笔记：文本分析

R语言深度学习实战：文本分类与情感分析

文本分析1--文本分析概述

pynlpir + pandas 文本分析

文本分析论文资料

文本分析工具awk

01 文本分析随记

Keras笔记--文本分析

Python文本分析技巧

07.文本分析

5.4 文本分析与加密

2.文本分析

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)