solr学习日记···文本分析-相关类梳理

solr文本分析的相关内容涉及到了许多类,这一节就来梳理一下这些类的关系,相信会对理解文本分析的配置有些帮助。

首先是工厂相关类:
类说明
至于具体的工厂类就不一一列举了,它们都在包org.apache.lucene.analysis.util中。可以点击这里查看其它的方法和具体介绍。

然后工厂产生的实例类:
类说明2
tokenizer产生的实例和filter产生的实例实际上都是token流,实际上文本分析进去的是文本出来的就是被分割过滤后的token流。
类说明3
这几个类的具体信息点击这里查看

在工厂类中,可以发现TokenizerFactory除了默认的create方法还有一个传入AttributeFactory类型参数的方法。那么AttributeFactory又是干什么的?
类说明4
相关类的信息点击这里查看

猜你喜欢

转载自blog.csdn.net/qq_19656425/article/details/79026383
今日推荐