A、Elasticsearchはトークナイザを建て
#Simple Analyzer – 按照非字母切分(符号被过滤),小写处理
#Stop Analyzer – 小写处理,停用词过滤(the,a,is)
#Whitespace Analyzer – 按照空格切分,不转小写
#Keyword Analyzer – 不分词,直接将输入当作输出
#Patter Analyzer – 正则表达式,默认 \W+ (非字符分隔)
#Language – 提供了30多种常见语言的分词器
1、標準アナライザ
2、シンプルアナライザ
3、空白アナライザ
4、ストップ・アナライザ
5、Keyworkアナライザ
6、パターンアナライザ
#Simpleアナライザ-非アルファベットスライスでは、(シンボルがフィルタリングされる)、処理小文字 #STOPアナライザ-小文字プロセスを、ストップワードフィルタリング(、Aは、IS ) #Whitespaceアナライザ-による空間分割Geqie小文字入れない #Keywordアナライザ-関係なく、単語の、出力を直接入力として #Patterアナライザ-正規表現で、デフォルト\ W + (非文字区切り) #languageが- 30の言語共通語を数多く提供しています #2を怠惰の上にクイックブラウンキツネLEAPを実行していますイヌにおける夏の夜に #は異なる分析結果を表示 #standard GET _analyze { 「分析」:「標準」、 「テキスト」:"2夏の夜に怠惰な犬オーバークイック茶色のキツネの飛躍を実行しています。「 } #simpe GET _analyze { 」アナライザー「:」シンプル「」テキスト「:」2は、夏の夜に怠惰な犬オーバークイック茶色のキツネの飛躍を実行しています。「 } GET _analyze { 」アナライザー「:」停止「」テキスト「:」2は、夏の夜に怠惰な犬オーバークイック茶色のキツネの飛躍を実行しています。" GET _analyze { 「アナライザー」:「空白」、 「テキスト」:「2夏の夜に怠惰な犬を超える飛躍クイック茶色のキツネを実行している。」 } #keyword GET _analyze { 「アナライザー」:「キーワード」、 「テキスト」:「2夏の夜に怠惰な犬オーバークイック茶色のキツネの飛躍を実行している。」 } GET _analyze { "アナライザ「:」パターン「」テキスト「:」2は、夏の夜に怠惰な犬オーバークイック茶色のキツネの飛躍を実行しています。「 } #english GET _analyze { 」アナライザー「:」英語「」テキスト「:」2は、夏の夜に怠惰な犬オーバークイック茶色のキツネの飛躍を実行しています。" } POSTの_analyze { " アナライザ":" icu_analyzer " " " 彼は、正確な合理言った" " } POSTの_analyze { " アナライザー":" 標準" " テキスト":" 彼は本当に合理的とは何、 " " } POSTの_analyze { " アナライザー":" icu_analyzer " 、 " テキスト":「このりんごは非常に良いではありません。」 }
第二に、中国の言葉ICUアナライザ
// 指定された直接のテスト分析 GETの_analyze { " アナライザー":" icu_analyzer " 、 " テキスト":" こんにちは中国" }
2.その他の中国語の単語のプラグイン