ワードブレーカ・アナライザ

A、Elasticsearchはトークナイザを建て

#Simple Analyzer – 按照非字母切分(符号被过滤),小写处理
#Stop Analyzer – 小写处理,停用词过滤(the,a,is)
#Whitespace Analyzer – 按照空格切分,不转小写
#Keyword Analyzer – 不分词,直接将输入当作输出
#Patter Analyzer – 正则表达式,默认 \W+ (非字符分隔)
#Language – 提供了30多种常见语言的分词器

 

 

 1、標準アナライザ

 

 

2、シンプルアナライザ

 

 

 3、空白アナライザ

 

 

 4、ストップ・アナライザ

 

 

  5、Keyworkアナライザ

 

 

 6、パターンアナライザ

#Simpleアナライザ-非アルファベットスライスでは、(シンボルがフィルタリングされる)、処理小文字
#STOPアナライザ-小文字プロセスを、ストップワードフィルタリング(、Aは、IS 
#Whitespaceアナライザ-による空間分割Geqie小文字入れない
#Keywordアナライザ-関係なく、単語の、出力を直接入力として
#Patterアナライザ-正規表現で、デフォルト\ W + (非文字区切り)
#languageが- 30の言語共通語を数多く提供しています2を怠惰の上にクイックブラウンキツネLEAPを実行していますイヌにおける夏の夜に

#は異なる分析結果を表示
#standard 
GET _analyze 
{ 
  分析標準テキスト"2夏の夜に怠惰な犬オーバークイック茶色のキツネの飛躍を実行しています。
} 

#simpe 
GET _analyze 
{ 
  アナライザーシンプルテキスト2は、夏の夜に怠惰な犬オーバークイック茶色のキツネの飛躍を実行しています。
} 
GET _analyze 
{ アナライザー停止テキスト2は、夏の夜に怠惰な犬オーバークイック茶色のキツネの飛躍を実行しています。"


  


GET _analyze 
{ 
  アナライザー空白テキスト2夏の夜に怠惰な犬を超える飛躍クイック茶色のキツネを実行している。
} 

#keyword 
GET _analyze 
{ 
  アナライザーキーワードテキスト2夏の夜に怠惰な犬オーバークイック茶色のキツネの飛躍を実行している。
} 

GET _analyze 
{ 
  "アナライザパターンテキスト2は、夏の夜に怠惰な犬オーバークイック茶色のキツネの飛躍を実行しています。
} 
#english 
GET _analyze 
{ アナライザー英語テキスト2は、夏の夜に怠惰な犬オーバークイック茶色のキツネの飛躍を実行しています。" 
} 
POSTの_analyze 
{ " アナライザ"" icu_analyzer " "


  


  " 彼は、正確な合理言った" " 
} 


POSTの_analyze 
{ 
  " アナライザー"" 標準" " テキスト"" 彼は本当に合理的とは何、 " " 
} 
POSTの_analyze 
{ " アナライザー"" icu_analyzer " " テキスト"このりんごは非常に良いではありません。」
}


  
デモ

 

第二に、中国の言葉ICUアナライザ

// 指定された直接のテスト分析
GETの_analyze 
{ 
  " アナライザー"" icu_analyzer " " テキスト"" こんにちは中国" 
}

2.その他の中国語の単語のプラグイン

 

おすすめ

転載: www.cnblogs.com/zd1994/p/12650261.html