多くの場合、我々はElasticSearchで中国語の単語、ここでは紙方法を簡単に見を有効にする必要があります。中国語の単語は、最初のプラグインをインストールします。ここで使用される IK、あなたも(のような他のプラグイン考えるかもしれ smartcnを)。
$ ./bin/elasticsearch-pluginインストールhttps://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.2.0/elasti csearch-analysis-ik-7.2.0.zip
上記のコードは、インストールされているバージョン7.2.0プラグイン、弾性7.2.0協力を使用することです。
PS:他のプラグインのコマンド:elasticsearch-プラグインヘルプ
次に、弾性を再起動すると、自動的に新しくインストールされたプラグインをロードします。
次に、新しいインデックスを作成し、単語を分割する必要があるフィールドを指定します。このステップは、この記事のためのデータ構造は、次のコマンドに応じて変化します。基本的には、中国の検索フィールドのすべてのニーズが、それは個別に設定する必要があります。
PUT /アカウント
{
"マッピング" :{
"人" :{
"プロパティ" :{
"ユーザ" :{
"タイプ" :"テキスト" 、
"分析" :"ik_max_word" 、
"search_analyzer" :"ik_max_word"
}、
"タイトル" :{
"タイプ" :"テキスト" 、
"分析" :"ik_max_word" 、
"search_analyzer" :"ik_max_word"
}、
"DESC」 :{
"タイプ" :"テキスト" 、
"分析": "ik_max_word" 、
"search_analyzer" : "ik_max_word"
}
}
}
}
}
上記のコード、タイプの人の名前を持つインデックスのアカウントの新しい名前の最初の。人は3つのフィールドがあります。
-
ユーザー
-
タイトル
-
DESC
これらの3つのフィールドは中国であり、タイプはテキスト(文字)、あなたはデフォルトの英語ワードブレーカを使用することはできません、中国のワードブレーカを指定する必要があります。
弾性の言葉が呼び出され アナライザ。私たちは、各フィールドのワードブレーカを指定します。
"ユーザ" :{
"タイプ" :"テキスト" 、
"分析" :"ik_max_word" 、
"search_analyzer" :"ik_max_word"
}
上記のコードでは、アナライザは、検索ワードトークナイザsearch_analyzerテキストフィールドトークナイザ、です。ik_max_wordワードがプラグインIKによって提供され、それはサブワードテキストの最大数であることができます。