эс по картированию

Elasticsearch обеспечить достаточное количество параметров отображения поля отображающих значения параметров для достижения некоторых общих черт, для поля Примера токенизатора, форматов даты, поиск выбора модели достигается за счетом параметров конфигурации, вводится один каждый из следующих параметры использования.

1. анализатор

анализатор указать параметры для слова текстового поля, действительное для индексирования и запросов. Tokenizer наберет текстовое содержимое на множество терминов, запрос переносы также будут запрашивать то же слово или другое слово является строкой символов, путем анализа и индекса. Обычное ИК китайское слова в качестве примера, для поля заголовка, анализатор параметры значения ik_max_word, использовать ik_max_word средство слова, когда поле названия при индексировании контента и выполнении запроса, отображение конфигурации выглядит следующим образом:

 

сайт PUT

{

"отображение": {

"свойства": {

"заглавие":{

«Типа»: «текст»,

"Анализатор": "ik_max_word"

}

}

}

}

Этот параметр может запросить анализатор, поле, уровень индекса определяется как его приоритет (приоритет более спереди):

 

Определено на поле Tokenizer

Индекс определяется в конфигурационном слове выключателя

по умолчанию токенизатор (стандарт)

В контексте запроса, приоритет Уорда, чтобы найти:

 

полнотекстовый слово запроса определяется

Определяется тип, определенный в search_analyzer токенизатор отображение поля

отображения пользовательского типа поля, определенный анализатор токенизатор

Индекс слово определяется Отправить пароль

Индекс определяется по умолчанию Tokenizer

Стандартный токенизатор (стандарт)

2. search_analyzer

Индексирование и поиск в большинстве случаев должно быть указано, когда то же самое слово, чтобы обеспечить согласованность терминов после индекса разбора запроса. Но иногда вам нужно указать другое слово прерыватель. Например, с помощью фильтра edge_ngram автоматического завершения. Использование запрос атрибуты анализаторов указаны слово прерыватель по умолчанию, но могут быть также покрыты search_analyzer.

 

Примерами являются следующие:

 

сайт PUT

{

"Настройка": {

"анализ":{

"фильтр":{

"Autocomplete_filter": {

"Тип": "edge_ngram",

"Min_gram": 1,

"Max_gram": 20

}

},

"Анализатор": {

"Автозаполнение": {

«Тип»: «на заказ»,

«Токенизатор»: «стандарт»,

"фильтр":[

«Нижний регистр»,

"Autocomplete_filter"

]

}

}

}

},

"отображение": {

"свойства": {

"заглавие":{

«Типа»: «текст»,

«Анализатор»: «автозаполнение»,

"Search_analyzer": "стандарт"

}

}

}

}

поле названия используется автозаполнение слова выполняется сегментация, но с использованием стандартного слова ищется. Индексирование документа:

 

PUT сайт / 1

{

«Название»: «Быстрый Браун Фокс»

}

в заголовке поле, генерируемое инвертированного индекса терминов включают в себя следующее:

 

[Д, Qu, кви, Quic, быстрый, б, ш, братан, бровей, коричневый, F, FO, лисица]

1

3. нормализатор

Параметры Normalizer для анализа до стандартизированной конфигурации, внимания на ключевые слова типа, например, все символы в нижний регистр. Значение Foo в следующем примере используются в поле перед анализом пользовательского нормализатора строки нормализованы и преобразуются в нижний регистр:

 

сайт PUT

{

"Настройка": {

"анализ":{

"Нормализатор": {

"My_normalizer": {

«Тип»: «на заказ»,

"Char_filter": [],

"Фильтр": [ "нижний регистр", "asciifolding"]

}

}

}

},

"отображение": {

"свойства": {

"Foo": {

«Тип»: «ключевое слово»,

"Нормализатор": "my_normalizer"

}

}

}

}

4. повышение

Правое поле используются для увеличения поля настройки веса. Такие, как установка правильных ключевых слова появляются в поле названия веса в два раза тяжелее, как и появляется контент в правом поле, где весовое содержание тяжелого поля по умолчанию 1, отображение выглядит следующим образом:

 

сайт PUT

{

"отображение": {

"свойства": {

"заглавие":{

«Типа»: «текст»,

"Подталкивание": 2

},

"Содержание": {

«Тип»: «текст»

}

}

}

}

Вы также можете установить вес в момент запроса:

 

сайт POST / _search

{

"Запрос": {

"совпадение":{

"заглавие":{

«Запрос»: «Я китайский»

"Подталкивание": 2

}

}

}

}

Рекомендуется указано увеличение времени запроса. При установке индекса взвешивания, если не перестроить индекс, веса не может быть изменен. При указании запроса веса может достичь того же эффекта, изменение веса более гибким.

 

5. принуждать

принуждать свойство для удаления грязных данных, значение по умолчанию верно. Целые числа 3-5 могут быть записаны в виде строки символов «5» или 5.0 поплавка. Атрибут принуждать может быть использован для удаления данных грязных, строк, и с плавающей точкой преобразуется в целое число.

 

6. copy_to

Так как заданный пользователь _all значение поля параметров copy_to может быть скопировано на множество супер поля полех. В следующем примере заголовок содержания и поле контента слито full_content.

 

сайт PUT

{

"отображение": {

"свойства": {

"заглавие":{

«Типа»: «текст»,

"Copy_to": "full_content"

},

"Содержание": {

«Типа»: «текст»,

"Copy_to": "full_content"

},

"Full_content": {

«Тип»: «текст»

}

}

}

}

7. doc_values

doc_values ​​параметром является ускорение сортировки, операции полимеризации. При построении инвертированного индекса, добавив дополнительное ** ** отображение хранения столбчатого, это практика пространство для времени. По умолчанию на поле не требуется для полимеризации или могут быть отсортированы от doc_values ​​экономии места.

 

сайт PUT

{

"отображение": {

"свойства": {

"положение дел":{

«Тип»: «ключевое слово»

},

"идентификатор сессии":{

«Тип»: «ключевое слово»,

"doc_values": ложные

}

}

}

}

Примечание: тип текста не поддерживается doc_values

 

8. динамическая

Если поле может быть добавлено автоматически, установив отображение динамического, принимает следующие параметры:

 

правда: Значение по умолчанию автоматически добавляется поле

ложь: игнорировать новое поле

строгий: строгий режим, открыть для себя новые поля сгенерировано исключение

Как использовать:

 

сайт PUT

{

"отображение": {

«Динамический»: «строгий»,

"свойства": {

"заглавие":{

«Тип»: «текст»

}

}

}

}

9. включен

индекс ES по умолчанию все поля, и некоторые поля нужно только для хранения, запроса или нет агрегации спроса, в этом случае вы можете использовать параметр включен для контроля. позволило установить в поле к ложному, ES Пропускает содержимое поля, значение поля может быть получено только из _source, но это не может быть найдено, поле может быть любым типом. Например:

 

сайт PUT

{

"отображение": {

"свойства": {

"имя":{

«Включено»: Ложные

}

}

}

}

10. fielddata

полимеризационных текстовые поля могут быть включены fielddata. fielddata впервые в области полимеризации, сортировка или при использовании генерации сценария. ES регенерировать условие документа в перевернутых отношениях, читая записи в таблице на диске, и, наконец-то память кучи Java.

 

fielddata атрибут текстового поля по умолчанию отключена, откройте fielddata потребляющего памяти.

 

 

сайт PUT

{

"отображение": {

"свойства": {

"заглавие":{

«Типа»: «текст»,

"Fielddata": правда

}

}

}

}

Формат 11.

ES с помощью параметра формата определяет формат даты.

 

сайт PUT

{

"отображение": {

"свойства": {

"Индекс": {

«Типа»: «дата»,

«Формат»: «гггг-ММ-дд чч: мм: сс || гггг-ММ-дд || epoch_millis»

}

}

}

}

12. ignore_above

Максимальная длина указанной строки, превышает максимальную длину, будут проигнорированы, только тип ключевого слова, например:

 

сайт PUT

{

отображения: {

"свойства": {

"сообщение":{

«Тип»: «ключевое слово»,

"Ignore_above": 20

}

}

}

}

13. ignore_malformed

ignore_malformed может игнорировать неправильные данные. Для исключения индекса поля несоответствующего типа данных происходит, в результате чего весь документ индексация не удалась. Если ignore_malformed параметр установлен верно, то исключение будет игнорироваться, аномальные поля не будут индексироваться, другие поля проиндексированы надлежащим образом.

 

14. индекс

атрибутов индекса указывает ли индексируется поле, он не выполняет поиск индекса, принимает значение истина или ложь.

 

15. index_options

Какая информация хранится в параметре index_options инвертированного индекса управления индекс. Устанавливает заголовок поле хранит номер документа, частота слова, расположение слов, начало и конец с точки зрения позиций символов, отображение выглядит следующим образом:

 

сайт PUT

{

"отображение": {

"свойства": {

"заглавие":{

«Типа»: «текст»,

"index_options": "Коррекция"

}

}

}

}

index_options Параметр Значение таблицы:

 

Параметры роли

документы хранят только номер документа, значение по умолчанию

freqs хранит номер документа и частота лексических единиц

Нет позиции для хранения документов, термин частота, термин смещения, смещение может быть использована для закрытия поиска и запрос фразы

Смещения номер документа, ключевые слова частоты, слово расположение пункта, в срок начала и окончания позиций символов накоплены, смещение устанавливается в истинных целей Объявления выделитель выделение

16. поля

Параметр поля позволяет такое же поле есть много различных способов индексации. Например, поле типа текста, может быть использовано для получения китайского текста, поиска пиньинь, отображение выглядит следующим образом:

 

сайт PUT

{

"отображение": {

"свойства": {

"заглавие":{

«Типа»: «текст»,

"Анализатор": "ik_max_word",

"Search_analyzer": "ik_smart",

"полей": {

"Пиньинь": {

«Типа»: «текст»,

«Анализатор»: «пиньинь»

}

}

}

}

}

}

17. нормы

нормирует параметры для документов по стандартизации, для того, чтобы вычислить корреляцию запроса документа. нормы, в то время как полезно забить, но будет потреблять больше дискового пространства, если вам не нужно забивать поле, то лучше не открывать нормы.

 

18. null_value

Нулевые поля значения не индексируются и не могут найти, null_value параметр позволяет значение индекса может быть поля нуля отображается для поиска. Примерами являются следующие:

 

сайт PUT

{

"отображение": {

"свойства": {

"положение дел":{

«Тип»: «ключевое слово»,

"Null_value": "NULL"

}

}

}

}

 

PUT сайт / 1

{

«Статус»: нулевая

}

 

PUT сайт / 2

{

"положение дел":[]

}

 

ПОЛУЧИТЬ сайт / _search

{

"Запрос": {

"срок":{

"Статус": "NULL"

}

}

}

1 документ можно найти, поскольку статус является недействительным, документ-не может быть найден, потому что значение является пустым состоянием массива, но не нулевое.

 

19. свойства

Отображение типа, нормального поле, и типа Objet типы вложенных полей указанные свойства (свойства), эти атрибуты могут представлять собой любой тип данных, в том числе вложенных типов объектов и атрибутов может быть добавлен одним из следующих способов:

 

Четко определить их при создании индекса.

Четко определить их, когда вы добавляете или обновление с помощью сопоставления PUT типа отображения API.

Динамически добавляется при индексировании документа, содержащего новое поле.

20. сходство

параметр подобия используется для определения модели документа скоринга, есть три параметра:

 

BM25: ES и Lucene по умолчанию модель скоринга.

классический: TF / скоринг модель IDF.

булева: модель скоринга.

сайт PUT

{

"отображение": {

"свойства": {

"имя":{

«Типа»: «текст»,

«Сходство»: «классический»

}

}

}

}

21. магазин

По умолчанию, поле индексируется, вы можете искать, но не сохраняются. Поскольку _source поле содержит копию исходного документа. В некоторых случаях это имеет смысл, например, не хранить исходные файлы, хранит только несколько полей нужно.

 

сайт PUT

{

"отображение": {

"_источник":{

«Включено»: Ложные

},

"свойства": {

"заглавие":{

«Типа»: «текст»,

«Магазин»: правда

},

"Индекс": {

«Типа»: «дата»,

«Магазин»: правда

},

"Содержание": {

«Тип»: «текст»

}

}

}

}

22. term_vector

вектор Слово содержит следующую информацию текст, который будет анализироваться:

Набор лексических единиц

Термин позиция

Стартовый символ отображается в перспективе позиции в исходном документе

term_vector параметр таблицы значений:

 

Параметр Значение Значение

нет значения по умолчанию, не хранит вектор слово

да просто коллекция предметов хранится слово

with_positions хранения терминов и срок позиции

with_offsets Срочные и характер смещения

with_positions_offsets хранения лексических единиц, термин положение, характер смещения позиции

Источник: https://blog.csdn.net/dwjf321/article/details/104003852

 

Опубликовано 277 оригинальные статьи · вона похвала 65 · просмотров 380 000 +

рекомендация

отblog.csdn.net/ailiandeziwei/article/details/104674654
рекомендация