Модель встраивания серии базовых знаний ChatGPT

Модель встраивания серии базовых знаний ChatGPT

Embeddings OpenAI (встраивание текста) измеряет релевантность текстовых строк. Встраивание обычно используется для:

  1. Поиск (ранжирует результаты на основе релевантности строке запроса)
  2. Кластеризация (где текстовые строки группируются по сходству)
  3. Предложить (рекомендовать элементы с соответствующими текстовыми строками)
  4. Обнаружение аномалий (определение выбросов с небольшой корреляцией)
  5. Меры разнообразия (анализ распределений подобия)
  6. Классификация (где текстовые строки классифицируются по их наиболее похожим меткам)

Embedding — это, по сути, вектор — список нескольких чисел с плавающей запятой, то есть текст представлен вектором, а расстояние между двумя векторами измеряет их корреляцию. Небольшое расстояние указывает на высокую корреляцию, а большое расстояние указывает на низкую корреляцию.

Вложения — это цифровые представления, которые преобразуют текст в последовательности чисел, облегчая компьютерам понимание взаимосвязей между этими понятиями. С тех пор, как модели встраивания OpenAI были впервые представлены, многие приложения использовали вложения для персонализации, рекомендации и поиска контента.

Получить встраивание текста

Чтобы получить встраивание текста, вам нужно только использовать текстовую строку и идентификатор встроенной модели (например, text-embedding-ada-002) в качестве параметров и вызвать интерфейс openai.

curl https://api.openai.com/v1/embeddings \
  -H "Content-Type: application

Guess you like

Origin blog.csdn.net/king14bhhb/article/details/130180111