Модель встраивания серии базовых знаний ChatGPT
Embeddings OpenAI (встраивание текста) измеряет релевантность текстовых строк. Встраивание обычно используется для:
- Поиск (ранжирует результаты на основе релевантности строке запроса)
- Кластеризация (где текстовые строки группируются по сходству)
- Предложить (рекомендовать элементы с соответствующими текстовыми строками)
- Обнаружение аномалий (определение выбросов с небольшой корреляцией)
- Меры разнообразия (анализ распределений подобия)
- Классификация (где текстовые строки классифицируются по их наиболее похожим меткам)
Embedding — это, по сути, вектор — список нескольких чисел с плавающей запятой, то есть текст представлен вектором, а расстояние между двумя векторами измеряет их корреляцию. Небольшое расстояние указывает на высокую корреляцию, а большое расстояние указывает на низкую корреляцию.
Вложения — это цифровые представления, которые преобразуют текст в последовательности чисел, облегчая компьютерам понимание взаимосвязей между этими понятиями. С тех пор, как модели встраивания OpenAI были впервые представлены, многие приложения использовали вложения для персонализации, рекомендации и поиска контента.
Получить встраивание текста
Чтобы получить встраивание текста, вам нужно только использовать текстовую строку и идентификатор встроенной модели (например, text-embedding-ada-002) в качестве параметров и вызвать интерфейс openai.
curl https://api.openai.com/v1/embeddings \
-H "Content-Type: application