Коварное и доступное обучение искусственному интеллекту уже здесь, первая модель LLM Hugging Face Falcon 40B включена в Amazon Cloud Technology Services

Произведено | Облачные вычисления CSDN

2023 год — это почти год бурного развития ИИ. Всевозможные масштабные модели приходят одна за другой, и вся отрасль интегрирует AIGC в производственный процесс для повышения эффективности. Недавно в научно-исследовательском центре TII (Институт технологических инноваций) в Абу-Даби, столице Объединенных Арабских Эмиратов, появилась большая языковая модель (LLM) Falcon 40B с 40 миллиардами параметров, которая заняла первое место в списке Hugging Face. большие языковые модели с открытым исходным кодом, а за ними стоит облако. Производитель Amazon Cloud Technology обеспечивает сверхсовременную поддержку обучения вычислительной мощности.

Последний рейтинг моделей больших языков с открытым исходным кодом Hugging Face

Модель большого языка Falcon предоставляет две версии с открытым исходным кодом разного размера — Falcon 40B и Falcon 7B, обе из которых созданы с нуля с использованием задач предварительной обработки данных и обучения модели Amazon SageMaker. Falcon 40B с открытым исходным кодом позволяет пользователям создавать и настраивать инструменты искусственного интеллекта для удовлетворения уникальных потребностей пользователей, упрощая интеграцию и обеспечивая долгосрочное сохранение активов данных. Веса моделей доступны для скачивания, проверки и развертывания в любом месте.

Здесь необходимо упомянуть облачный сервис ИИ, знаменитый Amazon SageMaker в рамках Amazon Cloud Technology. С момента появления больших моделей Amazon SageMaker постепенно включил в свою матрицу услуг основные крупные модели, такие как Stability AI, AI21 Labs и LG AI. Теперь пользователи, которые хотят использовать Falcon 40B, могут также развернуть Falcon 40B в центре машинного обучения Amazon SageMaker JumpStart. собственные модели с нуля.

Согласно последним новостям от Amazon Cloud Technology, начиная с 7 июня в Amazon SageMaker JumpStart также будут доступны две широкоязычные модели Falcon с открытым исходным кодом. Это центр машинного обучения SageMaker, который предоставляет предварительно обученные модели, встроенные алгоритмы и готовые шаблоны решений, чтобы помочь пользователям быстро начать работу с машинным обучением. Пользователи могут развертывать и использовать модели Falcon одним щелчком мыши в SageMaker Studio или программно с помощью SageMaker Python SDK.

Все мы знаем, что обучение ИИ требует много вычислительных ресурсов.Облачная технология Amazon SageMaker — это набор управляемых API для разработки, обучения, настройки и размещения моделей машинного обучения (ML), включая большие языковые модели. SageMaker Training предоставляет вычислительные кластеры с определяемыми пользователем аппаратными конфигурациями и кодом. Вычислительные задания тарифицируются по количеству запусков, а задачи распределяются посекундно, что означает, что пользователям не нужно платить за ресурсы графического процессора, когда услуга не используется. Можно сказать, что оптимизация затрат на обучение больших моделей ИИ поставщиками облачных услуг является очень доступным выбором для разработчиков. TII использует временный кластер, предоставляемый SageMaker Training API, для обучения большой языковой модели Falcon, поддерживая до 48 экземпляров ml.p4d.24xlarge (384 графических процессора NVIDIA A100). Теперь TII обучает следующее поколение больших языковых моделей Falcon, масштабируя обучение до 3136 графических процессоров A100 (392 экземпляра ml.p4d).

В дополнение к услугам крупномасштабных моделей Amazon Cloud Technology также предлагает помощника по программированию искусственного интеллекта Amazon CodeWhisperer, который является бесплатным для отдельных разработчиков. Помимо изучения миллиардов строк общедоступного кода, Amazon CodeWhisperer также обучается работе с кодом Amazon, чтобы создавать наиболее точный, быстрый и безопасный код для облачных сервисов, таких как Amazon EC2, Amazon Lambda и Amazon S3. Разработчики, использующие Amazon CodeWhisperer, выполняют задачи в среднем на 57 % быстрее, а вероятность успеха на 27 % выше.

Теперь вся отрасль использует искусственный интеллект для повышения эффективности производства и обслуживания, и поставщики облачных услуг, как поставщики вычислительных мощностей и приложений верхнего уровня, могут сыграть в этом огромную роль. Облачная модель также позволяет масштабировать вычислительную мощность и в то же время может максимизировать эффективность затрат на разработку приложений ИИ и снизить порог для разработчиков для развертывания ИИ от развертывания до онлайн.Для разработчиков очень выгодно платить внимание и попробовать. CSDN также продолжит сообщать последние новости AIGC.

おすすめ

転載: blog.csdn.net/FL63Zv9Zou86950w/article/details/131115326