4ª semana de julio 2023 Colección de modelos grandes

4ª semana de julio 2023 Colección de modelos grandes

  • 2023.7.31
  • Declaración de derechos de autor: este artículo es el artículo original del blogger chszs y no se reproducirá sin el permiso del blogger.

1. Cerebras lanzó la supercomputadora de IA más fuerte del mundo

Cerebras Systems, una empresa emergente de chips de IA, y G42, un holding tecnológico con sede en los Emiratos Árabes Unidos, anunciaron el 20 de julio que se unirán para construir una red de supercomputadoras interconectadas para brindar una nueva solución para la computación de IA, que se espera que reduzca en gran medida el tiempo de entrenamiento de modelos grandes de IA. En la actualidad, se lanza oficialmente la primera supercomputadora de IA en la red: "Condor Galaxy 1 (CG-1)", con una potencia de cómputo de IA de hasta 4 exaFLOPS, que actualmente es la supercomputadora de IA más poderosa.

CG-1 está compuesto por 64 computadoras CS-2 AI, y cada computadora CS-2 AI está impulsada por un chip WSE-2, lo que hace que la cantidad de núcleos AI en todo el sistema CG-1 alcance los 54 millones. la capacidad de memoria del chip alcanza los 82 TB, y la tasa de ancho de banda entre cada sistema CS-2 es de hasta 388 Tbps. Al mismo tiempo, el CG-1 también está equipado con hasta 72704 núcleos de CPU AMD EPYC.

CG-1 está optimizado para modelos de lenguaje grandes e inteligencia artificial generativa, con hasta 600 mil millones de modelos de parámetros compatibles como estándar. CG-1 utiliza un paralelismo de datos simple para lograr una escala de rendimiento casi lineal de 1 a 64 sistemas CS-2. La configuración ampliada admite hasta 100 billones de modelos de parámetros. Debe saber que el muy popular modelo de IA GPT-4 este año tiene 1,8 billones de parámetros.

2. Microsoft, OpenAI, Google y otros gigantes establecieron conjuntamente el Frontier Model Forum

Cuatro empresas, Microsoft, OpenAI, Google y Anthropic, iniciaron conjuntamente el establecimiento del Frontier Model Forum, que es una organización centrada en modelos de inteligencia artificial de vanguardia. Los llamados modelos de inteligencia artificial de vanguardia hacen referencia a aquellos modelos de aprendizaje automático a gran escala que superan las capacidades de los modelos de última generación existentes y pueden realizar múltiples tareas. El Foro cree que las empresas que crean tecnología de IA tienen la responsabilidad de garantizar que sea segura y esté bajo control humano.

La organización Frontier Model Forum ha anunciado sus objetivos de desarrollo:

  • Avanzar en la investigación de seguridad de IA para facilitar el desarrollo responsable de modelos de vanguardia, reducir el riesgo y permitir evaluaciones independientes y estandarizadas de capacidad y seguridad.
  • Identifique las mejores prácticas para el desarrollo y la implementación responsables de modelos de vanguardia y ayude al público a comprender la naturaleza, las capacidades, las limitaciones y las implicaciones de esta tecnología.
  • Colabore con legisladores, académicos, la sociedad civil y las empresas para compartir conocimientos sobre los riesgos para la confianza y la seguridad.
  • Apoyar el desarrollo de aplicaciones que puedan ayudar a abordar los mayores desafíos de la sociedad, como la mitigación y adaptación al cambio climático, la detección y prevención tempranas del cáncer y la lucha contra las ciberamenazas.

3. Netease Youdao lanza el modelo grande "Ziyue" para la industria de la educación vertical

El 26 de julio de 2023, NetEase Youdao lanzó el modelo grande "Ziyue" para la industria de la educación vertical. El modelo grande de "Ziyue" se ha aplicado al software y hardware en Youdao Ecology, y se ha comercializado, incluida la traducción de modelos grandes, corrección de composición de IA, lectura de gramática inglesa, entrenador de idiomas de población virtual, AIBox, preguntas y respuestas de documentos, etc. Para usuarios de pago. En la investigación interna de Netease, se cree que la capacidad de traducción del modelo grande "Ziyue" es mejor que la de ChatGPT y supera a todos los principales motores de traducción del mercado.

Comentarios: El comunicado de prensa oficial es un poco arrogante, superando a ChatGPT en todo momento. A juzgar por la traducción de Youdao en la versión web, solo se puede decir que la calidad de la traducción actual es buena. Youdao no siempre puede decir: "Todavía no hemos aplicado el gran modelo a nuestros productos".

4. UFIDA lanza el modelo de servicio empresarial YonGPT

El 27 de julio, UFIDA lanzó YonGPT, un modelo de servicio para grandes empresas. En la pista del modelo a gran escala, UFIDA optó por ser un modelo a gran escala en el campo de los servicios empresariales en el que se ha centrado durante mucho tiempo y ha acumulado hasta cierto punto, en lugar de hacer un lenguaje de propósito general a gran escala. -modelo a escala. En la conferencia de prensa, Yonyou demostró cuatro servicios de escenas inteligentes basados ​​en YonGPT: 1) Análisis inteligente de ingresos/beneficios empresariales y gestión de impuestos basados ​​en YonGPT, que puede controlar el estado operativo en tiempo real, obtener rápidamente información sobre los problemas, predecir con precisión la empresa. beneficios y predecir cambios de manera efectiva; 2) Facturación inteligente basada en YonGPT, realice una facturación inteligente rápida y mejore la eficiencia empresarial; 3) Reclutamiento inteligente basado en YonGPT, ayude a las empresas a identificar rápidamente talentos, encontrar talentos del grupo de currículums y mejorar la experiencia de la aplicación a través de AI interacción; 4) Basado en YonGPT La gran búsqueda inteligente mejora la experiencia de búsqueda, acelera el servicio basado en el valor del conocimiento empresarial y permite que el conocimiento empodere a las empresas y organizaciones.

5. New One Technology lanza modelo vertical de video

El 27 de julio, New One Technology lanzó un gran modelo orientado a video "New One Video Model" y una plataforma de generación de video AIGC basada en este gran modelo. Según el anuncio de New One Technology, sus capacidades de generación de IA han cubierto texto e imágenes. ., audio y video y otros modos de contenido, afirmando realizar el enlace completo del negocio AIGC desde el modelo a gran escala hasta el servicio de plataforma y el aterrizaje del servicio del producto. Es una pena que la conferencia de prensa sea principalmente de labios para afuera, y las cosas reales no se pueden ver.

6. La empresa emergente de inteligencia artificial Cohere lanza Coral, un asistente de conocimiento para usuarios empresariales

El 26 de julio, la startup de inteligencia artificial Cohere anunció el lanzamiento de Coral, un asistente de conocimiento para usuarios empresariales. Coral es un chatbot de nivel empresarial que entabla conversaciones con los usuarios para ayudarlos con las tareas relacionadas con el negocio. Coral alivia el problema de las alucinaciones al proporcionar referencias a datos internos de propiedad de la empresa, así como a fuentes disponibles públicamente, dijo la empresa. Además, Coral puede recibir capacitación sobre datos internos y recursos técnicos de la empresa para brindar análisis, informes y otra información personalizada. Coral ya está vinculado a cientos de fuentes de datos integradas, incluidos CRM, herramientas de colaboración, bases de datos, infraestructura de búsqueda y sistemas de soporte, dijo la compañía.

7. Stability AI lanzó el modelo de gráfico de código abierto Vincent SDXL 1.0

Stable Diffusion, un modelo de generación de texto a imagen creado por la startup estrella de inteligencia artificial Stability AI, se ha vuelto popular en todo el mundo este año. Si bien no hay escasez de modelos generativos de texto a imagen, Stable Diffusion es el modelo de código abierto más popular. Los desarrolladores de todos los ámbitos de la vida también han llevado a cabo innovaciones secundarias basadas en el modelo Stable Diffusion, lanzando una variedad de aplicaciones AIGC. El 26 de julio, Stability AI lanzó oficialmente el modelo gráfico Wensheng de fuente abierta Stable Diffusion XL (SDXL) 1.0, completando otra iteración importante en el proceso de evolución. Este es el último modelo de imagen insignia de Stability AI y el mejor modelo de código abierto en el campo de la generación de imágenes.

Antes del lanzamiento de SDXL 1.0, Stability AI lanzó SDXL 0.9 en junio solo para uso de investigación. Pero a partir de hoy, SDXL 1.0 será de código abierto para los desarrolladores a través de la API de Stability AI, y la gente común también podrá acceder a él a través de las aplicaciones de consumo Clipdrop y DreamStudio.

Actualmente hay varios canales para experimentar SDXL 1.0:

Algunos modelos domésticos a gran escala pueden seguir la ola de evolución.

8. Se anuncia la clasificación autorizada de los modelos chinos a gran escala C-Eval

C-Eval es un conjunto completo de examen y evaluación para modelos de idioma chino construido conjuntamente por la Universidad de Tsinghua, la Universidad Jiaotong de Shanghai y la Universidad de Edimburgo. Contiene 13.948 preguntas de opción múltiple, que cubren 52 temas diferentes y cuatro niveles de dificultad. El 23 de julio se anunció la clasificación más reciente. Los cuatro mejores modelos chinos a gran escala del mundo son ChatGLM2 de Tsinghua Zhipu, GPT-4 de OpenAI, SenseChat de SenseTime y AiLMe-100Bv1 de APUS. Los detalles son los siguientes:
Clasificación autorizada C-Eval de grandes modelos chinos
la prueba del modelo grande es similar a la puntuación de funcionamiento del teléfono móvil, solo como referencia. Con el ingenio del pueblo chino, podemos entrenar el modelo grande de acuerdo con las preguntas de la prueba y obtener más de 90 puntos o incluso 100 puntos. Algunos fabricantes de teléfonos móviles han optimizado el software de puntuación de carrera y activan la aceleración de overclocking tan pronto como se detecta el software de puntuación de carrera.

9. La herramienta de generación de video de pista Gen-2 está completamente abierta

Runway es una empresa que se enfoca en proporcionar varias herramientas de edición de imágenes de IA. Runway Gen-2 es el último modelo de IA para video generado por texto que lanzó. Gen-2 no solo puede editar un video que cumpla con los requisitos del usuario sobre la base del video original como Gen-1, sino que también puede generar videos desde cero. Usando el modelo Gen-2, los usuarios pueden generar clips de video de 4 segundos basados ​​en indicaciones de texto simples.Estos clips, que se pueden ver como GIF animados, brindan una forma única y concisa de dar vida a las ideas. Y aquellos que quieran usar Runway Gen-2, simplemente creen una cuenta gratuita en el sitio web de Runway.

Sin embargo, la cantidad de videos generados de forma gratuita es limitada. La cuota de prueba gratuita es de 105 segundos y cada video es de 4 segundos, lo que significa que se pueden generar alrededor de 26 videos Gen-2 de forma gratuita. Los usuarios pueden acceder a una variedad de funciones avanzadas por $ 15 por mes o $ 144 por año (por adelantado). Esto incluye videos de mayor resolución, la eliminación de la marca de agua de Runway y un aumento en el límite mensual de videos a 125 segundos, entre otras cosas.

Guess you like

Origin blog.csdn.net/chszs/article/details/132026337