¡Todos los ojos están puestos, se acerca el contraataque de Google! El nuevo PaLM 2 supera al GPT-4, el barril de la familia de oficina revienta y se actualiza, y la evolución épica de Bard...

 Productos secos Datawhale 

Último: Google PaLM 2, Fuente: Qubits

Todos los ojos están puestos y se acerca el contraataque de Google.

Ahora, la Búsqueda de Google finalmente está agregando la función de diálogo AI, y se ha abierto el canal de cola.

0ec6093a2866b66623f74498380f8551.gif

Por supuesto, este es sólo el primer paso.

Los grandes están por venir:

El nuevo modelo de lenguaje grande PaLM 2 se presentó oficialmente y Google afirma que supera a GPT-4 en algunas tareas.

La capacidad de Bard se ha actualizado mucho , no es necesario esperar en la fila y admite nuevos idiomas.

También se lanza la versión de Google del asistente de oficina AI, y será la primera en aparecer en Gmail.

Google Cloud también ha lanzado una serie de modelos básicos a gran escala para proporcionar más servicios de inteligencia artificial generativa para la industria...

En la última conferencia de desarrolladores de I/O, el gran espectáculo de Google fue realmente impactante.

Algunos internautas gritaron:

La guerra de la IA está en pleno apogeo.

5fa29615022415f5153ede9328892d03.png

Algunos incluso dijeron:

Ahora me arrepiento de haber pagado por ChatGPT.

40b6235fe2cf6b1d98316234fb575ff6.png

Después de una conferencia de prensa, el precio de las acciones de Google subió más de un 4%.

e816e885061e61087f0be99c6286a687.png

Algunas tareas de PaLM 2 superan a GPT-4

No hay duda de que PaLM 2 es la principal prioridad de la conferencia I/O de este año, que fue presentada por el propio Pichai.

2630b30ffeeaa6d0d28cc4b269fd327f.png

El Bard actual y más de 25 productos y funciones de inteligencia artificial de Google ahora son compatibles con PaLM 2 como tecnología subyacente.

Como el modelo grande más avanzado de Google en la actualidad, PaLM 2 se basa en la arquitectura Pathways, una versión mejorada de PaLM, basada en TPU v4 a través de JAX.

Según los informes, PaLM 2 ha recibido capacitación en más de 100 idiomas , lo que lo hace más capaz en la comprensión, generación y traducción de idiomas, y será mejor en el razonamiento de sentido común y el análisis lógico matemático.

Google dijo que el conjunto de datos de PaLM 2 tiene una gran cantidad de documentos y páginas web que contienen muchas expresiones matemáticas. Después de entrenar con estos datos, PaLM 2 puede resolver fácilmente problemas matemáticos e incluso hacer gráficos.

En términos de programación, PaLM 2 ahora admite 20 lenguajes de programación, como Python, JavaScript y otros lenguajes de uso común, así como Prolog, Fortran y Verilog.

c299720e118bf0be4079da23d51c00e4.png

Esta vez Google lanzó PaLM 2 en cuatro tamaños diferentes.

Utilizan diferentes animales para representar la escala. El más pequeño es "Gecko" y el más grande es "Unicornio".

8a65737dd5984916cc31fcd07785d9bc.png

Entre ellos, la versión "Gecko" es muy liviana y puede ejecutarse rápidamente en dispositivos móviles, incluido el estado fuera de línea; puede procesar 20 tokens por segundo.

ff3f51f1c63d26fdc09a11634d9d841e.png

El vicepresidente de DeepMind dijo en la conferencia de prensa previa a la conferencia I/O:

Hemos descubierto que más grande no siempre es mejor, por eso hemos decidido ofrecer una gama de modelos en diferentes tamaños.

Esto significa que será más fácil ajustar PaLM 2 para que pueda admitir más productos y aplicaciones.

En la conferencia I/O, Google anunció que más de 25 productos y aplicaciones ahora utilizan las capacidades de PaLM 2.

La forma específica de expresión es Duet AI .

86360b5b985396590923bc54e7a5749f.png

Puede entenderse como un producto de referencia de Microsoft 365 Copilot, un asistente de inteligencia artificial que puede integrarse en varios software de oficina.

Google ha demostrado las capacidades de Duet AI en Gmail, Google Docs y Google Sheets en la conferencia de prensa.

Incluyendo complementar el contenido del correo electrónico de acuerdo con las indicaciones, generar PPT, generar materiales de imagen de acuerdo con las indicaciones, generar formularios con un solo clic, etc.

57143d62ba402773bfbb61f402c3c07d.gif

Asimismo, este asistente de IA también puede brindar asistencia en la programación. Basado en Google Cloud, puede recomendar y corregir bloques de código en tiempo real y responder preguntas de programación de manera conversacional. Actualmente es compatible con Go, JavaScript, Python y SQL.

Además, basándose en PaLM 2, Google también ha lanzado algunos modelos grandes en campos profesionales.

El equipo de salud de Google construyó Med-PaLM 2 . Puede responder a una variedad de preguntas médicas y se dice que es el primer modelo de lenguaje grande en lograr un desempeño de nivel experto en el Examen de Licencias Médicas de EE. UU.

c2a63659a4393273d848d8d1f6b8d1dc.png

Actualmente, Google está tratando de hacerlo multimodal, como dar un diagnóstico después de examinar las radiografías usted mismo. A finales de este verano, este modelo estará disponible para un pequeño grupo de usuarios de Google Cloud.

e614eb6fdb637f2d76ceb4602ec09a28.gif

Otro modelo grande especializado es Sec-PaLM 2.

Este es un modelo a gran escala para el mantenimiento de la seguridad de la red, que puede analizar y explicar posibles scripts maliciosos y detectar el peligro de los scripts.

Luego, después de demostrar las extraordinarias capacidades de PaLM 2, es hora de hablar sobre cómo abrirlo para su uso.

Google dice que PaLM 2 ahora está disponible a través de la interfaz API de PaLM, Firebase y Colab.

Bard es completamente abierto y admite aplicaciones como imágenes y mapas integrados.

Bard, que se compara con ChatGPT, finalmente canceló la prueba de colas y la abrió por completo en más de 180 países y regiones de todo el mundo.

Se agregó el modo oscuro, muy elogiado por los programadores: (cabeza de perro manual)

51c0cf9fa0f2501e6b61c35cbad2cac3.png

Además de ampliar el alcance del acceso, Bard también agregó la capacidad de hablar directamente en japonés y coreano además del inglés. El chino parece tener que esperar a la próxima ola : Google dice que pronto agregará 40 versiones de idiomas.

188c2744f531d689e3ae9cf76df41e70.png

Desde hoy, Bard estará completamente conectado a PaLM 2, por lo que sus capacidades de programación y razonamiento también se han mejorado mucho, y la generación, depuración e interpretación de código son más profesionales (del tipo reconocido por los programadores).

Cuando lo dejas usar python para escribir un movimiento de ajedrez de "matar en cuatro pasos" (mate del erudito), que se refiere a otros códigos, te dará enlaces relevantes para tu conveniencia.

53fbf09eada06cf89b9d492245e7bd07.png

Puede preguntarle más sobre una función en el código que no entiende, preguntarle si puede mejorarla o pedirle que combine todo en un bloque de código.

11b77988fde957959aa3e3fee2e7d9c6.gif

Sin embargo, lo más sorprendente es que se ha añadido la función de importación con un solo clic a petición de la mayoría de desarrolladores .

Ahora, puede exportar el código generado por Bard directamente a Colab.

94f45dd0fb3b6220d27618926ec4f577.png

Además del código, cualquier contenido que genere con Bard, como borradores y formularios de correo electrónico, también se puede arrastrar directamente a Gmail, Documentos y Hojas de cálculo.

Por cierto, Bard ahora también admite imágenes en su respuesta . Lo más conveniente es pedir guías de viaje:

b5713fff6375ce89486dae6cada8e8fc.gif

Además de poder responderte con imágenes, también puedes enviarle imágenes directamente, como subir una imagen de dos perros, y dejar que te ayude a inventar algunas historias interesantes:

9281040bcdc72b9e9caa2df0b47b612c.gif

La función funciona con Google Lens, una aplicación de inteligencia artificial que permite que las máquinas aprendan a "ver imágenes y hablar".

Además de Google Lens, las capacidades de las aplicaciones propias de Google, como Docs, Drive, Gmail y Maps, también están integradas en Bard.

Por ejemplo, en la respuesta de Bard, use directamente Google Maps para ver la ubicación geográfica de varias universidades:

ef30c812709cdc2daac418a296e97094.png

Existe la sensación de que si desea usar varios productos de Google ahora, solo necesita usar Bard como entrada .

Además de su propia aplicación, Bard también mencionó Adobe Firefly esta vez, y varias imágenes creativas con derechos de autor pueden ser "útiles" con el diálogo:

ca086ebdd1a36d60b1b6fc65abd60011.gif

Refactorización de búsquedas, únete al diálogo sobre IA

Después de miles de llamadas, la búsqueda de Google finalmente abrió la capacidad de diálogo de IA.

"Para una familia con un niño menor de 3 años y un perro, ¿es mejor Bryce Canyon o Arches National Park?"

Para esta pregunta, antes de dejarla de lado, es posible que deba dividirla en varias preguntas pequeñas e ir al motor de búsqueda para ordenar mucha información antes de que finalmente pueda encontrar la respuesta.

Ahora Google te permite intentar hacerlo en un solo paso.

Como se muestra en la figura, la búsqueda de Google no solo llevó las respuestas buscadas, sino que tomó en cuenta los dos factores de niños y perros para dar una respuesta ordenada, por ejemplo, dijo:

Bryce Canyon tiene dos circuitos en los que pueden entrar los perros y es muy amigable para los paseantes; el Parque Nacional Arches no permite que las mascotas entren en la mayoría de las carreteras; ambos lugares requieren que las mascotas estén atadas, etc.

9c64cf0720b4d61aa454804f3644c6eb.png

Cada oración tiene un enlace de base específico para ver:

1c007022156bc8208fbbc5f4820134dc.png

Además, también mostrará enlaces a estrategias publicadas por internautas de diferentes sitios web.

Lo mejor de todo es que puede hacer más preguntas conversacionales sobre sus respuestas haciendo clic en el botón "solicitar un seguimiento".

Ir de compras también es divertido con la nueva Búsqueda de Google , que pretende ayudarlo a tomar decisiones de compra rápidas y racionales.

Por ejemplo, cuando desee una "bicicleta para un viaje de montaña de 5 millas", primero le indicará los factores importantes que debe considerar antes de elegir, como:

Fíjese en el diseño: las bicicletas eléctricas, las bicicletas de carretera y las bicicletas híbridas son adecuadas para los desplazamientos;

El segundo es observar el motor y la batería, y el tercero es observar la suspensión para la absorción de impactos Los desplazamientos en carreteras de montaña deben lidiar con el impacto de grietas y baches.

Luego, recomiéndele un automóvil adecuado y brinde información completa, como descripciones de productos específicos, últimas reseñas, precios e imágenes cuando lo recomiende.

2eae72202dc2cc4dbab210e40318f2ce.png

También puede hacer más preguntas, por ejemplo, siempre que solo necesite una bicicleta eléctrica roja, optimizará aún más la respuesta.

c200519b9040833c0d5410b5c933d30f.png
19835baae6b27ca20bd9695377876690.png

Esta característica está impulsada por el producto de comparación de compras de Google, Shopping Graph, que recopila y actualiza constantemente listados de productos de todo el mundo.

Vale la pena mencionar que Google declaró sin rodeos que la interfaz de búsqueda de IA actualizada aún estará integrada con anuncios, pero tenga la seguridad de que solo aparecerá en espacios publicitarios dedicados y no se mezclará con sus resultados de búsqueda.

Finalmente, esta nueva función solo se puede aplicar para prueba en Google Search Labs y está limitada a la experiencia del usuario en los Estados Unidos.

Tres modelos básicos lanzados en Google Cloud

En la conferencia I/O de este año, el contenido de Google Cloud también llama la atención.

Después de actualizar una gran ola de capacidades de IA, Google lanzó tres nuevos modelos para su plataforma de aprendizaje automático en la nube Vertex AI:

  • Codey: texto a código, ayudando a los programadores a escribir código

  • Imagen: texto a imagen, genera imágenes de alta calidad

  • Chirp: voz a texto, fácil de comunicar

b2d692ab373b061a17386d381ccd442c.gif

Las capacidades de estos tres modelos se demostraron en la conferencia de prensa de hoy, como la generación de códigos y la edición inteligente de fotos de Google.

c669ac5382014abac1f0674264ad9719.gif

Además, las API integradas para texto e imágenes ahora están disponibles en Vertex AI. Admite la conversión de datos de texto e imágenes en vectores numéricos multidimensionales y el mapeo de relaciones semánticas, lo que permite a los desarrolladores crear aplicaciones más interesantes.

Otra actualización importante fue en RLHF, donde Google dijo que fueron los primeros en traer esta funcionalidad como un servicio administrado a su plataforma de aprendizaje automático de extremo a extremo. La ventaja es que las empresas pueden combinar RLHF para entrenar rápidamente el modelo de recompensa para ajustar el modelo básico, que es fundamental para mejorar la precisión de los modelos grandes en aplicaciones industriales.

Además del modelo, Google Cloud también lanzó la supercomputación GPU A3 de próxima generación para capacitación. Al combinar la máquina virtual A3 y Nvidia H100, Google Cloud puede proporcionar un mayor rendimiento informático y ancho de banda, lo que permite a las empresas desarrollar modelos de aprendizaje automático más rápido.

Además de estos, Google también trajo nuevos productos de hardware, como el primer teléfono móvil con pantalla plegable con un precio de US $ 1,799 (aproximadamente RMB 12,000), así como el sistema Android 14 con acceso a funciones de IA (como proporcionar sugerencias de respuesta de información o algo así), no se muestra aquí uno por uno.

En general, como la 15ª conferencia I/O, Google realmente les ha traído muchos productos secos esta vez.

Vale la pena mencionar que Jeff Dean ya no es el orador invitado presentado en el escenario esta vez, solo cambió su rango hace unos días.

Como el ejecutivo más representativo de Google AI en el pasado, ¿dónde estará en la ola de AI 2.0?

También vale la pena esperar si Google puede ponerse al día en los campos de modelos grandes y búsqueda de IA.

¿Estás satisfecho con el contraataque de Google esta vez?

eee7af7116abee49c76bda64530a1a69.png

Aprendizaje de productos secos, como tres veces

Supongo que te gusta

Origin blog.csdn.net/Datawhale/article/details/130633413
Recomendado
Clasificación