Además de los modelos ChatGPT, ¿qué están haciendo los grandes, medianos y pequeños fabricantes?

Después de la llegada de ChatGPT, las principales empresas han trabajado arduamente en "grandes modelos" y las capacidades del modelo se han convertido en un tema de gran preocupación. Aunque ChatGPT define directamente el tipo de producto de robot de diálogo generativo basado en modelos grandes, el poder de su modelo también ha hecho que todos ignoren sus problemas en el uso del producto.

De hecho, ya sea un gran fabricante que desarrolla modelos subyacentes, un pequeño fabricante que se centra en la capa de aplicación o un desarrollador independiente de código abierto, todos compiten en secreto en términos de experiencia del producto más allá de las capacidades del modelo y participan en este juego definitorio con diferentes actitudes. Se acerca la revolución del diálogo de los nuevos métodos de interacción persona-computadora.

Entonces, además de los modelos, ¿qué más están "rodando"?

Grandes fabricantes: céntrese en los modelos, la experiencia es un poco "simple", centrarse en menos es más

ChatGPT: el marco de tres piezas define el minimalismo

Como punto de referencia de la industria, ChatGPT define directamente el estándar de la industria para robots conversacionales generativos. Al principio, la versión gratuita de ChatGPT solo tenía diálogo, gestión de diálogo y funciones simples de configuración de temas, y arrasó en el mundo con sus capacidades modelo. A medida que aumentaba el número de usuarios y quejas, el gerente de producto de ChatGPT no pudo quedarse quieto y comenzó a agregar gradualmente algunas funciones.

Lo más impresionante es, sin duda, Upgrade to Plus, que domina firmemente la página de configuración en la esquina inferior izquierda. A primera vista, solo hay dos palabras, "Agregar dinero". Además, ChatGPT también ha agregado gradualmente funciones como configuración de temas y administración de privacidad, pero aún destaca una moderación, lo cual es bastante cierto para el hermano Xiao Long.

La principal diferencia con la versión paga de ChatGPT es la adición de un botón para cambiar de modelo y la adición de funciones Beta en la configuración. Puede usar la función de búsqueda en Internet Navegación o usar otros complementos.

Bard & Bing: competencia indiferenciada

Los dos restantes de los Tres Grandes, Google Bard y Bing Chat, también tienen sus propios estilos, pero en general siguen manteniendo un estilo minimalista.

La lógica de diseño funcional de Bard es casi la misma que la de ChatGPT: la función de conversación es el foco principal y las funciones necesarias de gestión de conversaciones, gestión de cuentas y configuración de interfaz están integradas. Como maestro de la búsqueda, Bard también ha introducido una función de búsqueda basada en el diálogo, que puede introducir de forma natural búsquedas basadas en preguntas y presentar resultados fusionados, haciendo que la experiencia sea más actualizada. La consulta de información meteorológica y en tiempo real funciona bien.

Los modelos grandes tendrán múltiples respuestas y pesos correspondientes al generar respuestas. La función "Ver otras respuestas" de Bard proporciona a los usuarios más opciones. Cuando pregunté sobre el clima en Beijing, incluso me dio una versión de texto, la versión tabular y la versión minimalista son asombroso.

Cabe mencionar que en términos de interacción, la generación de respuestas de Bard es una generación única en lugar de un modo de máquina de escribir (los textos aparecen uno por uno, con un efecto de máquina de escribir, consulte ChatGPT), carece de un proceso de generación y la experiencia no. no se siente lo suficientemente suave.

A diferencia de ChatGPT y Google Bard, el posicionamiento de Bing Chat se basa en la búsqueda: funciona resumiendo las palabras clave de búsqueda a partir de la entrada y luego resumiendo los resultados de la búsqueda. Cada respuesta cita la fuente correspondiente, lo que también la hace menos creativa, pero la fuente es verificable y la precisión está garantizada.

Bing también tiene un estilo minimalista: el diseño general de la interfaz del producto no es muy diferente de los otros dos, pero los colores son obviamente más vivos. En términos de funcionalidad, ni siquiera hay una función de gestión de conversación al principio, puedes borrarla después de la conversación sin dejar rastro. Posteriormente se agregó la función "Actividad reciente", que permite a los usuarios ver sus conversaciones recientes.

La única característica de Bing es que ha establecido tres estilos de diálogo: más creativo, más equilibrado y más preciso. Puede determinar si el modelo es más preciso o más creativo en función de este parámetro, que corresponde al parámetro avanzado Temperatura en el Modelo GPT. . Sin embargo, debido a que es imposible comparar varios modos al mismo tiempo, es difícil para los usuarios sentir la diferencia en la experiencia del usuario. Incluso con opciones más creativas, debido al posicionamiento más orientado a la búsqueda de Bing, los resultados de búsqueda aún carecen de creatividad.

En comparación, la principal competencia entre los tres gigantes es la capacidad de modelado. Actualmente, ChatGPT sigue liderando, Bard integra mejor los modos de búsqueda y generación y la experiencia es mejor. Bing carece de los aspectos más destacados en uso, pero con una frase El GPT- 4 modelos son suficientes para atraer a la mayoría de los usuarios.

Fábricas pequeñas y medianas: experiencia en cultivo profundo, experiencia y experiencia más allá de las capacidades.

A diferencia de las capacidades del modelo de los grandes fabricantes, las pequeñas y medianas fábricas y los desarrolladores individuales se centran más en la capa de aplicación por encima de la capa del modelo y, basándose en las capacidades del modelo subyacente de los principales fabricantes, han despegado en términos de funcionalidad y experiencia.

Perplejidad: cómo crear un producto de conversación de IA basado en búsquedas

Lo primero de lo que quiero hablar es de 
Perplexity, un motor de búsqueda conversacional, que se puede decir que supera a Google Bard y Bing Chat en términos de experiencia. La perplejidad se traduce como "perplejidad" y es un indicador comúnmente utilizado en el campo de la inteligencia artificial para describir el efecto de los modelos de lenguaje. Cuanto menor es la perplejidad del modelo, más poderoso es el modelo. Perplexity es un pequeño equipo interdisciplinario con solo 14 empleados, pero se puede decir que es una gran empresa en términos de solidez del producto y se puede llamar un modelo de más es más.

Basado en la arquitectura conversacional básica de tres piezas estilo ChatGPT, Perplexity integra búsqueda de campo vertical (académico, YouTube, Reddit, Wolfram, etc.), historial de búsqueda, lista activa de búsqueda y funciones de Copilot (similar a AutoGPT). El diseño de la interfaz de usuario adopta un diseño de búsqueda tradicional, con el cuadro de diálogo en la parte superior de la pantalla y el cuadro de entrada sin marco de diálogo en la parte inferior. Las personas pueden darse cuenta de un vistazo que este producto es más un producto de "búsqueda".

Desde este punto de vista, Perplexity ha destacado su posicionamiento en búsquedas de forma más clara que Google y Bing, con un banner claro y un posicionamiento claro. La lógica del producto es similar a Bing, que es un resumen de los resultados de búsqueda. Después de múltiples usos, parece que las referencias a la literatura son más completas y más creativas que Bing. En múltiples rondas de conversaciones, Perplexity también agrega temas relacionados y predice otras preguntas que puedas tener en función de las respuestas. Si todo va bien, solo necesitas preguntar una vez, y las preguntas restantes se pueden resolver con un solo clic, haciendo que la experiencia muy suave.

Poe: El monstruo de Stitch de "American Zhihu"


Poe es la aplicación oficial de chat de IA lanzada por Quora, el "Zhihu estadounidense". Está conectada a varios servicios de IA como GPT-3.5, GPT-4, Claude, Midjourney, etc. Actualmente es el "monstruo de puntadas de IA" más oficial. ".

Su mayor punto de marketing: puedes usar GPT-4 y Claude Instant de forma gratuita. Sin embargo, cuando haces clic, encontrarás que GPT-4 solo se puede usar una vez al día y 30 veces al mes. Solo se puede decir que ser mejor que nada. Además, aparte de la costura, la experiencia del producto de sus servicios individuales es muy tosca, casi solo tiene funciones de conversación y la experiencia de uso a largo plazo es pobre.

Su asistente oficial de conversación con IA, Sage, no tiene nada único en términos de experiencia de usuario, y también debería utilizar un modelo como GPT-3.5.

Forefront: La mejor alternativa a ChatGPT

Free GPT-4 es casi el método de promoción más efectivo para todas las aplicaciones de shell. Mientras tenga esta función, incluso si solo puede usarla una vez al día, puede engañar a una gran cantidad de tráfico (Poe).


Forefront es casi completamente gratuito para GPT-4. Proviene de un proyecto de GitHub. Proporciona conexiones GPT-4 gratuitas a internautas comunes y corrientes mediante ingeniería inversa a Poe, Bing y otros fabricantes importantes que utilizan GPT-4. Ha obtenido 37.000 estrellas en GitHub y es casi el proyecto de más rápido crecimiento en los últimos tiempos.

Forefront tiene ricos ajustes preestablecidos de personalidad integrados para satisfacer las diversas necesidades de los usuarios. Los valores predeterminados de personalización provienen de un truco clásico: dejar que ChatGPT desempeñe un papel determinado para que sus respuestas puedan ser más precisas. Forefront le permite seleccionar múltiples personalidades con un solo clic, incluidos Leonardo da Vinci, Steve Jobs, ingenieros de desarrollo de software, etc., y proporciona una gran cantidad de plantillas de escenarios que pueden satisfacer escenarios como asistencia en programación, escritura creativa e investigación académica.

Aplicación Shell: explosión de detalles, buenas noticias para los jugadores profundos

Después de hablar sobre los principales actores oficiales, presentemos los diversos productos shell que dependen de la API oficial. Optimizan principalmente la interacción front-end en términos de capacidades del modelo y agregan algunas funciones auxiliares. Los usuarios pueden completar y usar sus propias API.

Este tipo de producto es más adecuado para experimentadores profundos y como herramientas de productividad, y hay muchos detalles que se pueden personalizar.

ChatBox: El rey de los clientes multiplataforma


ChatBox es actualmente el cliente de chat de IA multiplataforma más maduro. Los usuarios pueden acceder de forma independiente a ChatGPT, el servicio Azure ChatGPT, Claude API, etc. Ha recibido 117.000 estrellas en GitHub, arrasando en el mundo del cliente. Para los usuarios obsesionados con los clientes, también es la mejor opción en Windows.

La arquitectura de ChatBox también se basa en la arquitectura de tres etapas de ChatGPT, pero cada parte agrega más funciones para satisfacer una experiencia de uso diversa y eficiente. También establece una variedad de parámetros preestablecidos en la función de gestión de conversaciones, incluido el desarrollo de software, asistente personal, máquina de alarde y otros modos.

En la configuración, ChatBox también admite parámetros avanzados y visualización de información más detallada: primero, puede personalizar los parámetros de temperatura para ajustar la aleatoriedad y la creatividad de las respuestas del modelo; al mismo tiempo, puede mostrar el uso del token API, estimar el número de tokens de entrada y salida, y ajustar el tamaño del texto, el idioma predeterminado y otras características. Después de usarlo, debería considerarse el mejor cliente para Windows.

MacGPT: Si solo hubiera un cliente GPT, sería MacGPT

En cuanto a por qué ChatBox sólo puede ser el mejor cliente de escritorio para Windows, es porque hay un producto mejor en la plataforma Mac:
MacGPT.

Gracias a las características del sistema Mac, MacGPT admite 5 modos: Web, API, modo de barra de tareas, llamada global e Intext. Cualquier escenario puede satisfacer las necesidades.

El modo web es equivalente a una ventana de navegador simplificada y toda la experiencia del usuario es consistente con ChatGPT; la experiencia del modo API es similar a ChatBox, equivalente a un cliente Mac local; el modo de barra de tareas puede permitir despertarse desde la barra de tareas e iniciar conversaciones en cualquier momento, confiar en la barra de tareas garantiza que ChatGPT se pueda iniciar rápidamente en cualquier escenario, lo cual es muy eficiente; el modo de llamada global admite llamar a la barra de conversación superior a través de teclas de acceso rápido e iniciar una conversación de inmediato. Cualquiera que haya usado Alfred debería entenderlo 
. Qué suave es esta experiencia.

El modo Intext es aún más sorprendente: es simplemente un arma mortal para los trabajadores del texto. Cuando escribe en cualquier entorno de entrada de texto (Memo, Word, etc.)  /gpt, el contenido posterior se utilizará como entrada de ChatGPT y las respuestas se generarán directamente en el entorno de texto actual. Puede usar ChatGPT para preguntas y respuestas sin cambiar de aplicación , e insertado directamente en el documento, es simplemente una versión global de Notion AI que debe ampliarse.

ChatGPT-Next: Asistente de IA de servicio en la nube para todos

Si debo elegir un cliente shell ChatGPT del lado web, entonces me gustaría llamar 
a ChatGPT-Next el rey de los asistentes personales.

Su autor no solo desarrolló esta aplicación web, sino que también desarrolló la función de implementación con un solo clic en Vercel (servidor de alojamiento front-end). Es decir, con solo una clave API y unos pocos clics, todos pueden tener su propio cliente ChatGPT exclusivo, para uso personal, en equipo o como servicio para otros, es tan fácil como respirar.

El autor envió con éxito el cliente que implementé a mis padres y a mi abuela, lo que les causó un pequeño shock de IA. La abuela incluso felizmente me preparó un gran plato de cerdo estofado.

En términos de funciones del producto, ChatGPT-Next también es un maestro, con 20 personalidades preestablecidas y escenarios de aplicación, y admite personalización; en términos de parámetros avanzados, modelo de selección de modelo, temperatura aleatoria, tokens máximos de límite de respuesta única y penalización por presencia de frescura del tema. Todo se puede ajustar con precisión según el escenario de demanda. Al mismo tiempo, la compresión de la longitud histórica del mensaje en la gestión del diálogo también es una función de nivel rey: puede resumir el contexto cuando el número de contextos alcanza un cierto token y borrar la memoria anterior, reduciendo efectivamente la ocupación del token y haciendo que el diálogo sea más fácil. durable. Finalmente, su interfaz también es la más personalizable entre todas las aplicaciones: se pueden personalizar las fuentes, la voz, la vista previa de envío y los bordes compactos.

En términos de riqueza funcional y grado de personalización de los productos shell, ChatGPT-Next es el más fuerte en todas las direcciones. Tiene la mejor experiencia después de un uso prolongado. La velocidad de uso de la API también será más rápida que la velocidad oficial de varios servicios Es la primera opción para los jugadores de productividad.

Principales fabricantes nacionales: acceso rápido al ecosistema, las nuevas empresas van un paso más rápido

DingTalk, Feishu y WeChat, como los tres principales gigantes de la mensajería instantánea para oficinas en China, hasta ahora han tenido acceso no oficial a robots de inteligencia artificial de código abierto. Una nueva empresa nacional desarrolló una matriz de robot de diálogo de IA basada en DingTalk y Feishu a través de un proyecto maratónico en la comunidad de código abierto, integrando multimodal (ChatGPT, DALL·E + Whisper, Midjourney), creación de imágenes, análisis de tablas, exportación de documentos, Se pueden realizar discusiones sobre múltiples temas, cálculos de fórmulas y otras funciones. Incluso la API se proporciona de forma gratuita, lo que realmente permite el empoderamiento empresarial y permite que los trabajadores domésticos se conviertan en el primer grupo de jugadores en utilizar la IA sin problemas.

En términos de funciones ToB, las nuevas empresas nacionales deberían estar a la vanguardia del mundo: han completado el desarrollo de productos y pueden implementarse rápidamente de acuerdo con las condiciones empresariales, confiando en la mensajería instantánea para lograr mejoras en la eficiencia de la IA en las oficinas. La implementación rápida con un solo clic, la gestión de permisos de IA a nivel empresarial, los registros de uso de importación y exportación de usuarios, la interceptación de palabras de riesgo, etc., permiten a los usuarios empresariales usarlo sin problemas.

 

WeChat también tiene robots de código abierto correspondientes, pero debido a las limitaciones de la propia plataforma WeChat, las funciones de los robots WeChat están muy restringidas. Básicamente, las funciones oficiales se trasplantan al cuadro de diálogo de WeChat.

Se informa que Meituan también está integrando robots conversacionales internamente para ayudar a los empleados a mejorar la eficiencia en el trabajo. Su Asistente Xiaomei ha incorporado múltiples escenarios personalizados e indicaciones para ayudar a los empleados a comenzar rápidamente. La experiencia general no es diferente a la de ChatGPT.

Los clientes oficiales de otros importantes fabricantes de modelos nacionales todavía están tratando de alcanzar el nivel de GPT-3 y todavía se encuentran en un estado de secreto. Es más difícil obtener calificaciones de experiencia que productos maduros. Hay muchos, por lo que No haré comentarios por ahora, pero cabe confirmar que no habrá más características sorprendentes.

ChatGPT: App Store llega a la cima, llega la era de la IA móvil

Finalmente, hablemos de ChatGPT.

El 18 de mayo, ChatGPT se lanzó en la App Store y rápidamente encabezó la lista de descargas de iOS. ChatGPT en el lado móvil también destaca la simplicidad, pero se puede ver que se ha puesto algo de esfuerzo en la interacción general: la interfaz de conversación normal ha agregado retroalimentación de vibración para las respuestas, lo que hace que parezca que la IA del otro lado es realmente buena. escribir, y la experiencia es abrumadora; al mismo tiempo, la interacción de deslizar hacia la izquierda puede activar la función de gestión de conversación, la interacción de deslizar hacia la derecha puede abrir una nueva conversación, la lógica es clara; la fluidez general de uso también es muy buena, mucho mejor que la experiencia en la Web.

Sin embargo, los escenarios de aplicación actuales del terminal móvil son muy limitados y la mayoría de las personas a su alrededor lo utilizan como wiki de preguntas y respuestas. Sin el soporte de complementos y redes, el terminal móvil actualmente no tiene muchos escenarios de aplicación y en productividad. En estos escenarios, la terminal web es más eficiente y colaborativa, más fluida; después de todo, no puedo mantener mi teléfono encendido cuando estoy en el trabajo.

Sin embargo, el cliente iOS resuelve el problema de la dificultad para recargar ChatGPT plus. Se puede suscribir directamente a través de la App Store, lo que permite a muchos usuarios finalmente utilizar GPT-4 cómodamente.

El potencial del terminal móvil es, por supuesto, enorme: ahora ChatGPT acaba de llegar a su fin, pero se vislumbra su estratégico "lo quiero todo". En el pasado, existían los terminales móviles Poe y Snapchat, ChatGPT sin duda ha cambiado el panorama competitivo de los terminales móviles, esperaremos y veremos en qué se desarrollará en el futuro.

resumen

Los cambios de IA provocados por ChatGPT cambiarán profundamente la dirección del desarrollo de la sociedad. Ahora es una situación de lucha caótica y todos se esfuerzan por hacer algo. Sin embargo, los modelos no son algo que la gente común pueda hacer, por lo que han surgido más productos centrados en aplicaciones de escenarios, que también brindan a los empresarios y desarrolladores muchas ideas para aplicaciones de IA.

Además, la localización es otro tema importante. Los principales fabricantes nacionales obviamente están rezagados en términos de progreso, pero la capa de aplicaciones ya ha tomado la delantera y tiene muchos productos útiles. Este será el lugar con la competencia más intensa y las mayores oportunidades. en el futuro. Montado en la gran ola de la IA, bien podrías ser un cerdo volador.

Supongo que te gusta

Origin blog.csdn.net/2301_77531618/article/details/130953591
Recomendado
Clasificación