Usa ChatGPT para controlar NPC, ¡la acción es tan realista como una persona normal! El nuevo campo de bombardeo de investigación de Stanford Google, dotando a modelos grandes con memoria precisa...

Publicado por Xiao Xiao de Aufeisi Qubit
| Cuenta pública QbitAI

¡Dejando vivir juntas a 25 IA, simularon acciones humanas!

No solo se levantan, se cepillan los dientes, comen y duermen como personas, sino que también se ven obligados a "salir a trabajar" e incluso a celebrar fiestas juntos en su tiempo libre.

Todo esto, de un nuevo estudio de Stanford y Google -

Hicieron un experimento muy nuevo, crearon 25 AI NPC, cada uno con diferentes identidades y decisiones de acción, y los dejaron vivir juntos en un entorno de espacio aislado, confiando en el modelo grande de ChatGPT para completar las decisiones de acción .

Resulta que estos NPC de IA no solo vivirán como personas, como escritores para escribir, comerciantes para administrar tiendas, sino que también interactuarán entre sí e incluso tendrán diálogos:

Tan pronto como se publicó la investigación, explotó Ethan Mollick, profesor de la Escuela de Negocios Wharton de la Universidad de Penn, dijo:

Estas acciones son más como acciones que los humanos normales harían que "juegos de roles".

El científico de OpenAI, Andrej Karpathy, incluso dijo que "esto empequeñece a los juegos de mundo abierto":

Entonces, ¿qué tipo de "sociedad de IA" construye esta investigación?

Cuando la IA juega con Los Sims

A juzgar por la pantalla de demostración, estas 25 IA tienen diferentes identidades, personalidades y edades:

Vivirán en una comunidad comunal, que es muy detallada, incluyendo áreas residenciales, universidades, parques, cafés, etc.:

Se puede ver que cada IA tiene su propio itinerario básico, que incluye despertarse, lavarse, comer, dormir, etc. De acuerdo con las diferentes configuraciones de identidad, tomará diferentes acciones para mantener conjuntamente el funcionamiento de la comunidad.

Entre ellos, los emoji de la demostración simplemente representan las operaciones en curso de la IA, como enviar y recibir cartas y comer:

Pero entre ellos, también habrá comportamientos interactivos:

No es el lenguaje de la IA, sino la forma en que hablan los humanos:

No solo eso, estas IA que pueden interactuar entre sí pueden incluso escuchar los requisitos de los jugadores humanos y tomar las medidas correspondientes.

Por ejemplo, los autores del artículo mencionaron que le dijeron a uno de los AI NPC como ser humano que esperaban realizar un evento de "Fiesta del Día de San Valentín" en la comunidad.

Inesperadamente, este AI NPC no solo accedió con entusiasmo a las solicitudes de los autores, sino que espontáneamente comenzó a organizar este evento, incluyendo la hora, el lugar y las personas presentes:

Al ver esto, algunos internautas ya han expresado "demasiado loco"——

Para los jugadores, en lugar de seguir los pasos, es posible que realmente necesiten persuadir a los NPC o pensar y actuar para completar la tarea en el juego.

También hay internautas que han abierto sus mentes y han pensado en un modo de juego más "malvado":

Imagina que mataste a un NPC, luego condujiste de regreso a la ciudad y los viste celebrar su funeral...

Entonces, ¿cómo actúan espontáneamente estas IA y construyen una sociedad interactiva de IA autónoma?

Decisiones de acción de control con modelos grandes

Específicamente, Stanford y Google hacen que las IA actúen e interactúen con otras IA en dos pasos .

El primer paso es construir una variedad de "configuraciones personales" de IA y permitirles tomar acciones diarias que se ajusten a las configuraciones.

Aquí tomamos a John Lin, uno de los personajes de la IA, como ejemplo, puedes encontrar su lista de ajustes en la Demo.

Se puede observar que sus escenarios son muy detallados, incluyendo información básica (nombre, edad, lugar, hora), escenarios de atención (campo de visión, etc.), circunstancias personales (personalidad, antecedentes familiares, trabajo, etc.).

Usando esto como referencia, la IA llamada John Lin puede formar un hábito de vida diario fijo, que incluye levantarse temprano para lavarse rutinariamente, luego ir a trabajar y finalmente irse a casa a dormir.

Pero en el proceso de su vida, definitivamente se comunicará con otras IA o conocerá gente nueva, así que...

El segundo paso es dejar que el personaje de la IA responda al entorno externo y a las acciones de otras personas para generar interacciones .

Por lo tanto, esta investigación construye una arquitectura que potencia la IA con memoria, memoria de recuperación, percepción, retroalimentación e interacción.

A juzgar por el diagrama de la arquitectura, la IA primero percibirá el entorno circundante, registrará los eventos que ocurren dentro de un determinado campo de visión (atención) y los agregará a su propio flujo de memoria;

Posteriormente, ya sea lo que la IA planea hacer (planificar) o dar retroalimentación (reflexionar) sobre lo que sucedió afuera, se verá afectado por este flujo de memoria.La forma específica es recuperar los eventos correspondientes de la memoria y confiar en gran modelo ChatGPT para tomar decisiones ;

(Por supuesto, ya sea planificación o retroalimentación, el evento correspondiente también se agregará al flujo de memoria y se convertirá en una nueva memoria)

Finalmente, los resultados de estas decisiones se traducirán en soluciones concretas, incitando a la IA a pensar y tomar acciones concretas.

El estudio mencionó que la razón por la que se adopta la arquitectura de modelo grande + memoria es que, aunque el modelo grande ya tiene una lógica de acción muy buena, ya sea GPT-4 u otros modelos grandes, la planificación a largo plazo y el mantenimiento de una memoria limpia aún son un problema tipo de desafío.

En base a esto, se necesita un sistema de memoria como "referencia" para el modelo grande, de modo que tenga una lista clara de eventos que se puedan rastrear cuando se toman decisiones.

Aún así, el estudio plantea algunas preguntas sobre la seguridad de la IA .

Incluyendo cómo prevenir su impacto en la sociedad y, al mismo tiempo, ser utilizado por personas con intenciones de generar Deepfake y fraude de IA de "versión personalizada", etc.——

Por ejemplo, el vendedor de té de IA que chatea contigo en el futuro puede no solo recordar todo lo que dijiste, cada cumpleaños, sino que incluso puede usar esto como referencia para generar respuestas más "íntimas", para que "ella" se vea más como una persona...

Una cosa más

Vale la pena mencionar que una empresa nacional llamada Hyperparameter Technology ya ha fabricado un sistema AI NPC similar GAEA .

Al igual que el estudio de Google de Stanford, GAEA también tiene un sistema de memoria y se basa en un gran modelo de lenguaje para ayudar a los NPC a tomar decisiones de acción.

Sin embargo, existen algunas diferencias en los mecanismos de incentivos que impulsan a la IA a actuar. En comparación con este estudio que se basa en modelos grandes para completar las decisiones de acción:

La IA en GAEA también se basará en valores más específicos para afectar aún más las decisiones de acción del NPC (valor de hambre, valor de estado de ánimo, etc.):

Para este tipo de tecnología AI NPC, ¿qué juego de apertura mental piensas?

Dirección de demostración:
https://reverie.herokuapp.com/arXiv_Demo/#

Dirección en papel:
https://arxiv.org/abs/2304.03442

Enlace de referencia:
[1]https://twitter.com/emollick/status/1645499660402925576
[2]https://twitter.com/karpathy/status/1645485475996790784