[Artículo] Modelo MIND y nuevas tendencias en el diseño de productos de IA

Autor: Zen y el arte de la programación informática

1. Introducción

En los últimos años, con el desarrollo continuo de la tecnología de inteligencia artificial, muchas industrias han comenzado a transformarse para ser impulsadas por la inteligencia artificial en lugar de los modelos industriales tradicionales. Entre ellos, los productos portátiles y la tecnología de realidad virtual (VR/AR) se han convertido en tendencia. Los sistemas de inteligencia artificial actuales se implementan principalmente en base a reglas, algoritmos, datos, etc. Cómo lograr una mejor experiencia interactiva y desarrollar robots y productos de visión artificial de alta calidad en este nuevo entorno industrial es una cuestión clave. La investigación en este campo se centra principalmente en dos direcciones: por un lado, intentar establecer la comprensión y el conocimiento de los usuarios del mundo de la realidad virtual o la realidad aumentada a través de métodos de aprendizaje automático, mejorando así el sentido de la realidad y la inmersión del usuario; por otro lado , , aplicando habilidades físicas de interacción persona-computadora a escenarios de realidad virtual y realidad aumentada para mejorar la calidad y eficiencia de vida. Sin embargo, estas tecnologías a menudo dependen de recursos informáticos masivos y conjuntos de datos a gran escala, y para los usuarios individuales, incluso en productos de consumo de calidad comercial, no hay garantía de una velocidad de respuesta suficiente. Al mismo tiempo, tanto las empresas de I+D como los proveedores de plataformas de servicios deben realizar un diseño profesional en términos de estrategia de marketing, estructura de producto, experiencia interactiva, etc. Por lo tanto, cómo utilizar eficazmente la tecnología de inteligencia artificial en este nuevo entorno industrial, al mismo tiempo que se reducen los costos y se mejora la calidad del producto, se ha convertido en una cuestión importante. Este artículo combinará los resultados de la investigación técnica existente para explicar las nuevas tendencias en el modelo MIND y el diseño de productos de IA, y brindará algunas ideas sobre su dirección de desarrollo futuro.

2. Explicación de conceptos y términos básicos

2.1 modelo MENTE

El modelo MIND (Modelo Narrativo Digital Interactivo Mínimo) se basa en las necesidades de diversidad humana y la creatividad, entrelazando experiencias y actividades sociales humanas en una película de "aventura digital". Fue propuesto por primera vez por el equipo de la Universidad de Maryland en 2019, con el objetivo de explorar y definir cómo guiar a los usuarios para que participen en historias de aventuras que han circulado durante mucho tiempo en la historia de la humanidad de una manera que minimice las entradas y salidas. El modelo MIND incluye tres niveles: (1) Construcción de personajes diversificados: al darles a los personajes identidades y personalidades únicas, creamos personajes diversos, lo que permite a los usuarios construir situaciones que se vuelven más naturales, coordinadas y completas. (2) Clasificación narrativa: al clasificar los hábitos, costumbres y culturas del comportamiento humano en diferentes períodos y lugares, creamos pistas con personalidades distintivas y proporcionamos un desarrollo de la trama y una narrativa únicos. (3) Proyección de la situación: aprovechar al máximo el entorno del usuario y hacer que los usuarios se sientan inmersos en el entorno.

2.2 Diseño de productos de IA

El diseño de productos de IA se refiere al uso de visión por computadora, aprendizaje automático, aprendizaje profundo y otras tecnologías para mejorar las funciones del producto y las primas de la marca, y para mejorar el rendimiento del producto, la satisfacción del usuario y la participación de mercado a través de operaciones y toma de decisiones automatizadas. Un marco típico de diseño de productos de IA se puede dividir en cinco etapas: análisis de la demanda, diseño de la forma del producto, creación de prototipos de productos, optimización de la iteración del producto y mejora continua del producto.

2.2.1 Análisis de casos: gafas AR

En 2018, Microsoft lanzó HoloLens, que introdujo una perspectiva humana en el mundo de la realidad virtual. En comparación con las gafas estáticas tradicionales, HoloLens hace que las imágenes que los usuarios ven en la realidad virtual sean más dinámicas, emocionantes y atractivas. Sin embargo, este producto ha tenido dificultades para atraer la atención de los usuarios debido a su alto costo, falta de usabilidad y baja aceptación por parte de los usuarios. Por lo tanto, Microsoft introdujo la funcionalidad de reconocimiento de voz en versiones posteriores de HoloLens. Los usuarios pueden activar HoloLens en el dispositivo, decirle qué función necesitan y esto les ayudará a completar la tarea. Además, también se han lanzado funciones de reconocimiento de gestos y traducción. Aunque este producto fue difícil de implementar en algunas áreas, logró atraer la atención de los consumidores y así cambió el panorama de la industria de la realidad virtual.

2.2.2 Análisis de casos: función antirrobo de teléfonos móviles

Para proteger la información personal y los teléfonos móviles de los usuarios, el gobierno federal de EE. UU. lanzó en 2017 funciones integrales de bloqueo de teléfonos móviles y administración de contraseñas. Debido a la influencia de la globalización, las funciones de bloqueo de teléfonos móviles están llegando rápidamente al mercado. Sin embargo, debido a que los usuarios tienden a olvidar sus contraseñas durante el uso, sus cuentas pueden ser robadas. Con este fin, el gobierno federal ha lanzado un proyecto de gestión de contraseñas que pretende utilizar tecnología de inteligencia artificial para identificar automáticamente la información de las cuentas en los teléfonos móviles y recomendar las mejores contraseñas. Dado que se espera que el proyecto cueste mil millones de dólares estadounidenses y el costo del equipo sea de decenas de miles de yuanes, el gobierno estadounidense eligió una plataforma de computación en la nube para su implementación. El éxito del proyecto atrajo la atención de toda la industria e impulsó a otras empresas a emprender intentos similares.

3. Explicación de los principios básicos del algoritmo, pasos operativos específicos y fórmulas matemáticas.

El modelo MIND está diseñado para ser "jugable sin entrada". La idea central detrás de esto es utilizar el potencial y la intuición humanos para construir historias. Por lo tanto, primero debemos entender cómo funciona este modelo.

El modelo MIND debe responder primero a varios "por qué", como por ejemplo: ¿Cómo permitir a los usuarios comprender nuestro universo? ¿Cómo hacer que los usuarios resuenen? ¿Cómo crear una experiencia interesante y memorable? El modelo MIND consta de cuatro niveles, a saber, construcción diversificada de personajes, combinación narrativa, proyección situacional y diseño de interacción.

(1) Construcción de roles diversificados

El primer nivel es la construcción de roles diversos. Los personajes aquí pueden ser protagonistas, objetos, paisajes o incluso elementos virtuales interactivos en realidad virtual, todo para realzar el realismo y la diversidad de la escena. Al construir tu personaje, hay algunas cosas a considerar:

  1. Identidad: Crear múltiples personajes de diferentes razas, nacionalidades y profesiones estará más acorde con la diversidad y personalidad humana.

  2. Escenario: dé forma a la imagen del personaje de acuerdo con el entorno del usuario y las necesidades del objetivo, haciendo que la construcción de la situación por parte del usuario sea más natural, coordinada y completa.

  3. Metáfora: utiliza metáforas entre personajes para estructurar la trama y crear emociones sorprendentes.

  4. Retratos: presenta las características del personaje a través de retratos, permitiendo a los usuarios tener una comprensión más objetiva y precisa del personaje.

  5. Sentidos: a través de los atributos sensoriales del personaje, como la visión, el oído y el olfato, los usuarios pueden obtener una experiencia clara, profunda y real.

(2) Clasificación narrativa

El segundo nivel es la clasificación narrativa. El modelo MIND entrelaza las experiencias y actividades sociales humanas en una película de "aventura digital", por lo que es necesario comprender el proceso histórico pasado de la sociedad humana, el proceso de modernización, el contexto de la evolución de la civilización, la política, la economía y las contradicciones sociales de la actualidad. La sociedad y la complejidad de la naturaleza humana. Al ordenar la narrativa, es necesario considerar los siguientes puntos:

  1. Tiempo y espacio: Mostrar la autenticidad del desarrollo de la sociedad humana a través del tiempo y lugar de los acontecimientos y el camino evolutivo de los procesos históricos.

  2. Tema: utilice diferentes temas para guiar a los usuarios a resonar y crear narrativas de diferentes intereses.

  3. Concepto: Cultivar las capacidades de pensamiento y percepción de los usuarios a través de complejos hábitos, costumbres y cultura de comportamiento humano, así como las contradicciones políticas y económicas de la sociedad moderna.

  4. Símbolos: al conectar los símbolos con la experiencia humana, los usuarios pueden acostumbrarse a ellos y responder a diversos escenarios con facilidad.

(3) Proyección situacional

El tercer nivel es la proyección situacional. La proyección de situaciones significa que, al proporcionar diferentes escenas y ubicaciones, los usuarios pueden sentir que están en un espacio virtual y pueden explorar, disfrutar y crear sin restricciones. En este sentido, es necesario tener en cuenta los siguientes puntos:

  1. Espacio: el diseño y la atmósfera de las diferentes ubicaciones afectarán la percepción y experiencia de la situación por parte de los usuarios.

  2. Forma de expresión: diferentes formas de medios afectarán la experiencia sensorial del usuario, incluidas animaciones, fotografías, videos, etc.

  3. Inmersión: los usuarios pueden sentirse cansados ​​y frustrados antes de comprometerse por completo. Por lo tanto, colocar dispositivos u objetos frente a una imagen que equilibre la situación debe atraer la atención y la retroalimentación del usuario.

(4) Diseño de interacción

El cuarto nivel es el diseño de interacción. Al utilizar productos de realidad virtual o realidad aumentada, los usuarios deben controlar su propio comportamiento y proporcionar evaluación y retroalimentación sobre los resultados producidos por el sistema. Por tanto, a la hora de diseñar interacciones es necesario tener en cuenta los siguientes puntos:

  1. Reglas de acción: establezca las reglas de acción adecuadas para que los usuarios puedan controlar fácilmente sus movimientos y comportamientos.

  2. Preferencias del usuario: satisfaga diferentes tipos de necesidades de los usuarios al permitirles personalizar los parámetros del dispositivo y establecer preferencias personales.

  3. Información rápida: al mostrar información rápida en la pantalla, informe a los usuarios que el sistema se está ejecutando y evite un mal funcionamiento.

(5) Explicación de fórmulas matemáticas.

El modelo MIND utiliza diversos elementos como formas geométricas, colores, sonidos, líneas, relaciones espaciales, animaciones, texto, etc. en su diseño, y también añade una gran cantidad de fórmulas matemáticas. Echemos un vistazo a estas fórmulas:

(5.1) Construcción de roles diversificados

Fórmula del ángulo de Euler:

$θ=atan2(\frac{\text{Oz}-\text{Oy}}{\text{Ox}-\text{Oy}})$

$\text{Ox}$ es el vector unitario de la coordenada del eje X, $\text{Oy}$ y $\text{Oz}$ son los vectores unitarios de los ejes Y y Z respectivamente.

(5.2) Clasificación narrativa

Fórmula de la sección cónica:

$(xh)^2+(yk)^2=\sqrt{(r-\delta)^2+z^2}$

$\text{Xo}(t)=\frac{X_o}{2}+\left[\cos t+\sin t\right]\Delta x,\quad \text{Yo}(t)=\frac{Y_o }{2}+\left[-\sin t+\cos t\right]\Delta y,\quad z=Z_o+c_zt,\quad (0≤t≤2\pi)$

$\text{Xo}$, $\text{Yo}$, $Z_o$ son las coordenadas del punto central de la superficie cónica de la sección cónica, $\Delta x$, $\Delta y$ son la superficie cónica con radio $R$ La longitud horizontal de , $c_z$ es la altura.

Fórmula de mapeo de proyección:

$\text{P}=C_{\theta}\text{L}_p$

$\text{C}_{\theta}$ es el valor del coseno de la dirección de la fuente de luz y $\text{L}_p$ es el vector de reflexión.

(5.3) Proyección situacional

Fórmula del filtro de Kalman:

$\text{x}^{\text{t}}=F_{\text{t}}\cdot\text{x}^{\text{t-1}} + B_{\text{t}}\ cdot u^{\text{t}}$

$u^{\text{t}}$ es el comando de control, $F_{\text{t}}$ es la matriz de transición del estado del sistema y $B_{\text{t}}$ es la matriz de entrada de control.

Fórmula de presión atmosférica:

$P=-\rho\cdot g\cdot h$

$\rho$ es la presión del aire, $g$ es la aceleración debida a la gravedad y $h$ es la altitud.

Supongo que te gusta

Origin blog.csdn.net/universsky2015/article/details/133565428
Recomendado
Clasificación