[Documento] Un método de red neuronal autoorganizada adaptativa para el control distribuido de la formación de robots submarinos

Resumen

Con el objetivo de controlar la formación distribuida de un grupo de vehículos submarinos autónomos, se propone un método de red neuronal de mapeo autoorganizado adaptativo. Cuando la formación se mueve como un todo, este método controla a los robots submarinos para mantener su posición en la formación. El grupo de robots submarinos puede seguir la trayectoria planificada previamente para alcanzar la posición deseada en la forma de formación esperada. La ley de control propuesta se distribuye, es decir, el controlador de cada robot submarino solo utiliza su propia información y la información limitada de los robots submarinos vecinos. La estrategia de control de formación basada en el cálculo de la competencia autoorganizada se lleva a cabo considerando el equilibrio de la carga de trabajo, de modo que un grupo de robots submarinos pueda alcanzar la posición deseada bajo la premisa de equilibrio de la carga de trabajo y energía suficiente. Y la formación puede evitar obstáculos y cambiar la forma según sea necesario. La formación es una estructura distribuida líder-seguidor, pero no es necesario especificar líderes y seguidores explícitamente. Todos los robots submarinos de la formación son considerados líderes y seguidores, logrando así características importantes como la adaptación y la tolerancia a fallos. Los resultados de la comparación con métodos y experimentos tradicionales muestran la efectividad de este método.

Términos de índice: robots submarinos, control de formaciones, mantenimiento de formaciones, seguimiento de formaciones, líder-seguidor, mapa autoorganizado.

Introducción

El Vehículo Subacuático Autónomo (AUV) es un dispositivo altamente autónomo, no tiene conexión física con la nave nodriza y puede usar su propio sistema de control y guía para completar la tarea dada en el ambiente submarino [1]. Con la creciente complejidad de las tareas, es necesario realizar tareas submarinas más allá de las capacidades de un solo robot submarino a través de la cooperación de múltiples robots submarinos. En algunas tareas, los robots submarinos deben moverse colectivamente como una formación. El control de formación es una tecnología para controlar un grupo de vehículos, incluidos robots terrestres, aviones, vehículos de superficie y robots submarinos [2], [3], según las necesidades de la misión para moverse a lo largo de la ruta deseada, manteniendo el modo de formación deseado, y Adáptese a las limitaciones ambientales, como obstáculos, espacio limitado, corrientes oceánicas y limitaciones de comunicación [4], [5]. Para trabajar en un entorno específico o satisfacer las necesidades de ciertas tareas, varios sistemas de robots submarinos pueden adoptar una variedad de formas geométricas. Las formas geométricas típicas incluyen líneas, triángulos, rombos, cuñas y polígonos.

El control de la formación es un problema básico de múltiples sistemas de vehículos submarinos y se ha convertido en un punto clave de investigación en los últimos años. Los diversos métodos de control de la formación reportados en la literatura se dividen principalmente en cuatro categorías: esquema de estructura virtual, método basado en el comportamiento, tecnología de campo de potencial artificial y esquema de líder-seguidor. En el método de estructura virtual, toda la formación se trata como un solo cuerpo rígido. El movimiento de cada agente se deriva de la trayectoria del punto correspondiente en la estructura [6], [7]. Este método realiza el control de la formación al definir el comportamiento de los cuerpos rígidos. Cuando cambia el entorno de navegación, la formación del cuerpo rígido no se puede cambiar, lo que limita el ámbito de aplicación. En el enfoque basado en el comportamiento, las acciones de control de cada vehículo se derivan del promedio ponderado de cada comportamiento esperado, como el mantenimiento de la formación, la búsqueda de objetivos y la evitación de obstáculos [8] - [10]. Las ventajas de los métodos basados ​​en el comportamiento son una retroalimentación relativamente simple, clara y la disponibilidad para evitar obstáculos; la desventaja es la falta de una definición clara del comportamiento del grupo, lo que dificulta el análisis de las reglas de control local con métodos matemáticos.

Khatib [11] propuso un método basado en el concepto de campo de potencial artificial. La idea básica de este método es que el vehículo se mueve en un campo de fuerza similar al campo eléctrico generado por cargas positivas y negativas. La posición a alcanzar es la carga de atracción y el obstáculo es la carga de repulsión. Los obstáculos repelen el vehículo y el objetivo lo atrae. La fuerza de repulsión y la fuerza de atracción pueden formar un campo potencial, lo que hace que el vehículo se mueva a lo largo de la dirección del gradiente del campo potencial. La ventaja del método de campo de potencial artificial es que está claramente definido y es adecuado para el control en tiempo real, especialmente el problema de evitación de colisiones en un entorno de obstáculos; la desventaja es que la función de campo de potencial es a veces difícil de diseñar y se debe considerar el problema mínimo local [12], [13] .

En el control de robots de formación en tierra, en el aire o bajo el agua, el método líder-seguidor se usa ampliamente. Este método divide toda la formación en varios grupos, cada uno con al menos dos robots submarinos. En un grupo AUV dual arbitrariamente pequeño, un AUV es el líder y el otro es el seguidor [3], [16], [17]. El siguiente AUV mantiene un cierto ángulo y distancia del AUV principal. Un seguidor en un grupo puede ser un líder en otro grupo. La trayectoria de referencia del seguidor se genera a medida que el líder se mueve y el vehículo virtual está diseñado para rastrear la trayectoria. El control de seguimiento de posición se utiliza para que el seguidor rastree la trayectoria del vehículo virtual. El método líder-seguidor tiene una definición clara de toda la formación, que puede ser analizada por métodos matemáticos para asegurar la estabilidad de la formación [18] - [22]. Este método se usa ampliamente para proporcionar un marco para el control de la formación de robots [15], [23] - [26]; sin embargo, el esquema líder-seguidor ha encontrado un problema clave en aplicaciones prácticas: cuando el líder es un robot submarino Cuando ocurre una falla, sus seguidores no pueden seguir adelante. Si el AUV roto resulta ser el líder de la formación, entonces todo el equipo fallará y puede causar un desastre. En la mayoría de los casos, la información del líder, como el ángulo de rumbo, la velocidad lineal y la aceleración lineal, no se puede mostrar en tiempo real. Las siguientes personas pueden obtener información local e información sobre vecinos en el estrato submarino [27] - [30].

Este artículo propone un método de mapeo autoorganizado adaptativo para el control distribuido de la formación de múltiples sistemas de vehículos submarinos. La contribución del método propuesto se puede resumir de la siguiente manera.
1) Método de control de formación distribuido mejorado basado en una red neuronal autoorganizada. Aunque el método propuesto se basa en el marco de líder-seguidor, los robots submarinos en la formación se distribuyen aleatoriamente y cada robot submarino se considera un líder o seguidor. A menos que se especifique manualmente, si el robot submarino actúa como líder o seguidor en la formación depende solo del algoritmo adaptativo en sí.
2) Introducir un nuevo parámetro de velocidad de aprendizaje α \ alpha en la estrategia de formación propuestaα yα j \ alpha_junj, Para lograr la autoadaptación y la tolerancia a fallos. Debido a estas características, este método maneja los cambios de formación de una manera más efectiva y maneja la falla de algunos robots submarinos. Este método supera las deficiencias del modo maestro-esclavo tradicional, es decir, en la formación maestro-esclavo, cuando un robot submarino líder falla, su seguidor no puede continuar moviéndose. Se da la prueba matemática de la estabilidad y convergencia del algoritmo.
3) La estrategia enfatiza la reducción de la longitud total de la carrera y el equilibrio de la carga de trabajo. Se introduce una nueva estrategia de equilibrio de carga de trabajo en el algoritmo. En el proceso de seguimiento de la formación, se optimizó la longitud total del viaje, es decir, el consumo de energía de la formación. En comparación con el método tradicional de líder-seguidor, este método tiene una mayor eficiencia de navegación.

El resto del artículo está organizado de la siguiente manera. La segunda sección presenta el problema del control de la formación de los robots submarinos y la idea de aplicar una red neuronal autoorganizada al control de la formación. La tercera sección presenta el control de información de algoritmo distribuido y el seguimiento de la formación basado en un mapa autoorganizado adaptativo. La sección IV proporciona los resultados de la simulación experimental. La sección 5 es un resumen del método propuesto

Estado del problema y preparación

Uno de los principales desafíos de los múltiples sistemas de robots submarinos es el control de la formación submarina, que es la base para la coordinación y cooperación de los robots submarinos al realizar tareas. Kalanthal y Zimmer propusieron un método que considera el control de la formación como dos problemas desacoplados: límite e interior [31], pero este método solo es adecuado para grupos a gran escala. La posición del robot submarino en la capa interior no es fija. Cuando la formación contiene una pequeña cantidad de robots submarinos, es demasiado complicado de usar. Hoy en día, hay menos de diez robots submarinos en la mayoría de las misiones submarinas. Por lo tanto, proponemos un método de redes neuronales autoorganizadas para resolver el problema de la formación submarina. Este método puede manejar un número aleatorio de robots submarinos sin distinguir entre límites y capas internas. En formaciones distribuidas, todos los robots submarinos se mantienen en su lugar mediante este método, con solo información local y vecina.

A. Control de formación de robots submarinos

En este artículo, en primer lugar, asumimos que un grupo de robots submarinos homogéneos trabajan y se mueven en un espacio de trabajo común, que puede ser un plano bidimensional o un espacio tridimensional. Para facilitar la demostración intuitiva, este artículo utiliza gráficos bidimensionales, aunque los ejes x, y y z se consideran al explicar el algoritmo. Estos robots submarinos se distribuyen aleatoriamente en un área delimitada en el estado inicial y se espera que formen un patrón de formación correspondiente. Cada robot submarino tiene una posición en la formación. El líder y el seguidor se seleccionan mediante un algoritmo. Una vez formada la formación, la posición del robot submarino es relativamente fija. Toda la formación se mueve como lo requiere la misión sin distorsión.

Como se mencionó anteriormente, la formación puede tener cualquier forma que se requiera. Algunas formas de estrato típicas son triángulos, diamantes, cuñas y polígonos. En este artículo, la forma de información del robot submarino incluye puntos correspondientes al robot submarino. El método SOM trata de garantizar que un robot submarino pueda llegar a cada punto. Además, los robots submarinos ocupan todas las posiciones con el menor coste total y el menor consumo energético. Aquí, para cada robot submarino, el costo se evalúa por la distancia de viaje desde su posición inicial hasta su posición final en la formación.

La Figura 1 muestra un espacio de trabajo típico con robots submarinos y formaciones requeridas. Tres diamantes sólidos representan robots submarinos con posiciones iniciales distribuidas al azar, y los diamantes sin relleno son puntos que forman una formación triangular. La línea de puntos indica la trayectoria de movimiento de la formación necesaria para llegar al destino. Además, asumimos que todos los sumergibles autónomos son homogéneos y tienen capacidades de navegación básicas, por lo que este artículo no considera restricciones cinemáticas. Primero, se espera que el robot subacuático alcance la posición (representada por el diamante sin relleno en el lado negro), formando una formación triangular. En segundo lugar, toda la formación se mueve hacia el destino a lo largo del camino deseado. Considere la reducción del costo total de viaje y el equilibrio de la carga de trabajo de cada robot submarino.
Inserte la descripción de la imagen aquí

Continuará

Resultados de la simulación

Esta sección tiene como objetivo demostrar la eficacia del algoritmo anterior. La simulación se realiza en varios robots submarinos distribuidos aleatoriamente en el estado inicial. Basado en este método, se realiza un programa escrito en lenguaje MA TLAB. Los parámetros se modificaron durante nuestra simulación para obtener los mejores resultados, y se explicaron los resultados de los gráficos y tablas. Tenga en cuenta que, dado que muchos gráficos tridimensionales de líneas y curvas no se pueden mostrar claramente, utilizamos la vista en planta de los gráficos de este artículo. Para verificar que el método propuesto se puede aplicar a sistemas reales, también se llevan a cabo experimentos basados ​​en hardware en esta sección. El mapa del espacio de trabajo se genera mediante sonar o localización y mapeo simultáneos basados ​​en láser (SLAM). La trayectoria de toda la formación se genera mediante el método de campo de potencial artificial.

A. Mantenimiento de la formación y seguimiento de seis robots submarinos

Primero, el método propuesto se aplica a la situación en la que seis robots submarinos en el espacio de trabajo forman un triángulo y se mueven hacia el destino. Este método se utiliza para controlar la formación para moverse a lo largo de la pista hacia el objetivo. En la Figura 4 se muestra todo el proceso relacionado con el tiempo basado en el comportamiento de autoorganización adaptativa de múltiples sistemas de vehículos submarinos. El espacio de trabajo es un cuadrado acotado, donde (x, y, z) ∈ \ inΕ es de 0,50 metros.

En el mundo real, la ruta de seguimiento es generada por el módulo SLAM y el algoritmo de planificación de ruta. Debido a los obstáculos del entorno, el equipo de robots submarinos realizó modificaciones para evitar colisiones. Al principio, se distribuyó aleatoriamente un equipo de seis robots submarinos, representado por los diamantes amarillos rellenos. Basado en el método de la red neuronal autoorganizada, se forma una formación triangular. Luego, la formación se mueve a lo largo del camino en su conjunto. Después de que el equipo pasa por el lugar estrecho, la formación se reanuda y se mueve hacia el destino, como se muestra en la Figura 4. En una posición estrecha con obstáculos, se establece una forma de formación virtual para garantizar que la formación pueda pasar, y el robot submarino es guiado para formar una forma de formación virtual basada en el método de mapeo autoorganizado. Después de eso, la forma triangular se puede restaurar con la misma estrategia.
Inserte la descripción de la imagen aquí
Inserte la descripción de la imagen aquí

En conclusión

Con el objetivo de abordar el problema del control de la formación de múltiples sistemas de robots submarinos en un entorno de trabajo tridimensional, se propone un método basado en una red neuronal autoorganizada. El proceso de cálculo incluye la definición especial del peso neuronal inicial de la red, la regla de selección del ganador, la ley del equilibrio de la carga de trabajo, el método de actualización del peso y la estrategia de seguimiento de la formación. Basado en el método de red neuronal autoorganizada, se puede realizar el mantenimiento y seguimiento de la formación. Este método adaptativo guía a un grupo de robots submarinos incompletos para que se muevan en formación a lo largo del camino deseado hasta el destino deseado. Además, deformarse para cambiar su geometría para evitar obstáculos también es un problema complicado. Bajo la premisa de energía suficiente, ajuste razonablemente la longitud total de la carrera y el equilibrio de la carga de trabajo. Además, este método es tolerante a errores. Los resultados de la simulación verifican la efectividad de este método y lo comparan con el método tradicional de control maestro-esclavo, el resultado muestra que la ley de control se puede aplicar al sistema real.

En el mundo real, habrá más incertidumbres, como obstáculos en movimiento. El algoritmo debería poder ejecutar una estrategia dinámica libre de colisiones y hacer frente a los efectos graves de las corrientes oceánicas, que se estudiarán en nuestra investigación futura.

Enlace de papel

Supongo que te gusta

Origin blog.csdn.net/wangyifan123456zz/article/details/109240147
Recomendado
Clasificación