Red neuronal de memoria a largo plazo para la predicción de la velocidad del tráfico utilizando datos de sensores de microondas remotos

Recientemente leí la red neuronal de memoria a largo plazo a corto plazo para la predicción de la velocidad del tráfico utilizando datos de sensores de microondas remotos con cuidado, y registro el contenido principal y los sentimientos del artículo aquí. Originalmente, quería entregar como tarea, pero el profesor cambió la tarea, así que escribí el blog directamente, jajaja. Me tomó unos días reproducir el artículo. No es difícil. El resultado es básicamente el mismo que la conclusión de Ma. Tengo tiempo para escribir un artículo recurrente.

1. Resumen
Las redes neuronales se utilizan ampliamente en la predicción de tráfico. Esta investigación propone por primera vez que la red neuronal de largo y corto plazo (LSTM NN) se utiliza en la predicción de tráfico. Este modelo puede capturar cambios dinámicos no lineales. El modelo LSTM NN supera las deficiencias de la desaparición del gradiente durante el proceso de descenso del gradiente y, por lo tanto, exhibe un rendimiento excepcionalmente superior para los datos de series de tiempo dependientes a largo plazo. Para verificar aún más las capacidades de LSTM NN, se realizó un estudio empírico basado en los datos recopilados por dos detectores de microondas en Beijing. Y compare el efecto de predicción de LSTM NN con el modelo RNN tradicional y otros modelos populares de parámetros y no paramétricos Finalmente, se encuentra que LSTM NN puede lograr la mejor precisión y estabilidad de predicción.

2. Introducción
La aplicación exitosa de sistemas de transporte inteligentes depende de la adquisición precisa de información de tráfico. Esto es especialmente cierto en los sistemas avanzados de gestión de tráfico (ATMS) y los sistemas avanzados de información al viajero (ATIS). Una de las piezas de información más importantes es predecir el estado del tráfico futuro. Predecir las condiciones futuras del tráfico puede ayudar a los viajeros a realizar una mejor selección de rutas y planificación de viajes, y también puede ayudar a los expertos en tráfico a desarrollar medidas para aliviar la congestión del tráfico y mejorar la seguridad vial.
En la actualidad, los datos de la bobina se utilizan generalmente para predecir el tiempo de viaje y el volumen de tráfico, y los datos de video se utilizan para obtener la velocidad real de la carretera. Existen pocos estudios sobre el uso de otros datos para la predicción de la velocidad. En comparación con el tiempo de viaje, hay relativamente más formas de obtener parámetros de velocidad de la carretera, como el GPS. Los sensores de microondas de tráfico remoto (RTMS) se utilizan ampliamente en la práctica de la ingeniería porque no requieren carreteras cerradas para su instalación y otras ventajas. Pueden recopilar parámetros de flujo, velocidad y ocupación. La precisión de los parámetros de velocidad recopilados por RTMS puede alcanzar el 95%.
En comparación con los métodos estadísticos tradicionales para hacer predicciones, algunos métodos de inteligencia artificial se están volviendo cada vez más populares. En particular, los métodos de inteligencia artificial tienen más ventajas que los métodos estadísticos tradicionales cuando se trata de conjuntos de datos con ruido y datos faltantes. La red neuronal (ANN) es uno de los representantes típicos de los métodos de inteligencia artificial. En la actualidad, se han realizado muchas investigaciones sobre redes neuronales utilizadas para la predicción. El modelo RNN es muy adecuado para procesar datos espacio-temporales debido a su estructura, pero hay dos problemas principales: 1. Debemos determinar el paso del tiempo de retardo de RNN; 2 , RNN no puede capturar la dependencia de datos a largo plazo. Se espera que LSTM NN supere estas dos deficiencias de la RNN tradicional y logre mejores resultados de predicción.
Las innovaciones de este artículo incluyen principalmente los siguientes tres aspectos: 1. LSTM NN se utiliza para la predicción de velocidad por primera vez; 2. Este método puede determinar automáticamente el paso del tiempo de retardo; 3. El rendimiento de LSTM NN con RNN tradicional y métodos estadísticos tradicionales. Comparar.
La estructura de este artículo es la siguiente: en primer lugar, se revisa la investigación de la predicción del tráfico; en segundo lugar, se presenta la estructura de LSTM NN; en tercer lugar, se realiza una investigación empírica utilizando datos de Beijing y se combina LSTM NN y el modelo tradicional de RNN. Se compararon los métodos de filtro NN retardado, Elman NN, NN autorregresivo no lineal), SVM, ARIMA y Kalman, y finalmente se concluyó, discutió y prosiguió.

3. Revisión de la literatura
La predicción del flujo de tráfico se puede dividir en métodos paramétricos y métodos no paramétricos.
3.1 Método de
parámetros El método de parámetros significa determinar el modelo de antemano y luego utilizar los datos para calibrar los parámetros. Los métodos de parámetros comunes incluyen modelos de análisis y modelos de calibración de parámetros. En los métodos de análisis, los cálculos de parámetros se calculan mediante ecuaciones, como la función Bureau of Public Roads (BPR). El tiempo de viaje se calcula en función de la relación de capacidad requerida. Sin embargo, los parámetros tienen un cierto grado de aleatoriedad, por lo que no se pueden obtener muy buenos parámetros mediante el cálculo de ecuaciones, lo que puede dar lugar a resultados inestables. Para los modelos de simulación, la teoría básica del flujo de tráfico es el método más clásico de obtener parámetros de estado. En base a esto, se han propuesto muchos modelos mejorados, como el modelo de onda dinámica, el modelo molecular, el modelo de flujo de tráfico trifásico, etc. Si bien estos análisis pueden ayudarnos a comprender mejor las reglas de operación interna y los mecanismos del tráfico, la mayoría de estos modelos involucran supuestos muy ideales y soporte de datos limitado, porque el cuerpo principal del tráfico son las personas y las personas tienen una gran movilidad. Por lo tanto, es difícil comprender realmente el mecanismo a fondo.
El análisis de series de tiempo también se puede dividir en métodos paramétricos y métodos no paramétricos. El método de parámetros más clásico es el modelo ARIMA.
3.2
Métodos no paramétricos La estructura del modelo y los parámetros de los métodos no paramétricos no son fijos. Los modelos estadísticos clásicos y los modelos de inteligencia artificial son los dos modelos más populares. Entre ellos, los métodos de predicción de parámetros de tráfico de términos más comunes y clásicos incluyen los siguientes .
3.2.1 Filtro de Kalman
3.2.2 Máquina de vectores de soporte
3.2.3 Red neuronal artificial
Existe un tipo especial de red neuronal artificial llamada Red neuronal recurrente (RNN). Debido a que sus características estructurales son muy adecuadas para predecir datos de series de tiempo, los modelos RNN tradicionales también incluyen los siguientes RNN con diferentes estructuras: (1) Elman Neural Red; (2) Red neuronal con retardo de tiempo; (3) Red neuronal autorregresiva no lineal con entradas exógenas (NARX).
El modelo RNN tradicional tiene un rendimiento de predicción superior, pero aún existen los dos problemas siguientes.
1. El modelo RNN tradicional no puede entrenar datos de series de tiempo muy retrasados.
2. El RNN tradicional necesita establecer el paso del tiempo de retardo por adelantado, pero es difícil obtenerlo automáticamente.

4. Red neuronal de memoria a largo plazo a corto plazo (LSTM NN)
El modelo LSTM NN utilizado en este artículo se compone de una capa de entrada, una capa oculta cíclica y una capa de salida. Sin embargo, a diferencia del modelo RNN tradicional, la unidad básica del modelo Es un bloque de memoria. El bloque de memoria incluye unidades de memoria. Las unidades de memoria están compuestas por puertas de olvido, puertas de entrada y puertas de salida. Estas unidades de puerta resuelven el problema de la desaparición del gradiente hasta cierto punto y también pueden controlar automáticamente la transmisión y el olvido de información histórica. Por lo tanto, LSTM NN resuelve las deficiencias de la RNN tradicional hasta cierto punto. La estructura básica del bloque de memoria se muestra en la siguiente figura:
Inserte la descripción de la imagen aquí
Estructura del modelo LSTM NN

5. Desarrollo del modelo
Este trabajo selecciona los datos de dos detectores de microondas para investigación empírica, los dos detectores de microondas tienen direcciones opuestas y están instalados en la carretera. El período de tiempo de los datos es del 1 de junio de 2013 al 30 de junio de 2013, la frecuencia de recopilación es de 2 minutos y el contenido de la recopilación incluye tráfico, uso compartido y velocidad. Los datos faltantes se completan con datos adyacentes a la dimensión de tiempo. Este artículo utiliza los primeros 25 días como conjunto de entrenamiento y los últimos 5 días como conjunto de prueba. El modelo se utiliza para predecir la velocidad en los próximos dos minutos en función de los datos de tráfico y velocidad anteriores. A excepción de LSTM NN, otros modelos cambian todos los pasos de tiempo de retardo y diferentes combinaciones de entrada, y cada algoritmo se ejecuta 10 veces para reducir la aleatoriedad.

6. Resultados y comparación
Todos los modelos RNN tradicionales mantienen la misma topología: 1 capa de entrada, 1 capa oculta y 1 capa de salida. Hay 10 neuronas ocultas en la capa oculta. Para el modelo SVM, la función de base radial (RBF) se utiliza para entrenar los parámetros. Los parámetros p, dyq del modelo ARIMA se determinan utilizando el criterio AIC. Para el método de filtro de Kalman, se supone que los puntos de ruido tienen una distribución gaussiana.
LSTM NN consta de una capa de entrada, una capa de LSTM con bloques de memoria y una capa de salida. Los errores porcentuales absolutos medios (MAPE) y los errores cuadrados medios (MSE) se eligieron como indicadores para comparar el rendimiento de diferentes modelos.
La Tabla 1 y la Tabla 2 muestran la comparación de desempeño de cada modelo. Según esta tabla, podemos saber que LSTM NN es el mejor modelo, y el modelo LSTM NN supera la precisión del modelo RNN tradicional y el modelo SVM en al menos un 28% en la mayoría de los casos. Sin embargo, hay una situación en la que el MAPE de Elman NN es mejor que LSTM NN, pero este resultado no indica que Elman NN sea mejor que LSTM NN, porque una comparación más detallada muestra que Elman NN es muy inestable y tiene un valor de MSE grande. . Este hallazgo es consistente con el de Kikuchi y Nakanishi: Elman NN a veces no aprende con mucho éxito. El modelo NARX NN es mejor que otros modelos RNN tradicionales, pero la ventaja es muy pequeña. El efecto SVM también es muy bueno, comparable al modelo NARX NN, pero el ajuste de SVM requiere mucho tiempo y trabajo. En términos de efectos de predicción, los efectos del filtrado de Kalman y los modelos ARIMA son mucho peores que los de otros modelos, lo que puede deberse a demasiadas suposiciones sólidas realizadas por estos dos métodos.
Inserte la descripción de la imagen aquí

Las tablas 3 y 4 muestran el rendimiento después de configurar la entrada en velocidad y flujo de tráfico. De manera similar a los resultados de la Tabla 1 y la Tabla 2, LSTM NN sigue siendo superior a otros métodos. Además, cuando la velocidad y el flujo de tráfico se utilizan como entrada, el efecto se debe a una única velocidad histórica como entrada, pero la mejora del rendimiento no es obvia.
Inserte la descripción de la imagen aquí

Estudie más el efecto de predicción, prediga la velocidad el 30 de junio de 2014 y dibuje el efecto de predicción del modelo NARX NN y la velocidad real en un gráfico lineal como se muestra a continuación. Se puede encontrar que NARX NN tiende a subestimar la velocidad futura. Esto puede deberse a una capacidad de aprendizaje insuficiente.
Inserte la descripción de la imagen aquí

Con base en el análisis anterior, podemos obtener las siguientes tres conclusiones:
(1) Para el modelo RNN tradicional, el paso del tiempo de retardo es muy importante, y la configuración correcta de los parámetros del paso del tiempo de retardo puede mejorar enormemente el rendimiento. LSTM puede determinar automáticamente el paso del tiempo de retardo, por lo que el efecto es óptimo.
(2) NARX NN supera a otros modelos RNN tradicionales. Debido a que NARX NN puede incluir información previa y entrada adicional, el modelo Elman NN encontrará problemas como un tiempo de entrenamiento prolongado y fallas ocasionales de entrenamiento, por lo que no es adecuado como Modelo de predicción de velocidad.
(3) El modelo SVM puede lograr resultados de predicción relativamente buenos, pero el ajuste de los parámetros requiere mucho tiempo y trabajo.

7. Conclusión
Este artículo muestra un nuevo método LSTM NN para predecir la velocidad. LSTM NN puede aprender la correlación a largo plazo de series de tiempo y puede determinar automáticamente el paso del tiempo de retardo. Esto es muy ventajoso y adecuado para la predicción de parámetros de tráfico. Para estudiar empíricamente el efecto de LSTM NN, se recopilaron los datos de velocidad de 1 mes, los primeros 25 días se utilizaron como conjunto de entrenamiento y los últimos 5 días como conjunto de prueba. Además, se utilizan tres modelos RNN con topologías diferentes y algunos otros modelos paramétricos y no paramétricos para comparar con el modelo LSTM NN. Los resultados experimentales muestran que la precisión y estabilidad del modelo LSTM NN son mejores que otros modelos, y se obtienen principalmente los siguientes tres hallazgos útiles:
(1) A medida que aumenta el paso del tiempo de retardo, aumenta la precisión de la predicción de velocidad. Configurar correctamente el paso del tiempo de retardo puede mejorar la precisión de la predicción de velocidad. El modelo LSTM NN puede lograr un buen efecto de predicción de velocidad sin determinar el paso del tiempo de retardo.
(2) Comparado con otros modelos tradicionales de RNN, NARX NN puede lograr mejores resultados Debido a un aprendizaje insuficiente, Elman NN puede producir resultados inestables.
(3) SVM también es muy adecuado para pronosticar datos de series de tiempo y puede producir buenos resultados de pronóstico, pero se necesita mucho esfuerzo para ajustar los parámetros.
Las investigaciones futuras pueden considerar el uso de información espacio-temporal como entrada de LSTM NN, como el uso de la velocidad de los carriles adyacentes como entrada adicional. Además, también se puede analizar el impacto de diferentes niveles de recopilación de datos sobre el efecto de predicción. Las mejoras en el modelo LSTM NN, como el aumento de la profundidad de la capa oculta, también se pueden utilizar como direcciones de investigación.

参考 文献 :
Ma X, Tao Z, Wang Y, et al. Red neuronal de memoria a largo plazo a corto plazo para la predicción de la velocidad del tráfico utilizando datos de sensores de microondas remotos [J]. Investigación en transporte Parte C Tecnologías emergentes, 2015, 54: 187-197.

Supongo que te gusta

Origin blog.csdn.net/qq_39805362/article/details/105509203
Recomendado
Clasificación