Resumen de los artículos de aprendizaje por refuerzo para resolver problemas de programación de 2022

El primer artículo iniciado en 2023 le traerá un resumen de los artículos basados ​​en el aprendizaje por refuerzo para resolver la programación en 2022. Esta es también la dirección que estudié durante mi doctorado, por lo que he estado prestando atención a los desarrollos relacionados. Hoy lo comparto para su referencia. Siga la cuenta oficial (fabricación inteligente y programación inteligente) del artículo original y responda a " Programación DRL " para obtenerlo.

Desde el primer uso del aprendizaje por refuerzo para problemas de programación de talleres en 1995, el aprendizaje por refuerzo ha sido tibio en los años siguientes. La razón principal es que el aprendizaje por refuerzo general no puede resolver el problema de la explosión del espacio de estado. El aprendizaje por refuerzo comenzó a ingresar al campo de la programación. , y su crecimiento se disparó en los años siguientes. Especialmente en 2022, es sorprendente que hayan aparecido al menos 68 artículos relacionados, lo que demuestra que esta dirección está de moda. Por un lado, el aprendizaje de refuerzo profundo utiliza tecnología de aprendizaje profundo para realizar la predicción del comportamiento en un estado desconocido. Por otro lado, la programación de talleres siempre ha sido un problema clásico sin resolver, y también es un banco de pruebas para probar varios algoritmos. incluyendo el aprendizaje de refuerzo profundo.

lista

[1] Bai Y, Lv Y. Programación de taller de trabajo basada en el aprendizaje de refuerzo para la producción de remanufactura [C]. Conferencia internacional IEEE 2022 sobre ingeniería industrial y gestión de ingeniería (IEEM), 2022: 0246-0251.
[2] Cai JC, Lei DM, Wang J, et al. Un novedoso algoritmo de salto de rana aleatorio con aprendizaje de refuerzo para la programación de taller de flujo híbrido de ensamblaje distribuido [J]. Revista internacional de investigación de producción, 2022.
[3] Cao YL, Xu ZW, Mei M, et al. Método de reprogramación de trenes basado en el aprendizaje por refuerzo multiagente[C]. 6.ª Conferencia sobre tecnología de la información avanzada, electrónica y control de automatización del IEEE (IEEE IAEAC), 2022: 301-305.
[4] Chang J, Yu D, Hu Y, et al. Aprendizaje de refuerzo profundo para la programación dinámica y flexible de talleres de trabajo con llegada aleatoria de trabajos [J]. Processes, 2022, 10(4): 760.
[5] Chang JR, Yu D, Zhou Z, et al. Aprendizaje por refuerzo jerárquico para la programación flexible en tiempo real con objetivos múltiples en un taller inteligente[J]. Máquinas, 2022, 10(12).
[6] Chang X, Jia XL, Fu SF, et al. El aprendizaje de refuerzo profundo y el gemelo digital permitieron la programación en tiempo real para un taller flexible de productos complejos[J]. Actas de la Institución de Ingenieros Mecánicos, Parte B, Revista de Fabricación de Ingeniería, 2022.
[7] Chen SF, Huang ZY, Guo H F. Un método de aprendizaje profundo de extremo a extremo para el problema de programación de taller dinámico [J]. Máquinas, 2022, 10(7).
[8] Dong Z, Ren T, Weng J, et al. Minimizar el trabajo tardío del problema de programación del taller de flujo con un enfoque basado en el aprendizaje de refuerzo profundo [J]. Applied Sciences, 2022, 12(5): 2366.
[9] Du Y, Li JQ, Chen XL, et al. Aprendizaje por refuerzo basado en el conocimiento y estimación del algoritmo de distribución para el problema de programación de taller flexible [J]. Ieee Transactions on Emerging Topics in Computational Intelligence, 2022.
[10] Du Y, Li JQ, Li CD, et al. Un enfoque de aprendizaje de refuerzo para el problema de programación de taller de trabajo flexible con transporte de grúa y tiempos de configuración [J]. Transacciones IEEE en redes neuronales y sistemas de aprendizaje, 2022.
[11] Elsayed EK, Elsayed AK, Eldahshan K A. Programación de taller de trabajo basada en aprendizaje de refuerzo profundo de fabricación inteligente [J]. Cmc-Computers Materials & Continua, 2022, 73(3): 5103-5120.
[12] Esteso A, Peidro D, Mula J, et al. Aprendizaje por refuerzo aplicado a la planificación y control de la producción[J]. International Journal of Production Research, 2022.
[13] Gil CB, Lee J H. Enfoque de aprendizaje de refuerzo profundo para la programación de materiales considerando el entorno de alta dimensión del problema del taller de flujo híbrido [J]. Ciencias Aplicadas-Basilea, 2022, 12(18).
[14] Grumbach F, Muller A, Reusch P, et al. Programación robusta-estable en talleres de flujo dinámicos basados ​​en aprendizaje de refuerzo profundo [J]. Revista de Fabricación Inteligente, 2022.
[15] Gu WB, Li YX, Tang DB, et al. Uso de datos de fabricación en tiempo real para programar una fábrica inteligente a través del aprendizaje por refuerzo[J]. Computers & Industrial Engineering, 2022, 171.
[16] Hammami NEH, Lardeux B, Hadj-Alouane AB, et al. Job Shop Scheduling: un enfoque novedoso de DRL para la generación continua de horarios frente a las llegadas de trabajo en tiempo real[J]. IFAC-PapersOnLine, 2022, 55(10): 2493-2498.
[17] Hayes CF, Rădulescu R, Bargiacchi E, et al. Una guía práctica para el aprendizaje y la planificación por refuerzo multiobjetivo[J]. Autonomous Agents and Multi-Agent Systems, 2022, 36(1): 26.
[18] He Z, Tran KP, Thomassey S, et al. Optimización multiobjetivo del proceso de fabricación textil utilizando el aprendizaje de refuerzo multiagente basado en la red Q profunda[J]. Revista de sistemas de fabricación, 2022, 62: 939-949.
[19] Jeon SW, Lee DG, Oh SC, et al. Diseño e Implementación de un Sistema de Programación Basado en Simulación con Aprendizaje por Refuerzo para Líneas de Producción Reentrantes[J]. Máquinas, 2022, 10(12).
[20] Jing X, Yao XF, Liu M, et al. Aprendizaje de refuerzo de múltiples agentes basado en una red convolucional de gráficos para la programación flexible del taller [J]. Journal of Intelligent Manufacturing, 2022.
[21] Johnson D, Chen G, Lu Y Q. Aprendizaje de refuerzo de múltiples agentes para la programación de producción dinámica en tiempo real en una celda de ensamblaje de robot [J]. IEEE Robotics and Automation Letters, 2022, 7(3): 7684-7691.
[22] Jungbluth S, Gafur N, Popper J, et al. Programación basada en el aprendizaje de refuerzo de un proceso de taller con manipuladores robóticos controlados de forma distribuida para operaciones de transporte [C]. 14.º taller de IFAC sobre sistemas de fabricación inteligente (IMS), 2022: 156-162.
[23] Lee YH, Lee S. Programación basada en el aprendizaje de refuerzo profundo dentro del plan de producción en la fabricación de semiconductores [J]. Sistemas Expertos con Aplicaciones, 2022, 191: 116222.
[24] Lei K, Guo P, Wang Y, et al. Un marco de aprendizaje de refuerzo jerárquico de extremo a extremo para el problema de programación de taller flexible dinámico a gran escala [C]. Conferencia internacional IEEE sobre sistemas difusos (FUZZ-IEEE) / Congreso mundial IEEE sobre inteligencia computacional (IEEE WCCI) / Conferencia conjunta internacional sobre redes neuronales (IJCNN) / Congreso IEEE sobre computación evolutiva (IEEE CEC), 2022. [25] Lei
K , Guo P, Zhao W, et al. Un marco de aprendizaje de refuerzo profundo de acción múltiple para el problema de programación flexible de Job-shop [J]. Expert Systems with Applications, 2022, 205: 117796.
[26] Leng JL, Wang XY, Wu SP, et al. Un enfoque de aprendizaje por refuerzo multiobjetivo para la resecuenciación de problemas de programación en sistemas de fabricación de automóviles[J]. Revista internacional de investigación de producción, 2022.
[27] Li HX, Gao KZ, Duan PY, et al. Un algoritmo mejorado de colonia de abejas artificiales con Q-Learning para resolver problemas de programación de flujo de permutación [J]. Ieee Transactions on Systems Man Cybernetics-Systems, 2022.
[28] Li R, Gong WY, Lu C. Un aprendizaje de refuerzo basado en RMOEA/D para la programación de talleres de trabajos flexibles difusos biobjetivos [J]. Expert Systems with Applications, 2022, 203.
[29] Li RF, Zhang XY, Jiang LL, et al. Un algoritmo heurístico adaptativo basado en el aprendizaje por refuerzo para el problema de optimización de la programación de barcos[J]. Gestión oceánica y costera, 2022, 230.
[30] Li Y, Gu W, Yuan M, et al. Programación dinámica basada en datos en tiempo real para talleres de trabajo flexibles con recursos de transporte insuficientes utilizando una red profunda Q híbrida[J]. Robotics and Computer-Integrated Manufacturing, 2022, 74: 102283.
[31] Liao JL, Wu GL, Chen H, et al. ACDRL: un enfoque de aprendizaje de refuerzo profundo actor-crítico para resolver el problema de reprogramación de horarios de trenes con objetivo de energía bajo perturbaciones aleatorias [J]. Informes de energía, 2022, 8: 1350-1357.
[32] Liu R, Piplani R, Toro C. Aprendizaje de refuerzo profundo para la programación dinámica de un taller de trabajo flexible [J]. Revista internacional de investigación de producción, 2022: 1-21.
[33] Liu ZY, Wang Y, Liang XX, et al. Un enfoque de Q-learning profundo basado en redes neuronales gráficas para problemas de programación de talleres en la gestión del tráfico [J]. Ciencias de la Información, 2022, 607: 1211-1223.
[34] Long XJ, Zhang JT, Qi X, et al. Un algoritmo de colonia de abejas artificiales de autoaprendizaje basado en el aprendizaje por refuerzo para un problema de programación de taller flexible [J]. Concurrencia y Computación-Práctica y Experiencia, 2022, 34(4).
[35] Luo S, Zhang LX, Fan Y S. Programación en tiempo real para talleres de trabajo flexibles multiobjetivo dinámico parcial sin espera por aprendizaje de refuerzo profundo [J]. IEEE Transactions on Automation Science and Engineering, 2022, 19(4): 3020-3038.
[36] Marchesano MG, Guizzi G, Popolo V, et al. Programación dinámica de un taller de flujo con fecha de vencimiento restringida con Deep Reinforcement Learning[C]. Décima Conferencia trienal de IFAC sobre modelado, gestión y control de fabricación (MIM), 2022: 2932-2937.
[37] Neves M, Neto P. Aprendizaje por refuerzo profundo aplicado a un problema de planificación de secuencias de ensamblaje con preferencias del usuario[J]. Revista internacional de tecnología de fabricación avanzada, 2022.
[38] Oh SH, Cho YI, Woo J H. Aprendizaje de refuerzo distributivo con estudiantes independientes para problemas de programación de talleres flexibles con alta variabilidad [J]. Revista de diseño e ingeniería computacional, 2022, 9(4): 1157-1174.
[39] Samsonov V, Ben Hicham K, Meisen T. Aprendizaje por refuerzo en el control de fabricación: líneas de base, desafíos y caminos a seguir[J]. Aplicaciones de ingeniería de inteligencia artificial, 2022, 112.
[40] Saqlain M, Ali S, Lee J Y. Un algoritmo de búsqueda de árboles de Monte-Carlo para la programación flexible de talleres en sistemas de fabricación [J]. Flexible Services and Manufacturing Journal, 2022.
[41] Schneckenreither M, Haeussler S, Peiro J. Aprendizaje de refuerzo profundo ajustado a la recompensa promedio para la planificación de liberación de pedidos en la fabricación [J]. Knowledge-Based Systems, 2022, 247.
[42] Shao X, Kim C S. An Adaptive Job Shop Scheduler Using Multilevel Convolucional Neural Network and Iterative Local Search[J]. Acceso IEEE, 2022, 10: 88079-88092.
[43] Shimim FN, Whitaker B M. Un enfoque de aprendizaje por refuerzo para el problema de programación dinámica de trabajos [C]. 2022 IEEE Green Energy and Smart System Systems (IGESSC), 2022: 1-6.
[44] Song W, Chen X, Li Q, et al. Programación flexible de talleres de trabajo a través de redes neuronales gráficas y aprendizaje de refuerzo profundo[J]. Transacciones iee sobre informática industrial, 2022: 1-11.
[45] Torres AD, Andreiana DS, Roldan AO, et al. Una revisión de los enfoques de aprendizaje de refuerzo profundo para la fabricación inteligente en el marco de Industria 4.0 y 5.0 [J]. Ciencias Aplicadas-Basilea, 2022, 12(23).
[46] Valet A, Altenmüller T, Waschneck B, et al. Programación de mantenimiento oportunista con aprendizaje de refuerzo profundo [J]. Revista de sistemas de fabricación, 2022, 64: 518-534.
[47] Wang H, Cheng J, Liu C, et al. Marco de aprendizaje de refuerzo multiobjetivo para problemas dinámicos de programación de talleres flexibles con eventos inciertos [J]. Applied Soft Computing, 2022, 131: 109717.
[48] Wang J, Lei DM, Cai J C. Una colonia de abejas artificial adaptativa con aprendizaje de refuerzo para la programación distribuida de ensamblaje de tres etapas con mantenimiento [J]. Applied Soft Computing, 2022, 117.
[49] Wang SY, Li JX, Tang H, et al. CEA-FJSP: Programación flexible de talleres de trabajo consciente de las emisiones de carbono basada en el aprendizaje de refuerzo profundo [J]. Fronteras en Ciencias Ambientales, 2022, 10.
[50] Wang T, Cheng W, Zhang YH, et al. Selección Dinámica de Reglas de Prioridad Basada en Deep Reinforcement Learning para Reprogramación de RCPSP[C]. Décima Conferencia trienal de IFAC sobre modelado, gestión y control de fabricación (MIM), 2022: 2144-2149.
[51] Wang XL, Yao HP, Mai TL, et al. El aprendizaje de refuerzo profundo ayudó a la programación de flujo sin espera en redes sensibles al tiempo [C]. Conferencia de Redes y Comunicaciones Inalámbricas IEEE (IEEE WCNC), 2022: 812-817.
[52] Waubert De Puiseau C, Meyes R, Meisen TJJOI M. Sobre la confiabilidad de los sistemas de programación de producción basados ​​en el aprendizaje reforzado: una encuesta comparativa [J]. Revista de Fabricación Inteligente, 2022: 1-17.
[53] Wu GQ, Hua HJ, Niu D X. Optimización del despacho económico bajo en carbono de una planta de energía virtual basada en el aprendizaje de refuerzo profundo en el entorno del mercado de carbono de China [J]. Revista de Energía Renovable y Sostenible, 2022, 14(5).
[54] Xu ZY, Chang DF, Luo T, et al. Programación inteligente de grúas móviles de dos pisos basada en aprendizaje de refuerzo profundo [J]. Optimización de ingeniería, 2022.
[55] Yan Q, Wang H, Wu F. Programación dinámica habilitada para gemelos digitales con mantenimiento preventivo utilizando un algoritmo de aprendizaje Q de doble capa [J]. Computers & Operations Research, 2022, 144: 105823.
[56] Yan Q, Wu W, Wang H. Deep Reinforcement Learning for Distributed Flow Shop Scheduling with Flexible Maintenance[J]. Máquinas, 2022, 10(3): 210.
[57] Yang SL, Wang JY, Xu Z G. Programación en tiempo real para talleres de flujo de permutación distribuidos con llegadas de trabajo dinámicas utilizando aprendizaje de refuerzo profundo [J]. Informática de ingeniería avanzada, 2022, 54.
[58] Yang YY, Qian B, Hu R, et al. Algoritmo de aprendizaje de refuerzo profundo para el problema de programación de taller de flujo de permutación [C]. 18ª Conferencia Internacional sobre Computación Inteligente (ICIC), 2022: 473-483.
[59] Yu H S. Investigación sobre programación de transporte de logística de productos frescos basada en aprendizaje de refuerzo profundo [J]. Programación científica, 2022, 2022.
[60] Yun WJ, Park S, Kim J, et al. Aprendizaje de refuerzo profundo multiagente cooperativo para una vigilancia confiable a través del control autónomo de múltiples UAV[J]. IEEE Transactions on Industrial Informatics, 2022, 18(10): 7086-7096.
[61] Zhang M, Lu Y, Hu Y, et al. Método de programación dinámica para sistemas de fabricación de taller mediante aprendizaje de refuerzo profundo con optimización de política próxima [J]. Sostenibilidad, 2022, 14(9): 5177.
[62] Zhang Y, Zhu HH, Tang DB, et al. Programación dinámica de talleres basada en aprendizaje de refuerzo profundo para sistemas de fabricación de múltiples agentes [J]. Robotics and Computer-Integrated Manufacturing, 2022, 78.
[63] Zhao YJ, Yoo JH, Lim C G. Gestión de respuesta a la demanda en tiempo real para controlar la carga mediante el aprendizaje de refuerzo profundo [J]. Cmc-Computers Materials & Continua, 2022, 73(3): 5671-5686.
[64] Zheng XY, Liang CJ, Wang Y, et al. Programación dinámica multi-AGV en una terminal de contenedores automatizada: un enfoque de aprendizaje de refuerzo profundo [J]. Matemáticas, 2022, 10(23).
[65] Zhu HH, Tao S, Gui Y, et al. Investigación sobre un método de programación adaptable en tiempo real de un taller de trabajo dinámico basado en el aprendizaje por refuerzo[J] Machines, 2022, 10(11).[66]
Zhu HH, Zhang Y, Liu CC, et al.. Un enfoque de programación basado en el aprendizaje con refuerzo adaptativo con reglas de combinación para la producción de taller de trabajo de línea mixta [J]. Problemas matemáticos en ingeniería, 2022, 2022. [67] Liu Fengxu, Ke
Wen Bo. Programación dinámica en tiempo real del proceso de costura de prendas basado en el aprendizaje de refuerzo profundo [J]. Journal of Textile Science, 2022, 43(09): 41-48. [68] Luo Zihui, Jiang Chengling, Liu Liang, et al.
Basado en la investigación sobre el método inteligente de programación de talleres basado en el aprendizaje de refuerzo profundo [J] Journal of the Internet of Things, 2022, 6(1): 12 .

revisar

[1] Esteso A, Peidro D, Mula J, et al. Aprendizaje por refuerzo aplicado a la planificación y control de la producción [J] International Journal of Production Research, 2022.

[2] Samsonov V, Ben Hicham K, Meisen T. Aprendizaje por refuerzo en el control de fabricación: líneas de base, desafíos y caminos a seguir (Aprendizaje por refuerzo en el control de fabricación: línea de base, desafíos y perspectivas) [J] Aplicaciones de ingeniería de la inteligencia artificial, 2022, 112.

[3] Torres AD, Andreiana DS, Roldan AO, et al.A Review of Deep Reinforcement Learning Approaches for Smart Manufacturing in Industry 4.0 and 5.0 Framework (A Review of Deep Reinforcement Learning Approaches for Smart Manufacturing in Industry 4.0 and 5.0 Framework) [ J] Ciencias Aplicadas-Basilea, 2022, 12(23).

[4] Waubert De Puiseau C, Meyes R, Meisen TJJOI M. Sobre la confiabilidad de los sistemas de programación de producción basados ​​en el aprendizaje reforzado: una encuesta comparativa [J] Journal of Intelligent Manufacturing, 2022: 1-17.

programación de taller de trabajo

[5] Bai Y, Lv Y. Programación de taller de trabajo basada en el aprendizaje de refuerzo para la producción de remanufactura [C] Conferencia internacional IEEE 2022 sobre ingeniería industrial y gestión de ingeniería (IEEM), 2022: 0246-0251.
1

[6] Chen SF, Huang ZY, Guo H F. Un método de aprendizaje profundo de extremo a extremo para el problema de programación de talleres dinámicos [J] Machines, 2022, 10(7).

[7] Elsayed EK, Elsayed AK, Eldahshan K A. Programación de talleres de fabricación inteligente basada en el aprendizaje de refuerzo profundo [J] Cmc-Computers Materials & Continua, 2022, 73 (3): 5103-5120.

[8] Hammami NEH, Lardeux B, Hadj-Alouane AB, y otros Job Shop Scheduling: un enfoque novedoso de DRL para la generación continua de horarios frente a llegadas de trabajos en tiempo real Generación programada continua de llegadas de piezas de trabajo en tiempo real) [J]. IFAC-PapersOnLine, 2022, 55(10): 2493-2498.

[9] Jungbluth S, Gafur N, Popper J, et al. Programación basada en el aprendizaje por refuerzo de un proceso de taller con manipuladores robóticos controlados distribuidamente para operaciones de transporte [C] 14.º taller de la IFAC sobre sistemas de fabricación inteligentes (IMS), 2022 : 156-162.

[10] Liu ZY, Wang Y, Liang XX, et al. Un enfoque de Q-learning profundo basado en redes neuronales gráficas para problemas de programación de talleres en el método de aprendizaje de gestión del tráfico) [J]. Ciencias de la información, 2022, 607: 1211- 1223.

[11] Shao X, Kim C S. Un programador de taller adaptativo que usa una red neuronal convolucional multinivel y búsqueda local iterativa (un programador de taller adaptativo que usa una red neuronal convolucional multinivel y búsqueda local iterativa) [J] IEEE Access, 2022, 10 : 88079-88092.

[12] Shimim FN, Whitaker B M. Un enfoque de aprendizaje por refuerzo para el problema de la programación dinámica de trabajos [C] 2022 IEEE Green Energy and Smart System Systems (IGESSC), 2022: 1-6.

[13] Zhang M, Lu Y, Hu Y, et al. Método de programación dinámica para sistemas de fabricación de talleres de trabajo mediante aprendizaje de refuerzo profundo con optimización de política proximal () [J] Sostenibilidad, 2022, 14 (9): 5177.

[14] Zhu HH, Tao S, Gui Y, et al. Investigación sobre un método de programación adaptable en tiempo real de taller de trabajo dinámico basado en el aprendizaje por refuerzo [J] Machines, 2022, 10(11).

[15] Zhu HH, Zhang Y, Liu CC, et al. Un enfoque de programación basado en el aprendizaje de refuerzo adaptativo con reglas de combinación para la producción de taller de trabajo de línea mixta J. Problemas matemáticos en ingeniería, 2022, 2022.

Programación flexible del taller de trabajo

[16] Chang J, Yu D, Hu Y, et al.. Deep Reinforcement Learning for Dynamic Flexible Job Shop Scheduling with Random Job Arrival [J] Processes, 2022 , 10(4): 760.

[17] Chang JR, Yu D, Zhou Z y otros Aprendizaje por refuerzo jerárquico para la programación flexible en tiempo real con objetivos múltiples en un taller inteligente [J] Machines, 2022, 10(12).

[18] Chang X, Jia XL, Fu SF, et al. Los gemelos digitales y el aprendizaje de refuerzo profundo permitieron la programación en tiempo real para el taller flexible de productos complejos [J]. Actas de la Institución de Ingenieros Mecánicos Parte B-Journal of Engineering Fabricación, 2022.

[19] Du Y, Li JQ, Chen XL, et al. Aprendizaje por refuerzo basado en el conocimiento y estimación del algoritmo de distribución para el problema de programación de talleres flexibles [J ].Ieee Transactions on Emerging Topics in Computational Intelligence, 2022.

[20] Du Y, Li JQ, Li CD, et al.A Reinforcement Learning Approach for Flexible Job Shop Scheduling Problem With Crane Transportation and Setup Times (método de aprendizaje de refuerzo de problema de programación de taller flexible con transporte de grúa y tiempo de preparación) [J] Transacciones IEEE en redes neuronales y sistemas de aprendizaje, 2022.

[21] Gu WB, Li YX, Tang DB y otros Uso de datos de fabricación en tiempo real para programar una fábrica inteligente a través del aprendizaje por refuerzo (programación de fábrica inteligente basada en aprendizaje por refuerzo y datos de fabricación en tiempo real) [J]. Ingeniería Industrial, 2022, 171.

[22] Jing X, Yao XF, Liu M, y otros Aprendizaje de refuerzo multiagente basado en una red convolucional de gráficos para la programación flexible del taller (aprendizaje de refuerzo multiagente basado en la red convolucional de gráficos para la programación flexible del taller) [J] Revista de Fabricación Inteligente, 2022.

[23] Johnson D, Chen G, Lu Y Q. Aprendizaje por refuerzo de múltiples agentes para la programación de producción dinámica en tiempo real en una celda de ensamblaje de robot (Aprendizaje por refuerzo de múltiples agentes para la programación de producción dinámica en tiempo real en una celda de ensamblaje de robot) [J ] IEEE Robotics and Automation Letters, 2022, 7(3): 7684-7691.

[24] Lei K, Guo P, Wang Y, et al. Un marco de aprendizaje de refuerzo jerárquico de extremo a extremo para el marco de aprendizaje de refuerzo de capa de problema de programación de taller flexible dinámico a gran escala) [C]. Conferencia internacional IEEE sobre Fuzzy Systems (FUZZ-IEEE) / Congreso Mundial IEEE sobre Inteligencia Computacional (IEEE WCCI) / Conferencia Conjunta Internacional sobre Redes Neuronales (IJCNN) / Congreso IEEE sobre Computación Evolutiva (IEEE CEC), 2022.

[25] Lei K, Guo P, Zhao W, et al. Un marco de aprendizaje de refuerzo profundo de acción múltiple para el problema de programación de talleres flexibles [J]. Expert Systems with Applications, 2022, 205: 117796.

[26] Li R, Gong WY, Lu C. Un aprendizaje de refuerzo basado en RMOEA/D para la programación de talleres de trabajo flexibles difusos biobjetivos (programación de talleres de trabajos flexibles difusos biobjetivos basada en el aprendizaje de refuerzo RMOEA/D) [J]. Experto Sistemas con Aplicaciones, 2022, 203.

[27] Li Y, Gu W, Yuan M, et al. Programación dinámica basada en datos en tiempo real para talleres flexibles con recursos de transporte insuficientes utilizando la red Q profunda híbrida Programación dinámica basada en datos en tiempo real) [J]. y fabricación integrada por computadora, 2022, 74: 102283.

[28] Liu R, Piplani R, Toro C. Aprendizaje de refuerzo profundo para la programación dinámica de un taller de trabajo flexible [J] International Journal of Production Research, 2022: 1-21.

[29] Long XJ, Zhang JT, Qi X, et al. Un algoritmo de colonia de abejas artificiales de autoaprendizaje basado en el aprendizaje de refuerzo para un problema de programación de taller flexible )[J]. Concurrency and Computation-Practice & Experience, 2022, 34(4).

[30] Luo S, Zhang LX, Fan Y S. Real-Time Scheduling for Dynamic Partial-No-Wait Multiobjective Flexible Job Shop by Deep Reinforcement Learning [J].Ieee Transactions on Automation Science and Engineering, 2022, 19(4) : 3020-3038.

[31] Oh SH, Cho YI, Woo J H. Aprendizaje de refuerzo de distribución con estudiantes independientes para un problema de programación de taller flexible con un problema de alta variabilidad) [J] Journal of Computational Design and Engineering, 2022, 9(4): 1157 -1174.

[32] Saqlain M, Ali S, Lee J Y. Un algoritmo de búsqueda de árbol de Monte-Carlo para la programación flexible de talleres en sistemas de fabricación (algoritmo de búsqueda de árbol de Montecarlo para la programación flexible de talleres en sistemas de fabricación) [J] Revista de fabricación y servicios flexibles, 2022.

[33] Song W, Chen X, Li Q y otros, Programación flexible de talleres de trabajo a través de redes neuronales gráficas y aprendizaje de refuerzo profundo [J], Ieee Transactions on Industrial Informatics, 2022: 1-11.

[34] Wang H, Cheng J, Liu C, et al Marco de aprendizaje de refuerzo multiobjetivo para problemas dinámicos de programación de talleres flexibles con eventos inciertos (marco de aprendizaje de refuerzo multiobjetivo para problemas dinámicos de programación de talleres flexibles con eventos inciertos) [ J ].Soft Computing aplicado, 2022, 131: 109717.

[35] Wang SY, Li JX, Tang H, et al. CEA-FJSP: Programación flexible de talleres de trabajo consciente de las emisiones de carbono basada en aprendizaje de refuerzo profundo (CEA-FJSP: Programación flexible de talleres de trabajo consciente de las emisiones de carbono basada en aprendizaje por refuerzo )[J] Frontiers in Environmental Science, 2022, 10.

[36] Xu ZY, Chang DF, Luo T, et al. Programación inteligente de grúas móviles de dos pisos basada en el aprendizaje de refuerzo profundo [J]. Engineering Optimization, 2022.

[37] Yan Q, Wang H, Wu F. Programación dinámica habilitada para gemelos digitales con mantenimiento preventivo usando un algoritmo de aprendizaje Q de doble capa ) [J] Computers & Operations Research, 2022, 144: 105823.

[38] Zhang Y, Zhu HH, Tang DB, et al. Programación dinámica del taller de trabajo basada en el aprendizaje de refuerzo profundo para sistemas de fabricación de múltiples agentes [J]. Robotics and Computer-Integrated Manufacturing, 2022, 78.

Programación de taller de flujo

[39] Cai JC, Lei DM, Wang J, et al. Un nuevo algoritmo de salto de rana aleatorio con aprendizaje de refuerzo para el algoritmo de omisión de programación de taller de flujo híbrido de ensamblaje distribuido) [J] International Journal of Production Research, 2022.
2

[40] Dong Z, Ren T, Weng J, et al.. Minimización del trabajo tardío del problema de programación del taller de flujo con un enfoque basado en el aprendizaje de refuerzo profundo [J].Applied Sciences, 2022, 12(5): 2366.

[41] Gil CB, Lee J H. Enfoque de aprendizaje de refuerzo profundo para la programación de materiales teniendo en cuenta el entorno de alta dimensión del problema de taller de flujo híbrido [J] Applied Sciences-Basel, 2022, 12 (18).

[42] Grumbach F, Muller A, Reusch P, et al. Programación robusta y estable en talleres de flujo dinámico basados ​​en el aprendizaje de refuerzo profundo [J]. Journal of Intelligent Manufacturing, 2022.

[43] Li HX, Gao KZ, Duan PY, et al. Un algoritmo mejorado de colonia de abejas artificiales con Q-Learning para resolver problemas de programación de flujo de permutación [J] Transacciones iee en Systems Man Cybernetics-Systems, 2022.

[44] Marchesano MG, Guizzi G, Popolo V, et al. Programación dinámica de un taller de flujo limitado con fecha de vencimiento con Deep Reinforcement Learning [C] 10.ª Conferencia trienal de IFAC sobre modelado, gestión y control de fabricación (MIM), 2022: 2932 -2937.

[45] Yan Q, Wu W, Wang H. Aprendizaje de refuerzo profundo para la programación de talleres de flujo distribuido con mantenimiento flexible [J] Machines, 2022, 10(3): 210.

[46] Yang SL, Wang JY, Xu Z G. Programación en tiempo real para talleres de flujo de permutación distribuidos con llegadas dinámicas de trabajos usando aprendizaje de refuerzo profundo.Informática de ingeniería avanzada, 2022, 54.

[47] Yang YY, Qian B, Hu R, et al. Algoritmo de aprendizaje de refuerzo profundo para el problema de programación de taller de flujo de permutación [C] 18.ª Conferencia internacional sobre computación inteligente (ICIC), 2022: 473-483.

[48] ​​​​Luo Zihui, Jiang Chengling, Liu Liang, et al. Investigación sobre el método inteligente de programación de talleres basado en el aprendizaje de refuerzo profundo [J] Journal of Internet of Things, 2022, 6(1): 12.

otros problemas de programación

[49] Cao YL, Xu ZW, Mei M, et al. Método de reprogramación de trenes basado en el aprendizaje de refuerzo de múltiples agentes [C] 6.ª Conferencia de Control de Automatización, Electrónica y Tecnología de la Información Avanzada del IEEE (IEEE IAEAC), 2022: 301-305 .
3

[50] Hayes CF, Rădulescu R, Bargiacchi E, et al. Una guía práctica para el aprendizaje y la planificación con refuerzo multiobjetivo [J]. Autonomous Agents and Multi-Agent Systems, 2022, 36(1): 26.

[51] He Z, Tran KP, Thomassey S, et al. Optimización multiobjetivo del proceso de fabricación textil mediante el aprendizaje de refuerzo multiagente basado en la red Q profunda Fabricación textil)[J]. Journal of Manufacturing Systems, 2022, 62: 939-949.

[52] Jeon SW, Lee DG, Oh SC y otros Diseño e implementación de un sistema de programación basado en simulación con aprendizaje por refuerzo para líneas de producción reentrantes [J] Machines, 2022, 10(12).

[53] Lee YH, Lee S. Programación basada en el aprendizaje de refuerzo profundo dentro del plan de producción en la fabricación de semiconductores [J] Expert Systems with Applications, 2022, 191: 116222.

[54] Leng JL, Wang XY, Wu SP, et al. Un enfoque de aprendizaje por refuerzo multiobjetivo para resecuenciar problemas de programación en sistemas de fabricación de automóviles [J]. International Journal of Production Research, 2022.

[55] Li RF, Zhang XY, Jiang LL, et al. Un algoritmo heurístico adaptativo basado en el aprendizaje por refuerzo para el problema de optimización de la programación de barcos [J]. Ocean & Coastal Management, 2022, 230.

[56] Liao JL, Wu GL, Chen H, et al. ACDRL: Un enfoque de aprendizaje de refuerzo profundo actor-crítico para resolver el problema de reprogramación de horarios de trenes orientado a la energía bajo perturbaciones aleatorias (ACDRL: Un método de aprendizaje de refuerzo profundo actor-crítico es utilizado para resolver el problema de reprogramación de horarios de trenes con objetivo de energía bajo perturbaciones aleatorias) [J] Energy Reports, 2022, 8: 1350-1357.

[57] Neves M, Neto P. Aprendizaje de refuerzo profundo aplicado a un problema de planificación de secuencia de ensamblaje con preferencias del usuario [J] International Journal of Advanced Manufacturing Technology, 2022.

[58] Schneckenreither M, Haeussler S, Peiro J. Aprendizaje de refuerzo profundo ajustado a la recompensa promedio para la planificación de la liberación de pedidos en la fabricación [J] Knowledge-Based Systems, 2022, 247.

[59] Valet A, Altenmuller T, Waschneck B, et al. Programación de mantenimiento oportunista con aprendizaje de refuerzo profundo [J] Journal of Manufacturing Systems, 2022, 64: 518-534.

[60] Wang J, Lei DM, Cai J C. Una colonia de abejas artificial adaptativa con aprendizaje de refuerzo para la programación distribuida de ensamblaje de tres etapas con mantenimiento J]. Computación suave aplicada, 2022, 117.

[61] Wang T, Cheng W, Zhang YH, et al. Selección dinámica de reglas de prioridad basadas en el aprendizaje de refuerzo profundo para la reprogramación de RCPSP [C] 10.ª Conferencia trienal de IFAC sobre modelado, gestión y control de fabricación (MIM), 2022: 2144-2149.

[62] Wang XL, Yao HP, Mai TL, y otros Programación de flujo sin espera asistida por aprendizaje de refuerzo profundo en redes sensibles al tiempo (Programación de flujo sin espera asistida por aprendizaje de refuerzo profundo en redes sensibles al tiempo) [C]. Conferencia de Redes y Comunicaciones Inalámbricas (IEEE WCNC), 2022: 812-817.

[63] Wu GQ, Hua HJ, Niu D X. Optimización del despacho económico con bajas emisiones de carbono de una planta de energía virtual basada en el aprendizaje de refuerzo profundo en el entorno del mercado de carbono de China Optimización de la programación) [J]. Journal of Renewable and Sustainable Energy, 2022, 14(5).

[64] Yu H S. Investigación sobre programación de transporte de logística de productos frescos basada en aprendizaje de refuerzo profundo [J] Programación científica, 2022, 2022.

[65] Yun WJ, Park S, Kim J, et al. Aprendizaje de refuerzo profundo multiagente cooperativo para vigilancia confiable a través del control autónomo de UAV múltiple J. Ieee Transactions on Industrial Informatics, 2022, 18(10): 7086-7096.

[66] Zhao YJ, Yoo JH, Lim C G. Gestión de la respuesta a la demanda en tiempo real para controlar la carga mediante el aprendizaje de refuerzo profundo [J] Cmc-Computers Materials & Continua, 2022, 73(3): 5671-5686.

[67] Zheng XY, Liang CJ, Wang Y, y otros Programación dinámica multi-AGV en una terminal de contenedores automatizada: un enfoque de aprendizaje de refuerzo profundo (programación dinámica multi-AGV de terminal de contenedores automatizada: método de aprendizaje de refuerzo profundo) [J]. Matemáticas, 2022, 10(23).

[68] Liu Fengxu, Ke Wenbo. Programación dinámica en tiempo real del proceso de costura de prendas basado en el aprendizaje de refuerzo profundo [J] Journal of Textile Science, 2022, 43(09): 41-48.

Supongo que te gusta

Origin blog.csdn.net/hba646333407/article/details/128807018
Recomendado
Clasificación