Diseño paralelo de algoritmo de aprendizaje por refuerzo para entornos big data

##plugins.themes.bootstrap3.article.main##

Jacinto Rivero Hernández Jimmy Linares Lagarto Antonio Lamazares Fernández Lester Guerra Denis Humberto Díaz Pando

Resumen

El aprendizaje por refuerzo es una forma de aprendizaje basado en la prueba y error. Este tipo de aprendizaje se aplica a problemas complejos que requieren en la actualidad procesar grandes volúmenes de datos. Algunas de estos problemas sonadministración de recursos, problemas de planificación, control de tráfico, robótica, detección de intrusos, control de sistemas energéticos, detección de fraude en banca online, etc.Los algoritmos de aprendizaje por refuerzo tradicionales no están preparados para tratar conentornos big data, desde el enfoque de un único agente. Aprovechando las capacidades de computo de los sistemas multicomputadorse diseñó una variante del algoritmo Q-Learningenfocada a sistemas multiagentes. Luego con ambas variantes se realizó un experimento para validar que la solución acelera el proceso de aprendizaje basado en la cantidad de iteraciones que tardan las soluciones en completar un episodio. Finalmente se valida la solución a partir de la aplicación de una prueba estadística con los resultados obtenidos.

##plugins.themes.bootstrap3.article.details##

Cómo citar
Rivero Hernández, J., Linares Lagarto, J., Lamazares Fernández, A., Guerra Denis, L., & Díaz Pando, H. (2019). Diseño paralelo de algoritmo de aprendizaje por refuerzo para entornos big data. Serie Científica De La Universidad De Las Ciencias Informáticas, 11(5), 11-16. Recuperado a partir de https://publicaciones.uci.cu/index.php/serie/article/view/192
Sección
Artículos originales

Artículos más leídos del mismo autor/a