Diseño paralelo de algoritmo de aprendizaje por refuerzo para entornos big data
##plugins.themes.bootstrap3.article.main##
Resumen
El aprendizaje por refuerzo es una forma de aprendizaje basado en la prueba y error. Este tipo de aprendizaje se aplica a problemas complejos que requieren en la actualidad procesar grandes volúmenes de datos. Algunas de estos problemas sonadministración de recursos, problemas de planificación, control de tráfico, robótica, detección de intrusos, control de sistemas energéticos, detección de fraude en banca online, etc.Los algoritmos de aprendizaje por refuerzo tradicionales no están preparados para tratar conentornos big data, desde el enfoque de un único agente. Aprovechando las capacidades de computo de los sistemas multicomputadorse diseñó una variante del algoritmo Q-Learningenfocada a sistemas multiagentes. Luego con ambas variantes se realizó un experimento para validar que la solución acelera el proceso de aprendizaje basado en la cantidad de iteraciones que tardan las soluciones en completar un episodio. Finalmente se valida la solución a partir de la aplicación de una prueba estadística con los resultados obtenidos.