• Inicio

    Profesor: Juan Gomez Romero

    Resumen:

    El aprendizaje por refuerzo (“reinforcement learning”, RL) es un área del aprendizaje automático que estudia cómo un agente situado en un entorno puede resolver una tarea mediante experimentación repetitiva y asignación de recompensas. Las técnicas de RL tienen como objetivo maximizar la recompensa obtenida por el agente, equilibrando la exploración de secuencias de acción novedosas con el refinamiento de las ya conocidas. Los avances en aprendizaje profundo (“deep learning”, DL) han dado lugar a nuevas aproximaciones que utilizan redes neuronales para estimar la recompensa esperada y optimizar las acciones del agente. Estas propuestas de aprendizaje profundo por refuerzo (“deep reinforcement learning”, DRL) han demostrado ser extraordinariamente efectivas, superando incluso a la inteligencia humana en muchos ámbitos; por ejemplo, en el juego del Go.

    En este curso se introducirán los fundamentos del DRL, así como los aspectos prácticos de implementación para la resolución de problemas.

    Indice Breve

    1. Introducción al aprendizaje profundo

    1.1. Concepto de DL

    1.2. Algoritmos de optimización

    1.3. Implementación en PyTorch

    2. Aprendizaje por refuerzo

    2.1. Concepto de RL

    2.2. Modelos de decisión de Markov

    2.3. Métodos de Monte Carlo

    2.4. Métodos de diferencia temporal

    2.5. Implementación en OpenAI

    3. Aprendizaje profundo por refuerzo

    3.1. Concepto de DRL

    3.2. Métodos basados en estimación del valor de acción

    3.3. Métodos basados en determinación de políticas

    3.4. Implementación en PyTorch + OpenAI

    Conocimientos requeridos para tomar el curso: 

    El curso está destinado a estudiantes licenciados en Ciencias de la Computación. Se recomienda que el estudiante haya superado las materias: Álgebra, Inteligencia Artificial, Redes Neuronales.