• Inicio

    Carlos Gregorio Rodriguez, profesor de la Universidad Complutense de Madrid.
    Puntaje: 1 punto para licenciatura.
    Horarios: 28 y 29 de septiembre, 2,3,5,6 y 9 de octubre de 9 a 12.

    Forma de Evaluación

    Trabajo prácticos

    Programa

    Introducción Programación Paralela y Big Data
    -Espacio y tiempo en la era digital
    -Retos del procesamiento masivo
    -Soluciones Hw y Sw
    Hadoop: Sistema de ficheros distribuido
    -Distribuido, redundante y tolerante a fallos
    -NameNode y DataNode
    -Interfaz de línea de comandos
    -Ecosistema asociado
    Programación Paralela
    -Problemas de la programación clásica
    -Paradigma Map-Reduce
    Modelo de procesamiento
    Desarrollo de programas
    -Paradigma Spark
    Abstracción RDD
    Desarrollo de programas

    Metodología

    El curso tiene una orientación práctica y se desarrollará en laboratorio. La evaluación se realizará mediante entrega de trabajos.

    Bibliografía

    Karau H., Konwinski A., Wendell P., and Zaharia M. "Learning Spark". O'Reilly. 2015

    White T., "Hadoop: The definitive guide". O'Reilly. 2015

    Documentación Hadoop: http://hadoop.apache.org/docs/current/

    Documentación de Python MapReduce: http://mrjob.readthedocs.io/en/latest/

    Documentación de Spark: https://spark.apache.org/