• Inicio

    Ciencias de los Datos es una disciplina reciente que surje de la disponibilidad masiva de conjuntos de datos de todo tipo. Esta es una materia estrictamente interdisciplinaria que reúne temas de ciencias de la computación, matemática, física, y otras ciencias naturales y sociales. Se trata de un abordaje desde una perspectiva algorítmica y de la teoría de la información aplicados al análisis de datos de grandes corpus. En particular, se propone el uso de técnicas modernas de procesamiento de información (como por ejemplo, Machine Learning), y las tecnologías de procesamiento masivo (como por ejemplo MapReduce o Elastic Search).

    Los objetivos de la materia son: 1) Proveer a los alumnos con un conjunto de herramientas matemáticas que permitan el análisis estadístico clásico de conjuntos de datos. 2) Proveer a los alumnos herramientas computacionales para el modelado y adquisición de datos en grandes corpus. 3) Presentar las tecnologías recientes para procesamiento de cantidades masivas de datos. 4) Introducir al alumno en el análisis de datos utilizando Machine Learning.

    Se llevaran a cabo experimentos (en el laboratorio y usando/sobre grandes repositorios de datos tomados de la web) con particular foco en neurociencia, para inferir propiedades del computo humano a partir de datos observacionales. Se utilizara este problema especifico para abordar el problema de análisis de datos en muchas dimensiones, por ejemplo en el analisis de regularidades en grandes corpus de texto.

    La materia estará subdividida en 6 módulos:

    1. Estadística básica.
    2. Series Temporales
    3. Probabilidades y Análisis Bayesiano
    4. Técnicas de Machine Learning
    5. Redes Complejas
    6. Procesamiento de texto
     

    Calendario