Aula virtual con material para la comisión Turno Noche de Introducción a la Programación.
Prácticas TN: Lunes y Miércoles de 19:30 a 22:00 en los laboratorios del cero+inf.
Si no estas matriculado, para consultas administrativas dirigirse a: marianogonzalez@dc.uba.ar
Aula virtual con material para la comisión Turno Tarde de Introducción a la Programación.
Prácticas TT: Lunes y Miércoles de 13:30 a 17:00 en los laboratorios del cero+inf.
Si no estas matriculado, para consultas administrativas dirigirse a: marianogonzalez@dc.uba.ar
Aula virtual del contenido Teórico y general para la materia de Introducción a la Programación.
Clases Teóricas Jueves, aula magna del pabellón 1.
- Turno Mañana: 9:30 a 13:30 (Prof. Pablo De Cristoforis)
- Turno Tarde: 13:30 a 17:30 (Prof. Martín Urtasun)
- Turno Noche: 17:30 a 21:30 (Prof. Javier Altauz)
Para las clases prácticas referirse a las aulas virtuales de cada turno por separado.
Si no estas matriculado, para consultas administrativas enviar correo a: marianogonzalez@dc.uba.ar
Aula virtual con material para la comisión Turno Mañana de Introducción a la Programación.
Prácticas TM: Lunes y Miércoles de 9:30 a 13:00 en los laboratorios del cero+inf.
Si no estas matriculado, para consultas administrativas dirigirse a: marianogonzalez@dc.uba.ar
En la era del Big Data, podríamos decir que los datos nos hablan. A través del análisis y la inteligencia artificial, podemos escucharlos y transformarlos en conocimiento útil para la toma de decisiones.
Pero el camino no es sencillo. Los datos no vienen a golpearnos la puerta: debemos recolectarlos, organizarlos y gestionarlos de manera eficiente para que estén disponibles cuando los necesitemos. Ya sea que querramos desarrollar modelos de aprendizaje automático, realizar análisis ad-hoc o construir tableros de control, disponer de los datos adecuados en el momento preciso es un desafío permanente.
Más aún cuando los datos provienen de múltiples fuentes implementadas sobre diferentes plataformas tecnológicas, en distintos formatos, con volúmenes masivos y frecuencias de actualización heterogéneas. En la industria, las necesidades varían y no existe una única solución que las resuelva a todas. Hay variadas estrategias para la obtención, almacenamiento, procesamiento y acceso a los datos, desde los data warehouses clásicos hasta los más recientes data lakes y arquitecturas híbridas modernas y soluciones cloud.
En este curso, de modalidad teórico práctica, exploraremos estas arquitecturas y sus conceptos clave, desde su concepción hasta su implementación, y presentaremos las nuevas tendencias emergentes. Ejercitaremos sobre un caso de estudio y realizaremos algunos talleres en laboratorio.
En el mundo del Big Data, no se trata sólo de almacenar información, el plus está en convertirla en valor.
Días y horarios
Las clases serán los días martes de 18 a 22 hs., con excepción de tres clases de laboratorio (con día y hora a definir)
Correlativa:
- Bases de Datos ( Cs. Computación)
- Introducción a las Bases de Datos (Cs de Datos)
Docentes:
- Sergio D'Arrigo
Programa
- Introducción y motivación: Introducción. Importancia de los datos y rol de la analítica. Organizaciones “Data Driven”. Clasificación de los tipos de datos. ¿Qué entendemos por datos masivos? Desafíos para la inteligencia artificial y la analítica. Acceso e ingesta. Procesamiento. Integración. Almacenamiento. Explotación y visualización.
- Modelos y Diseño de Almacenamiento de Datos Masivos: Principales soluciones de almacenamiento de datos masivos. Modelos multidimensionales. Conceptos de Data Warehouse y Data Lake y arquitecturas híbridas. Arquitectura, modelización, diseño. Linaje y gobierno de datos. Protección de datos personales. Soluciones cloud.
- Procesos de ingesta de datos masivos: Implementación. Ingesta, almacenamiento y actualización. ETL, ELT, ETL Inverso. Ingesta en batch y en tiempo real. Integridad y calidad. DataOps.
- Explotación, visualización y análisis de datos masivos: Exploración, BI, Aprendizaje Automático. Utilización de sandbox analíticos. MLOps.
- Nuevas tendencias para almacenamiento de datos masivos: Variantes de data warehouses. Data warehouses y Big Data. Data lakehouses. Utilización de IA para extracción de características. Estado del arte.
La materia es optativa para las carreras de Licenciatura en Ciencias de la Computación y Licenciatura en Ciencia de Datos.