Para la materia tomamos como excusa el diseño de un producto que asista la creación de peliculas a través de modelos. Usamos eso para ilustrar algunos puntos relevantes a la hora de crear un producto, asi como tambien abordar ciertas cuestiones técnicas y metodológicas al construir productos de datos.


Cursada: Miércoles de 10:00 a 15:00 - Completamente presencial durante todo el cuatrimestre

Correlativas:

- Algoritmos y estructura de datos 3

- Métodos numéricos (o Álgebra Lineal Computacional de LCD)

Programa:

  1. Introducción

    1. Machine learning, data science, data products.

    2. Business Case, Metricas offline y Key Performance Indicators

  2. Aprendizaje supervisado

    1. Repaso de modelos clásicos (Regresión Logística, Decision Trees)

    2. Random Forests y Gradient Boosting en profundidad

  3. Metodología

    1. Método científico aplicado a Machine Learning en la práctica

    2. Overfitting / Underfitting. Bias / Variance trade-off

    3. Diseño experimental

    4. Técnicas de model selection clásicas: Grid search, Random search

    5. Técnicas avanzadas de model selection: Sequential model based optimization, Hyper Band, BO-HB

  4. Modelado no trivial aplicado a nuestro caso de estudio

    1. Categorical embeddings 

    2. Modelando (algunas) distribuciones

  5. NLP

    1. Tf-idf, word2vec, fastText

    2. Self-supervised learning ULMFiT

La materia otorga 3 puntos de optativa para la carrera de Licenciatura en Ciencias de la Computación.