Objetivos: 

El curso procura brindar herramientas aplicadas, útiles para la descripción, el análisis y el modelado de datos en un contexto científico interdisciplinario. Todas las técnicas estudiadas son implementadas en R, y ejemplificadas con conjuntos de datos reales y simulados. El enfoque particular del curso se centra en los datos y en la selección de métodos de análisis que se ajustan a ellos. Se intentará dotar al estudiante del conocimiento de una amplia variedad de técnicas útiles en el contexto de la ciencia de datos y en particular de técnicas de aprendizaje supervisado. 

Contenidos: 

  1. Regresión logística: estimación de parámetros, prediccion bajo el modelo logistico. Métricas de evaluacion de modelos. Clasificación.
  2. Modelo lineal generalizado. Estimación, predicción y técnicas selección y bondad de modelos.
  3. Regularización para Modelo Lineal Generalizado.
  4. Redes Neuronales Simple Capa en Regresión y Clasificación. Redes Neuronales Multicapa. Redes profundas.
  5. Clasificación y arboles de regresión.
  6. Ensambles, bagging, Random Forest, boosting.