• Programa

    1. Geometría proyectiva y transformaciones 2D

    Plantear los problemas geométricos 2D en el espacio proyectivo P^2, realizar rectificaciones de imágenes deformadas y medir segmentos y ángulos sobre sobre las imágenes deformadas. Se resaltarán también las ventajas de la geometría proyectiva en general: linealidad de las transformaciones y fácil manejo de los objetos geométricos (puntos, rectas, cónicas) en el infinito.


    2. Problemas de estimación en transformaciones proyectivas 2D

    Dadas dos imágenes entre las que existe una transformación proyectiva que las relaciona (por ej.: una pared vista por una cámara ubicada en dos posiciones distintas) el alumno debe poder estimar dicha transformación. Esto presenta problemas numéricos que no son resueltos por las soluciones "naïve" que surgen en forma inmediata. Se hace necesario considerar la correspondencia de muchos pares de puntos de ambas imágenes y elegir la proyectividad que minimiza alguna función de costo. Como el apareo de puntos entre dos imágenes puede contener errores gruesos (por ej.: puntos incorrectamente apareados), sobre todo en métodos automáticos de apareamiento, se considera el uso de métodos robustos ante esta situación, como es el método RANSAC (RANdom SAmple Consensus).


    3. Geometría proyectiva y transformaciones 3D

    Esta unidad es la versión 3D de la 1ra unidad, la cual se dedica a 2D. Los objetivos también son similares a los de la 1ra unidad. Se agrega, sin embargo, la necesidad de apreciar las diferencias no triviales entre P^3 y P^2 en cuanto a la representación de entes geométricos y sus relaciones, las cuales son aquí bastante más complejas.


    4. Modelos de cámara

    Una cámara mapea el mundo 3D de los objetos en la imagen 2D. Esto se hace mediante la matriz de proyección P que caracteriza a la cámara. El alumno debe comprender cómo es la estructura de la matriz de proyección P para los diferentes tipos de cámaras existentes y apreciar las diferencias entre las imágenes generadas por las mismas.


    5. Estimación de la matriz de proyección de cámara P y calibración

    En vista a la aplicación práctica de los conocimientos presentados en la unidad anterior, el alumno debe conocer los algoritmos para la estimación de la matriz P a partir de objetos conocidos y sus imágenes, y el método para calibrar la cámara (determinación de la matriz de calibración K). Debe saber también corregir la distorsión radial presente en las cámaras reales para poder así aplicar los modelos ideales estudiados.


    6. Geometría epipolar y matriz fundamental F

    El alumno debe comprender cómo la matriz fundamental F representa la geometría epipolar del par de cámaras. Debe conocer la estructura de la matriz F, así como sus propiedades respecto de ambas cámaras (caracterizadas por sus matrices P y P'), de las líneas epipolares y de los epipolos de las mismas. Estos conocimientos le permitirán, entre otras cosas, determinar los valores de las matrices P y P' a partir de F (a menos de una transformación proyectiva) y determinar F para ciertos casos importantes de posición relativa entre ambas cámaras.


    7. Reconstrucción 3D con dos cámaras

    Se desea que el alumno comprenda las bases teóricas de la existencia de una familia de reconstrucciones posibles (reconstrucción proyectiva) a partir del conocimiento de la matriz fundamental F y los sucesivos refinamientos posibles a partir del conocimiento de datos adicionales, lo que permite obtener una reconstrucción afín o una reconstrucción métrica. También debe conocer las condiciones bajo las cuales puede lograrse una reconstrucción métrica directa.


    8. Cálculo de la matriz fundamental F

    Es importante el conocimiento de diversos algoritmos para el cómputo de la matriz fundamental F a partir de las correspondencias entre puntos de las dos imágenes estéreo. El alumno debe poder apreciar las diferencias entre los mismos en cuanto a error, rapidez y simplicidad.


    9. Determinación de puntos 3D y construcción de mapas de disparidad a partir de dos vistas

    Esta unidad presenta algoritmos para la determinación de la posición de puntos en el espacio 3D a partir de dos imágenes estéreo y las matrices P y P' de las cámaras. Dado un sistema de visión estéreo, las imágenes que se capturan en cada cámara son prácticamente iguales, con una diferencia en la posición relativa de los objetos. Estas diferencias relativas en la posición en cada imagen, denominada disparidad, tiene una relación directa con la distancia (o profundidad) a la que se encuentran los objetos entre sí y con respecto a las cámaras. Los mapas de disparidad se obtienen de calcular la disparidad para cada pixel de la imagen. Existen tres etapas en este proceso: primero, seleccionar un punto característico de un objeto en una de las dos imágenes, segundo encontrar el mismo punto característico en la otra imagen, y tercero, medir la diferencia relativa (disparidad) entre la posición de estos dos puntos. Hay que tener en cuenta que para poder hacer esto, se deben rectificar y alinear las imágenes previamente.


    10. Algoritmos para la navegación de un robot basados en visión

    Esta unidad sirve para que el alumno utilice todo lo aprendido para desarrollar algoritmos de navegación basado en visión, que permitan a un robot autónomo tomar decisiones en tiempo real para su desplazamiento en ambientes interiores y exteriores. Para esto, es necesario que el robot pueda reconocer su posición relativa a los objetos que lo rodean, utilizando visión estéreo y construyendo mapas de disparidad del ambiente.