Vision Robótica: Geometría y Comprensión

J. Civera Sancho, Universidad de Zaragoza, España.

La extracción de información a partir de imágenes es una de las áreas de la ingeniería más activas y de mayor progreso en los últimos años. Las cámaras presentan un gran potencial como sensor por su bajo coste, la riqueza de la información que contienen, y la existencia de enormes bases de datos en las que entrenar modelos no paramétricos. La robótica impone restricciones adicionales a los objetivos generales de la visión por computador, que podríamos definir de manera general como “que un computador sea capaz de ver”. Por ejemplo:

1.

2. Los robots interaccionan con el ambiente que los rodea, por lo cual la información extraída debe referenciarse en el mundo 3D.

3.

4. La visión está integrada en el bucle de control del robot, con restricciones fuertes de tiempo real.

5.

6. El formato de entrada es secuencial (vídeo) e idealmente el procesamiento también debería serlo.

El objetivo de este curso es exponer las principales técnicas en visión por computador de interés para la robótica. En primer lugar se estudiarán los modelos geométricos que permiten la estimación de la estructura 3D de una escena a partir de imágenes. En la segunda parte del curso se estudiarán los modelos para la extracción de información de más alto nivel semántico: Reconocimiento de objetos, escenas y segmentación.

Forma de evaluación: La evaluación se realizará mediante un trabajo práctico, que se enviará por e-mail al profesor. El trabajo se propondrá el último día de curso y estará relacionado con los contenidos vistos en éste. La fecha límite para la entrega será aproximadamente 45 días después de la finalización del curso. El trabajo se realizará de manera individual o en grupos de máximo 2 personas.

Bibliografía:

[1] Richard Szeliski, Computer Vision: Algorithms and Applications, Springer, 2011.

[2] Richard I. Hartley, Andrew Zisserman, Multiple view geometry in computer vision, Cambridge University Press, 2000.

[3] Bill Triggs, Philip F. McLauchlan and Richard I. Hartley, Bundle Adjustment — A Modern Synthesis, Vision Algorithms: Theory and Practice. Lecture Notes in Computer Science Volume 1883, 2000, pp 298-372.

 pie-paginas.jpg