Aprendizaje Profundo¶

Visión por Computadora¶

Sesión Inaugural¶

Profesores¶

Coordinador¶

Campo Elías Pardo Turriago, cepardot@unal.edu.co

Conferencistas¶

Alvaro Montenegro, PhD, ammontenegrod@unal.edu.co
Daniel Montenegro, Msc, dextronomo@gmail.com
Oleg Jarma, Estadístico, ojarmam@unal.edu.co

Asesora Medios y Marketing digital¶

Maria del Pilar Montenegro, pmontenegro88@gmail.com

Asistentes¶

Nayibe Yesenia Arias, naariasc@unal.edu.co
Venus Celeste Puertas, vpuertasg@unal.edu.co

Qué es la Visión por Computadora¶

La mente humana es impresionante.

Solo observando esta imagen, somos capaces de discernir muchas cosas sobre esta: Las sombras, lejanías, enfoques, y más, con relativa facilidad.

Los computadores, por supuesto, no tienen esa capacidad.

en los inicios del desarrollo de la Inteligencia artificial, se pensaba que la obtención de información en el medio visual iba a ser una tarea sencilla. Algo muy alejado de la verdad

¿Por qué es tan difícil esta tarea? Porque estamos haciendo lo inverso a lo usual.

El campo de los gráficos de computador, en muchos casos, trata de simular el mundo y sus propiedades, y lo proyecta en una pantalla.

En la Visión por computadora estamos haciendo lo contrario. A partir de una pantalla o una imagen en 2D, queremos recuperar la información, y describir el mundo a nuestro alrededor. Algo que los humanos logramos de forma natural.

A pesar de que aún no es posible que la inteligencia artificial logre los mismo resultados que los seres vivos, no signfica que no han habido grandes investigaciones y desarrollos en este campo. Las últimas dos décadas han visto increible crecimiento en el desarrollo visual, y mucho de esto es debido al poder de los datos y el desarrollo logrado por estos: Machine Learning y Deep Learning.

Un poco de historia¶

1970
- Inicios en la detección de bordes
- Etiquetado de lineas
- cilíndros generalizados para modelación 3D
1980
- Representación de pirámide
- Estereo, textura y foco
- Procesamiento de datos tridimensionales
1990
- Invariantes proyectivas
- Vectores propios para reconocimiento facial
- Integración con técnicas de gráficos de computador
2000
- Fotografía computacional
- Aprendizaje para reconocimiento de objetos
- Primeras aplicaciones de Machine Learning
2010
- Uso de Bases de datos etiquetados
- Uso de GPUs
- Deep Learning y grandes arquitecturas

El estado del arte¶

Detección Avanzada de Objetos¶

Ya se ha pasado de simples reconocimientos de rostros u objetos específicos a una detección completa, de diferentes asuntos en una misma foto y con altos detalles dentro de la detección

Redes generativas adversarias¶

Se trabaja con dos modelos. uno que genera nuevas imágenes, y otro que detecta si esta son reales o creadas artificialmente. Se pone a estos dos modelos a "Competir", y gradualmente ambos irán mejorando en sus tareas.

Entre otras aplicaciones se encuentra la generación de contenido de alta definición a base de simples garabatos

Deep Learning Super Sampling¶

Los videojuegos pueden implicar mucho poder en la tarjeta gráfica, en especial cuando se están llegando a resoluciones como 4K y más allá. Además encuentran problemas como el Aliasing.

Nvidia para solucionar esto, entrenaron su propia red neuronal con una base de datos de múltiples capturas de juegos en múltiples resoluciones. Con esto el modelo aprende cómo las imágenes se deben ver

Estimación de poses¶

Se entrenan redes cuya intención es detectar cuerpos y a la vez definir dónde están las articulaciones clave. En una imagen es sencillo, pero mezclamos todo esto en video y se vuelve

Paquetes a utilizar¶

OpenCV¶

libreria de software libre que contiene los algoritmos necesarios para el desarrollo de Visión artificial. Entre sus capacidades está el procesamiento de imágenes, análisis de video, calibración de cámaras y detección de objetos

Librosa¶

libreria para procesamiento y análisis de música y audio. Cuenta con extracción de características, decomposición, filtros, entre otras cosas. Se usa a la par con Tensorflow

Darknet¶

El hogar de YOLO(You Only Look Once), El estado del arte en redes neuronales para Detección de objetos. Se trabajará con la versión 4 de este modelo