El algoritmo de Facebook dice convertir una imagen 2D en 3D, aun teniendo una sola camara el móvil

Con la popularización de los smartphones con doble cámara que permiten capturar profundidad, llegó esta opción para crear imágenes con curiosos efectos 3D para la plataforma. Ahora la red social anuncia que su algoritmo ya puede convertir cualquier fotografía en 3D, aunque no se tenga información de profundidad sobre ella.

De acuerdo a Facebook, el área de inteligencia artificial de Facebook han mejorado el algoritmo para que analice mejor las fotografías y la profundidad que hay en ellas. Dicen haber enseñado a una red neuronal a cómo entender y descubrir las tres dimensiones de una fotografía aunque se hayan tomado con cámaras de una sola lente.

No serán los primero ni los únicos en generar fotografías con profundidad usando una sola cámara y procesamiento por software. El ejemplo más claro de ello son las primeras generaciones del Pixel de Google, donde con una sola lente en la parte trasera se podía obtener un mood bokeh/retrato desenfocando el fondo. Incluso es posible hacer el desenfoque (que en cierto modo es darle profundidad) sólo con Google Fotos. Aparte de Google, Nvidia también ha hecho sus avances en este sentido.

Cuestión de entender la escena (y ver muchas fotos)

Facebook ha explicado en en forma muy general cómo se las ingenia la red neuronal para entender que hay profundidad en la imagen. De un modo parecido al humano, que aunque ve una fotografía en 2D, es capaz de entender que existe una profundidad porque conoce los objetos y sujetos de la fotografía y puede ponerlos en contexto. Además de valerse de las luces, sombras, superposiciones y perspectivas que aparecen.

Facebook dice usar diferentes técnicas para conseguir esto. Por ejemplo explican que han entrenado a la IA con «millones de fotografías 3D públicas» para que entienda los mapas de profundidad. También se ha aprovechado todo el bagaje del ecosistema Facebook y técnicas previamente desarrolladas en fotografía móvil. En un ejemplo mostrado por Facebook vemos cómo una fotografía frontal de la Fontana di Trevi se convierte en un mapa 3D respetando la posición de las columnas y el resto de elementos arquitectónicos en su correcta posición.

De acuerdo a ingenieros de Facebook, este nuevo algoritmo hace que las fotografías 3D sean «fácilmente accesibles por primera vez a muchos millones de personas». Dado que siguen habiendo muchos usuarios con smartphones con una sola cámara, con la herramienta será posible obtener la profundidad de las fotos tomadas. Eso sí, habrá que verlo en la práctica, aunque de momento los ejemplos dados por Facebook parecen prometedores.

La herramienta de Facebook para convertir fotografías 2D en 3D es gratuita y está disponible en la app de la red social. Comenta Facebook que lo único que se requiere es que se utilice un iPhone 7 o superior, en caso de ser un Android uno de gama media reciente es el requisito mínimo.


¿Quieres aprender a programar de manera profesional?

 

Te invitamos a formar parte de Azul School donde vas a tener acceso a cursos profesionales con certificado. Además tienes acceso a una red social de programadores donde puedes conocer gente de tu ciudad o país.

 

Si quieres acceder a todas las funciones te regalamos un descuento del 75% usando este cupón (no vas a encontrar este descuento en ningún otro lugar) Cupón: azulweb y lo puedes cambiar aquí: Haz clic aquí para cambiar el cupón del 75%.

 

También puedes probar la plataforma de forma gratuita y obtener un curso gratuito aquí: Haz clic aquí para probar la plataforma de forma gratuita.


Ernesto Mota

Ernesto Mota

Nací en el d.f., sigo siendo defeño, hoy radico en la hermosa ciudad de Cuernavaca, Morelos, soy Ing. en Sistemas computacionales, con un posgrado en Tecnologías de información, Doctorando en ambientes virtuales de aprendizaje y realidad aumentada, Tecnólogo es mi categoría laboral, y mi linea de investigación es la realidad aumentada aplicada a nuevos entornos de aprendizaje.

También te podría gustar...