Web y Blog personal

Photosynth: conectando tus fotos en un mapa 3D

Ya está disponible para su descarga y uso gratuito uno de los inventos de Microsoft más esperados: PhotosynthPhotosynth permite asociar imágenes de una misma escena tomadas desde puntos diferentes, de manera que las correspondencias establecidas permitan posicionar las diferentes capturas sobre un espacio 3D.

Esto nos permitirá desplazarnos sobre la colección de fotografías, reproduciendo una ‘experiencia de movimiento’ o ‘visita virtual con desplazamiento tridimensional’ a través de la localización geográfica que se ha capturado. Digamos que es lo más parecido a un collage en tres dimensiones, en el que cada fotografía queda situada en la posición espacial que le corresponde, y por el que podemos navegar a nuestro antojo.

David Pogue nos la analiza minuciosamente en este artículo. Hasta ahora teníamos una idea bastante clara de lo que estaban cocinando en Microsoft Live Labs. Blaise Agüera y Arcas, arquitecto de Seadragon (perfil en TED.com y breve biografía de este interesante tipo), realizó una impresionante presentación en la TED2007, en la que nos dejó boquiabiertos combinando multitud de imágenes de la parisina catedral de Notre Dame en un único ‘synth’.

En realidad, Photosynth nace precisamente de la combinación de la compra de Seadragon por parte de Microsoft en 2006, con el prototipo Photo Tourism fruto de las investigaciones de Noah Snavely (Universidad de Washington), Steve Seitz (Universidad de Washington) y Richard Szeliski (Microsoft Research). Para saber más puedes ver este vídeo promocional, y este artículo de CNET que también incluye un vídeo.

La idea inicial parecía ser la de aprovechar las colecciones de imágenes existentes (tipo flickr) para crear mapas de imágenes de virtualmente cualquier lugar del mundo. Esta ambiciosa idea parece haber sido abandonada por el momento (debido a problemas con el copyright, y al complejo problema que supondría manejar tal ingente cantidad de información), limitando su utilidad práctica inmediata a conjuntos de fotografías que se sabe corresponden a un mismo lugar.

Si aún no lo has probado, ya estás tardando. Bájatelo de aquí y pruébalo. Se instalarán dos programas distintos en tu computador: un complemento para tu navegador (Internet Explorer o Firefox) que te permitará visualizar los ‘synths’, y la aplicación ‘Photosynth’ que te ayudará a crear los tuyos propios. Dispondrás de 20 gigas de almacenamiento para subir tus fotografías. Desafortunadamente, los usuarios de Mac deberán esperar un poco para poder disfrutarlo…

Probando el invento

Yo ya lo he probado. No podía esperar. Ayer me bajé a la calle e hice unas cuantas fotos del histórico edificio del BBVA en la madrileña calle Alcalá. De las 10 fotos que envié a Photosynt, 9 fueron correctamente ‘synthetizadas’. Juzgad por vosotr@s mismos (necesitaréis haber instalado Photosynth en vuestra máquina, y también podéis ver aquí el resultado).

No está mal, ¿verdad? Claro, embargado por la emoción, me decidí a poner a prueba el sistema con algo un poquito más fuerte. Así que envié a Photosynth 101 fotografías tomadas en la Plaza de Cibeles (ver aquí en Google Maps). Y el resultado tampoco está nada mal: las fotos fueron agrupadas en 5 conjuntos (el más grande de los cuales se corresponde con la nueva sede del ayuntamiento, en el Palacio de Comunicaciones, y el Palacio de Linares, sin fantasmas), y sólo 6 imágenes quedaron sueltas. Podéis ver el resultado aquí.

¿A qué me recuerda esto?

La experiencia de usuario que nos ofrece Photosynth recuerda bastante a lo que es Street View de Google. Sin llegar a la perfección y precisión de este último, el invento de Microsoft nos permitirá montarnos nuestro propio Street View por nuestra cuenta y empleando nuestras propias fotos. ¿Qué tal un ‘synth’ de nuestra casa para enseñársela a un amigo o intentar venderla mejor en idealista.com? Sería un complemento excelente de las visitas virtuales (que utilizan imágenes panorámicas), e iría en la línea de la idea propuesta por Jesús Encinar en su blog.

Aún es más parecido a Look Around, el nuevo servicio de Panoramio que, desde el pasado junio, nos permite realizar visitas virtuales por algunos enclaves seleccionados (yo os lo anunciaba en este retazo de la red). Por ejemplo, siguiendo este enlace podréis dar un paseo entre los rascacielos neoyorkinos, y siguiendo este otro disfrutaréis de la majestuosa Alhambra granadina.

Si Photosynth surgía como consecuencia de investigaciones realizadas en la Universidad de Washington, parecido es el proyecto 4D Cities, que en este caso conduce Microsoft junto con el Georgia Tech. El proyecto está dirigido por Frank Dellaert. Precisamente en junio del pasado año asistí a una presentación del profesor Dellaert en el Tech Research Square Building de Atlanta (por cierto, no veáis cómo se lo montan estos americanos cuando se ponen a investigar… ¡el TSRB es alucinante!) que me dejó bastante impresionado. El contenido era algo así:

La idea es dar un pasito más allá; no limitarse a obtener una estructura tridimensional de las ciudades (entornos a los cuales está limitada la investigación, por el momento), sino intentar proyectar los mapas a lo largo del tiempo. La existencia o ausencia de algunos edificios en las diferentes fotografías, por ejemplo, puede ser utilizada para establecer un orden cronológico entre distintas instantáneas, permitiendo desplazarnos no sólo en el espacio, sino también a través del tiempo. Un nuevo rascacielos indicará que una fotografía es posterior a otra en la que éste no aparece. Pero hay que tener mucho cuidado con aquellos edificios que hayan sido demolidos o hayan visto remodelada su fachada… ¡Hacer esto de manera automática no es asunto trivial! Aquí podéis ver una demo funcional de 4D Cities: Atlanta.

Todo esto está basado en técnicas de ‘structure from motion‘, que intentan extraer información sobre la estrucutra tridimensional de los entornos a partir de imágenes tomadas desde diferentes puntos de vista. Esto puede ser utilizado para construir mapas, o para localizar un elemento móvil a medida que se desplaza por un lugar (por ejemplo, un robot).

Un poco de crítica constructiva…

Finalmente, me gustaría hacer un breve comentario sobre las cosas que a veces se leen en los medios. Las malas traducciones y las redacciones precipitadas, llevan a menudo a inexactitudes e imprecisiones que, lejos de aportar conocimiento útil, confunden y desinforman. A pesar de que me he enterado por el Navegante del lanzamiento de esta aplicación, me ha desagradado leer estas tres frases en el artículo/nota:

Asimismo, con esta nueva aplicación se podrán girar las fotos 360 grados […]. También se podrán hacer ‘zooms’ sin que la calidad de la imagen varíe mucho. […] lo ideal sería que cada pulgada (una pulgada son 2,54 centímetros) de la habitación o lugar estuviera tomada por tres fotos.

La aplicación no permite ‘girar las fotos’ 360 grados (si giramos una fotografía 360º obtenemos precisamente eso, la misma imagen) sino recrear una experiencia en 360 grados (siempre que se disponga del número suficiente de imágenes alrededor del punto desde el que han sido tomadas).

[…] you can use Photosynth to transform regular digital photos into a three-dimensional, 360-degree experience.

En realidad, sería más correcto hablar de 4π estereorradianes, puesto que las imágenes pueden estar tomadas en cualquier dirección del espacio, abarcando una esfera completa alrededor de cualquier punto. Por otra parte, cabe recordar que el ‘zoom’ sin pérdida de calidad será posible siempre que existan imágenes disponibles de zonas progresivamente reducidas de la imagen capturada. Esto es, podremos acercarnos a la escena en tanto en cuanto existan imágenes tomadas desde posiciones cada vez más próximas, o con niveles de zoom más elevados.

Por último, está bien que nos recuerden cuánto mide una pulgada en el Sistema Internacional de Unidades. Pero me temo que Photosynth no es tan exigente. No es preciso que esos 2,54 cm (¿de la escena?, ¿de la fotografía?, …) estén reproducidos en al menos tres de las imágenes capturadas. Me temo que el error se debe a una mala traducción de esta frase de David Pogue en su artículo de NYTimes.com:

You have to take lots and lots of overlapping pictures. Ideally, every inch of the room or space should be included in at least three photos.

Claro, para poder posicionar un punto de la escena en el espacio tridimensional, ese punto ha de aparecer en tres imágenes tomadas desde tres posiciones distintas. Cuando hablamos de ‘cada pulgada’ nos referimos a que el entorno ha de ser minuciosamente capturado de modo que nos aseguremos de que no nos dejamos demasiadas zonas sin cubrir desde al menos tres posiciones. Así que podéis sentiros libres para fotografiar sin llevar la cinta métrica a cuestas 😉

[Visto en NAVEGANTE]

Anterior

Los ‘freaks’ de Internet

Siguiente

Lo más parecido a estar dentro del Cubo de Agua

1 comentario

  1. Juan Aguarón de Blas

    Pues habrá que probarlo 🙂

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Funciona con WordPress & Tema de Anders Norén