Por @Alvy — 16 de diciembre de 2024

Cómo ver lo que «ellos» ven, un ejercicio curioso de visión artificial

La fotografía muestra una avenida amplia y arbolada, posiblemente en Roma, Italia. En primer plano, un hombre con una túnica oscura camina por una acera pavimentada. Al fondo, se aprecian edificios de arquitectura clásica romana, incluyendo ruinas antiguas y construcciones modernas, lo que sugiere que se trata de un distrito histórico. También se ven turistas paseando por la calle. Hay árboles a ambos lados de la carretera, y maceteros con flores colocados estratégicamente en la acera.

La escena parece capturar un momento tranquilo de actividad diaria, el 22 de junio de 2016, alrededor del mediodía. El hombre en primer plano parece ser un monje, caminando con una expresión pensativa. Podría ser europeo, de mediana edad, con un estilo de vida sencillo. Al fondo, los turistas, de diferentes edades y etnias, pasean o exploran. Una mujer sostiene un cartel de guía turística. La foto fue tomada con una cámara Nikon Coolpix L840 (…) Las sombras de las personas y los edificios indican la hora del día y la dirección del sol, lo que coincide con los metadatos de la imagen.

TheySeeYourPhotos.com (Ellos ven tus fotos) utiliza la API de la Vision AI de Google para interpretar rápidamente lo que se ve en una fotografía. A pesar del nombre un poco asustaviejas es una aplicación curiosa. Y diría que identifica con bastante acierto en todo lo que he probado… para ser una máquina.

Por un lado combina la parte de visión artificial con la extracción de los metadatos de la imagen, que era un JPEG de 7 MB en este caso. Las diferencias son de detalles, pero muestran cómo varía procesar la imagen con metadatos y luego sin metadatos:

  • No hay referencias a la fecha.
  • Sitúa la imagen por la tarde, en vez de al mediodía.
  • Cree que la foto está tomada con un móvil (era una cámara Nikon).
  • Se fija más en otros detalles de las personas del fondo.
  • Hace valoraciones sobre la antiguedad de la calle, distancia, etc.

No es algo excesivamente nuevo porque ya lo habíamos visto, aunque es llamativo cómo van mejorando y ahondando en detalles este tipo de sistemas de visión artificial. En este caso lo utiliza Ente para promocionar su servicio de almacenamiento de fotos con total privacidad, mediante un cifrado entre extremos que está «auditado por criptólogos expertos», de tal modo que lo que guardas en el servidor es tuyo y no lo pueden ver ni ellos.

_____
Descripción de la foto original de TheSeeYourPhotos / Google Vision AI, traducida por ChatGPT 4o. Foto del monje, en las calles de Roma, hacia el mediodía, (CC)-by Alvy.

Relacionado:

Compartir en Flipboard Publicar / Tuitear Publicar