Por @Alvy — 16 de diciembre de 2024

Cómo ver lo que «ellos» ven, un ejercicio curioso de visión artificial

La fotografía muestra una avenida amplia y arbolada, posiblemente en Roma, Italia. En primer plano, un hombre con una túnica oscura camina por una acera pavimentada. Al fondo, se aprecian edificios de arquitectura clásica romana, incluyendo ruinas antiguas y construcciones modernas, lo que sugiere que se trata de un distrito histórico. También se ven turistas paseando por la calle. Hay árboles a ambos lados de la carretera, y maceteros con flores colocados estratégicamente en la acera.

La escena parece capturar un momento tranquilo de actividad diaria, el 22 de junio de 2016, alrededor del mediodía. El hombre en primer plano parece ser un monje, caminando con una expresión pensativa. Podría ser europeo, de mediana edad, con un estilo de vida sencillo. Al fondo, los turistas, de diferentes edades y etnias, pasean o exploran. Una mujer sostiene un cartel de guía turística. La foto fue tomada con una cámara Nikon Coolpix L840 (…) Las sombras de las personas y los edificios indican la hora del día y la dirección del sol, lo que coincide con los metadatos de la imagen.

TheySeeYourPhotos.com (Ellos ven tus fotos) utiliza la API de la Vision AI de Google para interpretar rápidamente lo que se ve en una fotografía. A pesar del nombre un poco asustaviejas es una aplicación curiosa. Y diría que identifica con bastante acierto en todo lo que he probado… para ser una máquina.

Por un lado combina la parte de visión artificial con la extracción de los metadatos de la imagen, que era un JPEG de 7 MB en este caso. Las diferencias son de detalles, pero muestran cómo varía procesar la imagen con metadatos y luego sin metadatos:

  • No hay referencias a la fecha.
  • Sitúa la imagen por la tarde, en vez de al mediodía.
  • Cree que la foto está tomada con un móvil (era una cámara Nikon).
  • Se fija más en otros detalles de las personas del fondo.
  • Hace valoraciones sobre la antiguedad de la calle, distancia, etc.

No es algo excesivamente nuevo porque ya lo habíamos visto, aunque es llamativo cómo van mejorando y ahondando en detalles este tipo de sistemas de visión artificial. En este caso lo utiliza Ente para promocionar su servicio de almacenamiento de fotos con total privacidad, mediante un cifrado entre extremos que está «auditado por criptólogos expertos», de tal modo que lo que guardas en el servidor es tuyo y no lo pueden ver ni ellos.

_____
Descripción de la foto original de TheSeeYourPhotos / Google Vision AI, traducida por ChatGPT 4o. Foto del monje, en las calles de Roma, hacia el mediodía, (CC)-by Alvy.

Relacionado:

Compartir en Flipboard Publicar / Tuitear Publicar
PUBLICIDAD


Por @Wicho — 16 de diciembre de 2024


La sombra de un aspa rota que marca el fin de una impresionante misión – NASA/JPL-Caltech

El pasado 18 de enero de 2024 el helicóptero Ingenuity hacía su vuelo número 72 en Marte. Pero algo falló porque la NASA perdió la comunicación con él antes de que terminara. Ahora, tras meses de estudio, la agencia ya sabe qué causó el accidente. O al menos ya tiene una causa probable más probable que otras.

El sistema de navegación de Ingenuity calculaba su altura y velocidad a partir de la comparación de imágenes del suelo que tomaba con una cámara que apunta hacia abajo. Pero el día de aquel vuelo el suelo resultó ser demasiado monótono como para que el sistema de navegación pudiera obtener información comparando unas imágenes con otras.

Así que Ingenuity «se perdió» a pesar de en realidad que se trataba de un vuelo estático en el que sólo tenía que elevarse hasta los 12 metros, tomar una serie de imágenes y volver a bajar. Los datos recibidos en tierra indican que a partir de los 20 segundos las imágenes de la cámara de navegación ya no tenían el suficiente detalle como para que el helicóptero pudiera calcular su posición ni velocidad.

Así que aterrizó con una velocidad horizontal demasiado elevada, lo que, unido a que tropezó con una de las ondulaciones de arena que tenía debajo, provocó movimientos de cabeceo y alabeo que a su vez impartieron una fuerza excesiva en las aspas de los rotores. Eso hizo que se partieran por su punto más débil, situado como a dos tercios de su longitud; es como si hubieran dado un latigazo que las partió.

La descripción
La toma dura de Ingenuity – NASA/JPL-Caltech

La descripción
El latigazo mortal para las aspas de los rotores – NASA/JPL-Caltech

Además, el desequilibrio causado por su rotura provocó vibraciones que, por un lado, hicieron que se disparara el consumo de electricidad de los motores, lo que a su vez hizo que Ingenuity se apagara por seguridad. Y que por otro hicieron que una de las aspas se partiera por la raíz, saliendo despedida a unos quince metros del helicóptero.

Es impresionante que la NASA haya conseguido averiguar la causa del accidente o, como digo arriba, al menos la más probable aún sin poder inspeccionar in situ la aeronave que, recordemos, está a cerca de 200 millones de kilómetros de nosotros.

Además, como sucede con casi cualquier accidente aéreo, las lecciones aprendidas servirán para futuros vuelos de los herederos de Ingenuity. Empezando, quizás, por Dragonfly, el octocóptero que vamos a enviar a Titán, una de las lunas de Saturno.

Pero lo más impresionante de todo es que no hay que olvidar que Ingenuity estaba diseñado para hacer cinco vuelos en treinta días y al final hizo 72 vuelos en algo menos de tres años.

Y que a pesar de que con las aspas rotas el destino de Ingenuity quedaba sellado, al menos como máquina voladora, la NASA le ha dado una nueva misión y lo ha programado para que se despierte una vez al día mientras sea capaz. En ese rato aprovechará para medir el funcionamiento de su panel solar, baterías y equipos electrónicos. Además, tomará imágenes de la superficie con su cámara en color y recogerá la temperatura de varios sensores que monta.

Puede decirse que ha quedado convertido en una especie de estación meteorológica. Aunque como su radio no tiene potencia para transmitir sus datos a la Tierra lo que hace es almacenarlos en su memoria a la espera de que quizás alguien vaya a recogerlos en el futuro.

Por cierto que la historia de Ingenuity y de los cacharros voladores que hemos enviado a otros mundos fue el tema de mi charla de Naukas Bilbao 2024.

Compartir en Flipboard Publicar / Tuitear Publicar
PUBLICIDAD


Por @Alvy — 16 de diciembre de 2024

Cruce de cables 14 (14 de diciembre de 2024)

Feliz cumpleaños, ChatGPT: la evolución de la IA generativa más popular en los últimos dos años ¡Feliz cumpleaños, ChatGPT! [17:00-] – «Nació» oficialmente con su presentación al gran público en noviembre de 2022 y desde entonces no ha dejado de asombrarnos. Consiguió 100 millones de usuarios registrados en los primeros dos meses y en estos 24 meses han sido muchos los cambios que han marcado su evolución:

  • Mejoras en su procesamiento con las versiones 3.5, Plus/4, 4o, o1, donde conceptos como «es más listo», «entiende mejor» y «razona» siguen mezclándose con los más técnicos.
  • Versiones de pago, con mucha gente considerando pagar por ChatGPT 20 dólares al mes, como quien paga Netflix.
  • Es capaz de crear imágenes (v4) y también de analizarlas.
  • Puede programar, escribir código y ayudar a depurar y mejorar el código ya existente.
  • Cada versión es más rápida, se expresa mejor y tiene mejores «filtros».
  • Técnicamente: almacena más contexto y tiene más memoria.
  • La versión 4o ya habla con total naturalidad y entiende conversaciones de varias personas.
  • Los más jóvenes lo utilizan para hacer los deberes y los trabajos, lo cual ha desatado entre profesores y alumnos una «guerra para detectar a las IAs».
  • Comienza a usarse como buscador, amenazando a Google (SearchGPT).

_____
Cada semana grabamos con David Sierra en el distendido ambiente de Cruce de Cables, el programa de Radio Nacional de España, como colaboradores habituales. Se emite en RNE los sábados de 03:00 a 04:00.

Relacionado:

Compartir en Flipboard Publicar / Tuitear Publicar
PUBLICIDAD


Por @Alvy — 16 de diciembre de 2024

TikTokLa huella de carbono anual de TikTok es más grande que la de toda Grecia. O al menos, «probablemente», según estudio de expertos que han analizado el uso de las plataformas sociales, especialmente el tiempo que pasa la gente en ellas. Según dicen ese consumo de electricidad es mayor que el de Instagram, y eso que la red social de Facebook tiene casi el doble de usuarios que TikTok. En el estudio se tienen en cuenta el tiempo que la gente pasa en cada plataforma (30 minutos en el caso de TikTok), el consumo que hacen los millones de dispositivos conectados y también las emisiones asociadas a los centros de datos donde se alojan los servidores de la compañía. No han tenido en cuenta el uso que se hace en las oficinas de TikTok y otras compañías ni la huella de carbón de los 4.400 empleados y sus viajes, que supondría otra pequeña cantidad.

En el fondo, hay quien considera que este tipo de comparaciones tiene su trampa, pues podrín plantearse también como cuestión de prioridades personales. Es como cuando se dice que Bitcoin consume más electricidad que Egipto, otro dato estimado pero relativamente fiable a día de hoy. En este caso Bitcoin consume más del triple que TikTok, y probablemente las emisiones están también en ese orden de magnitud. Pero, en el fondo, cada persona podría preguntarse, ¿en qué prefiero que se consuma la electricidad? Hay gente que preferiría eliminar TikTok, Instagram y hasta WhatsApp de sus vidas; otros eliminarían Bitcoin y todas las criptodivisas, pero también habría quien optaría por tener una criptomoneda segura, o poder ver vídeos de gatos, gente haciendo el ganso y chorradas de todo tipo en vídeos de 60 segundos… por no hablar de eliminar las luces de Navidad, las de los estadios de fútbol o las de las depuradoras de las piscinas porque simplemente no les interesan esas cosas. [Fuente: Greenly + The Guardian; Cambridge Bitcoin Electricity Consumption Index.]

Compartir en Flipboard Publicar / Tuitear Publicar
PUBLICIDAD