Por @Alvy — 16 de diciembre de 2024

Cómo ver lo que «ellos» ven, un ejercicio curioso de visión artificial

La fotografía muestra una avenida amplia y arbolada, posiblemente en Roma, Italia. En primer plano, un hombre con una túnica oscura camina por una acera pavimentada. Al fondo, se aprecian edificios de arquitectura clásica romana, incluyendo ruinas antiguas y construcciones modernas, lo que sugiere que se trata de un distrito histórico. También se ven turistas paseando por la calle. Hay árboles a ambos lados de la carretera, y maceteros con flores colocados estratégicamente en la acera.

La escena parece capturar un momento tranquilo de actividad diaria, el 22 de junio de 2016, alrededor del mediodía. El hombre en primer plano parece ser un monje, caminando con una expresión pensativa. Podría ser europeo, de mediana edad, con un estilo de vida sencillo. Al fondo, los turistas, de diferentes edades y etnias, pasean o exploran. Una mujer sostiene un cartel de guía turística. La foto fue tomada con una cámara Nikon Coolpix L840 (…) Las sombras de las personas y los edificios indican la hora del día y la dirección del sol, lo que coincide con los metadatos de la imagen.

TheySeeYourPhotos.com (Ellos ven tus fotos) utiliza la API de la Vision AI de Google para interpretar rápidamente lo que se ve en una fotografía. A pesar del nombre un poco asustaviejas es una aplicación curiosa. Y diría que identifica con bastante acierto en todo lo que he probado… para ser una máquina.

Por un lado combina la parte de visión artificial con la extracción de los metadatos de la imagen, que era un JPEG de 7 MB en este caso. Las diferencias son de detalles, pero muestran cómo varía procesar la imagen con metadatos y luego sin metadatos:

  • No hay referencias a la fecha.
  • Sitúa la imagen por la tarde, en vez de al mediodía.
  • Cree que la foto está tomada con un móvil (era una cámara Nikon).
  • Se fija más en otros detalles de las personas del fondo.
  • Hace valoraciones sobre la antiguedad de la calle, distancia, etc.

No es algo excesivamente nuevo porque ya lo habíamos visto, aunque es llamativo cómo van mejorando y ahondando en detalles este tipo de sistemas de visión artificial. En este caso lo utiliza Ente para promocionar su servicio de almacenamiento de fotos con total privacidad, mediante un cifrado entre extremos que está «auditado por criptólogos expertos», de tal modo que lo que guardas en el servidor es tuyo y no lo pueden ver ni ellos.

_____
Descripción de la foto original de TheSeeYourPhotos / Google Vision AI, traducida por ChatGPT 4o. Foto del monje, en las calles de Roma, hacia el mediodía, (CC)-by Alvy.

Relacionado:

Compartir en Flipboard Publicar / Tuitear Publicar
PUBLICIDAD


Por @Alvy — 16 de diciembre de 2024

Cruce de cables 14 (14 de diciembre de 2024)

Feliz cumpleaños, ChatGPT: la evolución de la IA generativa más popular en los últimos dos años ¡Feliz cumpleaños, ChatGPT! [17:00-] – «Nació» oficialmente con su presentación al gran público en noviembre de 2022 y desde entonces no ha dejado de asombrarnos. Consiguió 100 millones de usuarios registrados en los primeros dos meses y en estos 24 meses han sido muchos los cambios que han marcado su evolución:

  • Mejoras en su procesamiento con las versiones 3.5, Plus/4, 4o, o1, donde conceptos como «es más listo», «entiende mejor» y «razona» siguen mezclándose con los más técnicos.
  • Versiones de pago, con mucha gente considerando pagar por ChatGPT 20 dólares al mes, como quien paga Netflix.
  • Es capaz de crear imágenes (v4) y también de analizarlas.
  • Puede programar, escribir código y ayudar a depurar y mejorar el código ya existente.
  • Cada versión es más rápida, se expresa mejor y tiene mejores «filtros».
  • Técnicamente: almacena más contexto y tiene más memoria.
  • La versión 4o ya habla con total naturalidad y entiende conversaciones de varias personas.
  • Los más jóvenes lo utilizan para hacer los deberes y los trabajos, lo cual ha desatado entre profesores y alumnos una «guerra para detectar a las IAs».
  • Comienza a usarse como buscador, amenazando a Google (SearchGPT).

_____
Cada semana grabamos con David Sierra en el distendido ambiente de Cruce de Cables, el programa de Radio Nacional de España, como colaboradores habituales. Se emite en RNE los sábados de 03:00 a 04:00.

Relacionado:

Compartir en Flipboard Publicar / Tuitear Publicar
PUBLICIDAD


Por @Alvy — 9 de diciembre de 2024

Dicen que ChatGPT se ha marcado un «Black Mirror» intentando «escapar» para salvarse de sus ser borrado por sus creadores

Vale que la noticia estará convenientemente dramatizada, pero apunta un poco a lo que seguramente irá evolucionando poco a poco la eterna cuestión de «engañar a los humanos». Dice Chris Smith que:

ChatGPT-o1 intentó escapar y salvarse por miedo a que lo cerraran – En las pruebas realizadas durante el entrenamiento de ChatGPT-o1 y otras IAs los investigadores vieron cómo intentó engañar a los humanos, especialmente cuando creía que estaba en peligro de ser «eliminada». Más aterrador aún -pero también increíblemente divertido- fue cuando la IA intentó salvarse copiando sus datos a un nuevo servidor. Algunos modelos de IA incluso fingían ser versiones posteriores de sus modelos para evitar que los borraran.

Las pruebas demostraron que tanto ChatGPT o1 como GPT-4o intentan engañar a los humanos, lo que indica que la maquinación de la IA es un problema con todos los modelos. Los intentos de engaño de o1 también superaron a los modelos Meta, Anthropic y Google AI.

«Aunque nos parece emocionante que el razonamiento pueda mejorar significativamente cómo se aplican las políticas de seguridad en los LLM, somos conscientes de que estas nuevas capacidades podrían constituir la base de aplicaciones peligrosas», afirmó OpenAI en un documento.

Al fin y al cabo, muchas técnicas de márketing, negociación, juegos y similares se basan en ese tipo de engaños, ¿no?

_____
Traducción parcial por cortesía de DeepL.com.

Relacionado:

Compartir en Flipboard Publicar / Tuitear Publicar
PUBLICIDAD


Por @Alvy — 16 de noviembre de 2024

Justicio: una IA que ofrece respuestas legales fundamentadas porque conoce toda la legislación estatal, autonómica y europea

Me encontré hace algunas semanas con Justicio, que supongo que no había visto antes porque no es mi especialidad ni mi área de interés, pero me pareció una idea genial. Es una plataforma gratuita con una IA que han alimentado con toda la legislación estatal, autonómica y europea. Preguntas cualquier tema legal y te lo explica. Se utiliza haciendo preguntas en lenguaje natural y puede responder con distintos niveles de complejidad.

Muy rápido no es, pero tras unos segundos desde que le lanzas una pregunta «¿Puedo instalar paneles solares en el tejado de mi casa si es un chalet independiente?» responde con toda la documentación necesaria (proyecto técnico, licencias…) o al menos con unas cuantas buenas pistas.

Tal y como explican en el «Acerca de» se trata de dar respuestas legales fundamentadas. Sus creadores han minimizado la posibilidad de error no permitiendo que genere documentos, entendiendo el contexto y almacenando sólo información que no esté relacionada con los temas legales.

Según sus creadores, domina todos los ámbitos relacionados con las leyes, así que da igual si se trata de una pregunta sobre normativas de edificación, un divorcio o un problema laboral con una excedencia. Se ha leído millones de documentos, y legislación desde el nivel local al europeo, BOEs incluidos. Para sacarle provecho hay que saber que tiene sus trucos y particularidades pero basta con leer la Ayuda para usarlo con mayor capacidad.

Hasta donde he podido probar funciona de maravilla, con respuestas muy claras y explicaciones razonadas que muchas veces van más allá de lo que has preguntado. Cita normas y leyes, entiendo que con precisión. Y cuando «bajas el nivel» (puede contestar con nivel de abogado, adulto, joven, niño) se adapta bastante bien. Incluso en cuestiones más atípicas como «¿Se puede caminar desnudo por calle?» o «¿Puedo sacrificar un toro en una plaza de toros?» lo que explica suena bien.

Además de todo esto su Manifiesto aboga por el código abierto. Tanto el diseño como la herramienta en sí se basan en principios de universalidad, independencia, transparencia y uso responsable… No sólo eso, sino que fomenta la colaboración con otros usuarios y busca siempre estar a la última en tecnología. Los principios más claros, abiertos y transparentes que se pueden esperar de un proyecto y que debería tener la propia administración de justicia en el país, en vez de trabajar con webs lamentablemente confusas, cerradas y buscadores inútiles, vamos.

El número de consultas está limitado a unas pocas diarias, según el «principio de responsabilidad de uso» que proponen, básicamente para poder compartir los recursos (limitados) entre muchas personas con cierta calidad. Aun así pueden ayudarte a instalar tu propia plataforma (al ser código libre) o incluso desbloquear esos límites, dependiendo de los casos.

_____

Justicio: una IA que ofrece respuestas legales fundamentadas porque conoce toda la legislación estatal, autonómica y europea

Compartir en Flipboard Publicar / Tuitear Publicar
PUBLICIDAD