ChatGPT 4.5 supera el test de Turing (o eso dicen)

Por @Alvy — 17 de abril de 2025

ChatGPT: Optimizing Language Models for Dialogue En un estudio que está todavía por revisar, unos investigadores cuentan que en una del Test de Turing con tres personas, en la que los participantes conversan con un humano y una IA al mismo tiempo y luego evalúan cuál es cuál, el modelo GPT-4.5 de OpenAI fue considerado humano el 73 por ciento de las veces cuando se le indicó que se comportara con cierta personalidad. Superó a ELIZA, LlaMa 3.1 y GPT-4o. Una cifra de más del 70% es bastante más que la probabilidad aleatoria del 50%, y se considera una señal suficiente –según los investigadores y lo que decía Turing– de que ha superado la legendaria prueba, aunque como suele suceder habrá muchas opiniones al respecto y sobre lo que significa realmente. [Fuente: Large Language Models Pass the Turing Test vía Futurism vía The Conversation.]

Relacionado:

MundoReal™

La Policía Nacional renuncia a su IA Veripol para detectar denuncias falsas por ser poco fiable y jurídicamente inútil

Por @Alvy — 17 de abril de 2025

La buena gente de Civio nos envió aviso acerca del seguimiento que hicieron de Veripol, una herramienta de la Policía Nacional para detectar denuncias falsas, a la que ha terminado renunciado. El caso es que Civio nunca consiguió que hicieran caso a sus peticiones para conocer el funcionamiento técnico de esta herramienta y sobre su uso, pero ha sido la propia policía la que ha desistido por su baja fiabilidad.

Veripol: el algoritmo que quiso ser detective

Veripol se presentó en 2018 como herramienta de inteligencia artificial con la supuesta capacidad de detectar denuncias falsas de robos con violencia con más del 90% de precisión. Era una especie de «máquina de la verdad» automatizada para rechazar denuncias sospechosas (al menos para la másquina). Seis años después, el experimento ha terminado y la «IA» ha sido desconectada. Estos son los detalles:

Veripol se entrenó con 1.122 denuncias de 2015, que son menos de las que se presentan en dos días en todo el país. Según cuentan, si una denuncia contenía palabras como «día», «abogado» o el número «200» era considerada como «probablemente falsa». (WTF?) En cambio, si mencionaba «autobús», «iPhone» o «matrícula», era más creíble. (WTF×2!) A falta de un detector de mentiras fiable, bienvenidos al mundo de las estadísticas forzadas y los adverbios sospechosos.
En octubre de 2024, la Dirección General de la Policía confirmó que Veripol ya no se usaba. ¿El motivo oficial? «No servía para los procedimientos judiciales». El motivo real: no se sabía muy bien cómo funcionaba, no era transparente, no había formación, y su uso se basaba en una muestra irrisoria con un sesgo de inicio brutal: asumir que más de la mitad de las denuncias que se presentan son falsas.
En julio de 2024 entró en vigor el nuevo Reglamento Europeo de Inteligencia Artificial, que calificaba herramientas como Veripol entre las de «alto riesgo». Traducción: o haces las cosas bien, con transparencia y garantías… o apaga y vámonos. Veripol no pasó el examen. Fin de la historia.
Ni el Ministerio del Interior ni la Policía han querido dar detalles técnicos o datos reales sobre el uso de Veripol. ¿Cuántas comisarías lo usaron? ¿En cuántos casos? ¿Qué formación se dio? Preguntas que desde hace años no tienen respuesta. La transparencia, como la IA, tampoco parece que funcione muy bien en las instituciones. ¿No se supone que hay un departamento sobre transparencia y datos abiertos? Igual estaban de vacaciones.

Veripol nació con vocación de sistema policial futurístico, un poco a lo Minority Report, pero se quedó en un experimento mal documentado, poco fiable y jurídicamente inútil. Una herramienta que analizaba lo que escribía un agente, no lo que decía el denunciante, que suelen ser cosas muy distintas. Y que además pretendía distinguir la verdad de la mentira en base de estadísticas y, lo peor, «listas de palabras sospechosas».

Un caso más de IA inflada de expectativas y desinflada por la realidad. Porque una cosa es programar, y otra muy distinta, impartir justicia sin saber bien lo que se hace y usando mal la tecnología.

Relacionado:

Energía

IA: Más agua, más energía, más emisiones

Por @Alvy — 16 de abril de 2025

Más agua, más energía, más emisiones Ya sabíamos que ChatGPT es un ávido consumidor de recursos, CPUs y capacidad de computación en general. Pero a medida que el número de usuarios aumenta, así como su popularidad, las cifras comienzan a ser preocupantes. El otro día alguien me lo comentó y hoy comprobé el dato: resulta que ChatGPT consume aproximadamente 25 veces más energía, 3.500 veces más agua* y produce 25 veces más emisiones de CO₂ que una consulta similar en Google… por no hablar de lo necesario para generar ilustraciones, dibujos y otras tontás. Aunque esa discusión siempre es algo relativo, es como para pensárselo dos veces… si acaso se está medianamente concienciado sobre que los recursos del planeta son limitados. [Fuente: irónicamente, datos recopilados por ChatGPT.]

_____
* El consumo de agua se debe a las necesidades de refrigerar los servidores.

Inteligencia artificial

Cruce de cables: Mis soluciones de baja tecnología favoritas

Por @Alvy — 12 de abril de 2025

Cruce de cables 32 (12 de abril de 2025)

Mis soluciones de baja tecnología favoritas [~18:20] – En este Cruce de Cables rememoramos cinco de mis «soluciones de baja tecnología» favoritas, esas soluciones para problemas cotidianos usando «tecnología primitiva», totalmente básica. Entre ellas:

Cómo arreglar la pestaña de plástico de un conector Ethernet RJ-45 estropeada… con un palillo.
Cómo guardar fácilmente todos los números de serie de aparatos y gadgets, para el seguro de la casa.
Cómo usar la cabeza como antena amplificadora con el mando del coche para encontrarlo en el aparcamiento, abrirlo o cerrarlo.
Cómo identificar los auriculares izquierdo y derecho mediante un simple nudo, para saber cuál es cuál incluso en la oscuridad.
El El botijo. En los 90 los profesores Pinto y Zubizarreta desarrollaron la ecuación del botijo con 16 factores: volumen de agua, temperatura, coeficiente de radiación de calor, superficie total del botijo… Pura física y fórmulas matemáticas.

_____
Cada semana grabamos con David Sierra en el distendido ambiente de Cruce de Cables, el programa de Radio Nacional de España, como colaboradores habituales. Se emite en RNE los sábados de 03:00 a 04:00.

Relacionado:

Cruce de cables: Los 50 años de Microsoft
Cruce de cables: ¿Por qué son tan malas las IAs jugando al ajedrez?
Cruce de cables: Los hackers no son piratas informáticos
Cruce de cables: El seguimiento de famosos a través de GPS
Cruce de cables: Los astronautas no abandonados en la EEI
Cruce de cables: Aviones de pasajeros supersónicos de ayer y hoy
Cruce de cables: La primera Ley de inteligencia artificial
Cruce de cables: ¿Un nuevo invierno de la inteligencia artificial?
Cruce de cables: Tecnología y las armas nucleares casi la lían parda.
Cruce de cables: Zuckerberg y sus movimientos con los verificadores
Cruce de cables: Las chicas del ENIAC y de los Colossus
Cruce de cables: La reparación de un ordenador a válvulas de los 50
Cruce de cables: El legado digital
Cruce de cables: Ada Lovelace y Grace Murray H. Hopper, informáticas
Cruce de cables: La evolución de ChatGPT, la IA generativa más popular
Cruce de cables: No vemos robots repartidores por las calles
Cruce de cables: Cómo no quedarse desconectado en una emergencia
Microsiervos como colaboradores de Cruce de cables de RNE

Lo más visto recientemente

ChatGPT 4.5 supera el test de Turing (o eso dicen)

La Policía Nacional renuncia a su IA Veripol para detectar denuncias falsas por ser poco fiable y jurídicamente inútil

Veripol: el algoritmo que quiso ser detective

IA: Más agua, más energía, más emisiones

Cruce de cables: Mis soluciones de baja tecnología favoritas

Cruce de cables 32 (12 de abril de 2025)

Cruce de cables: ¿Por qué son tan rematadamente malas las IAs jugando al ajedrez? 01/04/2025

Sólo aciertan de casualidad 29/03/2025

Steve Wozniak hablando en el Mobile World Congress de sus batallitas y de temas de actualidad candentes 04/03/2025

El «valle inquietante» conversacional de la voz artificial también existe, y lo estamos cruzando a pasos agigantados 28/02/2025

Dos agentes inteligentes hablando por teléfono y acordando pasar al «modo Gibberlink» que es más eficiente (que se lo digan a R2-D2) 26/02/2025

Material abierto para construir modelos de razonamiento general: 1.600.000 preguntas y 270.000 trazas de cadenas de pensamiento 23/02/2025

¿Inteligencia artificial verdaderamente inteligente? Va a ser que no, al menos por ahora 21/02/2025

Cómo veían la inteligencia artificial en 1970: la siempre interesante relación entre tecnología y el concepto de inteligencia 21/02/2025

Cruce de cables: la primera Ley de inteligencia artificial 16/02/2025

Elon Musk vs. Sam Altman: ahora el propietario de Twitter, Tesla y SpaceX quiere comprar OpenAI 11/02/2025

Cruce de cables: ¿se avecina un nuevo invierno de la inteligencia artificial? 10/02/2025

Modelos de lenguaje abiertos para una IA más transparente en Europa 04/02/2025

Operator de OpenAI añade la potencia de un agente de software a ChatGPT para que haga todo tipo de «recados» a través de internet 26/01/2025

Cómo trabajar en el día a día con una IA y no morir en el intento 23/01/2025

ELIZA, la primera psicoterapeuta programada con IA, rescatada del olvido gracias a la arqueología informática 22/01/2025

DeepSeek: un nuevo modelo de IA especializado en razonamiento lógico, resolución de problemas y con licencia abierta MIT. No tiene nada que envidiar a los de OpenAI 22/01/2025

Tareas programadas en ChatGPT: una forma de automatizar con todas las posibilidades de la IA de OpenAI 19/01/2025

Más propuestas de leyes de la robótica (y la IA) 15/01/2025

Un comparador de modelos de Inteligencia Artificial 09/01/2025

Cómo ver lo que ven «ellos», un ejercicio interesante de visión artificial 16/12/2024

Cruce de cables: La evolución de ChatGPT, la IA generativa más popular, en los últimos dos años 16/12/2024

Dicen que ChatGPT se ha marcado un «Black Mirror» intentando «escapar» para salvarse de ser borrado por sus creadores 09/12/2024

Justicio: una IA que ofrece respuestas legales fundamentadas porque conoce toda la legislación estatal, autonómica y europea 16/11/2024

BlinkShot muestra cómo es posible generar imágenes de IA a medida que se teclea y refina una idea 29/10/2024

Sobre la definición de «inteligencia artificial de código abierto» 28/10/2024

El extraño e inquietante caso del retrato para una conferencia de una mujer al que una IA cambió el aspecto y añadió ropa interior visible 16/10/2024

Por qué la IA no creará arte 02/09/2024

Las herramientas de IA que están captando la atención de la gente 29/08/2024

A las inteligencias artificiales les falta calle 13/08/2024

El pequeño robot de dos piernas de Berkeley que realiza movimientos muy humanos y se fostia con elegancia aguantándolo todo 10/08/2024

Queridas inteligencias artificiales: 09/08/2024

Entra en vigor la Ley Europea de Inteligencia Artificial 01/08/2024

¿A esto antes de ChatGPT no lo llamaban pensar? 01/08/2024

CalcGPT, la calculadora inútil pero «inteligente» 29/07/2024

Cómo evitar que Twitter use tus datos para entrenar su IA 27/07/2024

La falsa promesa de ChatGPT 20/06/2024

Inteligencia artificial: Guía para seres pensantes, un libro que hace honor a su título 17/06/2024

Del spam al slop o bazofIA de la inteligencia artificial 12/06/2024

El pingüino ñato y jovial brinca feliz, comiendo kiwi y exquisito budín de limón: un ejercicio sobre pangramas y LLMs 08/06/2024

Probamos el Samsung Galaxy S24 Ultra durante un par de semanas 29/05/2024

El «código udm=14» que libera las búsquedas de Google de los resultados con inteligencia artificial (y otras mierdas) 23/05/2024

Humane AI Pin, un gadget al que le falta algo más que un hervor: la inteligencia artificial portátil funciona mal, sigue en pañales (y se hace caquita) 11/04/2024

Un vistazo a la «mente» de ChatGTP y sus tripas de tratamiento estadístico y semántico 02/04/2024

In The Blink of An Eye, una de policías en la que uno es una IA 29/03/2024

Tecnológica Santa Cruz, una mirada hacia el futuro 07/03/2024

Riffusion: un experimento para crear música a partir de la letra de la canción 04/02/2024

Cómo hacer que los compañeros de trabajo dejen de enviar «sugerencias» generadas por ChatGPT 11/01/2024

La IA que supera a los humanos recorriendo un laberinto de canicas físico (y que además aprendió a hacer trampas) 20/12/2023

Los principios de la Conferencia de Asilomar sobre inteligencia artificial 29/11/2023

GPT-4 y el Test de Turing: la IA supera el 41% de las pruebas, mientras que los humanos nos mantenemos en un 63%, gracias 27/11/2023

Alter Ego, una interesante serie de RTVE Play sobre inteligencia artificial 21/11/2023

De visita por el centro de investigación y desarrollo de audífonos de Oticon 15/11/2023

Cómo hacer que un coche autónomo (no) te atropelle, básicamente haciendo el ganso sin vergüenza alguna 10/11/2023

El cementerio de los proyectos de inteligencia artificial 07/11/2023

La Declaración de Bletchley sobre la inteligencia artificial (y lo que opina ChatGPT sobre ella, sin paños calientes) 02/11/2023

La colección de audiolibros del Proyecto Gutenberg leídos por las voces de la inteligencia artificial de Microsoft: 5.000 libros gratis y aumentando 12/09/2023

Una ilusión óptica que también engaña al reconocimiento de imagen de las IA 02/09/2023

«La loca idea de una máquina que sepa pensar» y otros artículos sobre inteligencia artificial 31/08/2023

Las impresionantes creaciones visuales de ciencia-ficción con inteligencia artificial de Fernando Barbella 21/08/2023

Los bots inteligentes son mejores que los humanos resolviendo las pruebas CAPTCHA para bloquear a los propios bots 10/08/2023

Bard, la IA conversacional de Google, ya está disponible en España 15/07/2023

ProgramIA: una inteligencia artificial que explica y compara los contenidos de los programas electorales de cara a las Elecciones Generales 13/07/2023

AGI Simulator: un entretenimiento estilo Universal Paperclips pero con el surgimiento de la IA y la IAG según todos los factores posibles 12/07/2023

AI.txt, una iniciativa similar a Robots.txt para restringir el acceso a los datos a las inteligencias artificiales 08/07/2023

Klara y el Sol, una historia muy plana acerca de lo que es ser humano 26/06/2023

Análisis del estado de los modelos actuales de IA respecto a la Ley europea: suspendidos y «deben mejorar» 17/06/2023

El dron militar equipado con inteligencia artificial que en ejercicios simulados «mata» a los operadores humanos que lo supervisan para conseguir sus objetivos militares 02/06/2023

Los ChatGPT de moda todavía no son «inteligentes», al menos según el Test de Turing y un experimento que abarca 10 millones de pruebas 31/05/2023

ChatGPT para iOS ya está disponible en la App Store española y funciona bastante bien 31/05/2023

La revolución de los agentes personales basados en IA 24/05/2023

Opiniones recientes y bastante divergentes sobre la inteligencia artificial, los LLM y GPT 23/05/2023

Programadoras y programadores versus IA 17/05/2023

Los búnkeres nucleares de Ikea imaginados por Filip Filković con Midjourney 14/05/2023

Todo vuelve a cambiar, una magnífica introducción a las tecnologías que van a revolucionar el mundo (o no) 03/05/2023