En un estudio que está todavía por revisar, unos investigadores cuentan que en una del Test de Turing con tres personas, en la que los participantes conversan con un humano y una IA al mismo tiempo y luego evalúan cuál es cuál, el modelo GPT-4.5 de OpenAI fue considerado humano el 73 por ciento de las veces cuando se le indicó que se comportara con cierta personalidad. Superó a ELIZA, LlaMa 3.1 y GPT-4o. Una cifra de más del 70% es bastante más que la probabilidad aleatoria del 50%, y se considera una señal suficiente –según los investigadores y lo que decía Turing– de que ha superado la legendaria prueba, aunque como suele suceder habrá muchas opiniones al respecto y sobre lo que significa realmente. [Fuente: Large Language Models Pass the Turing Test vía Futurism vía The Conversation.]
Relacionado:
- GPT-4 y el Test de Turing: la IA supera el 41% de las pruebas, mientras que los humanos nos mantenemos en un 63%, gracias
- El test de Turing inverso diseñado por una IA, que luego es respondido por humanos y por IAs y finalmente evaluado por la misma IA, con curioso resultado
- Un Test de Turing mínimo en el que una sola palabra basta para distinguir humanos y máquinas
- ¿Ser humano o no? El Test de Turing a modo de juego que empareja gente desconocida (y a veces bots)
- Los ChatGPT de moda todavía no son «inteligentes», al menos según el Test de Turing y un experimento que abarca 10 millones de pruebas
- El test de Turing inverso
- El Test de Turing