Algoritmos ganando a mentiras… Jugando al póker (por ahora)

Por @Alvy — 6 de febrero de 2017

El jugador de póker profesional Dong Kim se enfrenta en el Casino Rivers de Pittsburgh –a través de la pantalla– con Libratus, la inteligencia artificial que resultó victoriosa en el reto Brains vs. AI

Libratus se ha enfrentado a un grupo de tipos que se ganan la vida consiguiendo engañar a sus rivales. Al principio su algoritmo no entendería lo que estaba pasando. ¿Faroles? ¿Qué es eso? Pero en cuanto lo entendió, manejó el engaño mejor que sus consumados rivales (…)

¿Qué sucedería si las máquinas empezaran a mentir? Podrían ser mentirijillas. El móvil al 80% que anuncia que su batería está baja para asegurar el suministro de electricidad cuando sea conectado al cargador o el coche cuyo ordenador anuncia averías inexistentes porque sabe que el frecuente paso por el taller alargará su vida… O grandes trolas, llegando a hacer realidad el argumento clásico de la ciencia ficción del ordenador que miente y mata (Hal en Odisea 2001 o Skynet en Terminator) para no ser desconectado (…)

Me pareció curiosa esta reflexión titulada A mentir no nos gana nadie... excepto Libratus (de Jorge Marirrodriga) sobre todo porque dediqué tiempo la semana pasada a preparar un artículo sobre ese software, Libratus: El día en que la inteligencia artificial ganó a los profesionales del póker (también publicado en El País).

La historia del reto Cerebros vs. IA, como lo llamaron a la competición, me pareció bastante interesante, porque era la primera vez que un algoritmo vencía al póker «sin límite de Texas» (Texas Hold’em) en modalidad uno‑contra‑uno. En total cuatro profesionales del Hold’em y Libratus jugaron 120.000 rondas de póker durante 20 días. De los 2 millones de dólares (virtuales) el software del departamento de informática de la Carnegie Mellon acabó llevándose 1,7 millones; como aliciente se repartían 200.000 dólares «reales» según la clasificación final. Previamente calcularon que una victoria de esa magnitid permitiría afirmar con una certeza del 99,7 por ciento que el resultado no se habría debido al puro azar.

Aunque naturalmente el programa domina perfectamente las reglas y los cálculos probabilísiticos aplicables a cada situación, también es cierto que «aprendió a engañar», y no porque se lo enseñaran expresamente: la idea de «tirarse un farol» surgió como parte del entrenamiento que hizo jugando consigo mismo para encontrar una estrategia óptima; una vez comprobada su efectividad también descubrió que debía tener en cuenta que otros jugadores usarían ese mismo recurso del juego – así que aprendió a protegerse cautamente de los faroles de los contrincantes.

El resultado es un algoritmo que –aunque necesita un supercomputadora entre bambalinas a día de hoy– afina de forma mucho más precisa y exacta que un humano la delgada línea entre apostar sobre seguro y pretenderlo; entre acobardarse y denegar un envite a sabiendas de que sus probabilidades son peores. Algo que, como dicen sus creadores, tiene múltiples aplicaciones más allá de los aparentemente sencillos juegos de naipes.

{Foto: Universidad Carnegie Mellon}