Por @Alvy — 13 de julio de 2019

Nueva victoria de las máquinas al póker, esta vez al Texas Hold’em en una mesa de seis jugadores

Hace un par de años escribí un artículo hablando de Libratus, un software creado en la Carnegie Mellon, que arrasó a los profesionales del póker y la cosa no ha hecho sino ir «mejorando». Ahora Nature publica otro acerca de una versión avanzada de la misma inteligencia artificial, llamada Pluribus, que ha vencido a profesionales en una mesa de seis jugadores, la variante más popular del juego: No limit: AI poker bot is first to beat professionals at multiplayer game.

Según cuentan para conseguir la proeza los investigadores de la Carnegie Mellon (Sandholm y Brown) junto con la división de investigación de Facebook AI han tenido que afinar mucho los algoritmos de Pluribus, que básicamente consisten en aprendizaje automático mediante refuerzo (jugando billones de manos de póker contra sí mismo) pero afinados para las complicaciones particulares de esa variante del juego, donde la clave son los faroles y saber manejar el tamaño de las apuestas. En Muerte del póker por una computadora: los mejores profesionales del juego de cartas sucumben ante la máquina (El Diario) David Sarabia lo explica estupendamente:

Un jugador de carne y hueso puede apostar la cantidad que le venga en gana en una mano, y en la práctica da igual apostar 200 dólares que 201. Pero no es lo mismo meter 300 que 800 dólares. Aunque Pluribus no esté programado para apostar todas las cantidades de 1 a 10.000 (las fichas iniciales con las que empezaban a jugar) y toma hasta 14 opciones diferentes dentro de ese rango, es capaz de entender si un humano le apuesta 587 dólares y actuar en consecuencia.

Otra de las simplificaciones del juego que han introducido los investigadores a Pluribus es la abstracción de información. En el póker, una escalera del 6 al 10 es mayor que una escalera del 5 al 9, pero Pluribus agrupa las manos similares (como estas dos) y simplifica su juego. Para el bot solo existe la clasificación de manos de póker (en la que una doble pareja gana a una pareja, un color a un trío, etcétera) mientras que los humanos sí tenemos en cuenta que un trío de seises gana a un trío de cinco (…)

En cuanto a hardware Pluribus requiere poca cosa: sólo utiliza 2 CPUs y es capaz de dedicirse por acerca de una mano en unos 20 segundos, el doble de rápido que un humano. Su coste en la nube es de unos 150 dólares.

Según Technology Review, los investigadores han dicho que debido a que su juego es tan poderoso y letal contra los humanos no liberarán su código para evitar abusos en los casinos online. Ya veremos lo que tarda en usarse.

Más información en estos artículos:

Relacionado:

{Foto (CC) Jack Hamilton @ Unsplash}

Compartir en Flipboard Publicar / Tuitear Publicar