El software está basado en un nuevo algoritmo que aprende de las decisiones que han sido infructuosas e incluso de los datos que pueden ser falsos (como marcarse un farol) y utiliza esta información para elaborar una gigantesca base de datos en la que se encuentran todas las jugadas posibles en una partida. El resultado: un jugador imbatible.
“Cepheus ha creado y desarrollado su propia estrategia desde cero, únicamente conociendo las normas del juego. El resultado son más de 260 terabytes de información, 1.000 veces más que lo que ocupa la versión en inglés de la Wikipedia”, explica a Sinc Michael Bowling, coautor del estudio.
Para su entrenamiento, Cepheus se batió contra sí mismo en 4.000 ordenadores durante dos meses, realizando 6.000 millones de manos cada segundo, consiguiendo un volumen de información más que suficiente acerca de las combinaciones de cartas posibles así como las posibilidades existentes de jugar una mano.
El algoritmo clave de Cepheus es CFR+, un conjunto de ecuaciones matemáticas “con una premisa relativamente simple: La inteligencia de Cepheus es fruto de su entrenamiento. Empieza actuando al azar y, partir de ahí, calcula el valor de todas las acciones posibles en todas las posibles situaciones” aclara Bowling. Esto es, sus cálculos actualizan continuamente la estrategia en base al arrepentimiento de cada decisión.
¿Gana la máquina todas las partidas? La primera mano parece ser la única en la que existe una posibilidad para vencer a Cepheus pero, la probabilidad de perder es tan pequeña que un jugador con gran experiencia “podría estar jugando toda su vida contra el programa sin cometer fallos y aun así no podría encontrar ninguna imperfección”, finaliza el investigador.
Sé el primero en comentar en «Un software descubre cómo ganar siempre al póker»