AI-software Pluribus verslaat pokerpro’s in 6-handed No Limit Hold’em

Pluribus / Copyright: Facebook AI (https://www.facebook.com/FacebookAI)

Er bestonden reeds Artificial Intelligence software programma’s, die enkele van de meest populaire denkspellen ter wereld, zoals dammen, schaken en Go, gekraakt hadden. In 2017 kwam de Zweed Tuomas Sandholm van Carnegie Mellon University met het AI programma Libratus, dat in een grote sample handen heads-up te sterk bleek voor verschillende poker pro’s. Multiplayer poker leek echter altijd een brug te ver, tot nu. Pluribus, de nieuwste troef uit de AI koker van de universiteit, bleek in 6-handed No Limit Hold’em te sterk voor gerenommeerde pro’s als Darren Elias, Greg Merson en Chris Ferguson. De resultaten van het onderzoek zijn gepubliceerd in het wetenschappelijke online magazine Science.

De triomf van Pluribus werd donderdag gemeld in het tijdschrift Science, onder de kop “Superhuman AI for multiplayer poker”. Zoals schaken, dammen, Go en andere games, is de meest populaire vorm van poker nu beheerst door de koude, harteloze berekeningen van een computerprogramma. De samenvatting van dit uitgebreid artikel kun je hier onder lezen:

In recent years there have been great strides in artificial intelligence (AI), with games often serving as challenge problems, benchmarks, and milestones for progress. Poker has served for decades as such a challenge problem. Past successes in such benchmarks, including poker, have been limited to two-player games. However, poker in particular is traditionally played with more than two players. Multiplayer games present fundamental additional issues beyond those in two-player games, and multiplayer poker is a recognized AI milestone. In this paper we present Pluribus, an AI that we show is stronger than top human professionals in six-player no-limit Texas hold’em poker, the most popular form of poker played by humans.

Bron: Science

De grote uitdaging bij het ‘kraken’ van multiplayer No Limit Hold’em zat hem in de hoeveelheid spelers en de onvoorspelbaarheid van de acties die de verschillende spelers konden ondernemen, waardoor het lastig was om dit allemaal te berekenen. Daarnaast is poker een spel waarbij een deel van de informatie verborgen is. De onderzoekers van Carnegie Mellon ontwikkelden echter een AI softwareprogramma dat door middel van self-learning het spelletje onder de knie kreeg. Pluribus begon als leek, maar door een grote hoeveelheid gespeelde handen, met daarin verschillende toegepaste tactieken werd Pluribus beter en beter.

De ultieme test was natuurlijk het spelen tegen verschillende echte spelers en onlangs waren de geleerden van mening dat Pluribus er klaar voor was. Telkens moest pluribus het opnemen tegen vijf tegenstanders, die gevormd werden door gerenommeerde poker professionals zoals Seth Davies, Darren Elias (foto), Nicholas Petrangelo, Chris ‘Jesus’ Ferguson en Greg Merson. Alhoewel de resultaten niet in een rechte lijn liepen, bleek dat Pluribus hoe lang hoe beter ging spelen en steeds betere resultaten boekte.

Darren Elias

Na meer dan 10.000 handen in 12 dagen gespeeld te hebben, kwam Pluribus dan ook als winnaar uit de bus. Gemiddeld wist het software programma 48 big blinds per duizend handen te winnen, een bijzonder goed resultaat. “Dit wordt beschouwd als een heel erg hoge winratio in Texas Hold ‘em met zes spelers, zeker tegen een groep professionals”, schrijven de onderzoekers. “Het impliceert dat Pluribus sterker is dan de menselijke tegenstanders.”

De grote kracht van Pluribus zit in het aanpassingsvermogen van de software. Door de self-learning skills kan het programma zich aanpassen aan diverse situaties en voor elke situatie de best mogelijke strategie bedenken. Ook kan Pluribus rekening houden met het feit dat spelers gedurende het spel van strategie kunnen wijzigen en zit ingebouwd dat de eigen acties een zekere onvoorspelbaarheid moeten hebben.

Deze mijlpaal in kunstmatige intelligentie heeft implicaties die verder gaan dan poker. Deze technologie, zeggen de uitvinders, zou kunnen worden toegepast op zelfrijdende auto’s, veilingen, contractonderhandelingen en beslissingen over product ontwikkeling. Bovendien, in tegenstelling tot de “deep learning” AI-programma’s die onverslaanbaar werden bij schaken en Go, gebruikt Pluribus geen enorme hoeveelheden gegevens en berekeningen.

No limping
Grappig was verder dat Pluribus tevens een beetje een conventionele poker wijsheid bevestigde: Limpen is geen winnende strategie. Je bent dus gewaarschuwd!

Facebook, Carnegie Mellon build first AI that beats pros in 6-player poker

Big milestone announcement from Facebook AI today! In collaboration with researchers from Carnegie Mellon, we’re detailing how we built Pluribus, the first #AI bot to win against elite poker players. It was the champion in six-player no-limit Texas Hold'em poker! This is the first time an AI bot has proven capable of defeating top professionals in any major benchmark game that has more than two players (or two teams).

Geplaatst door Facebook AI op Donderdag 11 juli 2019

Afbeelding: Pluribus / Copyright: Facebook AI 

Lars Smeets
Lars Smeets a.k.a. 'LarsVegas' uit Valkenburg is sinds 2012 aan PokerCity verbonden. Sinds 2017 is hij eigenaar, samen met Pieter 'PrinsFlip' Salet.