apr. 14, 2017
Kinesiska AI vinner 290 000 dollar mot Six Poker Pro
By RTR Dennis
Mycket har gjorts om AI-program som slår pokerspelare. Och vi kan lägga till en historia till den här trenden eftersom en kinesisk AI har slagit sex pokerproffs av 290 000 $ (230 000 £).
Kallad Lengpudashi mötte AI mot pokerproffs under en 5-dagarsperiod. Människorna leddes av Yue Du, som förra året vann $ 800 586 i ett $ 5000 WSOP Texas hold'em-evenemang. Du's 'Team Dragon' bestod av en blandning av spelare och ingenjörer som använde sin poker / AI-kunskap för att motverka Lengpudashi.
Texas hold'em ansågs ofta vara ett tufft spel för AIs att slå eftersom det, till skillnad från schack och Go, innehåller ofullständig information. AI har dock avancerat avsevärt till den punkt där de kan använda komplicerade satsningsstrategier och motverka sina motståndares bluffar. Och Lengpudashi visade detta på full skärm genom att besegra Du och hans team av pokerproffs med $ 290 000.
Tredje gången att AI har besegrat människor
Även om det verkligen är anmärkningsvärt är Lengpudashis seger inte ens nära den mest kända AI-vinsten över pokerproffs. Tidigare i år besegrade Libratus fyra elitpokerproffs - Dong Kim, Daniel MacAulay, Jimmy Chou och Jason Les - till $ 1 666 250.
Utvecklat av Carnegie Melon University sågs Libratus vinst som ett landmärke i AI-samhället. År 2015 besegrades Carnegie Melons AI, Claudico, med nästan 800 000 dollar mot Les, Kim, Björn Li och Doug Polk. Få förväntade sig att den senaste versionen, Libratus, skulle komma tillbaka och vinna så lätt.
Libratus utvecklades av ett forskargrupp vid Carnegie Melon, ledd av dataprofessor Tuomas Sandholm och doktorand Noam Brown.
"Människor tycker att bluffa är väldigt mänskligt", sa Brown, "Det visar sig att det inte är sant. En dator kan lära av erfarenheten, att om den har en svag hand och den bluffar kan den tjäna mer pengar."
En annan tävling med mindre förkunnelse ägde rum mellan University of Alberta AI, DeepStack, och en grupp på 11 pokerproffs. Varje spelare ombads att spela 3000 händer eller mer under fyra veckor mot DeepStack. Resultatet inkluderade att DeepStack segrade över människorna efter 44 000 händer.
Dataforskaren Michael Bowling, som ledde forskarna vid University of Alberta i detta projekt, sa att poker länge har varit en utmaning för hans yrke. Det verkar dock som om AI-samhället har tagit ett stort steg mot att övervinna detta hinder.
"Det är det viktigaste spelet med ofullkomlig information i den meningen att spelarna inte har samma information eller delar samma perspektiv medan de spelar", säger Bowling.
En annan milstolpe i artificiell intelligens
Segrar av Lengpudashi, DeepStack och Libratus bekräftar att AI har passerat människor i spelet med ofullständig information. Och detta är bara det senaste landmärket i det som har pågått sedan 1980-talet.
Allt började i början av 1980-talet när utvecklare började försöka besegra schack. Det tog inte lång tid att besegra en mänsklig schackspelare, men det skulle ta lång tid innan AI-samhället löste schack.
Detta kom den 11 maj 1997, då IBM-datorn Deep Blue besegrade världschackmästaren Garry Kasparov i sex matcher. Deep Blue vann två matcher, Kasparov vann 1 och de hade tre oavgjort.
Därefter noterade IBMs webbplats att tävlingen "var viktig datavetenskap, som drivit fram datorns förmåga att hantera de typer av komplexa beräkningar som behövs för att upptäcka nya medicinska läkemedel; göra den breda ekonomiska modelleringen som behövs för att identifiera trender och göra riskanalyser, hantera stora databassökningar; och utföra massiva beräkningar som behövs inom många vetenskapsområden. '
I slutet av 2000-talet var fokus hur AI skulle kunna vinna på limit hold'em. Denna uppgift utfördes snabbt eftersom limit hold'em har fasta bettinggränser, till skillnad från no-limit-versionen. Nu, över tre decennier efter det att resan med problemlösning började, har forskare slagit ett annat spel i no-limit hold'em.
Hur är AI bättre än mänskliga pokerspelare?
Enligt Bowling använder University of Alberta bot en teknik som kallas ständig lösning för att förbättra sitt pokerspel och besegra människor.
"Varje situation i sig är ett mini-pokerspel", förklarade han. 'Istället för att lösa ett stort pokerspel löser det miljontals av dessa små pokerspel, var och en hjälper systemet att förfina sin intuition om hur spelet poker fungerar. Och denna intuition är bränslet bakom hur DeepStack spelar hela spelet. '
Oavsett hur svårt ett beslut är kan DeepStack reagera i genomsnitt tre sekunder. Detta står i stor kontrast till professionella toppspelare, som ibland tar några minuter att fatta beslut i live-spel. Att kunna lösa miljontals "mini-pokerspel" på några sekunder ger AI: erna en stor fördel jämfört med sina mänskliga motsvarigheter.
Det hjälper också att trötthet aldrig är en faktor. I själva verket kan en AI fortsätta att lösa problem och förbättra sig från en konkurrens, medan en mänsklig spelare så småningom behöver vila, eller så börjar de fungera på mindre än optimal nivå.