https://frosthead.com

Denne poker-spillende AI ved hvornår de skal holdes og hvornår de skal foldes

Et computerprogram, der hedder Pluribus, har bedst pokerprofferne i en række seks-spiller no-limit Texas Hold'em-spil og nået en milepæl inden for kunstig intelligensforskning. Det er den første bot, der slår mennesker i en kompleks multiplayer-konkurrence.

Som forskere fra Facebooks AI-laboratorium og Carnegie Mellon University rapporterer i tidsskriftet Science, kom Pluribus til sejr i både human- og algoritmedominerede kampe. Oprindeligt skriver Merrit Kennedy for NPR, fem versioner af boten modsat en professionel pokerspiller; i den næste forsøgsrunde spillede en bot mod fem mennesker. I et Facebook-blogindlæg vandt AI i gennemsnit omkring $ 5 pr. Hånd, eller $ 1.000 i timen, når de spillede mod fem menneskelige modstandere. Denne sats betragtes som en "afgørende sejrmargin" blandt pokerfolk.

Når han talte med Kennedy, forklarer den fire-tiders World Poker Tour-mester Darren Elias, at han hjalp med at træne Pluribus ved at konkurrere mod fire borde af botrivivaler og advare forskere, når AI begik en fejl. Snart forbedrede botten sig meget hurtigt, [fra] at være en middelmådig spiller til dybest set en pokerspiller i verdensklasse på få dage og uger. ”Oplevelsen, siger Elias, var” temmelig skræmmende. ”

Ifølge Verges James Vincent, styrede Pluribus - en overraskende billig AI trænet med mindre end $ 150 værdier til cloud computing-ressourcer - pokerstrategi ved at spille mod kopier af sig selv og lære gennem prøve og fejl. Som Jennifer Ouellette bemærker for Ars Technica, indså botten hurtigt, at det bedste handlingsforløb var en kombination af gameplay og uforudsigelige træk.

De fleste menneskelige fordele undgår "donk-odds", som finder en spiller, der afslutter en runde med et opkald og starter den næste med et væddemål, men Pluribus omfavnede let den upopulære strategi. På samme tid, rapporterer Ouellette, oplyste AI også usædvanlige væddemål og udviste bedre randomisering end modstandere.

”Dets største styrke er dens evne til at bruge blandede strategier, ” sagde Elias ifølge en CMU-erklæring. ”Det er den samme ting, som mennesker prøver at gøre. Det er et spørgsmål om henrettelse for mennesker - at gøre dette på en helt tilfældig måde og gøre det konsekvent. De fleste mennesker kan bare ikke. ”

Pluribus er ikke den første pokerspilende AI, der besejrer menneskelige fagfolk. I 2017 udviklede botens skabere, Noam Brown og Tuomas Sandholm, en tidligere iteration af programmet kaldet Libratus. Denne AI besejrede afgørende fire pokerprofæer på tværs af 120.000 hænder på to-spiller Texas Hold'em, men som Facebook-blogindlægget forklarer, var det begrænset af, at det kun stod over for en modstander ad gangen.

I følge MIT Technology Review 's Will Knight udgør poker en udfordring for AI, fordi det involverer flere spillere og en overflod af skjult information. Sammenlignende involverer spil som skak og Go kun to deltagere, og spillernes positioner er synlige for alle.

For at overvinde disse forhindringer skabte Brown og Sandholm en algoritme konstrueret til at forudsige modstandernes næste to eller tre træk i stedet for at måle deres trin gennem slutningen af ​​spillet. Selvom denne strategi kan se ud til at prioritere kortsigtet gevinst frem for langsigtede gevinster, er Verges Vincent skriver, at "kortvarig incisivitet virkelig er alt hvad du har brug for."

Fremadrettet kan multiplayer-programmer som Pluribus bruges til at designe medicin, der er i stand til at bekæmpe antibiotikaresistente bakterier, samt forbedre cybersikkerheden og militære robot-systemer. Som Ars Technicas Ouellette bemærker, at andre potentielle applikationer inkluderer overvågning af flerpartsforhandlinger, prisfastsættelse af produkter og brainstorming af auktionsbudgivningsstrategier.

I øjeblikket, fortæller Brown til Knight, vil algoritmen forblive stort set under indhyllinger - hovedsageligt for at beskytte onlinepokersektoren mod ødelæggende økonomiske tab.

Forskeren konkluderer, "Det kan være meget farligt for pokersamfundet."

Denne poker-spillende AI ved hvornår de skal holdes og hvornår de skal foldes