skin

L'Intelligenza artificiale vince a poker anche in modalità 6 handed

30 agosto 2019 - 04:24

L'Intelligenza artificiale vince a poker anche in modalità 6 handed contro i campioni di hold'em. 

Scritto da Gt

Ancora un passo avanti per le intelligenze artificiali con un software complesso che è riuscito a battere avversari “umani”. E fin qui non sarebbe una novità, se non fosse che questi avversari erano appena sei nel formato six handed, appunto, finora mai battuto dai programmi di AI che avevano tentato di sfidare i giocatori umani. 

Il poker è stato a lungo una sfida formidabile per l'intelligenza artificiale. I giocatori non conoscono le carte dei loro avversari o il processo di pensiero nel bluff o nella strategia, a differenza di altri giochi come gli scacchi o il Go, che non hanno questo elemento nascosto. Ciò rende inefficaci le strategie di apprendimento automatico esistenti nel poker.

A luglio, tuttavia, un programma chiamato Pluribus, creato dai ricercatori di Carnegie Mellon in collaborazione con la divisione AI di Facebook, ha sconfitto i professionisti del poker Texas Hold'em no-limit a sei giocatori, lo stile di gioco più popolare al mondo. Questo risultato segna la prima volta che un computer ha battuto i migliori umani in una partita di poker con più di due giocatori o squadre.

I ricercatori hanno abbinato il loro programma al giocatore vincitore del World Poker Tour Darren Elias e al sei volte vincitore del World Series of Poker Chris Ferguson. Pluribus è emerso decisamente vittorioso nei confronti di entrambi i giocatori, ognuno dei quali ha giocato 5.000 mani di poker contro cinque istanze dell'IA.

Anche Michael Gagliano, un professionista del poker che ha guadagnato quasi $ 2 milioni nel corso della sua carriera, ha affrontato Pluribus. “È stato incredibilmente affascinante giocare contro il bot di poker e vedere alcune delle strategie che ha scelto. Ci sono state diverse commedie che gli umani semplicemente non stanno realizzando, in particolare relative al dimensionamento delle scommesse. I robot / AI sono una parte importante nell'evoluzione del poker ed è stato fantastico avere un'esperienza diretta in questo grande passo verso il futuro ", ha dichiarato Gagliano in un comunicato stampa dell'università.

I ricercatori hanno anche testato il parallelismo di Pluribus, lanciandolo contro cinque professionisti alla volta per 10.000 mani di poker in totale. Pluribus avrebbe guadagnato circa $ 1.000 l'ora se ogni chip avesse un valore di un dollaro.

Tuomas Sandholm, professore di informatica di Angel Jordan alla Carnegie Mellon, ha dichiarato in un comunicato stampa dell'università: "Pluribus ha ottenuto prestazioni sovrumane nel poker multiplayer, che è una pietra miliare riconosciuta nell'intelligenza artificiale e nella teoria dei giochi che è stata aperta per decenni". lab aveva precedentemente sviluppato Libratus, un'intelligenza artificiale che aveva fatto progressi contro gli umani nel Texas Hold'em no-limit per due giocatori.

"Giocare a una partita a sei giocatori anziché a scontro diretto richiede cambiamenti fondamentali nel modo in cui l'IA sviluppa la sua strategia di gioco", ha spiegato Noam Brown, un dottorato in informatica. studente che lavora come ricercatore per l'IA di Facebook.

Cosa rende Pluribus così buono rispetto ai suoi predecessori? Secondo Facebook, il programma utilizza un nuovo algoritmo di ricerca che deve solo valutare alcune mosse prima di quello attuale, che è più efficiente della ricerca fino alla fine del gioco. Inoltre, Pluribus incorpora tecnologie di auto-gioco più veloci per competere contro sei copie di se stesso per determinare la strategia per il primo giro di scommesse. Insieme, questi miglioramenti consentono al programma di funzionare su hardware di cloud computing per un valore di $ 150. Mentre le precedenti IA avevano richiesto le proprie server farm, Pluribus utilizzava solo 28 core di elaborazione durante il gioco live simultaneo contro cinque avversari.
Sandholm spera di applicare ciò che il suo team ha appreso da Pluribus alle sue aziende, Strategic Machine e Strategy Robot, che hanno svolto ricerche sull'apprendimento automatico nel mondo degli affari, medicina, difesa e intelligence. L'approccio utilizzato da un programma di poker multi-player può tradursi in altre impostazioni multi-agente che rappresentano situazioni del mondo reale, tra cui la prevenzione delle frodi e la sicurezza informatica.

Articoli correlati