abr. 14, 2017
AI chinesa ganha $ 290.000 contra Six Poker Pros
By RTR Dennis
Muito se tem falado sobre os programas de inteligência artificial (IAs) derrotando os jogadores de pôquer. E podemos adicionar mais uma história a esta tendência porque uma IA chinesa venceu seis profissionais de pôquer em $ 290.000 (£ 230.000).
Chamado de Lengpudashi, o AI enfrentou profissionais do pôquer por um período de 5 dias. Os humanos eram liderados por Yue Du, que ganhou $ 800.586 no ano passado em um evento de $ 5.000 WSOP Texas hold'em. O 'Team Dragon' de Du consistia em uma mistura de jogadores e engenheiros que usaram seus conhecimentos de pôquer / IA para combater Lengpudashi.
O Texas hold'em costumava ser considerado um jogo difícil de ser vencido porque, ao contrário do xadrez e do Go, ele apresenta informações imperfeitas. No entanto, as IAs avançaram consideravelmente ao ponto de poderem usar estratégias de apostas complicadas e neutralizar os blefes de seus oponentes. E Lengpudashi mostrou isso ao derrotar Du e sua equipe de profissionais de pôquer por $ 290.000.
Terceira vez que AIs derrotaram humanos
Embora certamente notável, a vitória de Lengpudashi não chega nem perto da mais famosa vitória de IA sobre os profissionais do pôquer. No início deste ano, Libratus derrotou quatro profissionais de poker de elite - Dong Kim, Daniel MacAulay, Jimmy Chou e Jason Les - com $ 1.766.250.
Desenvolvido pela Carnegie Melon University, a vitória do Libratus foi vista como um marco na comunidade de IA. Em 2015, o AI de Carnegie Melon, Claudico, foi derrotado por quase $ 800.000 contra Les, Kim, Bjorn Li e Doug Polk. Poucos esperavam que a última versão, Libratus, voltasse e ganhasse tão facilmente.
O Libratus foi desenvolvido por uma equipe de pesquisadores da Carnegie Melon, liderada pelo professor de computação Tuomas Sandholm e pelo estudante de doutorado Noam Brown.
"As pessoas pensam que blefar é muito humano", disse Brown, "mas isso não é verdade. Um computador pode aprender com a experiência que, se tiver uma mão fraca e blefar, pode ganhar mais dinheiro."
Outro concurso menos anunciado ocorreu entre a IA da Universidade de Alberta, o DeepStack, e um grupo de 11 profissionais de pôquer. Cada jogador foi convidado a jogar 3.000 mãos ou mais durante quatro semanas contra o DeepStack. O resultado incluiu DeepStack triunfando sobre os humanos após 44.000 mãos.
O cientista da computação Michael Bowling, que liderou os pesquisadores da Universidade de Alberta neste projeto, disse que o pôquer há muito é um desafio para sua profissão. No entanto, parece que a comunidade de IA deu um grande passo para superar esse obstáculo.
“É o jogo por excelência de informações imperfeitas, no sentido de que os jogadores não têm as mesmas informações ou compartilham a mesma perspectiva enquanto estão jogando”, disse Bowling.
Outro marco na inteligência artificial
As vitórias de Lengpudashi, DeepStack e Libratus confirmam que as IAs ultrapassaram os humanos no jogo da informação imperfeita. E este é apenas o mais recente marco no que tem sido um processo contínuo desde os anos 1980.
Tudo começou no início dos anos 1980, quando os desenvolvedores começaram a tentar derrotar o xadrez. Não demorou muito para derrotar um jogador de xadrez humano, mas demoraria muito até que a comunidade de IA resolvesse o xadrez.
Isso aconteceu em 11 de maio de 1997, quando o computador IBM Deep Blue derrotou o campeão mundial de xadrez Garry Kasparov em seis jogos. O Deep Blue venceu dois jogos, Kasparov venceu 1 e eles tiveram três empates.
Posteriormente, o site da IBM observou que a competição 'era uma importante ciência da computação, impulsionando a capacidade dos computadores de lidar com os tipos de cálculos complexos necessários para ajudar a descobrir novos medicamentos; fazer a modelagem financeira ampla necessária para identificar tendências e fazer análises de risco; lidar com grandes pesquisas de banco de dados; e realizar cálculos massivos necessários em muitos campos da ciência. '
No final dos anos 2000, o foco passou a ser como os AIs poderiam vencer no limit hold'em. Essa tarefa foi realizada rapidamente porque o limit hold'em tem limites de apostas fixos, ao contrário da versão no-limit. Agora, mais de três décadas após o início da jornada de resolução de problemas de jogos, os pesquisadores venceram outro jogo no no-limit hold'em.
Como os AIs são melhores do que os jogadores humanos de pôquer?
De acordo com Bowling, o bot da Universidade de Alberta usa uma técnica chamada resolução contínua para melhorar seu jogo de pôquer e derrotar humanos.
“Cada situação em si é um minijogo de pôquer”, explicou ele. 'Em vez de resolver um grande jogo de pôquer, ele resolve milhões desses pequenos jogos de pôquer, cada um ajudando o sistema a refinar sua intuição de como o jogo de pôquer funciona. E essa intuição é o combustível por trás de como o DeepStack joga o jogo completo. '
Não importa o quão difícil seja uma decisão, o DeepStack pode reagir em uma média de três segundos. Isso contrasta muito com os melhores jogadores profissionais, que às vezes levam minutos para tomar decisões em jogos ao vivo. Ser capaz de resolver milhões de 'mini-jogos de pôquer' em segundos dá aos AIs uma grande vantagem sobre seus colegas humanos.
Também ajuda que a fadiga nunca seja um fator. Na verdade, uma IA pode continuar resolvendo problemas e melhorando longe de uma competição, enquanto um jogador humano eventualmente precisa descansar, ou começa a operar em um nível abaixo do ideal.