fev. 11, 2017
Destaques da vitória de Libratus na batalha do pôquer online contra os bots
By RTR Dennis
A grande história no mundo do pôquer continua sendo como o programa de IA Libratus derrotou quatro jogadores de pôquer de elite por $ 1.766.250. Como vimos, a vitória do computador apresenta uma possibilidade realista de que o no-limit Texas Hold'em seja um jogo resolvido.
A vitória de Libratus também cria mais medo em torno da noção de que o pôquer online acabará ficando cheio de bots que dominam todas as apostas e jogos.
Como você deve saber, os bots têm sido usados com sucesso no pôquer de apostas baixas há anos. Mas agora estamos entrando em uma era em que nem mesmo ações de risco médio e alto estarão seguras? Descubra enquanto detalhamos a batalha para impedir que as IAs dominem o mundo do pôquer online.
Jogo não convencional, mas ótimo
A vantagem dos bots de pôquer é que eles podem jogar um número infinito de mãos sem se cansar. Mas em variantes no-limit, a limitação sempre foi pensada para ser que a inteligência artificial não pode dominar as nuances complexas das apostas no-limit. Essa noção foi dissipada, no entanto, com o desmantelamento de Libratus dos profissionais do pôquer no Rivers Casino Pittsburgh.
A equipe profissional de Jimmy Chou, Dong Kim, Jason Les e Daniel McAulay jogou 1.500 mãos por dia antes de descansar durante a noite. À medida que o desafio de um mês avançava, os jogadores tomaram muito café em um esforço para manter o foco. Les disse que o jogo lento de Libratus fez o desafio se arrastar também.
“A espera não deve me afetar de forma alguma”, disse ele à Bloomberg. “Mas às vezes você fica tipo 'OK, isso ainda vai acabar?”
Ao contrário dos humanos, o Libratus joga mais devagar no início das mãos com potes pequenos, visto que deve percorrer mais possibilidades por ter mais fichas na mão. E às vezes Libratus faz grandes apostas do nada, o que não é convencional e afasta os oponentes humanos. Mas a máquina jogou bem o suficiente para encenar a primeira vitória de no-limit hold'em para um computador contra profissionais de primeira linha.
“No-limit hold'em é o jogo que você vê em torneios e tem a reputação de ser mais uma arte do que uma ciência”, explicou Adam Kucharski, autor de The Perfect Bet: How Science and Math Are taking the Luck Out de jogos de azar. “Havia a ideia de que esse jogo seria mais seguro por muito mais tempo com essas máquinas.”
Libratus não é o único bot derrotando os profissionais do pôquer
O que nos diz sobre o futuro que o pôquer online pode enfrentar é que Libratus não é o único a vencer os profissionais de pôquer de IA. No início de janeiro de 2017, pesquisadores da Universidade de Alberta fizeram um artigo baseado em seu programa, DeepStack, derrotando 11 jogadores profissionais.
Tuomas Sandholm, um dos principais desenvolvedores do Libratus, apontou que o DeepStack não estava jogando com profissionais de alta qualidade. Michael Bowling, que liderou a pesquisa sobre o DeepStack, concorda com a afirmação de Sandholm.
Mas Bowling disse que sua IA jogava contra os profissionais quando eles estavam mais descansados, ao invés de por um mês direto como Libratus. O DeepStack também derrotou os profissionais por uma margem três vezes maior que o Libratus.
O que os dois homens concordam é que o pôquer pode nunca mais ser o mesmo, agora que a IA derrotou com facilidade os humanos no no-limit hold'em. Eles também apontam que conquistar o pôquer é apenas uma pequena parte dos programas de teste que serão usados para medicina, segurança cibernética e muito mais.
“Este é o principal benchmark que a comunidade definiu, mas esses algoritmos não são para o pôquer”, disse Sandholm. "Eles são de uso geral."
Apesar do DeepStack e do Libratus serem posicionados para propósitos maiores do que o pôquer, seus avanços mostram o que é possível para os futuros bots de pôquer na Internet.
Os desafios têm um formato diferente do pôquer online normal
Embora o que os bots tenham feito seja impressionante, é importante lembrar que esses jogos não acontecem exatamente como o pôquer online real. DeepStack e Libratus apenas jogam partidas heads-up, e o número de fichas entre os AIs e seus oponentes é zerado após cada mão.
Isso tira um pouco da psicologia do jogo, já que os jogadores não podem usar grandes pilhas para intimidar os oponentes. Eric Hollreiser, chefe de comunicações do PokerStars, disse que a diferença entre o desafio e o pôquer real é o que atualmente protege o jogo online.
“Embora em uma base funcional mão-a-mão imite o jogador de pôquer, está muito, muito distante da realidade do que acontece nas mesas”, disse ele.
Com base na opinião de Hollreiser, pode demorar um pouco até que os bots estejam prontos para dominar o nível mais alto do pôquer regular na Internet. Mas, como explicou Chris Grove do Online Poker Report, a possibilidade está cada vez mais perto da realidade. “Se você é um operador de pôquer online, esta é provavelmente sua preocupação número um em relação a fraude, e provavelmente por uma margem bastante ampla.”
Métodos para Combat Poker Bots
O PokerStars tem 70 funcionários cujo único trabalho é erradicar os bots de pôquer e outras formas de fraude. Sempre que a detecção de fraude suspeita de um bot, eles chamam os jogadores e perguntam qual estratégia eles usariam em certas mãos.
Outro método de encontrar bots envolve pedir aos jogadores para jogar por uma hora usando uma câmera giratória para mostrar os arredores, e que a pessoa está de fato controlando a ação.
É muito importante que o PokerStars e outros sites façam o que podem para monitorar os bots porque eles podem ganhar lucros 24 horas por dia, 7 dias por semana, mesmo que não sejam IAs de elite como DeepStack e Libratus.
Quanto tempo até que os AIs se alcancem?
Não é como se os quatro profissionais de pôquer que jogaram Libratus não estivessem dando tudo de si. Eles se encontravam todas as manhãs para compartilhar falhas no jogo do computador.
“Identificamos exploits específicos nos primeiros dias”, disse Les. “Nós os atacamos e atacamos, e agora eles se foram.”
Mas Libratus também fez ajustes, usando parte de seu poder de computação para jogar as mãos e outra parte para melhorar. À noite, o AI mudou totalmente para o modo de estudo, usando 600 nós (aproximadamente 3.000 Macbooks trabalhando simultaneamente) para melhorar seu jogo de pôquer.
Posteriormente, Les disse que estava tentando descobrir como poderia usar algumas das técnicas não convencionais de Libratus em seu próprio jogo. Mas no final, ele desistiu dessa noção. “Simplesmente não temos capacidade mental para fazer isso”, disse Les.
Usando a estratégia Nash Equilibrium no pôquer, os AIs provaram ser superiores aos seus oponentes humanos no heads-up. Mas, por enquanto, eles não podem competir contra jogadores habilidosos em mesas com vários jogadores. Isso porque os jogos multijogador têm tanto a ver com a identificação das falhas dos outros jogadores quanto com o uso de uma estratégia perfeita.
Quanto tempo até os programas de computador descobrirem esse aspecto?
Demorou mais de 20 anos para um AI vencer os profissionais de topo em uma situação de heads-up. Mas, devido ao rápido aprimoramento dessas máquinas ultimamente, pode não demorar tanto para os bots conquistarem os jogos multijogador online.
Mesmo quando os IAs se tornam superiores no pôquer multijogador, podemos pelo menos contar com os departamentos de detecção de fraudes nos principais sites para ajudar a impedir que esses programas governem o jogo.