As duas pontas do poker: Libratus e William Kassouf

O termo duas pontas, no poker brasileiro, é o apelido para o open-ended straight draw, a chamada para completar uma sequência que precisa de uma carta por qualquer um dos lados. Numa abordagem mais abstrata, também podemos imaginar uma linha ou régua onde num extremo está o jogo puramente matemático e do outro lado estão os aspectos psicológicos presentes no poker. Diametralmente opostos, a forma matemática seria representada pelo computador Libratus, a inteligência artificial que “aprendeu” e venceu os humanos, e em oposição, o controverso jogador britânico William Kassouf representaria as estratégias de ordem emocional.

O computador Libratus, batizado com uma expressão do latim que significa equilibrado, desequilibrou a disputa humanidade versus inteligência artificial, (ou Brain vs. AI como ficou denominado), levando a melhor de lavada no desafio contra quatro jogadores profissionais durante o mês de Janeiro deste ano, onde jogaram 120 mil mãos. A máquina foi desenvolvida sobre algoritmos capazes de interpretar situações e criar estratégias para sair delas, e por isso “aprendeu” com os jogadores humanos como consertar seus próprios erros.

No vídeo abaixo, do canal do profissional Doug Polk, os quatro jogadores falam sobre suas experiências ao enfrentar Libratus, e levantam questões como a melhora do computador durante a disputa, algumas mãos muito estranhas, o fato de terem subestimado a máquina e a impossibilidade de parar o jogo quando não estão praticando seu A-game. É interessante e vale a pena conferir, além de estar legendado (embora um trecho do vídeo parece se repetir ao longo dos 20 minutos):

O jogador catarinense Alexandre Santos, do blog Um Out no River, discorreu sobre o assunto respaldando a opinião de Sean Chaffin, do Pokernews: o computador não tem medo do risco, enquanto que os humanos ponderam sobre isso. Contudo, o risco evidente nessa disputa em específico não parece ser exatamente a perda financeira (o dinheiro em jogo era fictício, os stacks reestabelecidos a cada mão etc.), senão a honra ou qualquer outro aspecto moral. Portanto, o que parece sobrepor a questão do risco é o fato de que Libratus não se abala como os outros jogadores durante a disputa, e isso pode ser determinante para o desfecho, afinal o computador não oscila emocionalmente.

E falando em jogo emocional, na outra ponta dessa linha imaginária estão as estratégias de base psicológica que são o diferencial de William Kassouf, que obteve seu melhor desempenho na WSOP em seu deep run no Main Event do último ano, sendo eliminado na 17.a posição e embolsando pouco mais de 338 mil dólares pelo feito. A caixa de ferramentas de Kassouf é uma mistura de falatório e longas pausas de tempo, que desestabilizavam seus oponentes e traziam como resultado algum tipo de vantagem para o britânico. Contudo, nem por isso podemos considerá-lo um dos melhores jogadores do mundo. O que é certo é que contra determinadas pessoas, seu estilo falastrão cria condições favoráveis de jogo pra si.

O paradoxo interessante dessa linha imaginária se apresenta justamente na oposição entre humanos e máquinas, psicologia e matemática, emoção e razão. O pokerbot calcula num nível inalcançável para humanos, e jogadores de pele e osso perdem porque tentam imitar o robô, pois buscam a matemática perfeita e inexplorável para vencer a calculadora no longo prazo (um verdadeiro trabalho de Sísifo). Enquanto o humano que tenta não imitar os humanos, pois cria uma maneira própria de jogo, vence justamente porque apresenta a si mesmo, e contudo, vai perder na maioria das vezes, pois o jogo se trata de muitas derrotas e algumas vitórias, e seu repertório pode ou não ter efeito.

Uma conclusão possível é a de que o eixo entre Libratus e Kassouf não exista, pois há inúmeras outras formas de aprendizado possíveis além das duas pontas, um combo-draw cheio de variantes e com menos definições. Não há nada mais sólido do que a boa matemática aplicada e o nervosismo ao blefar, elementos que são facetas entrelaçadas de um todo, e não o inverso.

É certo que Kassouf seria derrotado pelo computador, também de lavada, mas não é esse o ponto se necessariamente jogamos apenas contra humanos. Ademais, as realizações matemáticas alcançadas por Libratus podem abrir novas possibilidades de saber, ampliar o conhecimento sobre o jogo, e até descrever o que há de lógico numa jogada maluca e carregada de impulso do seu adversário. Nesses termos há um caminho potencialmente mais proveitoso do que tentar derrotar o computador.

 

Imagem: Shutterstock.com (editada)

A distopia do poker

Enquanto as cartas do flop são dispostas sobre o feltro, um pequeno feixe de raios laser atinge o bordo ressaltando a silhueta dos naipes, um painel holográfico flutua sobre a mesa mostrando aos espectadores estatísticas em tempo real. Um dos jogadores arremessa um punhado de fichas, que ao passarem pela linha de apostas são imediatamente contabilizadas, pois microchips nanométricos no interior das fichas permitem a leitura dos valores, dispostos prontamente no painel flutuante. A era da tecnologia está em seu ápice e faz do poker um espetáculo visual para além do próprio jogo.

É a feature table do Main Event da nonagésima edição da World Series of Poker, que traz uma novidade em relação aos anos anteriores. A falta de prestígio do tradicional torneio entre humanos precisava de um incremento tecnológico ao mesmo tempo que queria ressaltar as características humanas no jogo, e para tanto, os mesmos nanochips das fichas foram colocados dentro das cartas, de forma que fica possível saber a sequência das que serão distribuídas, queimadas e abertas antes mesmo do início da mão. Tal recurso pode ser visualizado apenas pelos espectadores através de uma espécie de aplicativo de celular chamado Fate.

Para quem assiste ao espetáculo sabendo antecipadamente bordo, queimas e mãos dos jogadores, a expectativa acaba sendo por ver de que forma cada um vai lidar com a situação, como vai escapar, extrair valor, como se comporta, que tipo de loucura vai fazer estando drawing dead.

Embora Fate tenha chamado certa atenção, ele não foi suficiente para recuperar o prestígio do tradicional ME de jogadores de carne e osso, afinal numa sociedade tão tecnologicamente avançada, o momento maior da Série estava reservado para o evento #100, o derradeiro, um torneio de autômatos que disputam entre si o bracelete de campeão e onde a cada corte do baralho, duas dezenas de bordos são batidos numa mesa digital a cada mão jogada. É muito mais ação, os organizadores dizem, mais bads, mais velocidade, mais mãos por hora, mais tecnologia, mais show…

O recém lançado super-robô Oedipus, embora estreante, era o favorito para ganhar o Evento #100 da WSOP, e tem uma história peculiar. Oedipus é a junção de dois dos mais poderosos softwares de jogo, King, o robô norte-americano desenvolvido para ser imbatível, e Iokaste, que é o maior banco de dados de mãos da história do poker, fruto de um consórcio de empresas alemãs que detém o armazenamento de todas as mãos jogadas em todas as plataformas de poker online desde o início do século. Mas há um porém, a empresa Oracle, desenvolvedora de Fate, prestou um tipo de consultoria alertando a equipe de Oedipus que um erro relacional em suas linhas de código poderia fazer com que ele destruísse seu predecessor King e na sequência incorporasse Iokaste, além de apresentar possivelmente algum tipo de defeito se permanecesse em rede por um longo período. Sem considerar isso como um problema e no afã de ganhar a competição, a equipe que desenvolvera Oedipus o retirou da rede para concluir os trabalhos.

Jogando 12 horas por dia em rede, Oedipus não corria o risco de apresentar o problema descrito pela consultoria, e como favorito, não encontrou barreiras para passar pelos sete primeiros dias de disputa, alcançando a mesa final líder em fichas. Na FT, a supremacia do super-robô ficou evidente, Oedipus eliminou um a um de seus adversários e após quase duas dezenas de horas o torneio se afunilou e seu rival no heads-up final era o programa americano King. Fatalmente o destino se realiza, em rede por um longo período, e confrontando o robô que serviu de base para sua criação, Oedipus processa as jogadas com tamanha velocidade que provoca um curto circuito em King, destruindo-o.

Oedipus é declarado vencedor, mas só receberá o bracelete se derrotar o campeão do ano anterior alguns meses depois, em Novembro, concomitantemente a disputa do November Nine. Nesse meio tempo a equipe de Oedipus o coloca em diversas simulações de jogo, e aproveita o recém concluído banco de dados coletado de Fate para incrementar sua capacidade de leitura do jogo. Frente a essas informações, o super-robô começa a entender e simular o comportamento humano considerando o blefe para além de um cálculo previsto, ou seja, Oedipus aprende a blefar como humanos, mesmo quando a situação matemática não favorece a jogada. Basicamente, ele começa a usar o blefe mais frequentemente, como recurso para reverter spots desfavoráveis.

Na data da final mano a mano, ou bit a bit, Oedipus enfrenta o enigmático robô Sphinx, último campeão e conhecido por apresentar jogadas fora dos padrões, overbetando muitos potes e fazendo com que seus adversários tenham que arriscar todo seu stack na quase totalidade das mãos. Mas logo nas primeiras mãos Oedipus mostra ao que veio, e interpretando a estrutura das overbets de Sphinx, constrói um contra-ataque específico para cada um dos 20 bordos que a mesa digital ofereceu, mesclando mais blefes às jogadas. Sem conseguir assimilar as respostas, Sphinx entra em colapso, se autodestruindo.

Oedipus ganha seu bracelete e o consórcio alemão decide que Iokaste deve se juntar ao vencedor, sendo incorporada a Oedipus e consolidando o maior supercomputador da história. Mas a previsão de Oracle se realiza, o defeito previsto pelos consultores acontece e Oedipus fica “cego”, ou seja, não consegue diferenciar mais seus adversários autômatos dos humanos, e como o super-robô foi desenvolvido para o jogo tendo como premissa a eliminação dos adversários, acabou reproduzindo o comportamento das competições para caçar a espécie humana, entendendo-a como seu adversário mais direto. Tal qual a pirâmide muito conhecida no poker, a humanidade foi subjugada pelas máquinas, aliás por uma rede de máquinas comandada por Oedipus, o robô que aprendeu a blefar, que aprendeu o comportamento humano.

No November Nine do ano 2.059 a inteligência artificial tomou o lugar dos humanos, exatos 200 anos após a publicação de A Origem das Espécies, de Charles Darwin, comprovando que não é o jogo matemático e inexplorável que vence, mas o jogo que se adapta.

 

Imagem: Grande Esfinge de Tanis no Museu do Louvre (Naccarato)

A falha do robô de poker Cepheus é humana?

Cepheus é o programa de computador desenvolvido pelos pesquisadores da University of Alberta, no Canadá, que promete resolver o jogo de poker. Segundo artigo do site Cartas na Mesa, trata-se de um software que joga um poker perfeito, sem cometer falhas, e imbatível no longo prazo mesmo quando perde uma série de mãos. Cepheus foi treinado contra si mesmo, e o que o torna imbatível é seu enorme banco de dados de bilhões e bilhões de mãos e o fato de aprender com seus erros passados, tudo isso aliado a uma alta capacidade de processamento, o que faz o programa e seu algoritmo encontrarem respostas eficazes para os mais variados tipos de situações.

Fascinante, não? A promessa dos pesquisadores em matar o jogo com o Cepheus é interessante, e gera conhecimento para ser aproveitado em muitas outras áreas com seu modelo matemático. Aliás, falando em promessa, o próprio nome do software é uma, Cefeu (Cepheus em português), é uma constelação que tem como estrela principal a Gamma Cephei, que deverá ser, até meados do ano 3000, a estrela mais brilhante do céu no hemisfério norte. A escolha do nome está relacionada ao programa antecessor, chamado Polaris, que também foi desenvolvido pela mesma universidade e faz menção a outra estrela, que conhecemos como Polar, a mais brilhante atualmente.

O programa Cepheus é um evidente avanço nos estudos do jogo, contudo há outras formas de olhar a questão, como já explorado na crônica O improvável futuro possível do poker. Cepheus não resolve o poker como um todo, apenas parte dele, através de um modelo desenhado para uma disputa de limit hold’em heads up. O jornalista Christopher Hall escreveu no The Guardian sua experiência de 400 mãos contra Cepheus, e embora a amostra seja muito pequena, ele afirma que o pokerbot tem uma falha: ele não se adapta.

O ponto principal é perceber que Cepheus não joga os jogadores, não considera o adversário, não reconhece o oponente, mas apenas joga seu próprio modelo, e o aplica com precisão. Se o software aprende a cada mão jogada, é porque está computando mais um dado, e não necessariamente aprendendo. Isso gera uma hipótese, onde o “vírus“ humano pode jogar de maneira completamente não convencional, e talvez contaminar a base de dados do software de forma a fazer com que o programa aprenda errado. Mas isso é muita viagem. Ou não. Contudo, queremos vencer Cepheus?

Vencer Cepheus pode parecer um trabalho de Sísifo, e espero, esse não deve ser o desafio. É evidente que uma calculadora faz contas mais rápido que você, e em alguns casos, alguns cálculos que você nem tem ideia. Desafio maior é conseguir enxergar Cepheus como um modelo, e não como condição para um jogo perfeito. Quem joga poker online e sente o quão mecânico se torna o clicar de botões, que o diga.

Os modelos não são o jogo em si, mas ferramentas. Ferramentas essas para tentar fazer com que você não jogue exatamente de forma mecânica, mas acima de tudo, crie através delas.

 

 

Fontes: Cartas na Mesa, Cepheus Poker Project – University of Alberta, The Guardian, texto de Sarah Zhang para Gizmodo Brasil. Imagem: Ociacia/Shutterstock (editada)

Pessagno tem a conta que todo mundo queria ter, se ela existisse

Os segredos do poker são sempre muito explorados. É a jogada de marketing perfeita, afinal, a ideia simplória de que existe algum tipo de atalho possível para se dar bem no poker alcança contornos quase sagrados, como uma salvação à distância de um clique.

Há um milk shake milagroso que te faz emagrecer, uma maneira de ganhar dinheiro fácil apenas enviando emails, você pode aumentar a piroca em dez centímetros ou localizar facilmente o ponto G, dá pra ficar com o abdômen definido usando um aparelho que dá choques na barriga, ou até mesmo entrar numa pirâmide financeira. É assim que ficamos acostumados a buscar continuamente mais um segredo, mais uma resposta.

Parte dos novatos no jogo e alguns jogadores que não aguentam mais levar um out no river são loucos por um segredo, um daqueles que vai catapultar a conta fedida para além da lama. Aí o Pessagno tenta explicar porque dá raise/fold com 7BBs, mas quem dá crédito? Todos querem saber o segredo.

Então aí vai um segredo, dos bons, Pessagno é um robô. É evidente, seu nome é a sigla para PokerStars Super Androide Grinder Online, seu volume de jogo é muito grande, suas tomadas de decisão parecem estranhas e não naturais para a visão dos jogadores. Não pode ser humano, só pode ser um autômato, por isso ele aparece pouco nas mesas dos torneios ao vivo.

E aí, passou o blefe?

A ideia de que existe um segredo, só alimenta a conspiração, afinal, só pode ser possível se houver um segredo por trás. Aliás, pra quem gosta de uma conspiração, esse artigo cai como uma luva, ou melhor, como uma broca, com direito ao Pessagno no final.

Dedicação, perseverança, anos de estudos, percepção e criatividade parecem não valer frente aos segredos, pois não é possível que algo tão elementar cause um efeito tão bom. Em nossos termos, não vamos ver a resposta para o segredo, nossos termos aprisionam nosso entendimento, procuramos respostas no lugar de mudar as perguntas. Reflexões como a de Gabriel Goffi neste vídeo, são a matéria prima para trabalhar o jogo fora da conta premiada ou dos segredos.

Na prática, entre optar por push ou fold com 10BBs, a pergunta pertinente não é se devemos ir all in ou fold, mas se devemos escolher uma dessas duas opções.

Abaixo, o segredo da conta de Caio Pessagno.

 

Fonte: Blog do Pessagno e Canal Caio Pessagno no YouTube

O improvável futuro possível do poker

No futuro, o poker é uma indústria de escala mundial, não somente nos EUA onde foi seu berço, mas fortemente desenvolvida no resto do globo. Contudo, o principal custo dessa expansão parece ser uma onda conservadora na sociedade, que ainda vê o poker como jogo de azar. Visto este quadro, uma associação mundial, por força de uma pressão de mercado cada vez mais presente, queria provar ao mundo que o jogo de poker consistia essencialmente de habilidade.

Neste futuro, jogadores de poker não são classificados pelos ganhos ao longo da carreira, mas por um sistema de pontuação similar ao xadrez, que os qualifica por um rating. Esse novo modelo atendeu a uma demanda muito solicitada pelos jogadores, pois grandes torneios com fields gigantescos estavam gerando prêmios cada vez maiores aos campeões, que não necessariamente eram os melhores competidores, mas vinham ocupando os primeiros lugares nas listas. Por pelo menos duas décadas este sistema vigorou, e foram selecionados os dez melhores ratings dos últimos anos, que jogariam uma partida que definiria o melhor dentre eles.

Prontamente a mídia verificou que poderia explorar essa oportunidade, e evidentemente, a modalidade torneio foi a escolhida, pois uma mesa de cash game, independentemente da qualidade dos jogadores, não traria o drama e a adrenalina presentes e necessárias para gerar um espetáculo.

Assim que a competição começou, matemáticos e psicólogos foram chamados para comentar, jogadores da velha guarda e teóricos destrinchavam cada mão em busca do jogo perfeito, o apresentador ressaltava a qualidade técnica de cada um, ainda que deixasse clara as suas preferências e julgamentos. Comentários e estratégias que ficavam restritas aos bastidores começaram a ser televisionadas, e a cada transmissão, a quantidade de patrocinadores só aumentava. O jogo e o espetáculo não se diferenciavam mais.

Durante meses, sete torneios foram realizados, um play-off para não deixar dúvidas e, ao final, dois competidores terminaram empatados para o delírio dos espectadores. Foi então realizada uma nova série, agora mano-a-mano, para definir o melhor entre os dois. Acontece que, quando a série chegou ao seu desfecho, o jogador derrotado pediu uma revanche, alegando que o adversário havia recebido um melhor conjunto de cartas durante a disputa. A derrota é sempre amarga, e como o show tem que continuar, o pedido foi atendido. Ao término, o jogador derrotado na primeira série sagrou-se vencedor.

Sem solução para a contenda e com receio de perder público, os organizadores definiram uma nova regra. O heads-up final seria disputado com uma quantidade infinita de fichas e o campeão seria declarado pelo critério de submissão, ou seja, o perdedor teria que anunciar derrota por incapacidade de bater o adversário. Algo difícil de imaginar visto que nenhum jogador admitiria tão facilmente uma derrota neste formato.

Contudo, os dois jogadores toparam, e a nêga durou quase quatro dias seguidos. Com a estafa tomando conta de ambos, o improvável aconteceu e um deles pediu trégua, pois não suportava mais ficar de olhos abertos, não conseguia mais raciocinar e encontrar forças para o embate.

O jogador vencedor foi muito comemorado, finalmente havia o representante de um poker bem jogado, pelo resultado e pelo poder mental e perseverança. Contudo um desafio maior se apresentava, os organizadores levaram o campeão a disputar uma série contra um robô. Um software insistentemente testado numa máquina parruda, que mesmo no futuro, ainda não conseguia gerar o algoritmo que solucionaria o jogo, mas tinha um banco de dados quase incomensurável e uma capacidade de processamento idem.

No desafio contra a máquina, o campeão ganhou três partidas em dez, da metade pra frente da disputa, quando começou a perceber que quanto mais incomuns eram suas jogadas, mais difícil ficava para o computador resolver a partida. Mas neste ponto a mídia não estava mais tão interessada, a bola da vez já era outra, talvez um escândalo, talvez a gostosa da vez, talvez uma guerra televisionada.

O que restou disso tudo foi notar que o espetáculo trouxe mais praticantes para o poker, que máquinas não jogam, apenas fazem cálculos, e que jogadores são simultaneamente falíveis e criativos, e experimentam situações onde o entendimento que cada um tem do outro é um dos inúmeros fatores das vitórias e derrotas. Assim como no passado.

 

Foto: shutterstock (editada)