Crônica de uma noite estrelada

A última etapa do XXIV campeonato de Texas Hold’em organizado pelo clube ADT, que congrega grandes jogadores da modalidade, foi concluída na madrugada do dia 15 de novembro de 2017. Acirradíssima, a final contava com cinco jogadores em condições de vencer o campeonato, sendo que a diferença entre os três primeiros colocados estava em míseros 15 pontos (valor que qualquer jogador que participe da etapa já pontua).

Venci a etapa e o campeonato, o primeiro em minha trajetória no clube. Após três campeonatos consecutivos amargurando segundos e terceiros lugares consegui erguer, finalmente, o troféu de campeão. Entretanto, a construção da vitória não foi no dia 15, mas sim uma semana antes, quando se revelaram os jogadores aptos na última etapa a conquistar o campeonato. Como liderava o ranking por uma diferença mínima, tracei minha estratégia durante a semana, simulando posições, número de participantes, mãos com jogabilidade, e de quais jogadores devia me defender.

A vitória foi consequência de estudos, e não pela sorte que alguns atribuem. Embora tenha construído a liderança com um bom pôquer durante as etapas, não me descuidei em lembrar das boas e más jogadas, reler os posts e analisar os áudios de nosso grupo de estudos no WhatsApp, e sobretudo dos debates entre os colegas sobre as análises de mãos. Bem verdade, que como todo jogo de cartas, por definição, o pôquer tem um componente de sorte, caso contrário a vantagem matemática sempre prevaleceria. A imprevisibilidade e a jogabilidade fazem com que este jogo seja, talvez, o jogo que mais valorize a técnica, tática, análise de riscos e sobre o controle psicoemocional.

Talvez, neste contexto psicológico é que se desenhou minha conquista: O estudo minucioso e holístico (matemática, psicologia, economia, algoritmos, entre outros) que propicia ao jogador segurança e estabilidade. Por isto, é fundamental estudar os textos, áudios, vídeos e treinamentos disponíveis em livros ou na internet. Além disso, o coaching, seja entre grupos de jogadores (como no nosso caso) ou profissionais, e a troca de experiências.

O caminho para a vitória foi desenhado durante as 14 etapas preliminares, minha evolução no estudo do esporte e o estudo específico para a batalha na última etapa. Verdade também que liderava o ranking e sabia o que era necessário fazer para obter a vitória: permanecer na mesa até que os concorrentes fossem derrotados. Ligeira vantagem, porém, crucial para aplicação da minha técnica. A noite derradeira iniciou-se no sorteio da minha posição na mesa. Sabia, pelas minhas simulações, que de todas, a sorteada era a que mais me favorecia. Sorte.

Primeira mão: QQ. Soube lidar com esta mão extraindo um bom pote. Talvez o máximo possível.

Segunda mão: KK. Também puxei um bom número de fichas.

Claro que isto não ocorreria até o final da etapa, mas como me esforcei e me preparei tanto, parecia um sinal de que: “Hoje é seu dia”. Um reforço emocional, que me confortou até a última mão.

Escolhi a posição da mesa, o valor relativo das mãos para minhas ações e com quem eu poderia jogá-las para não comprometer a etapa e consequentemente o campeonato. Um algoritmo previamente elaborado e que segui à risca. Após os sete primeiros níveis, meu stack já havia triplicado e na mesa final já tinha quase 50 blinds e era chipleader. Não havia eliminado nenhum jogador até então, não joguei nenhuma mão que me comprometesse, não usei de agressividade excessiva (que é o meu ponto forte, mas também fraco e explorável). Nenhum All In. Nenhuma mão perigosa com jogadores tecnicamente estudados e concorrentes ao título. Meu “Kernel” do algoritmo.

Algumas jogadas foram cruciais:

1. Mão de Hollywood:
Jogador short, na posição UTG+1 da all In de uns 10BBs;
Jogador em UTG+2 da call;
Jogador em MP1 estoura all In de 20BBs;
Jogador em HJ dá call por baixo.

As mãos respectivas, (TQ de ouros), (88), (KK) e (AA). Minha mão (JJ). Penso por uns cinco minutos. Será que está tudo encavalado e meu JJ é bom? Algoritmo novamente: fold.

MP1 com KK leva trincando no bordo. Ganha um jogador fora da disputa do ranking, mas vejo um concorrente direto eliminado. E se eu estivesse na posição UTG+2 e tentasse isolar? Provavelmente teria perdido muitas fichas, mas a sorte me possibilitou jogar ou não aquela situação, estava na BB. Mais um reforço emocional, embora, meu fold fosse correto.

2. Quatro jogadores, com um único oponente brigando pelo título.
Dou call de 2,5BBs com KQ no BB, do raise de um não concorrente. Bordo AK555, que foi check-call até o river. Oponente da all In. Penso uns cinco minutos, e de novo o algoritmo: fold. Oponente dá showdown cortesia com 88. Se eu desse call e ele tivesse o “A”, trocaria minha liderança em fichas com ele e comprometeria a etapa. Um grande bluff. Embora estivesse claro que eu estava ganhando, fiquei muito feliz com meu fold. O algoritmo errou, mas me deu ainda mais segurança.

3. Três jogadores.
Eu chipleader e somente um outro concorrente ao título. Mais do que nunca tinha que eliminá-lo. All In do concorrente e eu no SB com AK de paus: call. Ele mostra TQ de ouros.

Naquele momento, tamanha era minha confiança, que levantei já comemorando o título. Não podia ter bad, era meu momento, era meu destino, era minha vez.

Break antes do heads-up final, fotos, congratulações, um sorriso aberto e aliviado, e uma lágrima escondida, prestes a cair e engolida. Para os jovens é uma conquista de muitas que virão, mas para um quase quinquagenário, uma das últimas de outras que virão.

A última etapa também era especial, disputa-se o chamado Grand Prix, torneio que vale troféu, com buy in mais alto, deepstack e premiação maior. Faria eu o chamado: barba, cabelo e bigode? Sim. Depois de uma longa disputa, um call seguro e de alma de K8 de ouros contra A2 off. Nenhum Ás, e meu 8 no river. Tinha que ser assim. Na última carta de longas 15 etapas.

Chego em casa às 5:00 da manhã. Acordo todos em casa e exibo meus dois troféus, ambos escritos “CAMPEÃO”. Congratulações, fotos e alegria. Agora sim, meus três troféus de 2º e 3º lugares, já expostos no meu cantinho de conquistas, recebem o Rei e a Rainha, completando o sentido no conjunto e demonstrando minha evolução. Juntos demonstram coesão, coerência e finalidade.

Por fim, como disse anteriormente, o ADT é um grande clube de pôquer, com jogadores excepcionais. É fonte de amizades e troca de conhecimento. Arrisco aqui: O ADT é o melhor. Para finalizar, acordo durante o resto dia 15/11/2017 em um devaneio de sonho, do qual eu não me retorno, gritando: “ALL IN!!!!”

 

Imagem: ADT Poker

As duas pontas do poker: Libratus e William Kassouf

O termo duas pontas, no poker brasileiro, é o apelido para o open-ended straight draw, a chamada para completar uma sequência que precisa de uma carta por qualquer um dos lados. Numa abordagem mais abstrata, também podemos imaginar uma linha ou régua onde num extremo está o jogo puramente matemático e do outro lado estão os aspectos psicológicos presentes no poker. Diametralmente opostos, a forma matemática seria representada pelo computador Libratus, a inteligência artificial que “aprendeu” e venceu os humanos, e em oposição, o controverso jogador britânico William Kassouf representaria as estratégias de ordem emocional.

O computador Libratus, batizado com uma expressão do latim que significa equilibrado, desequilibrou a disputa humanidade versus inteligência artificial, (ou Brain vs. AI como ficou denominado), levando a melhor de lavada no desafio contra quatro jogadores profissionais durante o mês de Janeiro deste ano, onde jogaram 120 mil mãos. A máquina foi desenvolvida sobre algoritmos capazes de interpretar situações e criar estratégias para sair delas, e por isso “aprendeu” com os jogadores humanos como consertar seus próprios erros.

No vídeo abaixo, do canal do profissional Doug Polk, os quatro jogadores falam sobre suas experiências ao enfrentar Libratus, e levantam questões como a melhora do computador durante a disputa, algumas mãos muito estranhas, o fato de terem subestimado a máquina e a impossibilidade de parar o jogo quando não estão praticando seu A-game. É interessante e vale a pena conferir, além de estar legendado (embora um trecho do vídeo parece se repetir ao longo dos 20 minutos):

O jogador catarinense Alexandre Santos, do blog Um Out no River, discorreu sobre o assunto respaldando a opinião de Sean Chaffin, do Pokernews: o computador não tem medo do risco, enquanto que os humanos ponderam sobre isso. Contudo, o risco evidente nessa disputa em específico não parece ser exatamente a perda financeira (o dinheiro em jogo era fictício, os stacks reestabelecidos a cada mão etc.), senão a honra ou qualquer outro aspecto moral. Portanto, o que parece sobrepor a questão do risco é o fato de que Libratus não se abala como os outros jogadores durante a disputa, e isso pode ser determinante para o desfecho, afinal o computador não oscila emocionalmente.

E falando em jogo emocional, na outra ponta dessa linha imaginária estão as estratégias de base psicológica que são o diferencial de William Kassouf, que obteve seu melhor desempenho na WSOP em seu deep run no Main Event do último ano, sendo eliminado na 17.a posição e embolsando pouco mais de 338 mil dólares pelo feito. A caixa de ferramentas de Kassouf é uma mistura de falatório e longas pausas de tempo, que desestabilizavam seus oponentes e traziam como resultado algum tipo de vantagem para o britânico. Contudo, nem por isso podemos considerá-lo um dos melhores jogadores do mundo. O que é certo é que contra determinadas pessoas, seu estilo falastrão cria condições favoráveis de jogo pra si.

O paradoxo interessante dessa linha imaginária se apresenta justamente na oposição entre humanos e máquinas, psicologia e matemática, emoção e razão. O pokerbot calcula num nível inalcançável para humanos, e jogadores de pele e osso perdem porque tentam imitar o robô, pois buscam a matemática perfeita e inexplorável para vencer a calculadora no longo prazo (um verdadeiro trabalho de Sísifo). Enquanto o humano que tenta não imitar os humanos, pois cria uma maneira própria de jogo, vence justamente porque apresenta a si mesmo, e contudo, vai perder na maioria das vezes, pois o jogo se trata de muitas derrotas e algumas vitórias, e seu repertório pode ou não ter efeito.

Uma conclusão possível é a de que o eixo entre Libratus e Kassouf não exista, pois há inúmeras outras formas de aprendizado possíveis além das duas pontas, um combo-draw cheio de variantes e com menos definições. Não há nada mais sólido do que a boa matemática aplicada e o nervosismo ao blefar, elementos que são facetas entrelaçadas de um todo, e não o inverso.

É certo que Kassouf seria derrotado pelo computador, também de lavada, mas não é esse o ponto se necessariamente jogamos apenas contra humanos. Ademais, as realizações matemáticas alcançadas por Libratus podem abrir novas possibilidades de saber, ampliar o conhecimento sobre o jogo, e até descrever o que há de lógico numa jogada maluca e carregada de impulso do seu adversário. Nesses termos há um caminho potencialmente mais proveitoso do que tentar derrotar o computador.

 

Imagem: Shutterstock.com (editada)

A falha do robô de poker Cepheus é humana?

Cepheus é o programa de computador desenvolvido pelos pesquisadores da University of Alberta, no Canadá, que promete resolver o jogo de poker. Segundo artigo do site Cartas na Mesa, trata-se de um software que joga um poker perfeito, sem cometer falhas, e imbatível no longo prazo mesmo quando perde uma série de mãos. Cepheus foi treinado contra si mesmo, e o que o torna imbatível é seu enorme banco de dados de bilhões e bilhões de mãos e o fato de aprender com seus erros passados, tudo isso aliado a uma alta capacidade de processamento, o que faz o programa e seu algoritmo encontrarem respostas eficazes para os mais variados tipos de situações.

Fascinante, não? A promessa dos pesquisadores em matar o jogo com o Cepheus é interessante, e gera conhecimento para ser aproveitado em muitas outras áreas com seu modelo matemático. Aliás, falando em promessa, o próprio nome do software é uma, Cefeu (Cepheus em português), é uma constelação que tem como estrela principal a Gamma Cephei, que deverá ser, até meados do ano 3000, a estrela mais brilhante do céu no hemisfério norte. A escolha do nome está relacionada ao programa antecessor, chamado Polaris, que também foi desenvolvido pela mesma universidade e faz menção a outra estrela, que conhecemos como Polar, a mais brilhante atualmente.

O programa Cepheus é um evidente avanço nos estudos do jogo, contudo há outras formas de olhar a questão, como já explorado na crônica O improvável futuro possível do poker. Cepheus não resolve o poker como um todo, apenas parte dele, através de um modelo desenhado para uma disputa de limit hold’em heads up. O jornalista Christopher Hall escreveu no The Guardian sua experiência de 400 mãos contra Cepheus, e embora a amostra seja muito pequena, ele afirma que o pokerbot tem uma falha: ele não se adapta.

O ponto principal é perceber que Cepheus não joga os jogadores, não considera o adversário, não reconhece o oponente, mas apenas joga seu próprio modelo, e o aplica com precisão. Se o software aprende a cada mão jogada, é porque está computando mais um dado, e não necessariamente aprendendo. Isso gera uma hipótese, onde o “vírus“ humano pode jogar de maneira completamente não convencional, e talvez contaminar a base de dados do software de forma a fazer com que o programa aprenda errado. Mas isso é muita viagem. Ou não. Contudo, queremos vencer Cepheus?

Vencer Cepheus pode parecer um trabalho de Sísifo, e espero, esse não deve ser o desafio. É evidente que uma calculadora faz contas mais rápido que você, e em alguns casos, alguns cálculos que você nem tem ideia. Desafio maior é conseguir enxergar Cepheus como um modelo, e não como condição para um jogo perfeito. Quem joga poker online e sente o quão mecânico se torna o clicar de botões, que o diga.

Os modelos não são o jogo em si, mas ferramentas. Ferramentas essas para tentar fazer com que você não jogue exatamente de forma mecânica, mas acima de tudo, crie através delas.

 

 

Fontes: Cartas na Mesa, Cepheus Poker Project – University of Alberta, The Guardian, texto de Sarah Zhang para Gizmodo Brasil. Imagem: Ociacia/Shutterstock (editada)

O improvável futuro possível do poker

No futuro, o poker é uma indústria de escala mundial, não somente nos EUA onde foi seu berço, mas fortemente desenvolvida no resto do globo. Contudo, o principal custo dessa expansão parece ser uma onda conservadora na sociedade, que ainda vê o poker como jogo de azar. Visto este quadro, uma associação mundial, por força de uma pressão de mercado cada vez mais presente, queria provar ao mundo que o jogo de poker consistia essencialmente de habilidade.

Neste futuro, jogadores de poker não são classificados pelos ganhos ao longo da carreira, mas por um sistema de pontuação similar ao xadrez, que os qualifica por um rating. Esse novo modelo atendeu a uma demanda muito solicitada pelos jogadores, pois grandes torneios com fields gigantescos estavam gerando prêmios cada vez maiores aos campeões, que não necessariamente eram os melhores competidores, mas vinham ocupando os primeiros lugares nas listas. Por pelo menos duas décadas este sistema vigorou, e foram selecionados os dez melhores ratings dos últimos anos, que jogariam uma partida que definiria o melhor dentre eles.

Prontamente a mídia verificou que poderia explorar essa oportunidade, e evidentemente, a modalidade torneio foi a escolhida, pois uma mesa de cash game, independentemente da qualidade dos jogadores, não traria o drama e a adrenalina presentes e necessárias para gerar um espetáculo.

Assim que a competição começou, matemáticos e psicólogos foram chamados para comentar, jogadores da velha guarda e teóricos destrinchavam cada mão em busca do jogo perfeito, o apresentador ressaltava a qualidade técnica de cada um, ainda que deixasse clara as suas preferências e julgamentos. Comentários e estratégias que ficavam restritas aos bastidores começaram a ser televisionadas, e a cada transmissão, a quantidade de patrocinadores só aumentava. O jogo e o espetáculo não se diferenciavam mais.

Durante meses, sete torneios foram realizados, um play-off para não deixar dúvidas e, ao final, dois competidores terminaram empatados para o delírio dos espectadores. Foi então realizada uma nova série, agora mano-a-mano, para definir o melhor entre os dois. Acontece que, quando a série chegou ao seu desfecho, o jogador derrotado pediu uma revanche, alegando que o adversário havia recebido um melhor conjunto de cartas durante a disputa. A derrota é sempre amarga, e como o show tem que continuar, o pedido foi atendido. Ao término, o jogador derrotado na primeira série sagrou-se vencedor.

Sem solução para a contenda e com receio de perder público, os organizadores definiram uma nova regra. O heads-up final seria disputado com uma quantidade infinita de fichas e o campeão seria declarado pelo critério de submissão, ou seja, o perdedor teria que anunciar derrota por incapacidade de bater o adversário. Algo difícil de imaginar visto que nenhum jogador admitiria tão facilmente uma derrota neste formato.

Contudo, os dois jogadores toparam, e a nêga durou quase quatro dias seguidos. Com a estafa tomando conta de ambos, o improvável aconteceu e um deles pediu trégua, pois não suportava mais ficar de olhos abertos, não conseguia mais raciocinar e encontrar forças para o embate.

O jogador vencedor foi muito comemorado, finalmente havia o representante de um poker bem jogado, pelo resultado e pelo poder mental e perseverança. Contudo um desafio maior se apresentava, os organizadores levaram o campeão a disputar uma série contra um robô. Um software insistentemente testado numa máquina parruda, que mesmo no futuro, ainda não conseguia gerar o algoritmo que solucionaria o jogo, mas tinha um banco de dados quase incomensurável e uma capacidade de processamento idem.

No desafio contra a máquina, o campeão ganhou três partidas em dez, da metade pra frente da disputa, quando começou a perceber que quanto mais incomuns eram suas jogadas, mais difícil ficava para o computador resolver a partida. Mas neste ponto a mídia não estava mais tão interessada, a bola da vez já era outra, talvez um escândalo, talvez a gostosa da vez, talvez uma guerra televisionada.

O que restou disso tudo foi notar que o espetáculo trouxe mais praticantes para o poker, que máquinas não jogam, apenas fazem cálculos, e que jogadores são simultaneamente falíveis e criativos, e experimentam situações onde o entendimento que cada um tem do outro é um dos inúmeros fatores das vitórias e derrotas. Assim como no passado.

 

Foto: shutterstock (editada)