O solver pode vencer em NL25? A resposta parece óbvia demais. Claro que pode, né? Mas não estou nada convencido. Claro, estamos falando sobre a winrate depois de pagar o rake; não é tão fácil ultrapassar este limite com o rake. Sim, há muitos regs e amadores fracos neste limite, mas o rake é muito alto.

Vamos tentar abordar o problema logicamente. Discutiremos o rake, os pontos fortes do solver, como ele supera todos os rivais e, em seguida, falaremos sobre as situações em que a winrate do solver será menor do que dos regulares. Vamos compará-lo com os regulares fracos, depois com os fortes, cujas winrates no NL25 são conhecidas por nós. Este é um bom ponto de partida. Em seguida, quero falar sobre por que as pessoas gostam tanto de repetir as ações do solver e por que isso nem sempre é correto. Talvez, eu possa até convencer alguns de vocês a pararem de copiá-lo. Se os treinadores me ouvirem e forçarem os alunos a jogar estritamente de acordo com o solver, eles podem se perguntar por que o fazem: porque é útil para o jogador ou por que é mais fácil? E então daremos um veredicto.

E o rake? Rake é o imposto que pagamos quando ganhamos potes. É igual a uma porcentagem do pote com um limite (cap). No Zoom25 no PokerStars , o cap está em torno de 8bb e a porcentagem é de 5%. Ou seja, quando você ganha um pote padrão de 200 blinds, paga menos de 5%. Em limites mais altos, o cap diminui e a carga se torna um pouco menor. Se você calcular o rake em NL25 em bb/100, ele ficará entre 7,5 e 9 bb. Isso é muito. Provavelmente uma parte dele pode ser recuperada à custa do rakeback, mas vamos esquecer isso por um momento. É muito difícil vencer o jogo com tal rake, mesmo quando você é visivelmente melhor do que o field. Portanto, a questão de saber se o solver pode vencer o rake nesse limite parece aberta para mim.

Claro, agora estou falando de 6-max. Quase todas as mãos são jogadas lá, o botão é foldado em apenas 15% das mãos e nos 85% restantes você pode usar a vantagem de posição. No 6-max, entramos no pote com muito menos frequência. Se o seu VPIP estiver em torno de 22%, isso significa que 70 a 80 vezes em 100 você simplesmente desistirá de suas cartas. A winrate será menor em comparação com o heads-up.

Encontramo-nos num mundo hostil desde o início: de um lado, rakes altos, do outro, a necessidade de desistir de muitas mãos antes do flop. E enquanto um solver que joga uma estratégia de equilíbrio de Nash inexplorável não perderá, por definição, para as pessoas, independentemente do rake, não há garantia de que ele terá números positivos depois de pagar o rake.

De que maneira um solver é superior a um ser humano? Primeiro, em equilíbrio e não em exploração. Não há buracos em sua estratégia, todas as frequências são perfeitas. Nenhuma quantidade de ajustes ajudará você a aumentar suas expectativas contra ele. Seu algoritmo é baseado no equilíbrio (claro, você pode criar um bot que joga com um estilo de exploração, mas estamos falando especificamente sobre o solver GTO). Sua força é que, mesmo que você conheça exatamente sua estratégia, nenhum ajuste o ajudará a aumentar as apostas contra você.

Qual a importância disso na prática? Quão valioso é que o oponente não possa explorá-lo, mesmo conhecendo sua estratégia em todas as suas nuances? Se quiser, pense nisso. Na minha opinião, não trará nenhum benefício. Mesmo que houvesse vulnerabilidades na estratégia do solver, as pessoas nunca as revelariam.

Em segundo lugar, o solver seleciona as linhas com o EV máximo com muito mais precisão. Se o GTO considerar uma c-bet em uma textura específica com uma mão específica como um erro, o solver não cometerá esse erro. Se uma mão tiver valor de showdown suficiente para não blefar no turn, o solver não blefará. Uma vez no river, com um bluff catcher tendo um blocker ruim, ele não pagará a aposta do oponente.

É valioso. Mas o valor da infalibilidade não é absoluto. É claro que o bot terá um resultado muito melhor do que o fish, que comete erros graves e caros. Porém, quando comparamos o ideal do solver com as soluções dos regulares break even, que aprenderam muito bem a evitar erros óbvios, quem disse que a diferença será tão grande? Eu ouço suas reclamações: “Que absurdo! Claro, o solver terá muito mais resultado!” Eu quero bancar o advogado do diabo e discutir com uma declaração tão trivial.

A precisão ideal de um solver em situações extremas são pequenos golpes na grande tela do jogo. Os grandes golpes são soluções simples e óbvias, bem como um blefe atrevido!

Movimentos contundentes contra certos tipos de jogadores têm um impacto muito maior na winrate do que ajustes finos baseados em blockers e outras sutilezas teóricas. Diante de um fish em tilt que perdeu a capacidade de desistir, o solver fará algo que nenhum reg faria: em resposta a uma aposta do pote no turn, ele fará check-raise e vai all-in no river, não apenas com valor , mas também com blefes. Claro, seu valor recuperará todo o EV perdido por blefe, mas o ponto aqui é que não apenas um reg forte, mas também um regular razoavelmente mediano jogará seu valor da mesma maneira, mas desacelerará com blefes. Duvido que o jogo livre de erros do solver lhe dê tantos ganhos contra fishes quanto um regular obteria com suas em suas mesas fracas. Este é o meu principal argumento.

39405-1679509295.jpg

Eu adoraria saber sempre a linha teórica ideal e o EV para cada ação durante a mão, mas não acho que muitas pequenas vantagens superem algumas grandes vantagens de contra fishes. No NL25, o dinheiro vem de jogadores fracos. É por isso que a seleção de mesa desempenha um papel fundamental nesse limite. É por isso que Garrett Adelstein teve um desempenho tão bom nas mesas do Hustler, porque ele jogava em uma mesa cheia de jogadores recreativos. Não é por acaso que os bons regulares são tão obcecados com a seleção de mesas. Como mostraram os cálculos no meu grupo do Discord, um jogador perdedor adiciona 5-8 bb/100 à winrate do resto. Isso é mais do que qualquer vantagem que um reg superior pode obter sobre um reg fraco.

O solver jogará com mais precisão do que os regulares, mas nunca perderá o equilíbrio. Um regular, jogando contra um peixe, fará muito mais desvios positivos do que negativos. Quando me sento em uma mesa zoom200 ou zoom500 com quatro regs e um fish, faço ajustes muito grandes contra os fishes que provavelmente serão lucrativos. Não consigo calcular, mas intuitivamente me parece que esses ajustes afetarão mais a winrate do que a precisão do solver.

Eu sei pela prática de treinamento que um regular fraco joga com uma winrate de -2...-3bb/100, às vezes até -5bb/100. Os regs mais fortes no limite o vencem com uma winrate de 3-4bb/100; as winrates em NL25 são muito difíceis de obter sem uma escolha boa de mesas e uma compreensão muito boa dos oponentes fracos, embora isso também seja possível. Portanto, a diferença entre regs fracos e fortes não é tão grande: 6-7bb/100 máx.

Ao mesmo tempo, mesmo um regular fraco obviamente jogará muitos potes grandes contra fishes desequilibrados com mais eficiência do que um solver.

Quando eu lancei esse tópico no Twitter, o seguinte contra-argumento sempre surgia: o solver esmagará os oponentes porque blefará com muito mais frequência e força, forçando as pessoas a cometer erros caros. Concordo em parte, mas não acho que eles vão ganhar potes pequenos o bastante nas primeiras streets e não acho que a abordagem em grandes potes será a melhor, acho ruim, na verdade. Por outro lado, existem potes pequenos com os quais os amadores costumam jogar muito mal, e os regs exploram essa fraqueza com muito mais frequência do que o solver. Então, outra questão é quem vai ganhar mais sem confronto: um solver ou um bom regular?

Talvez, você não ache que meus argumentos sejam convincentes o suficiente e continue acreditando que o solver destruiria NL25. Talvez você tenha duvidado e pense que há algo nisso.. Mas por que as pessoas estão tão preocupadas com o sucesso hipotético do solver? Por que é tão difícil para eles aceitar a possibilidade de que a máquina não vença o rake? Nos comentários, muitos entraram na fase de negação total sem argumentos sérios. Não quero ofender ninguém, mas não vejo de onde virão os EVs extras para compensar a falta de um hard exploit.

Provavelmente, o ponto é que as pessoas acham muito atraente chegar a um jogo vencedor simplesmente copiando as linhas do solver. No entanto, este é um conceito prejudicial e equivocado, que aconselho você a se livrar o mais rápido possível. As pessoas tendem a procurar apoio confiável para se proteger do caos. A incerteza é assustadora. Precisamos de ordem e estamos buscando proteção do solver. Porém, pense por si mesmo: usar a estratégia que um robô usa contra uma estratégia que ninguém usa contra nós pode gerar a máxima expectativa? Se você der uma resposta positiva, simplesmente não entendo sua lógica. Parece ser apenas uma questão de fé.

Não me interpretem mal. Não negligencio a teoria. Eu acho essa teoria incrível, que legal! Passei anos aprendendo com um solver como o poker funciona. Mas jogar em uma mesa real é um caos e deve ser aceito como é. Cada mão jogamos contra um adversário com uma estratégia específica, não contra a máquina que treinamos ontem à noite. E nossa tarefa é entender rapidamente suas diferenças.

Por fim, analisemos os dados empíricos. Não, eu não joguei 100.000 mãos com uma assistência GTO, isso seria antiético. No entanto, tenho dados de treinamento no GTO Wizard onde as respostas do jogador podem ser comparadas com as linhas do solver: o programa calcula a diferença em EV. Acredite ou não, conheço pessoas que não conseguem vencer o NL5, mas são fãs do GTO e estão muito perto de resolver as suas linhas, suas decisões são apenas 2-3bb/100 piores do que software! Parece que estar perto do GTO tem pouco efeito na sua winrate prática.

Também olhei alguns regulares breakeven ou perto disso de Zoom 500. Seus resultados no GTO Wizard eram quase indistinguíveis daqueles no solver. Portanto, estando no lugar, o solver jogaria apenas microscopicamente melhor. Provavelmente, o solver não ganharia na Zoom 500 depois do rake.

Então, se colocassem uma arma na minha cabeça e me perguntassem: o solver pode bater NL25? Eu diria com 70% de certeza: não!