※ChatGPT画伯作、”A dramatic scene of a poker game in progress, featuring a player engaged in a Texas Hold’em bluff.”
テキサスホールデムと効用関数
最近になってスマホでできるテキサスホールデムの無料ゲームをポチポチやるようになった(プレイしたことないくせに記事を書いていたのかよ、という話ではあるけれど)。以前の投稿でテキサスホールデムにおけるベット戦略を期待効用理論から決定する方法を述べたが、実際にゲームをやってみて気づいた点を補足的に追記する。
実をいうと、テキサスホールデムでは期待効用関数を最大化するようにベット戦略を決定するという考え方はほとんど用いられていない。期待効用関数ではなく、期待値(EV: Expected Value)を最大化するようにベット戦略を考えるのが通常であるようである。ゲームの性質上、すべてのチップを賭ける(オールイン)ということが頻繁に発生するためであり、Kelly基準やCRRA型効用関数はすべてのチップを失うという状況を避けようとすることから戦略の幅が狭まってしまうからなのかもしれない。
また、キャッシュゲームと異なりトーナメントでは徐々にチップの価値がインフレしていくため、できる限り少ないゲームで多くのチップを奪い取るように戦略を考えなければならない。加えて、トーナメントでは賞金にありつけるのは大体上位10%ぐらいであり、この順位以下では上位11%だろうが最下位だろうが得られる賞金がないという意味では変わらないことになる。そのため、リスク管理など考える必要性があまりなく、いかに対戦相手から多くのチップを奪い取れるかの期待値のみで判断することが合理的であるのかもしれない。
しかし、経済学的に考えると期待値を最大化するようにギャンブルにおけるベット戦略を考えるというのは狂気の沙汰に近いものであると考えられる。例えば、勝率が\(\small p=0.51\)で勝った場合に賭け金が2倍になるギャンブル(bold play)があるとする。このとき、Kelly基準における最適な賭け金比率は
\[ \small f^{\ast} = 2p-1 = 0.02 \]
であった。しかし、期待値を最大化する戦略(リスク中立的な効用関数)においては最適なベット戦略は\(\small f^\ast = 1\)であり、全力ベットが最適解になってしまう。テキサスホールデムにおいて、期待値(EV)を最大化するベット戦略はこれと同じ基準で戦略を決定していることになる。
なぜこのような齟齬が生じるかというと、テキサスホールデムの場合はテーブルの上に置いているチップが軍資金のすべてであるわけではないからだろう。軍資金が1000ドルである場合、テーブルに置くチップは100ドル程度(もっと少ないかもしれない)であり、オールインですべてのチップを失った場合は再度チップを買い直すことでゲームを続行するということになる。このように考えると、オールインで負けた場合の効用関数は\(\small u(\$0)\)ではなく、\(\small u(\$900)\)ということになるのかもしれない。このように考えれば、リスク回避を含めた効用関数をテキサスホールデムに適用することも可能であるだろう。期待値を最大化する戦略はテーブルの上のチップが軍資金に対して無視できるほど小さいという近似に相当する。
テキサスホールデムにおけるナッシュ均衡(GTO戦略)を計算する際は、期待値を最大化するように戦略を構築しているようであるが、この”期待値を最大化する戦略”というものがこの問題における最適解であるという理論的な根拠は一つもないことに気づくだろう。学問における公理や原理と同じであり、理論的な根拠はないけど、普通に考えたらこうした方が良いだろうという雰囲気で定められている前提である考えられる。しかし、経済学的に考えればこの前提は非常に不自然なものであると考えられる。もし、期待値を最大化するナッシュ均衡が導く戦略に不満を感じるようならば、この前提を疑ってみるとよいかもしれない。
補足したかった内容は以上で終わりである。本稿の残りの部分はゲームをプレイしてみた感想をいくつか並べてみようと思う。筆者がやっているゲームはおそらく初心者レベルの人が集まっている(筆者自身も初心者だけど)と思われるので、一般的には当てはまらないかもしれないことは注意しておく。
リンプインの比率が高い
ポーカーの本では、初心者の人たちはリンプイン(ビッグブラインドに相当する賭け金に対してコールすること)する確率が非常に高く、チップを奪う標的にされやすいということが主張される。いくら初心者とはいえ、そういう本の1冊ぐらいは読んでからゲームを始める人も多いだろうから、現実にはリンプインする人は少数派なんじゃないのかなと筆者は思っていた。
実際にゲームをやってみた感想であるが、リンプインをするプレイヤーは非常に多いし、(本を何冊か読んでいるにもかかわらず)筆者自身もなんかリンプインしてしまうのである。読んだ本の教訓をなぜか全く生かせないという謎な現象である・・・多くの本の著者がやるなと言っていることをなぜかみんな平然とやっているということで、非常に不思議に感じる現象でもある。これは第1節で指摘したテーブルの上のチップを軍資金のすべてと思い込んでおり、強気にベットすることを恐れてしまうことに原因があるのかもしれない。
もちろん、反対に本に書かれていることを実践していると推測できるプレイヤーも多数存在している。多くのゲームでFoldする一方で、強い手札が来た場合は積極的にレイズを行い、ベット額をコントロールしようとするプレイヤーである。ゲーム理論に基づいたナッシュ均衡戦略では、タイトアグレッシブというプレイスタイルに近い戦略が推奨されるため、多くの本では初心者はルースパッシブになりがちだから、意識してタイトアグレッシブなプレイスタイルを採用するようにした方が良いと主張される。そのため、タイトアグレッシブなプレイスタイルでゲームを進めるプレイヤーは初心者の中でも一歩進んでいるプレイヤーであると思うかもしれない。しかし、筆者がゲームをしている限りにおいて抱いた感想は次のようなものである。
タイトアグレッシブなプレイヤーは思ったほど強くない
もちろん、適切に運用されているタイトアグレッシブなプレイヤーが弱いということは意味しないが、付け焼刃でそれっぽくやっているタイトアグレッシブなプレイヤーは初心者リンパーと大して変わらないぐらい弱いような印象を受けた。何回かゲームをしていると、教科書通りのタイトアグレッシブなプレイをしているプレイヤーはそれとなく気づかれてしまうような気がするのである。タイトアグレッシブなプレイヤーはほぼ例外なくレイズして強気に出てくるタイミングで強い手札を持っているため、自分が対抗するほど強い手札がなければFoldすればよいということになる。結果として、タイトアグレッシブなプレイヤーは強い手札でも大したチップを獲得できないことになってしまう。
反対に、対抗できるかそれ以上の手札を持っている場合はスロープレイを仕掛けるとベットを勝手に引き上げてくれるので、コールでついていけばよいということになる。タイトアグレッシブなプレイヤーであることに気づかれると、この方法で大きくチップを奪われるというケースが多いように感じた。また、初心者リンパーが結構な天敵で、ほとんどコールしかしないプレイヤーがたまたま強い手札(ストレートやフラッシュ)を持っていることに気づかなく刺されてしまうということもあるように思う。タイトアグレッシブなプレイヤーは強い手札が来るのをチップが少しづつ減っていくのを見ながら忍耐強く待つ必要があるが、”よし来た”というタイミングでスロープレイで刺されてしまい、大きくチップを失うと途方に暮れてしまうかもしれない。
タイトアグレッシブを適切に運用するためには、ゲームへの参加率を意識して高める必要があるのだろう。この場合、微妙な手札の場合でも一定確率で参戦することになるが、この際にアグレッシブなスタイル崩さないように見せないと微妙な手札であることが見抜かれてしまうことになる。結果として、タイトアグレッシブをうまく運用するためには、微妙な手札でも強い手札であるかのように振舞うブラフを効果的に運用する必要が生じる。ただ、このブラフの運用が非常に難しいものである可能性があって、付け焼刃のタイトアグレッシブなプレイヤーがブラフをやると次のような感じになる。
ブラフ合戦
ブラフは上級者のテクニックであり、初心者はほとんど使わないだろうと思うかもしれないが、現実には初心者ばっかりと思われるテーブルでもブラフを多用するプレイヤーは多くいる印象を受ける。ただ、ブラフの使い方が首をかしげたくなるようなものであることがほとんどである。手札や共通カードから役に全くかすりもしないような弱いカードで恐ろしく強気なベットをしてくるということである。もちろん、それでも対戦相手のすべてをFoldさせられれば良いのであるが、現実には次のような現象を頻繁に見かけた。
プリフロップで2人がFoldしてリンプインをしたプレイヤーが4人(そのうちの一人が筆者だったのだけど)いて、フロップ、ターンと進行した結果、全員がチェックしかしないでリバーまで進行したとする。おそらく、全員ろくな役が出来ておらず、筆者も3のワンペアで誰かがレイズしたら降りる気満々でいた。このまま、全員チェックしてショーダウンになりそうだなと思っていたのであるが、リバーで一番最後にベットするプレイヤーが突然20bbのレイズを仕掛けてきた。共通カードの状況からして明らかなブラフであったのであるが、筆者は乗り気になれなくてあっさりFoldした。
奇妙なことであるが、次のプレイヤーが40bbにリレイズした上に、残りの一人がオールインするという形でベットを吊り上げてきた。全員明らかなブラフであり、最後の一人はオールインすれば他の2人を降ろせると踏んだのかもしれない。しかし、結果はそうならず元のレイズを仕掛けたプレイヤーもオールインし、40bbにリレイズしたプレイヤーもオールインするという展開になってしまった。ショーダウンした結果、全員ハイカードであり、勝者になったプレイヤーのキッカーも9みたいな微妙な結果になった。他の二人は64oとか52oでどう見ても勝ち目がないだろうというような手札だった。
そもそも初心者同士でないとそんな状況にならないだろうという話であるが、このブラフに対してブラフで返されたときの反応が合理性を欠いているような気がしてならないのである。ブラフは強い手札を持っていないときに相手をFoldさせる目的で行うが、相手を降ろすことに失敗した場合はさっさと撤退して損切しないといけないし、可能であるかぎりブラフの証拠を見せないようにするためカードを開かないようにしなければならない。オールインをしたプレイヤーがいる時点でショーダウンまで必ず行くため、もはやベットを吊り上げても意味がないし、手札をほかのプレイヤーに見せることになってしまう。このように考えるとオールインをしたプレイヤーが出た時点でブラフは失敗であり、撤退すべきなのかもしれない。
おそらく、現実のブラフはあからさまに弱い手札で行うことはあまり無くて、自分が勝っているか相手が勝っているか微妙な状況で行うことがほとんどなのかもしれない。ブラフするにしても弱すぎる手札では割が合わないように思う。また、ブラフをコールされたりレイズで返されたりするということはブラフであることがばれているか、相手が自分の手札に自信を持っているかのいずれかだろう。ブラフをやる場合は刺客(アサシン)になったつもりで一撃で仕留められなかった場合は、さっさと逃げないと”曲者だ!であえであえ”ということになってしまうのだろう。
最後に、ブラフを好むプレイヤーはテーブルにブラフを多用するプレイヤーが自分一人しかいない場合に、パッシブなプレイヤーが多いと相当な頻度で手札にかかわらず対戦相手を降ろすことができる。しかし、このブラフ好きのプレイヤーがテーブルに複数いると頻繁にブラフ合戦に陥って、弱い手札でショーダウンに持ち込まれた結果チップをすべて失うプレイヤーもよく見る。これが勝算がある手法なのかは筆者はやっていないのでよくわからない。
プリフロップでオールイン
初心者が多いゲームだとリンプインの比率が相当に高いということを書いたが、このリンプインを頻繁にするプレイヤーたち(リンパー)を攻撃する手段として、SBもしくはBBのポジションからいきなりオールインをしてくるプレイヤーというのが一定数いることに気づいた。この場合、リンプインしたプレイヤーは普通Foldして1bb分のチップを回収されることになる。こういった戦略が採られるからリンプインするぐらいならFoldしろということが言われるのかもしれない。また、タイトアグレッシブなプレイヤーから見て嫌な相手というのは、強い手札を隠してわざとリンプインしてくるプレイヤー(トラッピーというらしい)だろう。タイトアグレッシブなプレイヤーを泳がせて後半で逆転を狙ってくるプレイヤーで、こういったプレイヤーを可能な限り排除するための戦略であるのかもしれない。
ただ、面白いのはプリフロップでいきなりオールインされた場合に、Foldせずオールインしてくるプレイヤーも相当数いるということである。しかもショーダウンされたときの手札を見てもそれほど強いものではないことも多い。これはどういう現象なのだろうかと不思議に思うのであるが、リンパーの人たちはレイズやベットをほとんどしないという意味で小心者であるのと同時に負けず嫌いの人達なのかもしれない。要するに、プレイヤーにチップが50~100bbぐらいあるDeep Stackのゲームでプリフロップでオールインしてくるというのは明らかにブラフであるが、見え透いたブラフを許したくないとか、売られた喧嘩は買うぞという人たちなのかもしれない。
結果として、結構な確率でいきなりオールインはすべてのチップを奪われて退席になるということが起きる(もちろん、反対の場合もあるけど)。このように考えると、いきなりオールインでリンパーから小銭をせしめようという戦略はブルドーザーの前で小銭を拾う戦略であり、あまり良い戦略ではないのかもしれない。また、プリフロップからオールインへの具体的な対抗策を書いているポーカーの本もあるため、テーブルの慣れたプレイヤーから狙いをつけられて刺される場合もある。結局リンパーが多い場合は、弱い手札で参戦しているプレイヤーも少なくないので、タイトアグレッシブで強行突破するよりもルースアグレッシブに戦略を変えて、地道に確率が収束するようにした方が無難なのかもしれない。