ギャンブルにおけるKelly基準

確率論

問題設定

 ギャンブルにおけるKelly基準について、Kellyの論文に沿って具体的な計算方法を示していく。Kelly基準は複利運用における資金の平均成長率を最大化するように賭けを行う手法であり、経済学的に言えば対数型の効用関数を最大化することに対応する。金融や投資の理論でもしばしば議論の対象になる内容であるが、ここでは数学的な内容の紹介にとどめる。

 複利運用するギャンブラーの資本の平均成長率を\(\small G\)と表す。初期の資本額を\(\small V_0 \)で表し、\(\small N\)回の賭けの後の資本額を\(\small V_N\)と表す。このとき、

\[ \small G = \lim_{N\rightarrow \infty}\frac{1}{N} \log \frac{V_N}{V_0} \]

と表すことができる。コインの裏表を当てるような単純な2択の賭け(Bold Playといわれる。)を考える。勝利確率を\(\small p\)、負けの確率を\(\small q(=1-p)\)と表す。1回あたりの資本額に対する賭け金の比率を\(\small f\)と表すと、\(\small N\)回の賭けの後の資本額は勝利回数を\(\small W\)、負けの回数を\(\small L\)で表せば

\[ \small V_N = (1+f)^{W}(1-f)^{L}V_0 \]

が成り立つ。ここで、\(\small W+L=N\)である。したがって、

\[ \begin{align*} \small G \; & \small = \lim_{N\rightarrow \infty} \left[\frac{W}{N} \log (1+f) + \frac{L}{N} \log (1-f) \right] \\ & \small = p \log(1+f) + q\log(1-f) \end{align*} \]

を得る。

 資本の平均成長率\(\small G\)が最大になるような賭け金\(\small f\)を求める。素直に微分を求めれば

\[ \small \frac{dG}{df} = p\frac{1}{1+f} – (1-p) \frac{1}{1-f} = 0 \]

であるから、

\[ \small f^{\ast} = 2p-1 = 1-2q \]

を得る。代入すれば、最大の資本の平均成長率\(\small G^{\ast}\)は

\[ \small G^{\ast} = \log2 +p\log p+q \log q \]

と計算できる(Kellyの論文では、対数の底を2で計算しているようで

\[ \small G^{\ast} = 1 +p\log_2 p+q \log_2 q \]

となっているが、等価である考えられる。ここでは、対数の底は自然対数で計算する。)。これと同様の計算を一般のケースについて考える。

オッズがフェアである場合

 競馬やロト6などのくじ(Lottery)のような\(\small n\)個の選択肢があり、その中の一つの選択肢が当選し、当選者に投じられた賭け金を支払うギャンブルを考える(前節のような2択の賭けはSingle Wagerといわれるのに対して、このような賭けはMultiple Wagerといわれる。)。前節のように掛け金の大きさにかかわらず、払い戻し率が変わらない賭けの方式を固定オッズ方式(Fixed odds betting)というが、一般的なギャンブルでは賭け金が多い人気がある選択肢ほど払い戻し率が低くなる賭けの方式が採用されており、パリミュチュエル方式(Parimutuel betting)といわれる。以下では後者の方式を考える。各選択肢の当選確率を\(\small p_1,p_2,\cdots, p_n\)と表し、各選択肢に投じられている賭け金を\(\small A_1,A_2,\cdots,A_n\)と表す。選択肢\(\small i\)が当選した場合、その選択肢に投じた賭け金は

\[ \small \alpha_i = \frac{\sum_{j=1}^n A_j}{A_i} \]

倍で払い戻しされるものとする。このような当選時に返戻される金額の倍率をオッズ(odds)という。オッズから逆算して計算される当選確率を\(\small q_1,q_2,\cdots,q_n\)と表す。すなわち、

\[ \small q_i = \frac{1}{\alpha_i} \]

とする。

 公平な賭け(通貨を1単位投じた場合に返戻される金額の期待値が1であるゲーム)であるためには、

\[ \small p_i \alpha_i = 1, \quad \forall\;i \]

が成り立つ必要がある。言い換えれば、

\[ \small p_i = \frac{1}{\alpha_i} = q_i, \quad \forall\;i \]

である。これはコイントスやサイコロ、ルーレットのように、客観的に当選確率が推定できる場合に対応する。前節同様に、1回あたりの資本額に対する賭け金の比率を\(\small f_1,f_2,\cdots,f_n\)と表し、すべての資本額を賭けなければならないものと仮定する。この場合、ギャンブラーの資本の平均成長率を求めれば

\[ \small G = \sum_{j=1}^n p_j \log f_j \alpha_j = \sum_{j=1}^n p_j \log f_j-\sum_{j=1}^n p_j \log p_j \]

となる。

 資本の平均成長率\(\small G\)が最大になるような資金配分\(\small f_1,f_2,\cdots,f_n\)を求める。最適化問題は

\[ \begin{align*} \small \max \; & \small \sum_{j=1}^n p_j \log f_j-\sum_{j=1}^n p_j \log p_j \\ \small \text{s.t.} \; & \small \sum_{j=1}^n f_j = 1 \end{align*} \]

となる。スラック変数\(\small \lambda\)を導入して、Lagrangianを

\[ \small L(f_1,\cdots, f_n,\lambda) = \small \sum_{j=1}^n p_j \log f_j-\sum_{j=1}^n p_j \log p_j + \lambda \left(1-\sum_{j=1}^n f_j \right) \]

と定義し、Karush-Kuhn-Tucker(KKT)条件を求めれば、

\[ \begin{align*} &\small \frac{\partial L}{\partial f_i} = \frac{p_i}{f_i}-\lambda = 0, \quad \forall \; i \\ &\small \frac{\partial L}{\partial \lambda} = 1-\sum_{j=1}^n f_j = 0 \end{align*} \]

となる。第1式について和を取れば

\[ \small \sum_{i=1}^n p_i = \lambda \sum_{i=1}^n f_i \]

となるが、定義から

\[ \small \sum_{i=1}^n p_i =\sum_{i=1}^n f_i = 1 \]

であるため、\(\small \lambda = 1\)を得る。したがって、最適な資金配分は

\[ \small f_i^{\ast} = p_i = q_i \]

となり、オッズから推定される当選確率に比例するように資金を配分することが最適となる。このときの資本成長率は\(\small G^{\ast} = 0 \)であり、フェアなゲームではいくら賭けを行っても資金を増やすことができないことがわかる。

オッズがフェアでない場合

 前節の議論を競馬のように当選確率が自明でないギャンブルの場合について考える。この場合、自分自身が推定している当選確率\(\small p_i\)とオッズから逆算して計算される当選確率\(\small q_i\)が異なることになる。また、胴元の手数料は無いものと仮定し、賭け金はすべて当選者に払い戻されるものとする。すなわち、

\[ \small \sum_{i=1}^n q_i = \sum_{i=1}^n \frac{1}{\alpha_i} = 1 \]

が成り立つものと仮定する。この場合も前節同様に最適化問題を定めることができて、

\[ \begin{align*} \small \max \; & \small \sum_{j=1}^n p_j \log f_j-\sum_{j=1}^n p_j \log q_j \\ \small \text{s.t.} \; & \small \sum_{j=1}^n f_j = 1 \end{align*} \]

となる。スラック変数\(\small \lambda\)を導入して、Lagrangianを

\[ \small L(f_1,\cdots, f_n,\lambda) = \small \sum_{j=1}^n p_j \log f_j-\sum_{j=1}^n p_j \log q_j + \lambda \left(1-\sum_{j=1}^n f_j \right) \]

と定義し、Karush-Kuhn-Tucker(KKT)条件を求めれば、

\[ \begin{align*} &\small \frac{\partial L}{\partial f_i} = \frac{p_i}{f_i}-\lambda = 0, \quad \forall \; i \\ &\small \frac{\partial L}{\partial \lambda} = 1-\sum_{j=1}^n f_j = 0 \end{align*} \]

であるから、前節と解は同じであり

\[ \small f_i^{\ast} = p_i \neq q_i \]

と求めることができる。この場合、世の中の合意された確率より自分が推定した確率の方が正しいと信じるならば、自分が推定した確率に基づいて賭けの比率を決定するべきであり、オッズから推定される確率は無視するべきとなるだろう。

Track Take(胴元の手数料)がある場合

 一般的なギャンブルでは賭け金がすべてプレイヤーに配分されるということはなく、賭場の主催者の取り分が存在する。Track Take、もしくは、House Edge (House Advantage)と言われており、この率は多くの場合かなりの比率を占める。例えば、競馬や競艇では25%と言われているし、宝くじでは50%とも言われている。日本では、歴史的に賭場はお寺で開催されることが多かったらしく、”テラ(寺)銭”と言われている。これがある場合の最適な賭け金比率を求めよう。

 計算が複雑なので、証明を読んでいるうちに嫌にならないように、最初に具体的な計算方法を示しておく。賭け金の合計のうち、一定比率\(\small 0 < \theta < 1 \)だけ賭場の主催者が手数料を取るのであるから、この場合のオッズは

\[ \small \alpha_i = \frac{(1-\theta)\sum_{j=1}^n A_j}{A_i} \]

と計算される。したがって、\( \small q_i \)の合計値は1にはならず

\[ \small \sum_{i=1}^n q_i = \frac{1}{1-\theta}> 1 \]

が成り立つ。一般性を失うことなく、ギャンブラーにとって有利な選択肢に添え字を並び替えるものとする。すなわち、\( \small p_1 /q_1 > p_2 /q_2 > \cdots > p_n / q_n \)を仮定する。このときのギャンブラーにとっての最適な賭け金比率は

\[ \small t^{\ast} = \arg \min_t \frac{1-\sum_{j=1}^t p_j}{1-\sum_{j=1}^t q_j} \quad s.t. \;\; \sum_{j=1}^t q_j < 1 \]

を満たす\( \small t^{\ast} \)を計算して(ここで、\( \small \arg \min_t f(t) \)は \( \small f(t) \)を最小にする\( \small t \)の値を表す)

\[ \begin{align*} & \small f_i = \max\{p_i-b \; q_i, 0 \} \\ & \small b = \frac{1-\sum_{j=1}^{t^{\ast}} p_j}{1-\sum_{j=1}^{t^{\ast}} q_j} \end{align*} \]

と計算できる。\( \small q_j \)の合計値は1より大きかったのであるから、必ず\( \small t^{\ast} < n \)となる。したがって、この場合相対的に有利ないくつかの選択肢のみに賭け金を投じることになるし、\( \small \sum_{i=1} f_i = 1-b \leq 1 \)であり、資金のうちの一部のみを賭けに投じることになる。

 上記のことを証明しよう。オッズがフェアである場合と異なり、すべての資金を賭けることを正当化できないため、手元に残す資金の比率を\( \small b \)と表す。このとき、ギャンブラーの資本の平均成長率は

\[ \small G = \sum_{j=1}^n p_j \log \left(b+ f_j \alpha_j \right) \]

と表すことができる。Track Takeがない場合同様に、適切な制約条件を設定すれば、最適化問題は

\[ \begin{align*} \small \max_{b, f_1, \cdots, f_n} \; & \small \sum_{j=1}^n p_j \log \left(b+f_j \alpha_j \right) \\ \small \text{s.t.} \; & \small b + \sum_{j=1}^n f_j = 1, \; b \geq 0, \; f_j \geq 0 \; \forall j \end{align*} \]

となる。スラック変数\(\small k,\lambda_1,\cdots,\lambda_n \)を導入して、Lagrangianを

\[ \small L(b, f_1,\cdots, f_n, k, \lambda_1,\cdots,\lambda_n) = \sum_{j=1}^n p_j \log \left(b+ f_j \alpha_j \right) + k \left( 1-b- \sum_{j=1}^n f_j \right) + \sum_{i=1}^n \lambda_i f_i \]

と定義し、Karush-Kuhn-Tucker(KKT)条件を求めれば、

\[ \begin{align*} & \small \frac{\partial L}{\partial f_i} = \frac{p_i \alpha_i}{b+f_i \alpha_i}-k + \lambda_i = 0, \quad \forall \; i \\ & \small \frac{\partial L}{\partial b} = \sum_{j=1}^n \frac{p_j}{b+f_j \alpha_j} – k = 0\\ &\small \frac{\partial L}{\partial k} = 1 -b -\sum_{j=1}^n f_j = 0 \\ & \small \lambda_if_i = 0, \quad \forall \; i \end{align*} \]

となる。ここで、\(\small f_i > 0 \)の場合\( \small \lambda_i = 0 \)、\(\small f_i = 0 \)の場合\( \small \lambda_i > 0 \)でなければならないことに注意する。

 \( \small f_i >0 \)の添え字について、第1式の合計値を計算すると

\[ \begin{align*} \small \sum_{j \in \{i|f_i > 0 \}} p_j & \small = k b \sum_{j \in \{i|f_i > 0 \}} \frac{1}{\alpha_j} + k \sum_{j \in \{i|f_i > 0 \}}f_j \\ & \small = k b \sum_{j \in \{i|f_i > 0 \}} \frac{1}{\alpha_j} + k(1-b) \end{align*} \]

を得る。第2式について、\( \small f_i >0 \)と\( \small f_i =0 \)の添え字を分けて計算すると

\[ \small k b \sum_{j \in \{i|f_i > 0 \}} \frac{1}{\alpha_j} + \left( 1-\sum_{j \in \{i|f_i > 0 \}} p_j \right) = k b \]

が成り立つ。上記の式を代入すると\( \small k = 1 \)を得ることができる。したがって

\[ \small b = \frac{1-\sum_{j \in \{i|f_i > 0 \}} p_j }{1-\sum_{j \in \{i|f_i > 0 \}} \frac{1}{\alpha_j}}= \frac{1-\sum_{j \in \{i|f_i > 0 \}} p_j }{1-\sum_{j \in \{i|f_i > 0 \}} q_j}\]

を得る。KKT条件の第1式に上式を代入して計算すれば

\[ \small f_i = p_i-\frac{b}{\alpha_i} = p_i-b q_i, \quad f_i > 0 \]

を得る。最後に、\( \small f_i > 0 \)となる添え字の決定の仕方であるが、これは\(\small p_i \alpha_i \)が大きい順に定めればよく、かつ、\(\small \sum_j q_j < 1 \)である限りは有利な賭け(期待利得が正)であるから、これを満たす範囲で手元資金\(\small b \)が最小になるように決めてあげればよい。以上により、最初に示した資金配分方法が資本の期待成長率を最大化する戦略であることが証明できた。

参考文献

[1] Ethier, Stewart N. The Doctrine of Chances: Probabilistic Aspects of Gambling. Springer-Verlag, 2010.

[2] Kelly, John L. A New Interpretation of Information Rate. Bell System Technical Journal, 1956.