以下の内容はhttps://spherical-harmonics.hateblo.jp/entry/Todai/2005/Kouki_2より取得しました。


2005年(平成17年)東京大学後期-数学[2]

2020.09.18記(2026.02.20.17:52記)

[2] 10 枚のカードに 1 から 10 までの数が 1 つずつ書かれている.これらのカードを用いた次のようなゲームを考える.r を自然数とする.このゲームは最大 r ラウンドからなり,第1ラウンドから始まる.各ラウンドで,プレーヤーは,10 枚のカードから 1 枚のカードを抜き出し,その数を見てから,「停止」または「続行」のいずれかを選択する.「停止」を選択した問題は,そのラウンドでゲームは終了し,最後に抜き出したカードに書かれた数が得点となる.「続行」を選択した場合は,抜き出したカードをもとにもどして,次のラウンドを実行する.最終ラウンドでは,「停止」した選択できず,そのラウンドで抜き出したカードの書かれた数が得点となる.ただし,各ラウンドで,どのカードも等しい確率 \dfrac{1}{10} で抜き出されるものとする.

抜き出したカードに書かれた数 x によって「停止」または「続行」を選択する規則を,そのラウンドにおける戦略という.戦略はラウンドごとに,0 または 1 の値をとる関数 f(x)x=12…10 )によって,f(x)=0 ならば「続行」,f(x)=1 ならば「停止」と定める.

(1) k1\leqq k \lt 10 を満たす自然数とする.関数 f_k(x)
f_k(x)=\begin{cases} 0 & (1\leqq x\leqq k)\\ 1 & (k\lt x\leqq 10)\end{cases}
とする.最終ラウンドをのぞくすべてのラウンドで,f_k(x) によって定まる戦略を採用したときの得点の期待値を,rk で表せ.

(2) ラウンド数 r2 のとき,得点の期待値が最大となるような,第 1 ラウンドでの戦略を与え,そのときの得点の期待値を求めよ.

(3) ラウンド数 r3 のとき,得点の期待値が最大となるような,第 1 ラウンドおよび第 2 ラウンドでの戦略をそれぞれ与え,そのときの得点の期待値を求めよ.

2026.02.22.16:32記
カードが6枚の場合(サイコロを振る場合)が1977年の京大に出題されています.ある時点の結果が,それ以降の可能性(期待値)と比較して良ければ「停止」,悪ければ「続行」するので,最終ラウンドからさかのぼって考えます.

[解答]
(1) 最終ラウンドの得点の期待値は,110 の相加平均 \dfrac{11}{2} であり,最終ラウンド以前に「停止」した場合の期待値は,どのラウンドで「停止」したとしても,k+1〜10 の相加平均 \dfrac{k+11}{2} である.

また,最終ラウンドまで「続行」する確率は \left(\dfrac{k}{10}\right)^{r-1} であり,よって最終ラウンド以前で「停止」する確率は 1-\left(\dfrac{k}{10}\right)^{r-1} である.

以上により,求める期待値は \dfrac{11}{2}\left(\dfrac{k}{10}\right)^{r-1}+\dfrac{k+11}{2}\left\{1-\left(\dfrac{k}{10}\right)^{r-1}\right\}=\dfrac{k+11}{2}-\dfrac{k}{2}\left(\dfrac{k}{10}\right)^{r-1} となる.

(2)(3) 最大 rr=1,2,…)ラウンドを行なう場合の期待値の最大値を E_r とする.最大 r+1 ラウンドを行なう場合の第1ラウンドにおける戦略 f(x) における 0 の個数を k とし,第2ラウンド以降は最良の戦略をとるとすると,得点の期待値は
(f(x)=1となるxの和)\cdot\dfrac{10-k}{10}+E_r\cdot\dfrac{k}{10}
となる.よって k を固定した場合に得点の期待値を最大にするには,f(x)=1 となる x の和を最大とすれば良く,その戦略は f_k(x) である.

このときの得点の期待値は \dfrac{k+11}{2}\cdot\dfrac{10-k}{10}+E_r\cdot\dfrac{k}{10}=-\dfrac{k^2-(2E_r-1)k-110}{20} であるから,kE_r-\dfrac{1}{2} に一番近い整数のときに得点の期待値は最大となる.

今, E_1=\dfrac{11}{2} であるから,E_1-\dfrac{1}{2}=5 となり,ラウンド数が 2 のとき,得点の期待値が最大となる第 1 ラウンドの戦略は f_5(x) である.

このときの期待値は E_2=-\dfrac{5^2+\left\{1-2\cdot\dfrac{11}{2}\right\}\cdot5-110}{20}=\dfrac{27}{4}=6.75 となる.よって E_2-\dfrac{1}{2}=6.25 となり,ラウンド数が 3 のとき,得点の期待値が最大となる第 1 ラウンドの戦略は f_6(x) である.また,第 2 ラウンドの戦略はラウンド数が 2 のときの第 1 ラウンドの最良な戦略 f_5(x) である.

このときの期待値は E_3=-\dfrac{6^2+\left\{1-2\cdot\dfrac{27}{4}\right\}\cdot6-110}{20}=\dfrac{149}{20}=7.45 である.

ラウンド数 r4 のとき,得点の期待値が最大となるような,第 1 ラウンドの戦略は f_7(x) であり,ラウンド数が十分大きければ,第 1 ラウンドの戦略は f_{10}(x) となります.実際,
\displaystyle\displaystyle\lim_{r\to\infty}E_r=10
が成立します.




以上の内容はhttps://spherical-harmonics.hateblo.jp/entry/Todai/2005/Kouki_2より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14