https://spherical-harmonics.hateblo.jp/entry/Todai/2005/Kouki

2020.09.18記（2026.02.20.17:52記）

[2] $10$ 枚のカードに $1$ から $10$ までの数が $1$ つずつ書かれている．これらのカードを用いた次のようなゲームを考える． $r$ を自然数とする．このゲームは最大 $r$ ラウンドからなり，第1ラウンドから始まる．各ラウンドで，プレーヤーは， $10$ 枚のカードから $1$ 枚のカードを抜き出し，その数を見てから，「停止」または「続行」のいずれかを選択する．「停止」を選択した問題は，そのラウンドでゲームは終了し，最後に抜き出したカードに書かれた数が得点となる．「続行」を選択した場合は，抜き出したカードをもとにもどして，次のラウンドを実行する．最終ラウンドでは，「停止」した選択できず，そのラウンドで抜き出したカードの書かれた数が得点となる．ただし，各ラウンドで，どのカードも等しい確率 $\dfrac{1}{10}$ で抜き出されるものとする．

抜き出したカードに書かれた数 $x$ によって「停止」または「続行」を選択する規則を，そのラウンドにおける戦略という．戦略はラウンドごとに， $0$ または $1$ の値をとる関数 $f(x)$ （ $x=1$ ， $2$ ， $…$ ， $10$ ）によって， $f(x)=0$ ならば「続行」， $f(x)=1$ ならば「停止」と定める．

(1) $k$ は $1\leqq k \lt 10$ を満たす自然数とする．関数 $f_k(x)$ を
$f_k(x)=\begin{cases} 0 & (1\leqq x\leqq k)\\ 1 & (k\lt x\leqq 10)\end{cases}$
とする．最終ラウンドをのぞくすべてのラウンドで， $f_k(x)$ によって定まる戦略を採用したときの得点の期待値を， $r$ と $k$ で表せ．

(2) ラウンド数 $r$ が $2$ のとき，得点の期待値が最大となるような，第 $1$ ラウンドでの戦略を与え，そのときの得点の期待値を求めよ．

(3) ラウンド数 $r$ が $3$ のとき，得点の期待値が最大となるような，第 $1$ ラウンドおよび第 $2$ ラウンドでの戦略をそれぞれ与え，そのときの得点の期待値を求めよ．

2026.02.22.16:32記
カードが6枚の場合（サイコロを振る場合）が1977年の京大に出題されています．ある時点の結果が，それ以降の可能性（期待値）と比較して良ければ「停止」，悪ければ「続行」するので，最終ラウンドからさかのぼって考えます．

[解答]
(1) 最終ラウンドの得点の期待値は， $1$ 〜 $10$ の相加平均 $\dfrac{11}{2}$ であり，最終ラウンド以前に「停止」した場合の期待値は，どのラウンドで「停止」したとしても， $k+1〜10$ の相加平均 $\dfrac{k+11}{2}$ である．

また，最終ラウンドまで「続行」する確率は $\left(\dfrac{k}{10}\right)^{r-1}$ であり，よって最終ラウンド以前で「停止」する確率は $1-\left(\dfrac{k}{10}\right)^{r-1}$ である．

以上により，求める期待値は $\dfrac{11}{2}\left(\dfrac{k}{10}\right)^{r-1}$ $+\dfrac{k+11}{2}\left\{1-\left(\dfrac{k}{10}\right)^{r-1}\right\}$ $=\dfrac{k+11}{2}-\dfrac{k}{2}\left(\dfrac{k}{10}\right)^{r-1}$ となる．

(2)(3) 最大 $r$ （ $r=1，2，…$ ）ラウンドを行なう場合の期待値の最大値を $E_r$ とする．最大 $r+1$ ラウンドを行なう場合の第1ラウンドにおける戦略 $f(x)$ における $0$ の個数を $k$ とし，第2ラウンド以降は最良の戦略をとるとすると，得点の期待値は
$(f(x)=1となるxの和)\cdot\dfrac{10-k}{10}$ $+E_r\cdot\dfrac{k}{10}$
となる．よって $k$ を固定した場合に得点の期待値を最大にするには， $f(x)=1$ となる $x$ の和を最大とすれば良く，その戦略は $f_k(x)$ である．

このときの得点の期待値は $\dfrac{k+11}{2}\cdot\dfrac{10-k}{10}+E_r\cdot\dfrac{k}{10}$ $=-\dfrac{k^2-(2E_r-1)k-110}{20}$ であるから， $k$ が $E_r-\dfrac{1}{2}$ に一番近い整数のときに得点の期待値は最大となる．

今， $E_1=\dfrac{11}{2}$ であるから， $E_1-\dfrac{1}{2}=5$ となり，ラウンド数が $2$ のとき，得点の期待値が最大となる第 $1$ ラウンドの戦略は $f_5(x)$ である．

このときの期待値は $E_2=-\dfrac{5^2+\left\{1-2\cdot\dfrac{11}{2}\right\}\cdot5-110}{20}$ $=\dfrac{27}{4}=6.75$ となる．よって $E_2-\dfrac{1}{2}=6.25$ となり，ラウンド数が $3$ のとき，得点の期待値が最大となる第 $1$ ラウンドの戦略は $f_6(x)$ である．また，第 $2$ ラウンドの戦略はラウンド数が $2$ のときの第 $1$ ラウンドの最良な戦略 $f_5(x)$ である．

このときの期待値は $E_3=-\dfrac{6^2+\left\{1-2\cdot\dfrac{27}{4}\right\}\cdot6-110}{20}=\dfrac{149}{20}=7.45$ である．

ラウンド数 $r$ が $4$ のとき，得点の期待値が最大となるような，第 $1$ ラウンドの戦略は $f_7(x)$ であり，ラウンド数が十分大きければ，第 $1$ ラウンドの戦略は $f_{10}(x)$ となります．実際，
$\displaystyle\displaystyle\lim_{r\to\infty}E_r=10$
が成立します．