2020.09.18記(2026.02.20.17:52記)
抜き出したカードに書かれた数 によって「停止」または「続行」を選択する規則を,そのラウンドにおける戦略という.戦略はラウンドごとに,
または
の値をとる関数
(
,
,
,
)によって,
ならば「続行」,
ならば「停止」と定める.
(1) は
を満たす自然数とする.関数
を
とする.最終ラウンドをのぞくすべてのラウンドで, によって定まる戦略を採用したときの得点の期待値を,
と
で表せ.
(2) ラウンド数 が
のとき,得点の期待値が最大となるような,第
ラウンドでの戦略を与え,そのときの得点の期待値を求めよ.
(3) ラウンド数 が
のとき,得点の期待値が最大となるような,第
ラウンドおよび第
ラウンドでの戦略をそれぞれ与え,そのときの得点の期待値を求めよ.
2026.02.22.16:32記
カードが6枚の場合(サイコロを振る場合)が1977年の京大に出題されています.ある時点の結果が,それ以降の可能性(期待値)と比較して良ければ「停止」,悪ければ「続行」するので,最終ラウンドからさかのぼって考えます.
(1) 最終ラウンドの得点の期待値は,
また,最終ラウンドまで「続行」する確率は であり,よって最終ラウンド以前で「停止」する確率は
である.
以上により,求める期待値は となる.
(2)(3) 最大 (
)ラウンドを行なう場合の期待値の最大値を
とする.最大
ラウンドを行なう場合の第1ラウンドにおける戦略
における
の個数を
とし,第2ラウンド以降は最良の戦略をとるとすると,得点の期待値は
となる.よって を固定した場合に得点の期待値を最大にするには,
となる
の和を最大とすれば良く,その戦略は
である.
このときの得点の期待値は であるから,
が
に一番近い整数のときに得点の期待値は最大となる.
今, であるから,
となり,ラウンド数が
のとき,得点の期待値が最大となる第
ラウンドの戦略は
である.
このときの期待値は となる.よって
となり,ラウンド数が
のとき,得点の期待値が最大となる第
ラウンドの戦略は
である.また,第
ラウンドの戦略はラウンド数が
のときの第
ラウンドの最良な戦略
である.
このときの期待値は である.
ラウンド数 が
のとき,得点の期待値が最大となるような,第
ラウンドの戦略は
であり,ラウンド数が十分大きければ,第
ラウンドの戦略は
となります.実際,
が成立します.