以下の内容はhttps://spherical-harmonics.hateblo.jp/entry/Kyodai/1963/Bunkei_5より取得しました。


1963年(昭和38年)京都大学-数学(文系)[5]

2026.01.16.15:24:08記

[5] rna は正の既知数であって,r\lt n をみたし,x は未知数である.つぎの不等式を解け.
\displaystyle \left| \dfrac{r-nx}{\sqrt{nx(1-x)}} \right| \lt a

本問のテーマ
母比率の区間推定(Wilson の信頼区間
解の配置

2026.01.19.03:53:04記
与えられた式を整理すると二次不等式が得られますが,与えられた式が定義されるためには 0\lt x\lt 1 でなければいけないので,二次不等式の解と 0\lt x\lt 1 の共通部分が不等式の解となりますが,実は二次不等式の解は区間 0\lt x\lt 1 に含まれます.


二項分布 B(n,x) に従う確率変数 X正規分布で近似する際,Z=\dfrac{X-nx}{\sqrt{nx(1-x)}} が標準正規分布に従うと近似します.
\displaystyle\int_{\tfrac{p}{2}}^{+\infty}\dfrac{1}{\sqrt{2\pi}}e^{-\tfrac{x^2}{2}}\, dx=a
を満たす p を用いて,母比率の信頼率 100(1-p)\% の Wilson の信頼区間(の実現値)は X の実現値 r を用いて
\displaystyle \left| \dfrac{r-nx}{\sqrt{nx(1-x)}} \right| \lt a
から導かれる x の2次不等式を解くことによって得られます.2025年時点での高校数学の統計で習う母比率の信頼区間は Wald の信頼区間と呼ばれているもので,Wilson の信頼区間は習いませんが,どこかの大学で出題される可能性はあるでしょう.

[解答]
\sqrt{nx(1-x)} で割っているので 0\lt x\lt 1 であり,このとき与えられた不等式は (r-nx)^2\lt a^2 nx(1-x),すなわち f(x)=(n+a^2)nx^2-(2r+a^2)nx+r^2\lt 0 と同値となる.

y=f(x) は下に凸な放物線であり,f(0)=r^2\gt 0f(1)=(n-r)^2\gt 0,軸 \dfrac{2r+a^2}{2(n+a^2)}0\lt \dfrac{2r+a^2}{2(n+a^2)}\lt \dfrac{2n+a^2}{2n+2a^2}\lt 1 を満たし,f(x)=0 の判別式は a^2\{a^2n^2+4nr(n-r)\}\gt 0(∵ n\gt r) となるので,f(x)\lt 0 を満たす区間空集合ではなく,かつ区間 0\lt x\lt 1 に含まれる.

よって不等式を解くと
\dfrac{(2r+a^2)n-a\sqrt{a^2n^2+4nr(n-r)}}{2(n+a^2)n}\lt x\lt \dfrac{(2r+a^2)n+a\sqrt{a^2n^2+4nr(n-r)}}{2(n+a^2)n}
となる.

Wald の信頼区間では不等式を \displaystyle \left| \dfrac{r-nx}{\sqrt{n(r/n)(1-(r/n))}} \right| \lt a と近似するので,
\dfrac{r}{n}-a\sqrt{\dfrac{r(n-r)}{n^3}}\lt x\lt \dfrac{r}{n}+a\sqrt{\dfrac{r(n-r)}{n^3}}
という信頼区間が得られます.Wilson の信頼区間において
\dfrac{(2r+0^2)n-a\sqrt{0^2n^2+4nr(n-r)}}{2(n+0^2)n}\lt x\lt \dfrac{(2r+0^2)n+a\sqrt{0^2n^2+4nr(n-r)}}{2(n+0^2)n}
のように一部の a0 に置き換えたものが Wald の信頼区間となっています.

実現値が r のときの最尤推定による点推定の値は x=\dfrac{r}{n} であり,Wald の信頼区間最尤推定量に関して左右対称な区間となっていますが,Wilson の信頼区間最尤推定量に関して左右対称になっていません.\dfrac{2r+a^2}{2(n+a^2)}-\dfrac{r}{n}=\dfrac{(n-2r)a^2}{2n(n+a^2)} ですから,\dfrac{r}{n}\dfrac{1}{2} より小さい場合は右にずれ,大きい場合は左にずれ,ずれの量は \dfrac{r}{n}\dfrac{1}{2} から離れれば離れるほど大きくなることがわかります.

ちなみに n=2r のときの Wald の信頼区間
\dfrac{1}{2}-\dfrac{a}{2\sqrt{n}}\lt x\lt \dfrac{1}{2}+\dfrac{a}{2\sqrt{n}}
となり,Wilson の信頼区間
\dfrac{1}{2}-\dfrac{a}{2\sqrt{n+a^2}}\lt x\lt \dfrac{1}{2}+\dfrac{a}{2\sqrt{n+a^2}}
となります.この場合,Wilson の信頼区間の方が狭くなります.

また,r0 に近づくと Wald の信頼区間は1点 0 に近づきますが,Wilson の信頼区間0\lt x\lt \dfrac{a^2}{n+a^2} に近づくので,この場合,Wilson の信頼区間の方が広くなります.

Wald の信頼区間と Wilson の信頼区間の幅が等しくなるのは
r=\dfrac{n}{2}\left(1\pm \sqrt{\dfrac{n+a^2}{2n+a^2}}\right)
の場合です(計算間違いをしているかも知れません).

このような Wald の信頼区間と Wilson の信頼区間の比較は,一橋の ソーシャル・データサイエンス学部で出されても不思議ではありません,って過去問をちゃんと見ていないので既に出ているかも知れません.




以上の内容はhttps://spherical-harmonics.hateblo.jp/entry/Kyodai/1963/Bunkei_5より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14