以下の内容はhttps://spherical-harmonics.hateblo.jp/entry/Kumadai/1985/Edu_xより取得しました。


1985年(昭和60年)熊本大学-数学(教育学部)[x]

2025.06.07記

[x] 正の実数 a_1a_2b_1b_2mM が関係式
m\leqq\dfrac{b_k}{a_k}\leqq Mk=1,2
をみたすとする.このとき,次の不等式を証明せよ.

(1) b_k^2+mMa_k^2\leqq (m+M)a_kb_kk=1,2

(2) \dfrac{(a_1^2+a_2^2)(b_1^2+b_2^2)}{(a_1b_1+a_2b_2)^2}\leqq\dfrac{(m+M)^2}{4mM}

本問のテーマ
相関係数,回帰直線

2025.06.07記

[解答]
(1) 文字正により,k=1,2m\leqq\dfrac{b_k}{a_k}\leqq M から ma_k\leqq b_k\leqq Ma_k であるから,
b_k^2+mMa_k^2-(m+M)a_kb_k=(b_k-ma_k)(b_k-Ma_k)\leqq 0 である.

(2) (1)により
(b_1^2+b_2^2)+mM(a_1^2+a_2^2)\leqq (m+M)(a_1b_1+a_2b_2)
であるから,AM-GM不等式により
2\sqrt{mM(b_1^2+b_2^2)(a_1^2+a_2^2)}\leqq (m+M)(a_1b_1+a_2b_2)
が成立し,両辺を2乗することにより
\dfrac{(a_1^2+a_2^2)(b_1^2+b_2^2)}{(a_1b_1+a_2b_2)^2}\leqq\dfrac{(m+M)^2}{4mM}
が成立する.

回帰直線

2次元データ (x_1,y_1),…,(x_n,y_n) に対して
L(p,q)=\dfrac{1}{n}\displaystyle\sum_{i=1}^n \{y_i-(px_i+q)\}^2
を最小にする p,q によって定まる直線 Y=pX+qYX への(最小二乗基準による)回帰直線という.

v_x\neq 0 のとき,
L(p,q)=\overline{\{y-(px+q)\}^2}=\{\overline{y}-(p\overline{x}+q)\}^2+v_{y-(px+q)}=\{\overline{y}-(p\overline{x}+q)\}^2+v_{y-px}=\{\overline{y}-(p\overline{x}+q)\}^2+v_y-2ps_{yx}+p^2v_x=\{\overline{y}-(p\overline{x}+q)\}^2+v_x\left(p-\dfrac{s_{xy}}{v_x}\right)^2+\dfrac{v_xv_y-s_{xy}^2}{v_x}
p=\dfrac{s_{xy}}{v_x}q=\overline{y}-\dfrac{s_{xy}}{v_x}\cdot\overline{x} のとき最小となるので,求める回帰直線は
Y=\dfrac{s_{xy}}{v_x}(X-\overline{x})+\overline{y}
となる.

同様に,2次元データ (x_1,y_1),…,(x_n,y_n) に対して
L(p)=\dfrac{1}{n}\displaystyle\sum_{i=1}^n (y_i-px_i)^2
を最小にする p によって定まる直線 Y=pXYX への(最小二乗基準による)原点を通る回帰直線という.\overline{x^2}\neq 0 のとき,
L(p)=\overline{(y-px)^2}=\overline{x^2}\left(p-\dfrac{\overline{xy}}{\overline{x^2}}\right)^2+\dfrac{\overline{x^2}\cdot\overline{y^2}-(\overline{xy})^2}{\overline{x^2}}
p=\dfrac{\overline{xy}}{\overline{x^2}} のとき最小となるので,求める回帰直線は Y=\dfrac{\overline{xy}}{\overline{x^2}}X となる.

これら回帰直線の残差変動とシュワルツの不等式の関係は
コーシー・シュワルツの不等式の有名な証明と回帰直線の残差変動(残差平方和) - 球面倶楽部 零八式 mark II
参照.

では,実質的に[解答]と同じ式変形であるが,意味が見え易い[大人の解答]を行う.統計的な立場からすると m\leqq\dfrac{b_k}{a_k}\leqq Mk=1,2,…,n)なので \dfrac{b_k}{a_k}≒\dfrac{m+M}{2},つまり原点を通る回帰直線として傾きを m,M の平均値としてみた,という話である.

[大人の解答](一般の n の場合)
(2) 2次元データ (a_1,b_1),…,(a_n,b_n) に対して L(p)=\dfrac{1}{n}\displaystyle\sum_{i=1}^n (b_i-pa_i)^2 とおく.

m\leqq\dfrac{b_k}{a_k}\leqq Mk=1,2,…,n)から \dfrac{m-M}{2}\leqq\dfrac{b_k}{a_k}-\dfrac{m+M}{2} \leqq \dfrac{M-m}{2},つまり
\left(\dfrac{b_k}{a_k}-\dfrac{m+M}{2}\right)^2 \leqq \dfrac{(M-m)^2}{4}
となるので,
L\left(\dfrac{m+M}{2}\right)=\overline{\,\left(b-\dfrac{m+M}{2}a\right)^2\,}\leqq \dfrac{(M-m)^2}{4}\cdot \dfrac{1}{n}\displaystyle\sum_{i=1}^n a_i^2=\dfrac{(M-m)^2}{4}\cdot \overline{a^2}
つまり
\overline{b^2}-(m+M)\overline{ab}+\dfrac{(m+M)^2}{4}\overline{a^2}\leqq\dfrac{(M-m)^2}{4}\cdot \overline{a^2}
が成立する.整理して AM-GM 不等式を用いると
(m+M)\overline{ab}\geqq \overline{b^2}+mM\overline{a^2}\geqq 2\sqrt{mM\overline{a^2}\cdot \overline{b^2}}
となるので,二乗して整理すると
\dfrac{\overline{a^2}\cdot\overline{b^2}}{(\overline{ab})^2}\leqq\dfrac{(m+M)^2}{4mM}
となる.

本問の設定において本質的なのは ma_k\leqq b_k\leqq Ma_kmM\geqq 0 の部分だけなので,

2次元データ (x_1,y_1),…,(x_n,y_n) に対して
m(x_k-\overline{x})\leqq y_k-\overline{y}\leqq M(x_k-\overline{x})k=1,2,…,n
なる正の(もしくは同符号の)定数 m,M が存在する(データの重心を通り傾きが m,M の直線の間に全データが挟まれている)とき,x,y相関係数 r_{xy}
r_{xy}^2 \geqq \dfrac{4mM}{(m+M)^2}=\left(\dfrac{A}{G}\right)^2=\left(\dfrac{G}{H}\right)^2=\dfrac{A}{H}
を満たす.ここで A,G,H はそれぞれ m,M の相加平均,相乗平均,調和平均である.

のように本問は一般化される.ここで r_{xy}^2 は決定係数とも呼ばれ,1に近いほどデータの分布の直線度が増すという1つの指標になっている.この点からしても本問の(2)の不等式は不自然である(逆数をとるべき).

この一般化だと x_k-\overline{x} が正にも負にもなり,a_i が常に正である本問との整合性がとれないのではないかと思うかも知れない.このことに気付くのは非常に素晴しいことである.本問との整合性をとるために

2次元データ (a_1,b_1),…,(a_n,b_n) に対して,新たに
2次元データ (-a_1,-b_1),…,(-a_n,-b_n) を付け加えた 2n 個の2次元データについて考えれば \overline{a}=\overline{b}=0 となり,\overline{a^2},\overline{b^2},\overline{ab} は同じ値
となるので,この 2n 個の2次元データを用いれば整合性がとれることになる.

(原点を通る回帰直線を(y 軸に沿う誤差の関数の最小化によって)求める問題において,データ (x_k,y_k)x_k\lt 0 を満たすとき,(x_k,y_k)(-x_k,-y_k) に置き換えても誤差が変わらないので全ての x_k が非負として良く,さらに x_k=0 となる場合の誤差は回帰直線の傾きに依存しないので取り除いて考えても良いので結局,x_k は全て正としても良いことになる.

2025.06.09記
最適な回帰直線と p=\dfrac{m+M}{2} とした回帰直線に対する損失 L の関係は
L\left(\dfrac{m+M}{2}\right)=\overline{a^2}\left(\dfrac{m+M}{2}-\dfrac{\overline{ab}}{\overline{a^2}}\right)^2+\dfrac{\overline{a^2}\cdot\overline{b^2}-(\overline{ab})^2}{\overline{a^2}}
であり,これを \dfrac{(M-m)^2}{4}\cdot \overline{a^2} で評価しているので,
\overline{a^2}\left(\dfrac{m+M}{2}-\dfrac{\overline{ab}}{\overline{a^2}}\right)^2+\dfrac{\overline{a^2}\cdot\overline{b^2}-(\overline{ab})^2}{\overline{a^2}}\leqq \dfrac{(M-m)^2}{4}\cdot \overline{a^2}
整理して
\overline{a^2}\cdot\overline{b^2}-(\overline{ab})^2\leqq \left(\overline{ab}-m\overline{a^2}\right)\left(M\overline{a^2}-\overline{ab}\right)
が成立する.もちろんこの式は \overline{a^2}\neq 0 により
(m+M)\overline{ab}\geqq \overline{b^2}+mM\overline{a^2}
と同値な式であるが,
0\leqq (b_k-ma_k)(Ma_k-b_k)k=1,2,…,n) から
\overline{a^2}\cdot\overline{b^2}-(\overline{ab})^2\leqq \left(\overline{ab}-m\overline{a^2}\right)\left(M\overline{a^2}-\overline{ab}\right)
が導けることになる(だから何だというのはまだ良くわからずとりあえず書いておく).




以上の内容はhttps://spherical-harmonics.hateblo.jp/entry/Kumadai/1985/Edu_xより取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14