[2] 変量
が変量
に正比例することは理論的にわかっているが,比例定数
の値がわからない.そこで,
,
,
のときの
の値を測ったところ,それぞれ
,
,
という測定値を得た.
の値をかりに定めたとき
,
,
をそれぞれ
,
,
に対応する
の測定の誤差とみなす.このとき,
をそれぞれ
(i) 誤差の二乗の和が最小となるように の値を定めよ.
(ii) 誤差の絶対値の和が最小となるように の値を定めよ.
ただし,小数第三位を四捨五入して小数第二位まで求めよ.
本問のテーマ
最小二乗基準による代表値の定義
最小絶対偏差基準による代表値の定義
最小二乗基準による原点を通る回帰直線
最小絶対偏差基準による原点を通る回帰直線
最小絶対偏差基準による代表値の定義
最小二乗基準による原点を通る回帰直線
最小絶対偏差基準による原点を通る回帰直線
2019.04.03記
誤差の二乗和を最小とするのは平均値、誤差の絶対値和を最小とするのは中央値、という統計の初歩の問題なのだが、高校生に統計を必修化させる割りに、代表値をこの観点から教えていないのが問題。
[解答]
(i)
を最小にする
は、
がそれぞれ
個あるときの平均値であるから、
により、
(i)
(ii) を最小にする
は、
がそれぞれ
個あるときの中央値であるから、
により、
2020.04.01記
(うっかり二重に書いていた.1年後に解説を書くと考え方は同じだけど文章がちょっと違う)
[解答]
(i) 誤差の二乗の和は
となるので、
が4個,
が9個,
が16個の合計29個のデータの平均値を考えれば良く,それは



(i) 誤差の二乗の和は
(ii) 誤差の絶対値の和 となるので、
が2個,
が3個,
が4個の合計9個のデータの平均値を考えれば良く,それは
である。
2022.05.03記
本問を比重の問題として,原点を通る回帰直線としても良い.
に対して,
とする.
[別解]
(i)の最小二乗基準における原点を通る直線のあてはめは



の最小化なので,
となり,本問の場合,



となる.
(i)の最小二乗基準における原点を通る直線のあてはめは
の最小化なので,
となる.
(ii)の最小絶対偏差基準おける原点を通る直線のはてはめは
2008年(平成20年)東京大学後期-総合科目II[1]A - [別館]球面倶楽部零八式markIISR
と同様に考えると,必ず原点という仮想データを通るので,もう1つのデータ点を通ることがわかる.
そしてその最小値は,傾きの中央値となることが幾何的にわかる.
傾きは,
,
となるので,その中央値は
から
である.