以下の内容はhttps://spherical-harmonics.hatenablog.com/entry/2026/01/21/101152より取得しました。


中点値(midrange)

データ分析において,色々話すときに「最大値と最小値の平均」は割りと用いるのだが,それに名前がついていることを半年ほど前に知った.「中点値(midrange)」と呼ぶらしい.この名前は日本の統計学の本のほとんどに載っていない(自分調べ).

データ x_1,…,x_n に対して,平均値は L_2(a)=\dfrac{1}{n}\displaystyle\sum_{i=1}^n |x_i-a|^2 を最小にする a,中央値は L_1(a)=\dfrac{1}{n}\displaystyle\sum_{i=1}^n |x_i-a| を最小にする a,最頻値は L_0(a)=\dfrac{1}{n}\displaystyle\sum_{i=1}^n |x_i-a|^0(ここでは 0^0=0 とする)を最小にする a として特徴付けられる.ただし最頻値に関しては,各 x_i は一般に異なることが多く,このままでは最頻値を与える a の値が非常に多くなる(x_i が全て異なる場合は,an 個得られる)ので,データを階級 C_1,…,C_K(階級値 c_1,…,c_k) でグループ分けを行い,同じ階級に属するデータを全てその階級値と見做すことによって a の値を絞ることが行わる.つまり L_0(a)=\dfrac{1}{n}\displaystyle\sum_{k=1}^K \# C_k |c_k-a|^0 の最小化によって最頻値を特徴付ける.

データの数を∞にして,階級幅を0に近づける極限において,この最小化が「極大値」に対応するかどうかについては,そのうち考えよう.

ともかく,三つの代表値「平均値(最小二乗基準),中央値(最小絶対偏差基準),最頻値」は高校の統計で学ぶけれど,それ以外に「中点値(チェビシェフ基準,または min-max 基準)」という代表値は日本の統計学の本にはほとんど載っていない.これは L_{\infty}(a)=\max\{ |x_1-a|,…,|x_n-a|\} を最小にする a として特徴付けられ,L_{\infty}(a) を最小にする a は最大値 M=\max\{ x_1,…,x_n\} と最小値 m=\min\{ x_1,…,x_n\}の平均(中点)\dfrac{M+m}{2} になる.そしてその最小値は \dfrac{M-m}{2} となる.

分布が左に偏っている場合,L_k(a)k\geqq 0) を最小にする ak について単調増加であるから,小さい順番に最頻値,中央値,平均値,中点値となり,同様に分布が右に偏っている場合,大きい順番に最頻値,中央値,平均値,中点値となる.

なお,L_{\infty}(a) と添字が \infty となっているのは
\displaystyle\lim_{K\to\infty}\left(\sum_{k=1}^K |x_i|^k\right)^{\tfrac{1}{K}}=\max\{ |x_1|,…,|x_n|\}
が成立することに由来する.




以上の内容はhttps://spherical-harmonics.hatenablog.com/entry/2026/01/21/101152より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14