データ分析において,色々話すときに「最大値と最小値の平均」は割りと用いるのだが,それに名前がついていることを半年ほど前に知った.「中点値(midrange)」と呼ぶらしい.この名前は日本の統計学の本のほとんどに載っていない(自分調べ).
データ に対して,平均値は
を最小にする
,中央値は
を最小にする
,最頻値は
(ここでは
とする)を最小にする
として特徴付けられる.ただし最頻値に関しては,各
は一般に異なることが多く,このままでは最頻値を与える
の値が非常に多くなる(
が全て異なる場合は,
が
個得られる)ので,データを階級
(階級値
) でグループ分けを行い,同じ階級に属するデータを全てその階級値と見做すことによって
の値を絞ることが行わる.つまり
の最小化によって最頻値を特徴付ける.
データの数を∞にして,階級幅を0に近づける極限において,この最小化が「極大値」に対応するかどうかについては,そのうち考えよう.
ともかく,三つの代表値「平均値(最小二乗基準),中央値(最小絶対偏差基準),最頻値」は高校の統計で学ぶけれど,それ以外に「中点値(チェビシェフ基準,または min-max 基準)」という代表値は日本の統計学の本にはほとんど載っていない.これは を最小にする
として特徴付けられ,
を最小にする
は最大値
と最小値
の平均(中点)
になる.そしてその最小値は
となる.
分布が左に偏っている場合,(
) を最小にする
は
について単調増加であるから,小さい順番に最頻値,中央値,平均値,中点値となり,同様に分布が右に偏っている場合,大きい順番に最頻値,中央値,平均値,中点値となる.
なお, と添字が
となっているのは
が成立することに由来する.