前回は分布を定義した。
その中で、分布の値は比例尺度であり、本質的に同じ分布が複数あることに言及した。
今回はその対処を考えることで確率分布を定義する。
相似な分布
「分布が本質的に同じである」ということをもう少しちゃんと定義するために、相似な分布というものを定義する。
確率変数に対して2つの分布
を考える。
この2つの分布に対して、ある正の実数
が存在し、任意の
について
が成り立つとき、
と
は相似であるといい、
と表記することにする。
記号で表現すると、以下の通り:
なお、これは独自の定義なので、他の統計の本ではたぶん出てこない。
の記号はよく使われてるけど。
(これは実際に上記の相似の定義と同じになっている)
前回のサイコロの例だと、と
は相似になっている
(
とすればいい)。
一方で、
とすると、は
や
とは相似になっていない。
条件を満たすような
が存在しないことは簡単に分かる。
さて、上のように相似を定義すると、次のことがすぐに言える:
命題
分布の相似は同値関係である。
証明は簡単なので省略。
また、相似な分布は本質的に同じ分布であることが次の命題から分かる:
命題
確率変数の2つの分布
について、
とする。このとき、
について
が成り立つ。
証明
なので、ある
が存在し、任意の
に対して
となる。よって、
規格化と確率分布
定義から分かるとおり、相似な分布はいくらでも作れる(適当に定数倍すればいい)ので、その相似な分布の集まりを代表するような分布を1つ考えたい。 そのときパッと思いつくのは、分布の値を全部足し合わせた値を1として基準にする方法。
今、確率変数の分布
に対して
であると仮定する。
このとき、確率分布
を次のように定義する:
上記のように分布から確率分布を得ることを規格化といい、分布に掛けた定数のことを規格化定数と呼ぶ。
のとき
であるので、確率分布は規格化定数が1であるような分布であるとも言える。
さて、確率分布が相似な分布の集まりの代表として使えることは、次の命題から言える:
命題
確率変数の2つの分布
を規格化した確率分布がそれぞれ
であるとする。
このとき、
である。
証明
とする。
ならば、ある
が存在して
なので、
よって、
逆に、ならば
であり
なので、
とすれば
である。
規格化の例
サイコロの例
規格化の例として、先程のサイコロの例を考えてみる。
サイコロの出目の分布に対する確率分布
は、規格化定数が
なので、
となる。
また、分布については、規格化定数が
でありなので、分布
は確率分布でもあることが分かる。
長さの例
別の例として、前回の、長さ1cmのものを測ったときの例も考えてみる。
この例では観測値を確率変数であるとし、その分布は
であると考えた。
これを規格化した確率分布は、
であるので規格化定数は10であり、
となる。
今日はここまで!