以下の内容はhttps://spherical-harmonics.hatenablog.com/entry/2024/06/24/003523より取得しました。


最近話題らしい O 変換と統計におけるデータの標準化

とりあえず本人がまとめた

を引いておけば良いか。

受験数学の恩師に昔、算数の和差算の本質は
x=\dfrac{x+y}{2}+\dfrac{x-y}{2}
y=\dfrac{x+y}{2}-\dfrac{x-y}{2}
という式変形にあるという話を聞いたのだが、このO変換は、それを3文字に拡張した形になっている.

任意の実数 x,y,z に対して
x=\dfrac{x+y+z}{3}+r\cos\theta
y=\dfrac{x+y+z}{3}+r\cos\left(\theta-\dfrac{2\pi}{3}\right)
z=\dfrac{x+y+z}{3}+r\cos\left(\theta+\dfrac{2\pi}{3}\right)
をみたす r,\theta が存在するのでこの置き換えをしようというのがO変換である.

この存在証明もいくつか投稿されているが、

の証明は非常に良き。なお、この証明は実は線形代数の知識を用いると簡単である。
(上記の証明の意味がわかる)

とりあえず平行移動して x+y+z=0 のときに
x=r\cos\theta
y=r\cos\left(\theta-\dfrac{2\pi}{3}\right)
z=r\cos\left(\theta+\dfrac{2\pi}{3}\right)
をみたす r,\theta が存在すれば十分である.文字を置き換えて

x_1+x_2+x_3=0 のときに
x_1=r\cos\theta
x_2=r\cos\left(\theta-\dfrac{2\pi}{3}\right)
x_3=r\cos\left(\theta+\dfrac{2\pi}{3}\right)
をみたす r,\theta が存在することを証明すれば良い.

(i) x_1^2+x_2^2+x_3^2=0 のときは r=0\thetaは任意とすれば良い.

(ii) x_1^2+x_2^2+x_3^2\neq 0 のときは この値を a^2a\gt 0) とおくと
\overrightarrow{x}=\dfrac{1}{a}(x_1,x_2,x_3)^{\top}
\overrightarrow{e}=\dfrac{1}{\sqrt{3}}(1,1,1)^{\top}
\overrightarrow{y}=\vec{e}\times\vec{x}=:\dfrac{1}{a}(y_1,y_2,y_3)^{\top}
とおくと
||\overrightarrow{x}||=||\overrightarrow{e}||=1
\overrightarrow{x}\bullet \overrightarrow{e}=\dfrac{x_1+x_2+x_3}{\sqrt{3}a}=0
であるから,
\overrightarrow{x}\overrightarrow{y}\overrightarrow{e}
は右手系正規直交系をなす.よって3×3行列
(\overrightarrow{x},\overrightarrow{y},\overrightarrow{e})
は直交行列となる(3次元回転行列)。よって行も正規直交となるので
\dfrac{x_1^2+y_1^2}{a^2}+\dfrac{1}{3}=\dfrac{x_2^2+y_2^2}{a^2}+\dfrac{1}{3}=\dfrac{x_3^2+y_3^2}{a^2}+\dfrac{1}{3}
が成立し,よって
x_1^2+y_1^2=x_2^2+y_2^2=x_3^2+y_3^2
となり,複素平面上の3点
x_1+y_1 ix_2+y_2 ix_3+y_3 i
は原点を重心とする正三角形をなす.よって
x_1=r\cos\theta
x_2=r\cos\left(\theta-\dfrac{2\pi}{3}\right)
x_3=r\cos\left(\theta+\dfrac{2\pi}{3}\right)
をみたす r,\theta が存在する.
r=x^2+y^2\theta=\mbox{arg}(x_1+y_1 i) とすれば良い)

ここで具体的に外積を計算すると
y_1=\dfrac{1}{\sqrt{3}}(x_3-x_2)y_2=\dfrac{1}{\sqrt{3}}(x_1-x_3)y_1=\dfrac{1}{\sqrt{3}}(x_2-x_1)
となり,r=\dfrac{\sqrt{2}}{3}\sqrt{(x_1-x_2)^2+(x_2-x_3)^2+(x_3-x_1)^2} となる.

実はこの行列を用いた証明は[別館]に既に書いている.
(2024.10.09追記、その証明は
1993年(平成5年)東京大学後期-数学[2] - [別館]球面倶楽部零八式markIISR
参照)

(2024.07.06修正
この線形代数を用いた証明を利用すれば、4文字の場合のO変換も考えることができる. が、正四面体の頂点の位置を表す表記はおそらく面倒になるだろう(北極を正四面体の1頂点としたときの残りの3頂点の緯度を表す角度は有名角ではないので、あまりメリットはないだろう),と書いたものの緯度を表す角度の余弦は -1/3 なので言う程面倒にはならないことがわかった.
正四面体の頂点の座標として (r,r,r)(r,-r,-r)(-r,r,-r)(-r,-r,r) が選べるのでそんなに面倒な形にはならない.3次元回転はオイラー角度にせよ,ロール・ピッチ・ヨー表示にせよ,3パラメータで回転を表すことになるが,そのうちの最後の回転軸に正射影すると最後の回転は必要ないので2パラメータと r でO変換を表現することができる.

例えば,\dfrac{x+y+z+w}{4}=a とおき,オイラー角表示(の1つの形式)を利用すると
x=a+r(\cos\beta\cos\gamma-\cos\beta\sin\gamma+\sin\beta)
y=a+r(\cos\beta\cos\gamma+\cos\beta\sin\gamma-\sin\beta)
z=a+r(-\cos\beta\cos\gamma-\cos\beta\sin\gamma-\sin\beta)
w=a+r(-\cos\beta\cos\gamma+\cos\beta\sin\gamma+\sin\beta)
が4文字のO変換(の1つ)となる.しかし文字の入り方が美しくない.

正四面体の4頂点を
(0,0,r)\left(r,0,-\dfrac{r}{3}\right)\left(r\cos\dfrac{2\pi}{3},r\sin\dfrac{2\pi}{3},-\dfrac{r}{3}\right)\left(r\cos\dfrac{4\pi}{3},r\sin\dfrac{4\pi}{3},-\dfrac{r}{3}\right)
と表現すると,先程とは別のオイラー角表示により
x=a+r\cos\beta
y=a-\dfrac{r}{3}\cos\beta-r\sin\beta\cos\theta
z=a-\dfrac{r}{3}\cos\beta-r\sin\beta\cos\left(\theta+\dfrac{2\pi}{3}\right)
w=a-\dfrac{r}{3}\cos\beta-r\sin\beta\cos\left(\theta+\dfrac{4\pi}{3}\right)
(この r は先程の r とは異なる)
と表わされることがわかる.こちらの方がO変換としては好まれる形だろう.)

2024.06.24追記
結局、データ x_1,x_2,x_3 に対して
x_k\mapsto u_i=x-\overline{x}
というアファイン変換を行うと、
u_1+u_2+u_3=0
という関係式をみたすので、単位円上の正三角形の重心が0となる性質から
うまく u_k=r\cos\left(\theta+\dfrac{2\pi}{3}(k-1)\right) と置くことができるということ。

この変換のポイントは
x^2+y^2+z^2=3\overline{x}+\dfrac{3}{2}r^2
xy+yz+zx=3\overline{x}-\dfrac{3}{4}r^2
\theta を含まないところにある.

この性質は2つのデータ
u=(u_1,u_2,u_3)^{\top}u_{+}=(u_2,u_3,u_1)^{\top}
u_1+u_2+u_3=0 )のなす角は前者を (1,1,1)^{\top} のまわりに \dfrac{2\pi}{3} 回転すると後者になることから \dfrac{2\pi}{3} となり,また
u_1^2+u_2^2+u_3^2=\dfrac{3}{2}r^2
であるから
u_1u_2+u_2u_3+u_3u_1=\dfrac{3}{2}r^2\cos\dfrac{2\pi}{3}=-\dfrac{3}{4}r^2
となる.よって共分散は
s_{uu_{+}}=\dfrac{u_1u_2+u_2u_3+u_3u_1}{3}-\dfrac{u_1+u_2+u_3}{3}\cdot\dfrac{u_2+u_3+u_1}{3}=-\dfrac{1}{4}r^2
となるので,
x=(x_1,x_2,x_3)^{\top}x_{+}=(x_2,x_3,x_1)^{\top}
の共分散はデータの平行移動に不変であるから
s_{xx_{+}}=-\dfrac{1}{4}r^2
となり
s_{xx_{+}}=\dfrac{x_1x_2+x_2x_3+x_3x_1}{3}-\overline{x}^2=-\dfrac{1}{4}r^2
とから
x_1x_2+x_2x_3+x_3x_1=3\overline{x}^2-\dfrac{3}{4}r^2
となる.

統計で通常用いられる z 変換(z値への変換,データの標準化)は
\sigma=\sqrt{\overline{x^2}-\overline{x}^2}
としたときの
x_k\mapsto z_i=\dfrac{x-\overline{x}}{\sigma}
であるから,v_z=\dfrac{z_1^2+z_2^2+z_3^2}{3}=1 となるように調整されたもので、
先程の v_x=v_u=\dfrac{u_1^2+u_2^2+u_3^2}{3}=\dfrac{r^2}{2}
と比べると \sigma=\dfrac{r}{\sqrt{2}} という関係があることがわかる.

よって O 変換と同等な変換は統計の言葉を用いると
x_1,x_2,x_3 について
x_k\mapsto z_i=\dfrac{x-\overline{x}}{\sigma}
と標準化すると
z_1=\sqrt{2}\cos\theta
z_2=\sqrt{2}\cos\left(\theta+\dfrac{2\pi}{3}\right)
z_3=\sqrt{2}\cos\left(\theta-\dfrac{2\pi}{3}\right)
と置くことができる,ということを意味している.

2024.07.06追記

[問] 3人だが受けた試験において,3人の偏差値のうちの最大値のとりうる値の範囲を求めよ.

[解答]
3人の得点を標準化すると原点中心半径 \sqrt{2} の円周上の3点を軸に正射影すれば良いので,3人の偏差値のうち最大のものを標準化したもののとりうる値の範囲は
\dfrac{\sqrt{2}}{2}\leqq z\leqq \sqrt{2}
である.よって3人の偏差値のうちの最大値のとりうる値の範囲は
50+5\sqrt{2}(≒57.07) 以上 50+10\sqrt{2}(≒64.14) 以下
となる.

[問] 3人だが受けた試験において,3人の得点は等間隔に並んだとする.3人の偏差値を求めよ.

[解答]
3人の得点を標準化すると原点中心半径 \sqrt{2} の円周上の3点を軸に正射影すれば良いので
\sqrt{2}\cos\dfrac{5}{6}\pi\sqrt{2}\cos\dfrac{1}{2}\pi\sqrt{2}\cos\dfrac{1}{6}\pi
つまり
-\dfrac{\sqrt{6}}{2}0\dfrac{\sqrt{6}}{2}
となる.よって3人の偏差値は
50-5\sqrt{6}(≒37.8)5050+5\sqrt{6}(≒62.2)
である.




以上の内容はhttps://spherical-harmonics.hatenablog.com/entry/2024/06/24/003523より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14