補足.因子分析_回転前後の尤度

 \gdef \vec#1{\boldsymbol{#1}} \\ \gdef \rank {\mathrm{rank}} \\ \gdef \det {\mathrm{det}} \\ \gdef \Bern {\mathrm{Bern}} \\ \gdef \Bin {\mathrm{Bin}} \\ \gdef \Mn {\mathrm{Mn}} \\ \gdef \Cov {\mathrm{Cov}} \\ \gdef \Po {\mathrm{Po}} \\ \gdef \HG {\mathrm{HG}} \\ \gdef \Geo {\mathrm{Geo}}\\ \gdef \N {\mathrm{N}} \\ \gdef \LN {\mathrm{LN}} \\ \gdef \U {\mathrm{U}} \\ \gdef \t {\mathrm{t}} \\ \gdef \F {\mathrm{F}} \\ \gdef \Exp {\mathrm{Exp}} \\ \gdef \Ga {\mathrm{Ga}} \\ \gdef \Be {\mathrm{Be}} \\ \gdef \NB {\mathrm{NB}} \\ \gdef \indep {\mathop{\perp\!\!\!\!\perp}} \\ \gdef \tr {\mathrm{tr}}

モデルやそこで使われてるパラメータ表記は<因子分析>のものを引き継ぐ形とします。


ここでは、斜交回転させた前後で尤度が変化しないことを示します。
直交回転については斜交回転が直交回転を包含するために、斜交回転の場合だけを示せば十分です。


斜交回転とは、潜在変数f\vec f・パラメータΛ\Lambdaに対してある正則行列A  (Rm×m)A ~~ (\in \mathbb{R}^{m \times m})を用いて、
f2=Af0Λ2=Λ0A1\begin{aligned} \vec f_2 &= A \vec f_0 \\ \Lambda_2 &= \Lambda_0 A^{-1} \end{aligned}と変換することでした。


斜交回転前は、
x=μ+Λ0f0+e     (A)\begin{aligned} \vec x = \vec \mu + \Lambda_0 \vec f_0 + \vec e ~~~~~ \mathrm{(A)} \end{aligned}とモデリングしたために、対数尤度関数l(μ,Φ0,Ψ,Λ0)l(\vec \mu, \Phi_0, \Psi, \Lambda_0)は、
l(μ,Φ0,Ψ,Λ0)=n2log(2π)12logΛ0Φ0Λ0+Ψ12tr[(Λ0Φ0Λ0+Ψ)1(xμ)(xμ)]      (A)\begin{aligned} l(\vec \mu, \Phi_0, \Psi, \Lambda_0) &= -\frac{n}{2} \log(2 \pi)-\frac{1}{2} \log | \Lambda_0 \Phi_0 \Lambda_0^{\top} + \Psi |-\frac{1}{2} \tr[ (\Lambda_0 \Phi_0 \Lambda_0^{\top} + \Psi)^{-1} (\vec x-\vec \mu) (\vec x-\vec \mu)^{\top} ] ~~~~~ \mathrm{(A’)} \end{aligned}となりました。


斜交回転後(上記変換後)のパラメータを使って(A)を書き直すと、
x=μ+Λ2f2+e     (B)\begin{aligned} \vec x = \vec \mu + \Lambda_2 \vec f_2 + \vec e ~~~~~ \mathrm{(B)} \end{aligned}と斜交回転前(上記変換前)と同様の形でモデリングできることから(上記(A)\mathrm{(A)}において、Λ0f0=Λ0A1Af0=Λ2f2\Lambda_0 \vec f_0 = \Lambda_0 A^{-1} A \vec f_0 = \Lambda_2 \vec f_2より)、対数尤度関数l(μ,Φ2,Ψ,Λ2)l(\vec \mu, \Phi_2, \Psi, \Lambda_2)は、
l(μ,Φ2,Ψ,Λ2)=n2log(2π)12logΛ2Φ2Λ2+Ψ12tr[(Λ2Φ2Λ2+Ψ)1(xμ)(xμ)]      (B)\begin{aligned} l(\vec \mu, \Phi_2, \Psi, \Lambda_2) &= -\frac{n}{2} \log(2 \pi)-\frac{1}{2} \log | \Lambda_2 \Phi_2 \Lambda_2^{\top} + \Psi |-\frac{1}{2} \tr[ (\Lambda_2 \Phi_2 \Lambda_2^{\top} + \Psi)^{-1} (\vec x-\vec \mu) (\vec x-\vec \mu)^{\top} ] ~~~~~ \mathrm{(B’)} \end{aligned}となります。


(A),(B)\mathrm{(A’),(B’)}のうちΛΦΛ\Lambda \Phi \Lambda^{\top}以外の部分は共通しているので、以下Λ0Φ0Λ0=Λ2Φ2Λ2\Lambda_0 \Phi_0 \Lambda_0^{\top} = \Lambda_2 \Phi_2 \Lambda_2^{\top}を示すことができれば題意は示されます。


よって、以下ではΛ0Φ0Λ0=Λ2Φ2Λ2\Lambda_0 \Phi_0 \Lambda_0^{\top} = \Lambda_2 \Phi_2 \Lambda_2^{\top}を示します。
Λ2Φ2Λ2=(Λ0A1)V[f2](Λ0A1)=(Λ0A1)V[Af0](Λ0A1)=(Λ0A1)AΦ0A(Λ0A1)=(Λ0A1)AΦ0A(A)1Λ0=Λ0Φ0Λ0\begin{aligned} \Lambda_2 \Phi_2 \Lambda_2^{\top} &= (\Lambda_0 A^{-1}) V[f_2] (\Lambda_0 A^{-1})^{\top} \\ &= (\Lambda_0 A^{-1}) V[A \vec f_0] (\Lambda_0 A^{-1})^{\top} \\ &= (\Lambda_0 A^{-1}) A \Phi_0 A^{\top} (\Lambda_0 A^{-1})^{\top} \\ &= (\Lambda_0 A^{-1}) A \Phi_0 A^{\top} (A^{\top})^{-1} \Lambda_0^{\top} \\ &= \Lambda_0 \Phi_0 \Lambda_0^{\top} \end{aligned}


以上より、斜交回転させた前後で尤度が変化しないことが示されました。
(冒頭にも記載しましたが、斜交回転は直交回転を包含するため、直交回転させた前後で尤度が変化しないことも示されたことになります)