ユーザ用ツール

サイト用ツール


prml演習14.17の解答

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
prml演習14.17の解答 [2024/12/11 16:16] – [(ゲート関数が定数の場合)] masahitoprml演習14.17の解答 [2024/12/11 16:26] (現在) – [(ゲート関数が線形分類モデルの場合)] masahito
行 108: 行 108:
  
 ==== (ゲート関数が線形分類モデルの場合) ==== ==== (ゲート関数が線形分類モデルの場合) ====
-<html> +
-<div class="contents">+
 2レベルの線形ロジスティックモデルのゲート関数を用いたHMEモデル 2レベルの線形ロジスティックモデルのゲート関数を用いたHMEモデル
-<div id="canvas2" class="canvas"></div>+ 
 +{{:wiki:14:14.17_2.svg?800}} 
 + 
 +<html> 
 +<div>
 \(\pi_1,\ \pi_2\) は線形ロジスティックモデル、\(\rho_1,\ \rho_2\) も線形ロジスティックモデルとすると \(\pi_1,\ \pi_2\) は線形ロジスティックモデル、\(\rho_1,\ \rho_2\) も線形ロジスティックモデルとすると
 \[ \[
行 121: 行 124:
 \end{align} \end{align}
 \] \]
 +</div>
 +</html>
 +
 である。混合分布は である。混合分布は
 +
 +<html>
 +<div>
 \[ \[
 \begin{align} \begin{align}
行 131: 行 140:
 \end{align} \end{align}
 \] \]
 +</div>
 +</html>
 +
 となる。 となる。
-<br/> 
  
 1レベルの線形ソフトマックスモデルのゲート関数を用いたHMEモデル 1レベルの線形ソフトマックスモデルのゲート関数を用いたHMEモデル
-<div id="canvas3" class="canvas"></div>+ 
 +{{:wiki:14:14.17_3.svg?800}} 
 + 
 +<html> 
 +<div>
 \(\tau_1(\bx),\tau_2(\bx),\tau_3(\bx)\) を線形ソフトマックスモデルとすると \(\tau_1(\bx),\tau_2(\bx),\tau_3(\bx)\) を線形ソフトマックスモデルとすると
 \[ \[
 \tau_k(\bx) = \frac{\exp\l(\bu_k^\T\bx\r)}{\sum_j\exp\l(\bu_j^\T\bx\r)} \tau_k(\bx) = \frac{\exp\l(\bu_k^\T\bx\r)}{\sum_j\exp\l(\bu_j^\T\bx\r)}
 \] \]
 +</div>
 +</html>
  
 である。混合分布は である。混合分布は
 +
 +<html>
 +<div>
 \[ \[
 \begin{align} \begin{align}
行 150: 行 170:
 \end{align} \end{align}
 \] \]
 +</div>
 +</html>
 +
 となる。 となる。
-<br/>+
 上記2つのHMEモデルが等価であると仮定すると \((1) = (2)\) となる。 上記2つのHMEモデルが等価であると仮定すると \((1) = (2)\) となる。
-<br/>+
 また \(p_1,\ p_2,\ p_3\) は独立で \(0\) でないので また \(p_1,\ p_2,\ p_3\) は独立で \(0\) でないので
 +
 +<html>
 +<div>
 \[ \[
 \begin{align} \begin{align}
行 162: 行 188:
 \end{align} \end{align}
 \] \]
 +</div>
 +</html>
 +
 を得る。ここで \(\sigma\l(\bw^\T\bx\r)=W,\ \sigma\l(\bv^\T\bx\r)=V,\ \exp\l(\bu_j^\T\bx\r)=U_j\) と書くと上の連立方程式は を得る。ここで \(\sigma\l(\bw^\T\bx\r)=W,\ \sigma\l(\bv^\T\bx\r)=V,\ \exp\l(\bu_j^\T\bx\r)=U_j\) と書くと上の連立方程式は
 +
 +<html>
 +<div>
 \[ \[
 \begin{align} \begin{align}
行 170: 行 202:
 \end{align} \end{align}
 \] \]
 +</div>
 +</html>
 +
 となる。これより となる。これより
 +
 +<html>
 +<div>
 \[ \[
 \begin{align} \begin{align}
行 178: 行 216:
 \end{align} \end{align}
 \] \]
 +</div>
 +</html>
 +
 よって よって
 +
 +<html>
 +<div>
 \[ \[
 \l(\begin{array}{ccc} \l(\begin{array}{ccc}
行 185: 行 229:
 \l(\begin{array}{c}U_1\\U_2\\U_3\end{array}\r) = \b{0} \l(\begin{array}{c}U_1\\U_2\\U_3\end{array}\r) = \b{0}
 \] \]
 +</div>
 +</html>
 +
 となる。左辺の係数行列の行列式は となる。左辺の係数行列の行列式は
 +
 +<html>
 +<div>
 \[ \[
 \begin{align} \begin{align}
行 193: 行 243:
 \end{align} \end{align}
 \] \]
 +</div>
 +</html>
 +
 なので係数行列は逆行列を持つ。この逆行列を左から掛けて なので係数行列は逆行列を持つ。この逆行列を左から掛けて
 +
 +<html>
 +<div>
 \[ \[
 \pmatrix{U_1\\U_2\\U_3}=\pmatrix{0\\0\\0} \pmatrix{U_1\\U_2\\U_3}=\pmatrix{0\\0\\0}
 \] \]
-を得る。これは \(U_1+U_2+U_3\ne 0\) と矛盾する。よって上記の2つのHMEモデルは等価ではない。よって 
-<br/> 
-2レベルの線形ロジスティックモデルのゲート関数を用いたHMEモデルに等価な<br/> 
-1レベルの線形ソフトマックスモデルのゲート関数を用いたHMEモデルが必ず存在するとはいえない。 
- 
 </div> </div>
 </html> </html>
 +
 +を得る。これは \(U_1+U_2+U_3\ne 0\) と矛盾する。よって上記の2つのHMEモデルは等価ではない。よって \\
 +2レベルの線形ロジスティックモデルのゲート関数を用いたHMEモデルに等価な \\
 +1レベルの線形ソフトマックスモデルのゲート関数を用いたHMEモデルが必ず存在するとはいえない。
 +
  
prml演習14.17の解答.txt · 最終更新: 2024/12/11 16:26 by masahito

特に明示されていない限り、本Wikiの内容は次のライセンスに従います: (C) 2017 Masahito.N
(C) 2017 Masahito.N Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki