\(\bz_n\)の更新値\(\bz_n^{new}\)は、\(J\)を最小にする\(\bz_n\)の\(\bmu=\bmu^{new}\)のときの値である。
つまり、\(\pdiff{J}{\bz_n}=\b{0}\) と \(\bmu=\bmu^{new}(\bW,\bz_1,\ldots,\bz_N)\) の交点である。
\[
\small
\begin{align}
\b{0}
&=\pdiff{J}{\bz_n}
=\pdiff{}{\bz_n}\sum_{i=1}^N\|\bx_i-\bmu-\bW\bz_i\|^2 \\
&=\pdiff{}{\bz_n}\|\bx_n-\bmu-\bW\bz_n\|^2 \\
&=\pdiff{}{\bz_n}\{(\bx_n-\bmu-\bW\bz_n)^\T(\bx_n-\bmu-\bW\bz_n)\} \\
&=\pdiff{}{\bz_n}\{
(\bx_n-\bmu)^\T(\bx_n-\bmu)
-2(\bW\bz_n)^\T(\bx_n-\bmu)
+(\bW\bz_n)^\T(\bW\bz_n)\} \\
&=-2\bW^\T(\bx_n-\bmu)+2\bW^\T\bW\bz_n~~~\cmt{※3, ※4} \\
\end{align}
\]
よって
\[
\bW^\T\bW\bz_n = \bW^\T(\bx_n-\bmu)
\]
ここで、\(\bmu = \bmu^{new}=\barx-\bW\barz\)とすると
\[
\begin{align}
\bW^\T\bW\bz_n&=\bW^\T(\bx_n-\barx+\bW\barz) \\
\therefore \bW^\T\bW(\bz_n-\barz)&=\bW^\T(\bx_n-\barx) \\
\end{align}
\]
よって\(\bz_n\)の更新式は
\[
(\bz_n-\barz)^{new}=(\bW^\T\bW)^{-1}(\bx_n-\barx)
\]
となる。ただし
\[
\begin{align}
(\bz_n-\barz)^{new}&=\bz_n^{new}-\barz^{new} \\
\barz^{new}&={1\over N}\l(\bz_n^{new}+\sum_{i=1,i\ne n}^N \bz_i \r)\\
\end{align}
\]
である。が、反復計算において、\(\bz_n, \barz\) を個別に扱うことはなく、必ず \((\bz_n-\barz)\)の形で処理される。また、式中の \(\bW,\bz_{i\ne n}\) は反復の前回値である。
\(n=1,\ldots,N\) について並べて行列表記すると
\[
\small
\begin{align}
\pmatrix{(\bz_1-\barz)^{new}&\cdots&(\bz_N-\barz)^{new}}
&=\pmatrix{(\bW^\T\bW)^{-1}\bW^\T(\bx_1-\barx)&\cdots&(\bW^\T\bW)^{-1}\bW^\T(\bx_N-\barx)} \\
&=(\bW^\T\bW)^{-1}\bW^\T\pmatrix{(\bx_1-\barx)&\cdots&(\bx_N-\barx)} \\
\end{align}
\]
となる。ここで
\[
\begin{align}
\bOmega &= \pmatrix{(\bz_1-\barz)&\cdots&(\bz_N-\barz)} \\
\widetilde\bX &= \pmatrix{(\bx_1-\barx)^\T\\\vdots\\(\bx_N-\barx)^\T} \\
\end{align}
\]
と置くと、
\[
\bOmega^{new} = (\bW^\T\bW)^{-1}\bW^\T\widetilde\bX^\T
\]
となる。ただし \(\bOmega^{new}\) は \(\bOmega\) の \((\bz_n-\barz)\) を \((\bz_n-\barz)^{new}\) としたものである。
この式は、(12.58)で\(\ \E[\bz_n]\ \)を\((\bz_n-\barz)^{new}\)に置き換えたものになっている。