HbA1cとグリコアルブミンは共に血糖コントロール状態を判定するための標準的な指標で,共に平均血糖に比例する指標です.両指標間には強い相関関係が存在し相互変換も可能ですが,一方で,共に合併症に対する独立した予測因子になっています 1) .つまり,HbA1c値が等しい症例であっても,グリコアルブミン値の高い方が合併症が出やすく,逆に,グリコアルブミン値が等しい症例であっても,HbA1c値の高い方が合併症が出やすいということになります.両者はよく似た指標ですから,両者をうまく組み合わせればもっと良い指標が作れるのではないかと考えられます.この考え方が主成分分析(Principal component analysis)という考え方です.本ページでは主成分分析法を用いて,HbA1cとグリコアルブミンを総合した血糖コントロール指標について述べます.
HbA1cとグリコアルブミンを組み合わせれば,HbA1c単独あるいはグリコアルブミン単独よりも優れた血糖コントロール指標を作ることができます.では,どのように組み合わせれば最善の指標を作ることができるでしょうか?
図1.主成分分析の考え方:元のデータ
図2.主成分分析の考え方:変換したデータ
このように変換したうえで,図2に示すように X-Y軸を \(θ\) だけ回転し,最もデータの伸びている方向に軸を合致させます.この新しい軸のうち,最もデータの伸びている方向をZ1軸,これと垂直な方向をZ2軸とします.このようにすると,データ \((X_i,Y_i)\) の新しい座標系における数値 \((Z1_i,Z2_i)\) は \begin{align} &Z1_i = X_i cos θ + Y_i sin θ\\ &Z2_i = - X_i sin θ + Y_i cos θ \end{align} となります.この新しいZ1軸を第1主成分,Z2軸を第2主成分と言いますが,\(Z1\) が合併症に対する最強の予測因子となります.
では,どのようにすればZ1軸とZ2軸を計算することができるのでしょうか? 主成分分析法の教科書を開いて勉強しなければならないのであれば,とても計算できそうにありませんが,実はこの主成分分析のZ1軸は既に述べたMeasurement Error Model法の回帰直線と一致しています(興味がある人のために,両者が一致することの数学的証明をこのページの次の項に示しました).
図3.HbA1cとグリコアルブミンの主成分分析と両者を総合した血糖コントロール指標
これで主成分分析結果が使えるわけですが,上記の結果そのままでは重心(平均点)が原点となるため,対象者が異なると軸の位置が移動する可能性があります.臨床的には,Z1,Z2軸が対象者によって移動すると困りますので,Z1,Z2軸を左下方へ平行移動し,点(2,0)を新しい原点とした方が便利です.このようにすると,図3のZ2軸はZ20 の位置に移動し, \begin{align} Z1 = \frac{HbA1c - 2 + GA × 0.25}{\sqrt{2}} \end{align} が第1主成分となります.この式では,分母が \(\sqrt{2}\) となっていますが,分母を 2 としても主成分分析の意義は変化しませんから,\(z\) を次のように再定義します: \begin{align} z = \frac{HbA1c - 2 + GA × 0.25}{2} \end{align} この \(z\) を修正HbA1c値と呼ぶことにしましょう.修正HbA1cは平均血糖に比例する指標であり,HbA1cとグリコアルブミンを総合した血糖コントロール指標になっています.統計学的な視点からは,修正HbA1cはHbA1c単独あるいはグリコアルブミン単独よりも優れた合併症予測因子になると予測されます.修正HbA1cの有用性については mass study のデータを用いて確認する必要がありますが,興味深い研究テーマになるのではないでしょうか?
主成分分析の詳しい原理は省略しますが,主成分分析の教科書によると固有値 \(λ\) が \begin{align} λ = \frac{S_{XX} + S_{YY} + \sqrt{(S_{XX} - S_{YY})^2 + 4 S_{XY}^2}}{2} \end{align} となります.\(Z_1\) 軸をX-Y平面上の式で書くと \begin{align} Y = a_P X \end{align} という式になりますが,この式の勾配 \(a_P\) は,上記の \(λ\) を用いて \begin{align} a_P = tan θ = \frac{λ - S_{XX}}{S_{XY}} = \frac{S_{YY} - S_{XX} + \sqrt{(S_{YY} - S_{XX})^2 + 4 S_{XY}^2}}{2S_{XY}} \end{align} となります.ここまでは主成分分析法の教科書のまる写しです.
この \(Z_1\) 軸を元の \(x\)-\(y\) 平面上の式に変換しましょう.\(x\)-\(y\) 平面上での \(Z_1\) 軸を
\begin{align}
y = a_{P'} x
\end{align}
とすると,\(X\),\(Y\) は \(x\),\(y\) と
\begin{align}
&X = x / ε_x\\
&Y = y / ε_y
\end{align}
という関係でしたので,
\begin{align}
a_{P'} = a_P × \frac{ε_y}{ε_x}
\end{align}
となります.一方,\(S_{XX}\),\(S_{YY}\),\(S_{XY}\) は
\begin{align}
S_{XX} = S_{xx} / ε_x^2 ,
S_{YY} = S_{yy} / ε_y^2 ,
S_{XY} = S_{xy} / ε_x ε_y
\end{align}
となっていますから,
\begin{align}
a_{P'} =
\frac{
\frac{S_{yy}}{ε_y^2} - \frac{S_{xx}}{ε_x^2}
+ \sqrt{
\left(
\frac{S_{yy}}{ε_y^2} - \frac{S_{xx}}{ε_x^2}
\right)^2
+ 4 \left( \frac{S_{xy}}{ε_x ε_y} \right)^2
}
}
{ 2 \frac{S_{xy}}{ε_x ε_y} }
× \frac{ε_y}{ε_x}
\end{align}
となります.従って,
\begin{align}
μ = ε_y^2 / ε_x^2
\end{align}
とすると,
\begin{align}
a_{P'}=\frac{ S_{yy}-μ S_{xx} + \sqrt{(S_{yy}-μS_{xx} )^2+4μS_{xy}^2 }}{2S_{xy}}
\end{align}
となって,MEM法と同じ式になります.
このようにMEM法の結果と主成分分析法の結果が一致するという事実は,MEM法と主成分分析法が統計学的に優れた解析法であること示すものと考えられます.