第4章 HbA1c,グリコアルブミン,血糖の相互変換

4.4) 主成分分析法を用いた総合的血糖コントロール指標

作成日:2018/9/5,最終更新日:2019/1/22

 HbA1cとグリコアルブミンは共に血糖コントロール状態を判定するための標準的な指標で,共に平均血糖に比例する指標です.両指標間には強い相関関係が存在し相互変換も可能ですが,一方で,共に合併症に対する独立した予測因子になっています 1) .つまり,HbA1c値が等しい症例であっても,グリコアルブミン値の高い方が合併症が出やすく,逆に,グリコアルブミン値が等しい症例であっても,HbA1c値の高い方が合併症が出やすいということになります.両者はよく似た指標ですから,両者をうまく組み合わせればもっと良い指標が作れるのではないかと考えられます.この考え方が主成分分析(Principal component analysis)という考え方です.本ページでは主成分分析法を用いて,HbA1cとグリコアルブミンを総合した血糖コントロール指標について述べます.

1.HbA1cとグリコアルブミンに対する主成分分析法の応用

 HbA1cとグリコアルブミンを組み合わせれば,HbA1c単独あるいはグリコアルブミン単独よりも優れた血糖コントロール指標を作ることができます.では,どのように組み合わせれば最善の指標を作ることができるでしょうか?

図1.主成分分析の考え方:元のデータ


図2.主成分分析の考え方:変換したデータ

 主成分分析を行うに当たり最初に注意すべきことは,HbA1cとグリコアルブミンには先に述べたように誤差があることです.誤差の大きさの異なるデータを用いて単純に主成分分析を行うと誤った結果を導くことになります.そこで,次の変換を行い,両軸の誤差が等しくなるように調整します. \begin{align} &X_i = (x_i - \overline{x} ) / ε_x \\ &Y_i = (y_i - \overline{y} ) / ε_y \end{align} ただし,\(\overline{x}\),\(\overline{y}\) はデータ \(\{x_i\}\),\(\{y_i\}\) の平均値,\(ε_x\),\(ε_y\) はデータ \(\{x_i\}\),\(\{y_i\}\) の標準誤差です.このように変換すると,データとX-Y軸は図2のようになり,新しい変数 \(X\),\(Y\) の標準誤差は共に1となります.

 このように変換したうえで,図2に示すように X-Y軸を \(θ\) だけ回転し,最もデータの伸びている方向に軸を合致させます.この新しい軸のうち,最もデータの伸びている方向をZ1軸,これと垂直な方向をZ2軸とします.このようにすると,データ \((X_i,Y_i)\) の新しい座標系における数値 \((Z1_i,Z2_i)\) は \begin{align} &Z1_i = X_i cos θ + Y_i sin θ\\ &Z2_i = - X_i sin θ + Y_i cos θ \end{align} となります.この新しいZ1軸を第1主成分,Z2軸を第2主成分と言いますが,\(Z1\) が合併症に対する最強の予測因子となります.

2.主成分分析法から見た総合的血糖コントロール指標

 では,どのようにすればZ1軸とZ2軸を計算することができるのでしょうか? 主成分分析法の教科書を開いて勉強しなければならないのであれば,とても計算できそうにありませんが,実はこの主成分分析のZ1軸は既に述べたMeasurement Error Model法の回帰直線と一致しています(興味がある人のために,両者が一致することの数学的証明をこのページの次の項に示しました).

図3.HbA1cとグリコアルブミンの主成分分析と両者を総合した血糖コントロール指標



 Measurement Error ModelによるHbA1cとグリコアルブミンの回帰直線は \begin{align} HbA1c = GA × 0.250 + 2.01 \end{align} となっていました.従って,図3に示すように横軸にHbA1c,縦軸にグリコアルブミンを取り,目盛を 1:4 にすると,MEM法の回帰直線は重心を通る45度の直線になります.主成分分析におけるZ1軸はこの回帰直線に一致し,Z2軸はこのZ1軸に垂直な直線になります.このZ1軸が血糖コントロールを表す最善の指標になります.

 これで主成分分析結果が使えるわけですが,上記の結果そのままでは重心(平均点)が原点となるため,対象者が異なると軸の位置が移動する可能性があります.臨床的には,Z1,Z2軸が対象者によって移動すると困りますので,Z1,Z2軸を左下方へ平行移動し,点(2,0)を新しい原点とした方が便利です.このようにすると,図3のZ2軸はZ20 の位置に移動し, \begin{align} Z1 = \frac{HbA1c - 2 + GA × 0.25}{\sqrt{2}} \end{align} が第1主成分となります.この式では,分母が \(\sqrt{2}\) となっていますが,分母を 2 としても主成分分析の意義は変化しませんから,\(z\) を次のように再定義します: \begin{align} z = \frac{HbA1c - 2 + GA × 0.25}{2} \end{align} この \(z\) を修正HbA1c値と呼ぶことにしましょう.修正HbA1cは平均血糖に比例する指標であり,HbA1cとグリコアルブミンを総合した血糖コントロール指標になっています.統計学的な視点からは,修正HbA1cはHbA1c単独あるいはグリコアルブミン単独よりも優れた合併症予測因子になると予測されます.修正HbA1cの有用性については mass study のデータを用いて確認する必要がありますが,興味深い研究テーマになるのではないでしょうか?

3.MEM法の結果と主成分分析法の結果が一致することの数学的証明

 主成分分析の詳しい原理は省略しますが,主成分分析の教科書によると固有値 \(λ\) が \begin{align} λ = \frac{S_{XX} + S_{YY} + \sqrt{(S_{XX} - S_{YY})^2 + 4 S_{XY}^2}}{2} \end{align} となります.\(Z_1\) 軸をX-Y平面上の式で書くと \begin{align} Y = a_P X \end{align} という式になりますが,この式の勾配 \(a_P\) は,上記の \(λ\) を用いて \begin{align} a_P = tan θ = \frac{λ - S_{XX}}{S_{XY}} = \frac{S_{YY} - S_{XX} + \sqrt{(S_{YY} - S_{XX})^2 + 4 S_{XY}^2}}{2S_{XY}} \end{align} となります.ここまでは主成分分析法の教科書のまる写しです.

 この \(Z_1\) 軸を元の \(x\)-\(y\) 平面上の式に変換しましょう.\(x\)-\(y\) 平面上での \(Z_1\) 軸を \begin{align} y = a_{P'} x \end{align} とすると,\(X\),\(Y\) は \(x\),\(y\) と \begin{align} &X = x / ε_x\\ &Y = y / ε_y \end{align} という関係でしたので, \begin{align} a_{P'} = a_P × \frac{ε_y}{ε_x} \end{align} となります.一方,\(S_{XX}\),\(S_{YY}\),\(S_{XY}\) は \begin{align} S_{XX} = S_{xx} / ε_x^2 ,   S_{YY} = S_{yy} / ε_y^2 ,   S_{XY} = S_{xy} / ε_x ε_y \end{align} となっていますから, \begin{align} a_{P'} = \frac{ \frac{S_{yy}}{ε_y^2} - \frac{S_{xx}}{ε_x^2} + \sqrt{ \left( \frac{S_{yy}}{ε_y^2} - \frac{S_{xx}}{ε_x^2} \right)^2 + 4 \left( \frac{S_{xy}}{ε_x ε_y} \right)^2 } } { 2 \frac{S_{xy}}{ε_x ε_y} } × \frac{ε_y}{ε_x} \end{align} となります.従って, \begin{align} μ = ε_y^2 / ε_x^2 \end{align} とすると, \begin{align} a_{P'}=\frac{ S_{yy}-μ S_{xx} + \sqrt{(S_{yy}-μS_{xx} )^2+4μS_{xy}^2 }}{2S_{xy}} \end{align} となって,MEM法と同じ式になります.
 このようにMEM法の結果と主成分分析法の結果が一致するという事実は,MEM法と主成分分析法が統計学的に優れた解析法であること示すものと考えられます.

参考文献

  1. Nathan DM, Paula McGee P, Steffes MW, et al: Relationship of glycated albumin to blood glucose and HbAlc values and to retinopathy, nephropathy, and cardiovascular outcomes in the DCGT/EDIC study. Diabetes 63:282-290, 2014.