第4章 HbA1c,グリコアルブミン,血糖の相互変換

4.1) 従来法による回帰分析の問題点とMeasurement Error Model法

作成日:2018/9/5,最終更新日:2019/1/22

 糖尿病患者の血糖管理における最も重要な指標は血糖そのものです.しかし,これまでは日々の詳細な血糖を長期に渡り測ることはできませんでした.このため,これまではHbA1cやグリコアルブミンを用いて血糖コントロール状態を判定してきました.ところが最近,簡便なCGM機器が市販され,日々の血糖を詳細に調べることが可能になってきました.従って,今後,CGM機器で測定された血糖をHbA1cやグリコアルブミンと対比する機会が増えると考えられます.本章では,これら3者の相関関係についてのこれまでの知見をまとめ,基本的な相関関係と相互変換式を確認したいと思います.最初に,従来法による回帰分析の問題点について説明し,次にMeasurement Error Model (測定誤差モデル,観測誤差モデル) を用いた新しい回帰分析法について解説します.

1.HbA1c,グリコアルブミン,血糖間の基本的関係

 HbA1c(IFCC)とグリコアルブミンは基本的には平均血糖に比例する指標です.ただし,HbA1cとしてNGSP値を用いる場合はHbA1c値から2.15%引いた値が血糖値に比例します.従って,これら3者の関係は \begin{align} &HbA1c(IFCC) = AG × β_{1(1)}\\ &HbA1c(NGSP) =AG × β_{1(2)} + 2.15\\ &GA = AG × β_2 \end{align} となります.\(AG\) は先行期間の平均血糖,\(β_{1(1)}\),\(β_{1(2)}\),\(β_2\) はヘモグロビンおよびアルブミンに対する糖化係数です.Hoelzelら 1) によって報告されたように,\(HbA1c(IFCC)\) と \(HbA1c(NGSP)\) の間には \begin{align} HbA1c(NGSP) = HbA1c(IFCC) × 0.914 + 2.15 \end{align} という関係がありますので,\(β_{1(1)}\) と \(β_{1(2)}\) の間には \begin{align} β_{1(2)} = β_{1(1)} × 0.914 \end{align} という関係があります.また,\(HbA1c\) と \(GA\) 間の相互変換式も,同様に, \begin{align} &HbA1c(IFCC) = GA × R_{(1)}\\ &HbA1c(NGSP) = GA × R_{(2)} + 2.15\\ \end{align} となり,\(R_{1}\) と \(R_{2}\) の間には \begin{align} R_{(2)} = R_{(1)} × 0.914 \end{align} という関係があります.現在は,HbA1cとしてNGSP値が用いられているのでこのような配慮が必要になりますが,いずれHbA1cがIFCC値に移行すれば,変換式は簡単になります.問題は,これらの相互変換式をどのようにして決定するかということになります.

2.従来法による回帰分析の考え方

 2つの指標間の関係式を検討する場合,多数の患者データを用いて回帰分析を行い,\(y=ax+b\) という関係を求めるのが普通です.しかし,HbA1c,グリコアルブミン,血糖値の関係をこの方法で解析すると大きな問題が発生します.それは回帰分析法の基本的な考え方に起因しています.

 通常の回帰分析では,独立変数 \(x\) には誤差がないことが前提となっています.ところが,HbA1cやグリコアルブミンに係わらず,臨床データを対象とする場合,\(x\),\(y\) 双方に大きなバラツキが存在するのが普通です.このため,回帰分析を行う際に,どちらを \(x\) 軸にとっても \(x\) 軸には誤差がないという前提を満たすことができません.結果として,通常の回帰分析では,背景にある正しい関係式を得ることができません.この問題は大変重要ですので,以下に詳しく説明します.

図2.\(x\)と\(y\)の間に\(y=ax+b\)という関係があると仮定する

図1.分散したデータから回帰直線を計算する

図4.\(x\)と\(y\)を逆転した場合は正しい相関関係は得られない

図3.\(y\) 方向のみに誤差があると仮定する.データは\(y\)方向に分散する

 回帰分析では,図1に示すようなデータから \(x\)-\(y\) 間の回帰直線を計算します.回帰分析の目的は,図2に示すように \(x\)-\(y\) 間に \(y=ax+b\) という直線的関係があると仮定し,この係数 \(a\) と \(b\) を統計学的に求めることです.通常の回帰分析では \(x\) には誤差がなく,\(y\) にのみ誤差があると仮定します.従って,図3に示すように,データは \(y\) 方向に分散します.この分散の方向性は非常に重要で,図4のように,\(x\),\(y\) を逆転し,\(x=cy+d\) として回帰分析を行っても正しい結果は得られません.
 また,よく誤解されていますが,「\(x\) から \(y\) を推計するためには \(y=ax+b\) を仮定して回帰分析を行うが,逆に \(y\) から \(x\) を推計するためには,\(x=cy+d\) を仮定して回帰分析を行う必要がある」という考え方も間違っています.上に述べたように,回帰分析は,背景に存在する \(x\)-\(y\) 関係を統計学的に推測するための方法です.因果関係は関係ありません.従って,もし \(x\) に誤差がなく,\(y\) にのみ誤差があるのであれば,\(x=cy+d\) として回帰分析を行っても,背景にある正しい \(x\)-\(y\) 関係を導くことはできません.このような場合は,\(y\) から \(x\) を推計する場合も,\(y=ax+b\) を仮定して行った解析結果を用いるのが正しいということになります.

3.\(x\),\(y\) 双方に誤差のあるデータの従来法による回帰分析

 では,\(x\),\(y\) 双方に大きな誤差がある場合はどうすればよいのでしょうか? 双方に誤差があっても,一方の誤差が大きく,他方の誤差が小さい場合は,誤差の小さい方を \(x\),誤差の大きい方を \(y\) とすれば,正しい回帰直線に近い結果を得ることができます.ただし,この場合,誤差の大きさをどのようにして比較するかが問題になります.この比較は,見かけ上の数値の大小で決めるわけではないことに注意が必要です.
 分かりやすく考えるために,データの単位を変えた場合について考えます.例えば,\(x\) 軸が長さである場合,\(x\) の単位を \(m\) から \(cm\) に変えると数値は100倍になり,誤差も100倍になります.しかし,\(x\) 軸の数値を \(m\) で表しても,\(cm\) で表しても回帰分析の結果は同じにならなければなりません.従って,単に数値で比較しても意味はないわけです.\(x\),\(y\) 間の誤差の大きさを比較するためには,データの広がりと比較し,相対的な誤差の大きさを考えることが必要です.統計学的には,\(x\),\(y\) のデータの分布の標準偏差を \(σ_x\),\(σ_y\),標準誤差を \(ε_x\),\(ε_y\) とした場合,\(ε_x^2 / σ_x^2\) と \(ε_y^2 / σ_y^2\) を比較すれば正しく誤差の大きさを比較することができます.

図5.\(x\),\(y\) 双方に誤差がある場合,データは円形に分散する

 では,\(x\),\(y\) 双方の誤差が同程度である場合はどのようにすればよいのでしょうか?分かりやすく考えるため,\(x\),\(y\) の誤差が等しく,互いにランダムに発生する場合を考えます.この場合,図5に示すように,データは元の点の周囲に円形に分散することになります.全体的なデータが \(y=ax+b\) の直線上に正規分布に従って分布する場合,誤差分散によりデータの分布は全体として楕円形に広がります.このようなデータを用い,\(y=ax+b\) と仮定して回帰分析を行うと,回帰直線は \(y\) 軸に平行な直線と楕円との接点(左右に2つある)を通る直線Aとなります.また,\(x=cy+d\) を仮定して回帰分析を行うと,回帰直線は \(x\) 軸に平行な直線と楕円との接点(上下に2つある)を通る直線Bとなります.しかし,正しい \(x\)-\(y\) 関係は楕円の頂点を通る実線Cの関係ですから,通常の回帰分析では正しい \(x\)-\(y\) 関係を得ることはできません.では,どのようにすれば正しい結果を得ることができるのでしょうか?

4.Measurement Error Modelを用いた回帰分析 2)

 \(x\),\(y\) 双方に誤差のある場合の回帰分析の方法については,多数の方法が開発されています.しかし,いずれも数学的に非常に複雑です.その中で最も使いやすい方法の一つに Measurement Error Model (MEM) 法という方法があります.従来法とMEM法の比較を以下に簡潔に記載します.

図6.従来法とMEM法の比較.A) \(x\) を独立変数とした場合の回帰直線,B) \(y\) を独立変数とした場合の回帰直線,C) MEM法で解析した場合の回帰直線

3.1) 従来法による回帰分析

 変数 \(x\),\(y\) 間の回帰直線を \begin{align} y=ax+b\\ \end{align} とすると,通常の回帰分析では,\(a\),\(b\),\(R\)(相関係数)は   \begin{align} &a=\frac{S_{xy}}{S_{xx}}\\ &b=\overline{y}-a \overline{x} \\ &R^2=\frac{S_{xy}^2}{S_{xx} S_{yy}} \end{align} となります.\(\overline{x}\),\(\overline{y}\) は \(\{x_i\}\),\(\{y_i\}\) の平均値,\(S_{xx}\),\(S_{xy}\),\(S_{yy}\) は \begin{align} &S_{xx} = \sum_{i=1}^{n} ( x_{i} - \overline{x} )^2\\ &S_{xy} = \sum_{i=1}^{n} ( x_{i} - \overline{x} )( y_{i} - \overline{y} )\\ &S_{yy} = \sum_{i=1}^{n} ( y_{i} - \overline{y} )^2 \end{align} です.\(n\) はデータ数です.

 回帰係数 \(a\) の標準誤差(以下 \(s[a]\) と書きます)は \begin{align} s[a] = \sqrt{ \frac{ 1-R^2}{n-2} S_{yy} } \end{align} となります.回帰係数が有意であるかどうかは, \begin{align} t = a / s[a] \end{align} とすると,この t 値が自由度 \(n-2\) の t 分布をしますので,t 検定をすれば判定できます.t 値はこのように \(a\) と \(s[a]\) から計算するのが原則ですが,相関係数 \(R\) から次式で直接計算することもできます. \begin{align} t = \sqrt{ (n-2) \frac{R^2}{1-R^2} } \end{align} この t 値を用いて t 検定をすれば結果は同じになります.

 

3.2) MEM法による回帰分析

 MEM法による勾配 \(a\) を \(a_M\) と書くと,\(a_M\) は \begin{align} a_M=\frac{ S_{yy}-μ S_{xx} + \sqrt{(S_{yy}-μS_{xx} )^2+4μS_{xy}^2 }}{2S_{xy}} \end{align} となり,かなり複雑な式になります.\(S_{xx}\),\(S_{xy}\),\(S_{yy}\) は従来法と同じですが,MEM法では \(μ\) というパラメータが入ります.\(μ\) は \begin{align} μ=ε_y^2 / ε_x^2 \end{align} で表わされます.\(ε_x\),\(ε_y\) はデータ \(x_i\),\(y_i\) の測定誤差(標準誤差)で,MEM法の条件は \(μ\) が分かることです.逆に,\(μ\) さえ分かれば,MEM法の数学的な詳細を理解できなくても,上式を用いれば正しく回帰分析を行うことができます.
 MEM法における最も重要なパラメーターは \(μ\) ですが,MEM法で得られる回帰直線は必ず図6に示すように回帰直線AとBの間に入ります.なお,いずれの回帰式も重心 \((\overline{x},\overline{y})\) を通ります.\(μ\) が大きければAに近づき,\(μ\) が小さければBに近づきます.最も極端な場合で \(ε_x=0\) の場合は \(μ=∞\) となり,Aに一致します.また,\(ε_y=0\) の場合は \(μ=0\) となり,Bに一致します.このように,MEM法の結果は \(μ\) で決まります.

 MEM法の場合は \(s[a_M]\) の計算式は非常に複雑になります. \begin{align} &σ_{xx} = \frac{S_{xy}}{(n-1)a }\\ &σ_{uu} = \frac{ S_{yy}+μ S_{xx} - \sqrt{(S_{yy}-μS_{xx} )^2+4μS_{xy}^2 }}{ 2 μ(n-1)} \\ &σ_{uv} = -a σ_{uu}\\ &s_{vv} = (μ + a^2) σ_{uu} \frac{n-1}{n-2} \end{align} とすると,\(a_M\) の標準誤差 \(s[a_M]\) は \begin{align} s[a_M] =\frac{ σ_{xx} s_{vv} + σ_{uu} s_{vv} - σ_{uv}^2 }{ σ_{xx}^2 (n-1) } \end{align} となります.計算が複雑で,私自身も式の意味はよく分かりませんが,パソコンを使えば計算はできます.有意差検定は従来法と同じで t 検定をします.

5.従来法の結果を用いてMEM法で再解析する方法

 MEM法による回帰分析は以上の方法で簡単に実行できます.簡単であっても,データを全て調べ直さなければならないのであれば,すぐに適用することができないことになります.ところが,次のような手順を踏めば,従来法のデータを利用してMEM法による回帰分析をやり直すことができます.

 MEM法の式をよく見ると,\(a_M\) 値は \(S_{xx}\),\(S_{xy}\),\(S_{yy}\) の相対比と\(μ\) が分かれば計算できることが分かります.これら3者の比を \begin{align} S_{xx} : S_{xy} : S_{yy} = 1 : U : V   \end{align} とすると,\(a_M\) は \begin{align} a_M=\frac{ V - μ + \sqrt{(V - μ)^2 + 4μU^2 }}{2U} \end{align} となります.

 従来法による回帰分析の結果が各論文に記載されていますが,それらの結果の中には,必ず,回帰係数 \(a\) と相関係数 \(R\) が記載されています.それらは,\(U\),\(V\) と   \begin{align} &a=U\\ &R^2=U^2 / V \end{align} という関係があります.従って,   \begin{align} &U=a\\ &V=a^2 / R^2 \end{align} となりますので,\(a\) と\(R\) から \(U\) と \(V\) が計算できます.

 残る問題は \(μ\) の推定です.残念ながら \(μ\) の値は従来法の論文には記載されていません.\(μ\) の推定のためには, \(ε_y\) と \(ε_x\) の推計が必要です.もし論文に残存誤差が記載されていれば,それを \(ε_y\) として用いることができます.\(ε_x\) は,多くの場合,何らかの方法で推定することが必要です.ただし,双方の絶対値は必要でなく,相対的な比率が分かれば \(μ\) を計算することができます.多少の誤差があっても \(μ\) が推定できれば,従来法よりはるかに正確な回帰式を得ることができます.

 回帰係数の標準誤差の計算や有意差検定を行いたい場合は,前項の \(s[a_M]\) の式の \(S_{xx}\),\(S_{xy}\),\(S_{yy}\) にそれぞれ 1,\(U\),\(V\) を代入すれば計算できます.

参考文献

  1. Hoelzel W, Weycamp C, Jeppson J-O, et al.: IFCC reference system for measurement of hemoglobin A1c in human blood and the national standardization schemes in the United States, Japan, and Sweden: a method comparison study. Clin Chem 50:166-174, 2004.
  2. Fuller WA: Measurement Error Models. Wiley & Sons Inc. New Jersey, 1987.