2013年9月30日月曜日

傾向スコアについて

麻酔科勉強会  担当:S先生

「傾向スコアについて」

・臨床研究の目的は、因果推論にある
・そのツールとして統計を用いる
・観察研究と介入研究(実験研究)
  ・観察研究:研究者は介入せず観察する
    →コホート研究 ケースコントロール研究
  ・介入研究:研究者により、治療法が決められるなど
   ある種の実験的介入
    →ランダム化比較試験など
・コホート研究
  ・定義した対象集団から抽出した標本(コホート)を追跡。
  ・観察して事象の発生を記述する。
     ・リスク要因に曝露している群と曝露していない群に分ける。
     ・両群をある期間にわたって追跡する
     ・アウトカムが発生するかどうかを観察する。
     ・曝露群と非曝露群で発生頻度や累積発生率を比較する。
     ・相対リスク、寄与リスクを求めることができる。
・ケースコントロール研究
  ・アウトカムを発生した群(ケース群)を特定し、
   発生しなかった群(コントロール群)を選択する
・バイアスと交絡
  ・観察研究では以下の因子が問題になる
    ・因果関係(研究要因とアウトカムとの関係)
    ・偶然誤差(データ数が小さい場合など)
    ・系統誤差(バイアス、交絡)
  ・因果関係を主張するには・・・
    →偶然誤差、系統誤差の程度を評価する必要がある。
  ・特に交絡が問題
・介入研究
  ・研究者の介入による群間比較
  ・ランダム化を行うと研究の質が上がる。
  ・ランダム化比較試験はバイアスや誤差が入りにくいデザイン
・因果効果の定義と 無作為割り付けの重要性
  ・集団で考えると・・・
  ・E(Yt=0)=ΣYt=0(個体i)/n=処置t=0を与えたときの反応の期待値
  ・E(Yt=1)=ΣYt=1(個体i)/n=処置t=1を与えたときの反応の期待値
    →集団の因果効果の定義は
    →E(Yt=1)ーE(Yt=0)
  ・ただし、同じ集団に異なる処置を同時に行うことはできない
    →因果推論は原理的に不可能
・因果推論の根本問題=欠損値の問題
  ・欠損値問題として捉えれば・・・
     →ランダム割付けにより根本問題を解決
・共変量の調整法
  ・マッチング・層別化
     ・共変量の似ている物を比較
     ・ただし”似ている”の定義はあいまい
     ・共変量が多いと類似するデータが少なくなる
  ・共変量を含めた回帰モデル(共分散 重回帰)
     ・回帰モデルで共変量の影響を調整
     ・モデルの依存度が高い(ロバストが低い)
・傾向スコア(propensity score)
  →両者の良いとこ取りをする
・傾向スコアとは
  →割り付けられやすさの指標
    ・ei = p(t=1|ci)
 ・共変量ベクトルがciの時に処置群に割り当てられる条件付確率
 ・この式は“割付け”と共変量の関係を示す。
    →説明変数と結果変数はでない
 ・一般的にはロジスティック回帰で求める
・傾向スコアでは「割付け」をモデル化
・同じ傾向スコアを持つ患者
  →実際どちらの群に割り付けられたかは偶然による
  →処置以外の効果は無作為化されている
・傾向スコアが一致しているペアをマッチングすると
  →差の平均が因果効果の不偏推定量になることが証明できる。
  →ちょっと難しいけど。。。
・傾向スコアの具体的方法
  ①傾向スコアの計算
    →ロジスティック回帰などから共変量を用いて計算
  ②算出された傾向スコアで調整
     →マッチング、層別解析、IPW推定量
・傾向スコアが共分散分析に比べて優れている点
  ①次元の縮約
   ・傾向スコアは共変量を一次元に縮約している
      →共変量の重なりが少ない場合でも使用できる
  ②モデル依存度の低さ 解析のロバストさ
   ・共変量と結果変数の関係をモデリングしなくてもよい
   ・回帰モデルよりもモデルの誤設定に強い
・傾向スコアの前提条件
  ・「強く無視できる割当て」条件
  ・どちらの群に割り当てられるかは共変量の値にのみ依存
    →結果変数に依存しない
  ・どの対象となっている共変量が上記を満たしているかは
   はっきりしないことが多い。
・前提条件の確認法
  ・割り付けを共変量が説明していることを示す。
    →C統計量など
  ・共変量自体の分布が調整されていることを示す
    →群間での共変量の差がないこと
  ・逆に説明できないor調整されない場合
    →見逃している共変量があることが示唆される
  ・従属変数との因果関係を考えて共変量を選択
    ・処置前かつ結果変数に先行→共変量
    ・処置後かつ結果変数に先行→微妙
    ・処置後かつ結果変数の後になる→共変量ではない
・傾向スコアの限界
  ・2群以上の比較を行う場合
   →2群ごとに傾向スコアを計算することになり母集団がかわる。
  ・マッチング・層別解析では因果効果の推定値は計算できるが、
   標準誤差が計算できない。
  ・マッチングでは「同じ傾向スコア」を持つものをペアにするが、
   連続変数のため完全に一致することは少ない。
   そのためペア選択に恣意性が残る。
  ・マッチングでは多いデータの群で多くのデータが無駄になる。
  「対象者の少ないほうの群の共変量」上での期待値が
   因果効果の推定量になる。