統計学第7回
「カテゴリ変数2つの解析」
中澤 港
http://phi.ypu.jp/stat.html
<[email protected]>
フィッシャーの正確な確率の補足説明
クロス集計表を
a
m1-a
m1
n1-a m2-(n1-a) m2
n1
n2
N
とすれば,
周辺度数を固定したときにこの表が得られる確率
は,m1Ca*m2C(n1-a)/NCn1
計算すると,m1!m2!n1!n2!/{a!(m1-a)!(n1-a)!(m2n1+a)!N!}となる。フィッシャーの正確な確率は,それ
より小さな確率が得られる表の確率も全部足したも
のになる(両側検定の場合)ので,計算が大変。
リスクとオッズ
原因と結果にどれくらいの関連があるかを知りた
いとき,原因が無いグループの結果に対して,原
因があるグループの結果がどれくらい大きいかで
評価するという考え方
病気を例にとって説明すると……
病気のリスクとは,全体のうちでその病気を発症
する人の割合
病気のオッズとは,発症した人の発症していない
人に対する人数比
リスク比
リスク比は原因なし群のリスクに対する,原因あり群
のリスクの比。Risk Ratio, Relative Riskなどという。
全体のうちどれくらい発症するかという情報が必要な
ので前向き研究でしか計算できない。
原因の有無と発症が無関係なら1。
2×2のクロス集計表で言えば,
発症あり 発症なし
曝露あり
X
m1-X
m1
曝露なし
Y
m2-Y
m2
n1
n2
N
として,
リスク比は,(X/m1)/(Y/m2) = (X*m2)/(Y*m1)
オッズ比
オッズ比は原因なし群のオッズに対する,原因あり群
のオッズの比。Odds Ratio。
オッズは比なので,断面研究でも患者対照研究でも
計算でき,しかもそれらが数学的に一致する。
原因の有無と発症が無関係なら1(RRと同様)。
2×2のクロス集計表で言えば,
疾病あり 疾病なし
曝露あり
a
b
m1
曝露なし
c
d
m2
n1
n2
N
として,
オッズ比は,(a/b)/(c/d) = (a*d)/(b*c)
関連性の指標の意味
オッズ比はリスク比の良い近似となる。稀な疾患の
場合(一般化していえば,「注目している事象が起こ
る確率がきわめて低い場合」)は,患者対照研究に
よってオッズ比を求める方が効率が良い。
オッズ比やリスク比が統計的に有意かどうかは,そ
の95%信頼区間が1を含むかどうかで決まる。95%信
頼区間は対数変換して正規近似で求めるのが普通
その他の関連性の指標としては,リスク差,相対差,
曝露寄与率,母集団寄与率,YuleのQ,ファイ係数な
どが用いられる。
同じ質問を繰り返して行った場合に同じ答えが返っ
てくるかどうかを見るにはκ係数を使う。
ダウンロード

PowerPointプレゼンテーション(ただし若干フォントがおかしい)