疫学(Epidemiology)
第4回
標本抽出法
誤差やバイアスの制御
中澤
港(内線1453)
<[email protected]>
http://phi.ypu.jp/epidemiology/
第4回講義概要
●
●
これまでも多少触れたが,標本抽出法
について概説し,標本抽出を含むデザ
インによって誤差やバイアスをどのよう
に減らすことができるのかを説明する。
日本疫学会編「疫学」では概ね第17章
と第10章に相当する。
標本抽出法とは?
●
●
●
疫学調査で得られた結果を適用したい集団(
介入研究でいう参照集団にあたる。統計的に
考えるならば母集団)の全数を調査する悉皆
調査は,費用や時間などの制約,あるいはそ
の必要がないなどの理由で実施されないこと
が多い。
その代わりに,集団全体を代表する適当なサ
イズの標本をうまく選んでやればよいことにな
る。
如何にうまく集団全体を代表するような標本を
選ぶかという目的で考案されたさまざまな方法
を総称して標本抽出法と呼ぶ。
なぜ標本抽出するのか?
●
●
●
●
悉皆調査には欠点がある
集団には多様性がある
代表性をもった部分を標本として抽出できれば,
その部分を調べることによって全体の性質を推
測できる(統計的推測の考え方)。
記述疫学では母集団が確定していないと無意
味。分析疫学や介入研究では,必ずしもそうで
はない。
サンプルの種類
●
●
●
●
area sample
cluster sample
grab sample
probability sample (広義のrandom sample)
単純無作為抽出法
●
●
●
まず母集団の全員をリストし連番を割り振る。
乱数表,さいころ,コンピュータなどを使ってラン
ダムな番号を必要な個数選ぶ。例えば,
– 全員に(0,1)の一様乱数を与える
– 小さい順に並べ替える
– 小さい方から必要なところまで対象とする
統計ソフトを使うと簡単。N人からなる母集団か
らp人を抽出するとき,Rならrank(runif(N))の出
力結果の左からp個の番号に当たる人を標本と
すればよい。
層別抽出法
●
●
●
●
●
●
●
年齢別,性別,職業別など,既知の階層毎に単
純無作為抽出する
層によって調査指標が異なることが既知の場合
は単純無作為抽出より代表性がいい
層ごとの集計ができる
サンプリング以前に,階層の情報がわかってい
なければならない(が,予備的にその集団につ
いて階層を調べたりすると,それ自体が本調査
に影響するかもしれない)
階層の出現頻度が事前にはわからない
時間と金がかかる
総サンプル数が決まっている場合,階層毎のサ
ンプル数が減ってしまう
集束抽出法
●
●
●
●
集落抽出法ともいう。Cluster sampling
多段抽出の1つで,最終段階では全数を標本と
する。最終段階の1つ前で選ばれる集団を単位
として抽出する方法と考えられる
途上国の調査ではよく使われる。例えば,複数
の村を含む州の調査などで,村をランダムに選
んで,選ばれた村は全数調べる
比較的安上がりで同意を得やすく短期間で調査
できる場合が多い
確率比例抽出法
●
●
●
Probability Proportionate Sampling (PPS)
母集団が不均質なとき,均質と考えられるブロッ
クに分け,各ブロックの人口に比例した確率でい
くつかのブロックが選ばれた後,各ブロックから
は同数のサンプルを抽出する方法
逆にブロックサイズによらず等確率でいくつかの
ブロックが選ばれた後,各ブロックからそのサイ
ズに比例した数のサンプルを抽出する方法を副
次抽出法という。
標本抽出法の選択
●
●
●
母集団が小さいときは,単純無作為抽出か層別
抽出
母集団が大きいときは,資金が豊富にあれば層
別抽出
母集団が大きく資金が乏しいとかアクセスが悪
いときは多段抽出
標本サイズの計算
●
●
●
表17.2を参照
目的によって計算式が異なる
測定値に関する予測(先行研究などから)が得
られ,有意水準と検出力を決めれば計算できる
誤差
●
●
●
●
●
誤差=真値との差
標本誤差=標本抽出の偶然変動に伴う母集団の
真値との差(標本サイズが大きいほど小さい)
非標本誤差=標本誤差以外の誤差(例えば不適切
な標本抽出による誤差)
ランダムな誤差(偶然誤差)
– ランダムな誤差が小さい=精度(precision)が高
い
系統的な誤差=バイアス
– 研究デザイン,データ収集,分析,レビュー,出
版など,研究のさまざまな段階で起こりうる。
– 系統的な誤差が小さい=正確さ(accuracy)が高
い
バイアス
●
●
●
選択バイアス(selection bias)
– 観察する集団が母集団を正しく代表していない
ときに起こる偏り
情報バイアス(information bias)
– 観察するときに得られる情報が正しくないため
に起こる偏り
交絡バイアス(confounding bias)
– 分析疫学で起こる特殊な偏り。要因と疾病の両
方と関連する交絡因子の存在によって起こる
バイアスの制御
●
●
●
●
無作為化(randomization):ランダムに群分けを
することで介入以外の条件を確率的に均質化
マッチング(matching):交絡因子の条件が似る
ように対照群を選ぶ
層化(stratification):交絡因子のカテゴリ別に解
析することで交絡因子の影響を除く
標準化(standardization):基準集団を決めて交
絡因子のカテゴリ別割合を調整することで交絡
因子の影響を取り除く
ダウンロード

Microsoft Powerpoint 97/2000形式