対立仮説下でのみ存在する
遺伝形式という母数を持つ
2x3分割表検定に関する考察
~SNPによるケース・コントロール関連検定~
京都生物統計セミナー(KBS京都)
2009/11/10
京都大学医学・生命科学総合研究棟
京都大学大学院医学研究科附属ゲノム医学センター統計遺伝学分野
山田 亮
遺伝子DNA
mRNA
タンパク質
分子機能
形質
DNA
mRNA2
mRNA1
Peptide3
Peptide1
Peptide2
Molecule3
Molecule1
Phenotype1
Molecule4
Molecule2
Phenotype2
Phenotype3
Phenotype4
Association study with DNA-markers
Susceptible
DNA-mRNA-Protein relation is not straight, but
comparison between DNA variations and phenotype
variations bypassing mRNA/proteins simplifies the
analysis structure.
Non-susceptible
父由来
母由来
ディプロイド
優性遺伝・劣性遺伝
父由来 母由来 父由来 母由来 父由来 母由来 父由来 母由来
優性遺伝・劣性遺伝
ヘテロ
ホモ1
ホモ2
父由来 母由来 父由来 母由来 父由来 母由来 父由来 母由来
アレルコピー数
2 0
0 2
1 1
形質比
優性遺伝形式
1:0
1:0
0:1
劣性遺伝形式
1:0
0:1
0:1
優性遺伝・劣性遺伝
父由来 母由来 父由来 母由来 父由来 母由来 父由来 母由来
アレルコピー数
2 0
0 2
1 1
形質比
優性遺伝形式
1:0
1:0
0:1
劣性遺伝形式
1:0
0:1
0:1
湿性耳垢は優性
が2つか1つで湿性
乾性耳垢は優性
が2つで乾性
複合遺伝性疾患と閾値モデル
Complex genetic traits and threshold model
X non-risk homozygoutes
Heritability = 0.6
Vall=Vg+Ve; Vg=0.6
VlocusX=0.6x0.01
Allele freq of X = 0.4
HWE
Phenocopy = 0.2
X heterozygoutes
Prevalence = 0.01
RR(homo1vs homo2) =1.71
RR(hetero vs homo2) = 1.29
X homozygoutes
多型
SNPのケース・コントロール解析
AA
Aa
aa
和
ケース
r1
r2
r3
R
コント
ロール
s1
s2
s3
S
和
t1
t2
t3
T
SNPのケース・コントロール解析
•
ジェノタイプ(AA Aa aa)の違いはケースになる
リスクに影響するか?
•
リスクアレルはあるか?
•
ヘテロだからこそ、という可能性を見るか、ヘ
テロはホモ1とホモ2の間と見るか
– ? Risk(AA) >= Risk(Aa) >= Risk(aa) ?
SNPのケース・コントロール解析
1. リスクアレルはあるか?
•
A (もしくは a) はケースになるリスクをもたらすか?
2. 遺伝形式は何か?
•
•
•
AA Aa は aa に比べてケースになるリスクを増やすがそ
の強弱はどうか?
2の問いは1の問いでAがリスクをもたらすこ
とを前提としている
2の母数は1に関する対立仮説下でのみ存
在する
遺伝形式という対立仮説下でのみ存在
する(局外)母数を持つ
2x3分割表検定に関する考察
~SNPによるケース・コントロール関連検定~
•
対立仮説
–
–
•
リスクアレルはある
Risk(A)>Risk(a)
局外母数 k には範囲がある
–
–
–
Risk(Aa)=k Risk(AA) +(1-k) Risk(aa); 0<=k<=1
k=1 : 優性
k=0 : 劣性
道具を導入
2x3分割表の幾何表現
• n1+n2+...+nk=N; ni>=0
• 正(k-1)次元単体
• k-1次元空間上のk本
の相互に「対等な」ベ
クトルが
cos (-1)(-1/(k-1))
なる角をなして作る
AA
Pop1 r1
Pop2 s1
t1
和
Aa
r2
s2
t2
aa
r3
s3
t3
和
R
S
T
R
t1
t2
S
t3
AA
Aa
aa
和
Pop1
r1
r2
r3
R
Pop2
s1
s2
s3
S
和
t1
t2
t3
T
t2
t3
t1
• Pop1の正三角形と
Pop2の正三角形は
• R,Sに比例した大きさで
• 独立帰無仮説の点を中
心に
• 点対称で配置され
• 3カテゴリ(AA,Aa,aa)は
それぞれ2/3pの角で交
わる向きに、幅t1,t2,t3
を与えている
• 面積を計算して、テーブル数
を計算する
• この正三角形の面積は
0
1
• テーブル数は
N-2
N-1
N
0
1
2
N-1
N
周辺度数から、とりうるテーブル数
を幾何的に計算
単位正三角形は高さ1
N: テーブル数
A: 多角形の面積
L: 多角形の周長
9057
52040
61097
20005
300012
320017
10014
78009
88023
39076
430061
469137
7億6352万5503
SNPのケース・コントロール解析
1. リスクアレルはあるか?
•
A (もしくは a) はケースになるリスクをもたらすか?
2. 遺伝形式は何か?
•
•
•
AA Aa は aa に比べてケースになるリスクを増やすがそ
の強弱はどうか?
2の問いは1の問いでAがリスクをもたらすこ
とを前提としている
2の母数は1に関する対立仮説下でのみ存
在する
AA
Pop1 r1
Pop2 s1
t1
和
Aa
r2
s2
t2
aa
r3
s3
t3
和
R
S
T
• 検定手法いくつか
–
–
–
–
3独立カテゴリについての2群間の独立性検定
優性形式検定
劣性形式検定
Armitage-Cockran トレンド 検定~線形重み付けトレンド検定
自由度2カイ自乗統計量
3独立カテゴリについての2群間の独立性検定
10
20
30
等高線は楕円
をθ回転したもの
a
b
θ
Aa
<x,y> : 内積
ei : 3方向の単位ベクトル
a
AA
AA
Pop1 r1
Pop2 s1
t1
和
Aa
r2
s2
t2
aa
r3
s3
t3
和
R
S
T
• 検定手法いくつか
–
–
–
–
3独立カテゴリについての2群間の独立性検定
優性形式検定
劣性形式検定
Armitage-Cockran トレンド 検定~線形重み付けトレンド検定
AA
Pop1 r1
Pop2 s1
t1
和
t2 + t3
劣性 自由度1
Aa
r2
s2
t2
aa
r3
s3
t3
t1
和
R
S
T
r1, s1 が等しければ、同
じ検定結果
AA
Pop1 r1
Pop2 s1
t1
和
Aa
r2
s2
t2
aa
r3
s3
t3
優性 自由度1
r3, s3 が等しければ、同
じ検定結果
和
R
S
T
AA
Pop1 r1
Pop2 s1
t1
和
Aa
r2
s2
t2
aa
r3
s3
t3
和
R
S
T
線形トレンド 自由度1
r2, s2 が等しいライン
2r1+r2, 2s1+s2が等しけ
れば、同じ検定結果
=
r1-r3, s1-s3が等しけれ
ば、同じ検定結果
3カテゴリ 自由度2
劣性 自由度1
線形トレンド 自由度1
優性 自由度1
3カテゴリ 自由度2
劣性 自由度1
劣性検定カイ自乗値は、3カテゴリ検定
カイ自乗値の「接線」
自由度2の検定値楕円に
引いた3接線は、3つの異
なる自由度1の検定統計
量に対応していた。
接線は楕円の全周に引け
る。
3本の接線は、ホモとヘテ
ロのリスク比に対応づけら
れる。
接線は自由度2検定で帰
無仮説が成立しないときに
のみ値を持つ母数である。
「興味ある」接線はどれ
か?
複合遺伝性疾患と閾値モデル
Complex genetic traits and threshold model
X non-risk homozygoutes
Heritability = 0.6
Vall=Vg+Ve; Vg=0.6
VlocusX=0.6x0.01
Allele freq of X = 0.4
HWE
Phenocopy = 0.2
X heterozygoutes
Prevalence = 0.01
RR(homo1vs homo2) =1.71
RR(hetero vs homo2) = 1.29
X homozygoutes
「興味ある」接線はどれか?
ヘテロはホモ1とホモ2の間
? Risk(AA) >= Risk(Aa) >= Risk(aa) ?
“MAX” from Dominant to Recessive
OMTT (Optimal Mode Trend Test)
Chi-square for Trend
AA
Aa
aa
marginal
pop1
d11
d12
d13
R
pop2
d21
d22
d23
S
marginal
T1
t2
t3
T
weight
w1
w2
w3
dij = obsij –expij
wi : トレンドの重み
{w1,w2,w3}={1,r,0}; -∞<=r<=∞
r=1 : 優性モデル
r=0.5 : 線形トレンド
r=0 : 劣性
-∞<=r<=∞ : 自由度2
0<=r<= : OMTT
自由度2
自由度1
P値は
自由度1
OMTT 自由度・・・
優性 自由度1
おまけ
http://www.genome.med.kyoto-u.ac.jp/wiki_tokyo/index.php/
公開アプリケーション
ダウンロード

遺伝形式という局外母数を持つ 2x3分割表検定に関する考察