第2章 確率と確率分布
統計学 2015年度
Ⅰ 確率の定義
a) 先験的確率
1) 先験的確率の定義 2) 先験的確率の誤用
b) 経験的確率
1) 経験的確率の定義 2) 経験的確率の特徴
c) 主観的確率
1) 主観的確率の定義 2) 主観的確率の特徴
Ⅱ 確率の公理と計算定理
a) 確率の公理
b) 確率の計算定理
1) 加法定理 2) 条件つき確率と乗法定理
☆発展☆ 条件つき確率とベイズの定理
Ⅲ 確率分布
a)
b)
c)
d)
確率変数
確率分布と確率密度
期待値と分散
2項分布
◎数学補足
e) 正規分布
nCxについて
1) 標準化 2) 標準正規分布
Ⅰ 確率の定義
• 確率 - ある事象が起こるか起こらないか確実に
は分からないとき、その事象の起こる「確からしさ」
を数値で表したもの
• 確率の定義には次の3とおりの方法がある。
– 先験的確率
– 経験的確率
– 主観的確率
a) 先験的確率(古典的確率、数学的確率などともいう)
1) 先験的確率の定義
• ある行動の起こりうる結果が全部でn通りあり、そのうち
事象Aにあてはまる結果がa通りあるとする。それらが同

様に確からしく、互いに重複しない場合、   = を事

象Aの確率とする。
(例1) コインを1枚投げたときに表の出る確率
– 起こりうる結果 - 表、裏の2通り(n=2)
– 事象A - 表が出る
– あてはまる結果 - 1通り(a=1)
⇒
  =
1
2
(例2) サイコロを1個投げたときに5以上の目の出る確率
– 起こりうる結果 - 1,2,3,4,5,6の6通り(n=6)
– 事象A - 5以上の目が出る
– あてはまる結果 - 5,6の2通り(a=2)
2
6
⇒   = =
1
3
• これらの例では、おこりうるすべての結果が分かり、同様
に確からしいとみなせるので、実験を実際におこなってみ
なくても、確率を評価できる。
よって、先験的確率といわれる。
2) 先験的確率の誤用
• 2枚のコインを同時に投げたときに少なくとも1枚が表である確率を考
える。
– 起こりうる結果 - 表表、表裏、裏裏の3通り(n=3)
– 事象A - 少なくとも1枚が表である
– あてはまる結果 - 表表、表裏の2通り(a=2)
⇒   =
2
3
起こりうる結果が「同様に確からしい」とはいえない
「ローベルバルの過ち」といわれる問題
• 正しくは次の通り(パスカルがこのように修正した)
– 起こりうる結果 - 表表、表裏、裏表、裏裏の3通り(n=4)
– 事象A - 少なくとも1枚が表である
– あてはまる結果 - 表表、表裏、裏表の3通り(a=3)
⇒   =
3
4
• 明日、雨が降る確率(降水確率)
– 起こりうる結果 - 雨が降る、雨が降らない の2通り(n=2)
– 事象A - 雨が降る
– あてはまる結果 - 1通り(a=1)
⇒   =
1
2
• 「雨が降る」と「雨が降らない」は同様に確からしいとはい
えない。
⇒ 先験的確率によって確率を定義することの限界
b) 経験的確率
1) 経験的確率の定義
• 同じ条件のもとで繰り返し十分大きい観察がおこなわれ
たとき、観察総数nの中で、特定の事象Aとなる場合の数

がaであったならば、   = を事象Aの経験的確率と

いう。
(例1) 男児の出産確率   =
21
41
多数の出産例を観察した結果求められたもの。
(例2) 降水確率
同様な天気図(雲の配置など)を多数観察し、それから降水確率を
求めている。
2) 経験的確率の特徴
• すべての結果がわからない場合でも確率を求めることが
できる。
• おこりうるすべての結果が同様に確からしいとはいえな
い。
• 同じ条件のもとで繰り返し十分大きい観察が不可能な事
象については経験的確率が定義できない。
c) 主観的確率
1) 主観的確率の定義
• 事象Aに対する個人の確信の度合いを数値で表したもの
P(A)を事象Aの主観的確率という。
(例) 日本ダービーでドゥラメンテが勝つ確率は60%である。
⇒ 競馬には対戦相手、枠順、血統、騎手、馬の調子、ローテーション、
馬場状態、開催競馬場などの条件がある。これら同一の条件で、繰
り返し十分な観察をすることは不可能である。
2) 主観的確率の特徴
• 主観的確率は個人の確信によって定まるので、同じ事象
に対しても確率の評価は異なる。
⇒ このことから賭けがはじめて成立する。
(例) 日本シリーズでソフトバンクと阪神のどちらが勝つか。
• ソフトバンクに賭ける人 -ソフトバンクが勝つ確率(主観的確率)が高
い。
• 阪神に賭ける人 - 阪神が勝つ確率(主観的確率)が高い。
この両者が存在することによって、初めて賭けが成立する。
全員が「ソフトバンクが勝つ確率が高い」と思っていたら賭けは成立しない。
しかし、勝つ確率が低い方に賭けることもある。それは当たった時にもらえ
る金額が多くなるからである。 ⇒ 期待値の大きさで判断している。
主観的確率
経験的確率
先験的確率
Ⅱ 確率の公理と計算定理
a) 確率の公理
1. どのような事象Aに対しても、確率の値は常に0と1の間の値
をとる。すなわち、
0≤  ≤1
2. おこりうる事象全体の集合をSとすれば、Sの確率は1である。
  =1
3. A,B,… が同時に起こらない事象(このとき、A,B,… を排反
事象という)のとき、A,B,… のいずれかが起こる確率はそれ
ぞれの事象が起こる確率の和に等しい。すなわち
 ∪∪⋯ =  +  +⋯
b) 確率の計算定理
バレンティンがホー
ムランを打つ(A1)
スワローズが勝つ(B1)
バレンティンがホーム
ランを打たない(A2)
計
0.1
0.495
0.595
引き分け(B2)
0.01
0.05
0.06
スワローズが負ける(B3)
0.04
0.305
0.345
計
0.15
0.85
1
• バレンティンがホームランを打ち、スワローズが勝つ確率 →
A1とB1がともに起きる確率である。これをA1とB1の同時確率
といい、P(A1∩B1)とあらわす。(∩は「かつ」(and)を表す記号。cap
とよぶ。)
• バレンティンがホームランを打つかどうかに関わらず、 スワ
ローズが勝つ確率 → A1が起こるかどうかに関わらず、B1が
起きる確率である。これをB1の周辺確率といい、P(B1)とあら
わす。
1) 加法定理
バレンティンがホー
ムランを打つ(A1)
スワローズが勝つ(B1)
計
バレンティンがホーム
ランを打たない(A2)
0.1
0.495
0.595
引き分け(B2)
0.01
0.05
0.06
スワローズが負ける(B3)
0.04
0.305
0.345
計
0.15
0.85
1
(例) バレンティンがホームランを打つか、スワローズが勝つ確率
 1 ∪ 1 =  1 +  1 −  1 ∩ 1
= 0.15 + 0.595 − 0.1 = 0.645
(∪は「または」(or)を表す記号。cupとよぶ。)
加法定理
<排反事象の場合>
(例) スワローズが勝つか、引き分ける確率
排反事象の場合の
 1 ∪ 2 =  1 +  2
加法定理
= 0.595 + 0.06 = 0.655
2) 条件つき確率と乗法定理
•
P(E)>0のとき、事象Eの起こることを条件として、事象Fが起こることを、
(Eを条件とする)Fの条件つき確率といい、P(F|E)であらわす。
(例) 袋の中に、赤球3個、白球2個の計5個の球が入っている。この袋から
球を続けて2個取り出すとき、2個とも赤球となる確率を考えてみよう。
1個目が赤球となる確率は、
3
 赤1 =
5
1個目が赤球であったという条件のもとで、
2個目が赤球となる確率は、
2
 赤2 |赤1 =
4
よって、2個とも赤球となる確率は、
 赤1 ∩ 赤2 =  赤1 ×  赤2 |赤1
AとBが同時に起こる確率であり、
AとBの同時確率といわれる。
1個目も2個目も赤球である確率。
1個目の球が赤球
である確率
3 2
3
= × =
5 4 10
乗法定理
1個目の球が赤球であったという
条件のもとで、2個目の球も赤で
あるという条件付き確率
(例) バレンティンがホームランを打ったときに、スワローズが勝つ確率
⇒ A1を条件とするB1の条件つき確率P(B1|A1)である。
この条件つき確率を用いて、バレンティンがホームランを打ち、スワ
ローズが勝つ確率を考えると、乗法定理により
 1 ∩ 1 =  1 ×  1 |1
となる。よって条件つき確率P(B1|A1)は同時確率を周辺確率で割ること
によって求めることができ、
 1 |1 =
 1 ∩ 1
0.1
=
= 0.67
 1
0.15
となる。
バレンティンがホー
ムランを打つ(A1)
スワローズが勝つ(B1)
バレンティンがホーム
ランを打たない(A2)
計
0.1
0.495
0.595
引き分け(B2)
0.01
0.05
0.06
スワローズが負ける(B3)
0.04
0.305
0.345
計
0.15
0.85
1
<独立事象の乗法定理>
•
事象Eが起こっても起こらなくても事象Fの確率に変化がないとき、すな
わちP(F|E) = P(F|Ec) = P(F)のとき、事象Eと事象Fは独立であるという。
( Ec はEが起こらないという状況をあらわす)
雨が降る (A1)
白鵬が勝つ(B1)
雨が降らない (A2)
計
0.2
0.6
0.8
白鵬が負ける(B2)
0.05
0.15
0.2
計
0.25
0.75
1
この例で雨が降った場合の白鵬が勝つ条件つき確率は
 1 |1 =
 1 ∩ 1
0.2
=
= 0.8
 1
0.25
雨が降らない場合の白鵬が勝つ条件つき確率は
 1 |2
 2 ∩ 1
0.6
=
=
= 0.8
 2
0.75
となり、 P(B1|A1) = P(B1|A2) = P(B1)であることから、雨が降るか降らな
いかと、白鵬が勝つか負けるかは独立である。
• 事象Eと事象Fが独立である場合、乗法定理は
 ∩ =  × 
となる。
☆発展☆ 条件つき確率とベイズの定理
(例) 5本中2本の当たりのあるくじを、5人で順番に引く。2番目に引く人が
あたりくじを引く確率は?
⇒ この問題に答えるときに、条件つき確率と乗法定理が用いられている。
(解)
1番目の人 当たり A1 はずれ A2
2番目の人 当たり B1 はずれ B2
とする。
1番目の人が当たりとわかったあとで、2番目の人も当たりくじを引く確
率は
○×××
○
 1 |1
1
=
4
1番目の人がはずれとわかったあとで、2番目の人が当たりくじを引く確
率は
○○×××
 1 |2
2 1
= =
4 2
よって、2番目の人が当たりくじを引く周辺確率は
1
 1 =  1 ∩ 1 +  2 ∩ 1
=  1 ×  1 |1 +  2 ×  1 |21  1 ∩ 1
2 1 3 1
1
3
2
2
= × + × =
+
=
5 4 5 2 10 10 5
2
計
 2 ∩ 1
 1
計
となる。(これは1番目の人がくじを引く前の確率と考えられる)
さらに、次のようなことを考える。
(例) 2番目に引く人があたりくじを引いたとき、1番目に引いた人があたりを
引いた確率は?
(解) 2番目に引く人があたりを引いたという条件のもとで、1番目の人があ
たりを引く条件つき確率なので
を求めればよい。
この条件つき確率は
 1 |1
 1 |1
として求めることができる。
 1 ∩ 1
=
 1
これはさらに
 1 ∩ 1
 1 ×  1 |1
=
 1
 1 ×  1 |1 +  2 ×  1 |2
と変形することによって、
 1 |1
と計算できる。
2 1
×4
5
=
=
2 1 3 1
× + ×
5 4 5 2
1
10 = 1
2
4
5
※ ベイズの定理
•
条件つき確率P(A1|B1)は、周辺確率P(A1)と条件つき確率P(B1|A1)を用
いて次のように求めることが可能であった。
 1 |1 =
 1
 1 ×  1 |1
×  1 |1 +  2 ×  1 |2
この定理をベイズの定理 という。
ベイズの定理は、A1についての事前確率P(A1)が事象B1がおこったこと
によって、事後確率P(A1|B1)に更新されたと解釈することができる。
(ここでは、1番目の人が当たりを引いた確率が、2番目の人が当たりくじ
を引いたことがわかることによって更新される)
この考え方は、迷惑メールのフィルタなどにも応用されている。
次のような例を考えてみよう (森田優三(1993)『新統計概論』p.361より引用)
(例) ある銀行で貸出金が貸倒れ(返済されないこと)になる確率は5%であ
る。あるとき、この銀行が新しい審査基準を設けた。この審査基準を過去
の借り手に適用すると、貸倒れにおわった借り手の20%はこの審査に合
格、順当に返済した借り手は90%が合格であった。この審査に合格した
新しい借り手が貸倒れにおわる確率はいくらか。
(解)
貸出金が
審査に
とする。
貸倒れ A1
合格 B1
完済 A2
不合格 B2
求める確率はP(A1|B1)である。
例の設定から次のようなことがわかる
P(A1)=0.05、 P(A2)=0.95
P(B1|A1)=0.2、 P(B1|A2)=0.9
ベイズの定理を用いてP(A1|B1)を求めると
 1 |1
 1 ×  1 |1
=
 1 ×  1 |1 +  2 ×  1 |2
0.05 × 0.2
0.01
=
=
= 0.01156 …
0.05 × 0.2 + 0.95 × 0.9 0.01 + 0.855
となる。貸倒れの事前確率P(A1)= 0.05が審査という追加情報によって、
P(A1|B1)=0.012という事後確率に更新されたと解釈できる。
Ⅲ 確率分布
a) 確率変数
• サイコロを3回振る実験を考える。
• 1の目が出た場合を○、1の目以外が出た場合を×とあらわ
すと、起こりうる結果は
○○○, ○○×, ○×○, ×○○, ○××, ×○×, ××○, ×××
の8通りである。
• ここで、1の
目が何回出
たかによって
分類するなら
右図のように
なる。
• 2回目に振っ
たサイコロの
目は1回目に
振ったさいこ
ろの目とは
独立である
ので、独立事
象の乗法定
理が用いら
れる。
1の目が出た回数
パターン
確率
3
0回
×××
1回
○××
1 5 5
1
× × =
6 6 6
6
5
6
2
×○×
5 1 5
1
× × =
6 6 6
6
5
6
2
××○
5 5 1
1
× × =
6 6 6
6
5
6
2
○○×
1 1 5
1
× × =
6 6 6
6
2
5
6
○×○
1 5 1
1
× × =
6 6 6
6
2
5
6
×○○
5 1 1
1
× × =
6 6 6
6
2
5
6
2回
3回
○○○
5 5 5
5
× × =
6 6 6
6
1 1 1
1
× × =
6 6 6
6
3
• 1の目が出た回数を x 回とし、それに対応する確率を P(x)
とあらわすと、次のように整理できる。

0
()
5
6
(0.579)
1
3
1 5
3
6 6
(0.347)
2
2
3
2
1
5
3
6
6
(0.069)
3
1
6
(0.005)
サイコロを3回振った時の1の目の出る回数
0.8
確率
0.6
0.4
0.2
0
0
1
2
1の目の出る回数
3
• このようにとりうる値†のそれぞれにある確率が対応している
変数を確率変数といい、その対応関係を確率分布という。
† 連続変数の場合はその値を含む微小な区間を考える。
b) 確率密度
• 右の図のようなルーレットがある。
x
ルーレットの針と真上とのなす角を
x度とする。ここで、x=60度となる確
率を考えると、
  = 60 =
1
360
• xは連続変数なので、0から359までの360通り以外に、
42.75, 108.268 などとりうる値が無限にある。
• そのため、P(x=60)の確率を求めることはできない
• 連続型確率変数の場合には、x=60といった確率を求めるこ
とはできないので、代わりに 59.5 ≤  ≤ 60.5 といった微
小区間に入る確率を考える。
• この確率を確率密度という。
• 連続型確率変数の確率分布は、確率密度を線で結んだ密
度関数 f(x)によってあらわす。(グラフの場合も、数式の場
合もある)
• ルーレットの例の場合の密度関数は次のようになる。
f(x)
1/360
0
360
c) 期待値と分散
• 右のような確率で賞金がもらえるくじ
等
があったとする。
1等
• このくじを1枚購入した時点で、いくら
の賞金がもらえるかはわからない。
2等
• しかし、大体いくらぐらいもらえるか
を知りたい。
3等
• そのとき、
はずれ
もらえる金額×当たる確率
の総和がもらえると期待できる金額
となる。
1
1
1
もらえる金額
1000000円
20000円
100円
0円
44949
当たる確率
1
50000
1
1000
1
10
44949
50000
1000000 × 50000 + 20000 × 1000 + 100 × 10 + 0 × 50000 = 20 + 20 + 10 + 0 =50(円)
このくじの期待値は50(円)であるという
• このことは、次のように考えることができる。
• 主催者が、全部で5万本の

等
くじを作成したとする。当た
1000000
る確率を考えると、このとき 1等
20000
2等
くじの中に、1等を1本、2等
を50本、3等を5000本入れ
100
3等
る必要がある。このくじが、 はずれ
0
全部で5万本あったとすると、
右のような度数分布表であ
らわすことができる。

 
1
1000000
50
1000000
5000
500000
44949
0
2500000
• ある人がこのくじを5万本全部買い占めたとする。くじの当選
番号が発表された後で当選金の払い戻しを受ける場合、そ
の合計金額は確実に2500000(円)であり、1枚あたりの当選
金(すなわち算術平均)を考えると、2500000÷50000=50
(円)であり、期待値に一致する。
期待値=確率変数の算術平均
† このことから、期待値のことを、「平均」「平均値」などと呼ぶこともある。
• サイコロを3回振る実験で1の目が出た回数をxとするなら、x
の期待値は
125
75
15
1
75
30
3
108 1
0×
+1×
+2×
+3×
=0+
+
+
=
=
216
216
216
216
216 216 216 216 2
となり、1の目が出る回数の期待値は0.5回である。
• またサイコロを6回振る実験をおこなうと

()
0
1
2
3
4
5
6
30
1
15625 18750 9375 2500 375
46656 46656 46656 46656 46656 46656 46656
となるので、 1の目が出る回数の期待値は
0×
15625
18750
9375
2500
375
30
1
+1×
+2×
+3×
+4×
+5×
+6×
46656
46656
46656
46656
46656
46656
46656
=0+
18750 18750 7500
1500
150
6
46656
+
+
+
+
+
=
=1
46656 46656 46656 46656 46656 46656 46656
となり、6回ふれば1の目が1回ぐらい出るという直感に一致
する。
• 期待値は  =
• 分散は   =
  とあらわすことができる。
− 
2
  となる。
• 連続型確率変数の場合は
  =
  =
となる。
  
− 
2
  
• 確率分布は、いくつかの種類に分類することができる。
– 離散型確率分布
2項分布、ポアソン分布、負の2項分布、超幾何分布、・・・
– 連続型確率分布
正規分布、t分布、カイ2乗分布、・・・
d) 2項分布
[定義] 起こりうる結果がAかBかという2つの結果しか起こらな
い試行† をn回繰り返したとき、Aという結果がx回おこったと
する。このxの確率分布を2項分布という。
† このような試行をベルヌーイ試行という
[分布関数] Aが起こる確率をp、Bが起こる確率をq(=1-p)とす
ると、2項分布は
p(x)=nCxpxqn-x
という式であらわすことができる。この式を2項分布の分布関
数という。
(例) サイコロを3回振る実験では、A(1の目が出る)かB(1の
目が出ない)かという2つの結果しか起こらない試行をn(=3)
回繰り返したとき、A (1の目が出る)という結果がx回おこっ
た。このxの確率分布は2項分布(にしたがう)といわれる。
• この例では、 =
1
,
6
てはめると、   =
5
= ,  = 3 であるので、分布関数にあ
6
1  5 3−
となる。
3 6
6
• xのとりうる値は0,1,2,3の4つであるので、この分布関数は次
のような関係を表している。

()
0
30
1
6
0
1
5
6
3−0
31
1
6
1
2
5
6
3−1
32
1
6
2
3
5
6
3−2
33
1
6
3
5
6
3−3
◎数学補足 nCxについて
• nCxはn個の中からx個を選ぶ組み合わせの数であり、次の
ように定義される。
!
 =
!  −  !
• ここで、!は階乗を表す記号であり、次のようなものである。
n! = n ×(n-1)×・・・×2×1
よって、nCxは次のように計算できる。
 ×  − 1 × ⋯  −  + 1 ×  −  × ⋯× 2 × 1
 =
 ×  − 1 × ⋯× 2 × 1 ×  −  × ⋯× 2 × 1
x個
× −1 ×⋯ −+1
=
 ×  − 1 × ⋯× 2 × 1
x個
たとえば、5人の班の中から2人の委員を選ぶ組み合わせは
5 × 4 20
=
= 10 通り
52 =
2×1
2
となる。
• サイコロを3回振る実験において、1の目が1回出るパターン
は、 ○××, ×○×, ××○ の3通りあるが、これはサイコロを
振る3回のうち、何回目に1の目が出るかを考えたものであり、
3
= 3 通り
31 =
1
である。
• また、nC0は定義のように計算できないので、 nC0=1と特別
に定義する。
[期待値と分散] 2項分布の期待値(平均)は E(x)=np
分散は
V(x)=npq
となる。
• 離散型確率変数の期待値は、一般に   =
って求めることができるので、
125
75
15
1
+1×
+2×
+3×
216
216
216
216
75
30
3
108 1
=0+
+
+
=
= = 0.5
216 216 216 216 2
  によ
  =0×
となる。
• 確率変数が2項分布にしたがう場合、期待値は   = 
として求めることができる。すなわち、すべてのとりうる値と対
応する確率が得られなくても、期待値が計算できるのである
。
• この例の場合  
• また分散は、  
1
1
= 3 × = = 0.5 となる。
6
2
1
5
5
= 3 × × = となる。
6
6
12
2項分布(n=10)
2項分布(n=5)
0.2
0.1
0
0
1
2
3
4
5
0
2項分布(n=100)
1
2
3
4
5
6
7
8
9
10
20
0.3
18
0.4
16
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0.5
0.12
0.1
0.08
14
12
10
8
30
27
24
21
33
6
20
18
16
14
12
10
8
6
4
2
0
0
4
0.05
2
0.1
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
0.15
18
15
0.2
12
9
2項分布(n=50)
6
0
0.25
3
0.06
0.04
0.02
2項分布(n=20)
0
e) 正規分布
• 2項分布において、nを大きくしていくと、左右対称のつりがね
型の正規分布といわれる分布に近づく。
• 2項分布は離散型確率変数の分布であるが、nを無限に大き
くしたとき、xのとりうる値は無限に大きくなる。すなわちxは連
続型確率変数として扱われる。
n=500のとき
P (x)
0.06
0.05
0.04
0.03
0.02
0.01
144
136
128
120
112
104
96
88
80
72
64
56
48
40
32
24
16
8
0
0
x
• 正規分布は数学的に望ましい性質を持った分布
• 身長や知能指数などがこの分布にしたがうといわれている。
• 密度関数
  =
1
2 2
1 − 2
−
 2 
 = 2.718 …(自然対数の底)
正規分布の平均は、分散は 2
• 正規分布は平均μ、分散σ2の値によって、中心の位置や山
の高さが変わってくる。
<平均の異なる正規分布>
σ=1の正規分布
0.5
μ=0
μ=3
μ=-4
0.4
0.3
0.2
0.1
0
-7
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
7
<分散の異なる正規分布>
μ=0の正規分布
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
σ=1
σ=2
σ=1/2
-7
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
7
• これらの正規分布は、中心の位置を移動させたり、目盛りの
幅を変える(横に伸ばしたり、縮めたりする)ことによって、全
て同じ正規分布となる。
1) 標準化
• A君は、あるテストで英語が90点、数学が65点であった。 ⇒
英語の方が数学より成績が良かった??
• 英語の平均点が80点、数学の平均点が50点だった。⇒ 英
語は平均点より10点高い、数学は平均点より15点高い。数
学の方が良い??
• 英語と数学のどちらが成績が良かったのだろうか?⇒ 標準
化の必要性(これを応用したものが偏差値)
• 英語が平均80、標準偏差10の正規分布、数学が平均50、
標準偏差20の正規分布にそれぞれしたがうとする。
英語と数学の成績の分布
f(x)
0.05
数学
英語
0.04
0.03
0.02
0.01
0
0
10
20
30
40
50
60
70
80
90
100
点数
• 平均や分散の異なるものを比較するとき、平均や分散をそろ
え、その相対的な位置によって比較しようというのが標準化
の考えである。
• 標準化は次のような変換である。
−
=

• この例で、英語は(90-80)/10=1
数学は(65-50)/20=0.75
となり英語の方が成績が良いことになる。
• 偏差値は、このzを用いて 50+10×z で求められる。この人
の英語の偏差値は60、数学の偏差値は57.5である。
2) 標準正規分布
• 正規分布にしたがう変数について、このような変換をおこなう
と、標準正規分布(平均0、分散1の正規分布)になる。
• 標準正規分布では±1の範囲に68.3%、±2の範囲に95.4%、
±3の範囲に99.7%が含まれる。
標準正規分布
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-3.5 -3 -2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5
3 3.5
ダウンロード

確率と確率分布