項目間の関連を分類するための指標の研究
◇主な内容◇
① 左図の?を示す
② これにより、次の○を埋める
順序性係数
?
相関係数
?
公式あり
データ型
順序性係数
の定義
実データで
の検証
1-0データ
竹谷1979
多数あり
確率
正答率
○
○
回帰係数
元高校教員 浅尾 彰俊
1
先行研究の概要
○ 正誤情報
異なる回答者
項目j
1
1
1
1
1
1
1
1
0
0
0
0
0
0
項目k
1
1
1
1
1
0
0
0
1
1
1
1
0
0
a=5
集計
b=3
○ 2×2分割表(集計したもの)
c=4
集
計
項目k
0
1
1
小計
小計
a
b
a+b
c
d
c+d
a+c
b+d
N(総人数)
項目j
0
d=2
2
先行研究の概要
順序性係数の定義(竹谷1979)
γ
*
jk
cN
 1
( c  d )( a  c )
項目k
項目j
小計
小計
1
0
1
a
b
a+b
0
c
d
c+d
a+c
b+d
N(総人数)
○ Cが他と比べて小さいとき、第2項は小さくなり、順序性係数は大きくなる。
○ 順序性係数がある「しきい値(通常0.5)」以上のときに「順序性がある」とする。
○ 順序性があるとき、「項目jができなければ、項目kはできない。」と解釈
3
先行研究の確認
実データに対する適用例
例1
中学校1年生
数学の問題
データ件数
N=700
第1問
第2問
第3問
第4問
第5問
要因
第1問
第2問
定数項移項
○
○
x+2=5
x-4=7
3x=6
2x+4=10
4x-8=16
第3問
1-0データ
第6問
第7問
第8問
第9問
第10問
第4問
第5問
○
○
第7問
第8問
第9問
第10問
○
○
○
○
○
○
○
○
○
○
○
○
○
かっこをはずす
○
○
○
解が分数
○
x移項
係数で割り算
○
○
○
第6問
7x=5x+6
7-3x=8+2x
5(x-3)=4(7-2x)
-4(x+3)=2(5-x)
7x-3(x+2)=11
筆者の
データ
○
4
先行研究の確認
例1
の順序関係一覧表
p1
p2
p3
p4
p5
p1
p2
p3
p4
p5
p6
p7
p8
p9
・・・
p6
p7
p8
p9
p10
・・・
・・・
→
・・・
・・・
・・・
→
・・・
・・・
・・・
・・・
→
→
→
→
→
→
→
→
→
→
・・・
・・・
・・・
・・・
→
→
→
→
→
・・・
←→
・・・
p10
5
先行研究の確認
例1
のIRSグラフ
j→kのとき、
「jできる→kできる」ではなく
「jできない→kできない」
を表す
(数学記号の
十分条件→必要条件
とは逆)
すでに間接
的につな
がっている
ときは直接
の矢印は
書かない
6
本研究の概要(1)
データの形 1-0データ
異なる回答者
項目j
1
1
1
1
1
1
1
1
0
0
0
0
0
0
項目k
1
1
1
1
1
0
0
0
1
1
1
1
0
0
a=5
集計
b=3
c=4
d=2
拡張
データの形
確率・正答率データ
異なる回答者
項目j
0.9
0.8
0.7
0.6
0.8
0.8
0.6
0.7
0.1
0.2
0.3
0.1
0.0
0.1
項目k
0.7
0.8
0.6
0.9
0.7
0.1
0.2
0.3
0.6
0.7
0.7
0.8
0.1
0.2
7
本研究の概要(1)
回帰式が
q αβp となるとき
a=5
c=4
内分点
a
αβ
ab
内分点
c
α
cd
d=2
a
c
β

ab cd
b=3
8
本研究の概要(1)
順序性係数と回帰係数の関係
1-0データ ○
順序性係数の定義
γ
*
jk
γ
*
cN
 1
( c  d )( a  c )
jk
c
 1 c  d
ac
N
1-0データ ○
1-0データ ○
確率データ ○
回帰係数→順序性係数
α βp
γjk  1 
*
q

q
9
本研究の概要(1)
q αβp
因子分析の用語と
紛らわしくならないよ
うに「要因」と表示
共通要因
の割合
α βp
γjk  1 
*
q

q
K独自要因
の割合
α
q
c
α
cd
10
本研究の概要(1)
順序性係数と相関係数の関係
2×2分割表における相関係数(連関係数)
1
r
p1 - p 
いずれか1つのセルの
「確率」と「独立なときの
理論値」との差
(を標準化したもの)
(
)内は
a


pq


q1  q   N

のいずれでも同じ
r
ad  bc
( a  b )( c  d )( a  c )( b  d )
順序性係数
γ
*
jk
ad  bc

( a  c )( c  d )
1-0データ ○
1-0データ ○
11
本研究の概要(1)
相関係数→順序性係数
( a  c )( c  d ) *
q( 1  p ) *
r
γ jk 
γ jk
( a  b )( b  d )
p( 1  q )
γ
*
jk

p( 1  q )
r
q( 1  p )
1-0データ ○
確率データ ○
γjk
*
p psk
β 
r
q qs j
α βp
γjk  1 
*
(別ルートも可)
q

q
12
参考:独立性の検定と比較したとき
(筆者の考え)
Nが数百になれば
ほとんどの項目は
「独立でない」と判定される
「カイ2乗」「条件付き確率
の比較」などによる独立性
の検定
総数Nの効果
あり
1
N
検定は
帰無仮説に
ズームイン
する
独立と仮定して検定する
「従属の程度」は分からない
順序性係数
単なる比率を表し
総数Nの効果なし
仮説はなく
ズームイン
しない
回帰係数や相関係数
と同様に「程度」を表す数字
総数Nを増やしても
識別力が変化しない
「ものさし」
13
本研究の概要(2)
□ 分類したい項目間の関係
ア 項目j→項目kの順序関係が認め
られるもの
j
k
ウ 項目j,k間に双方向順序関係が
認められるもの
イ 項目k→項目jの順序関係が認め
られるもの
j
k
j
k
エ 項目j,k間の順序関係はないが, オ 項目j,k間には順序関係も相関関
各々第3の項目lと順序関係があり,
係もないもの(項目j,kは独立)
相関関係が認められるもの(いわゆる
擬似相関)
k
l
または,遠い順序関係にあるもの
j
j
k
j
k
14
本研究の概要(2)
□ 順序性係数を用いた分類 (エを含めるとすべて分類できる:筆者の考え)
γkj*
γkj*  const1 const1≦γ *  const2 const2 ≦γ *
kj
kj
γjk*
γjk*  const1
オ
(独立)
無印
エ
const1≦γjk  const2
*
const2 ≦γjk
*
イ
j←k
(擬似相関または遠
い順序関係)・・・
ア
j→k
ウ
j←→k
※本研究では const1=0.3 , const2=0.5 で計算
15
本研究の概要(3)
実データでの検証 確率・正答率データ
p50
p50
p51
p53
p54
p55
p57
p60
p64
p67
p68
0.47
0.49
・・
・・
0.50
・・
1.07
・・
・・
・・
・・
・・
・・
・・
・・
1.43
・・
0.41
・・
0.19
0.43
0.84
・・
・・
0.68
0.23
0.61
・・
0.50
・・
・・
0.65
・・
・・
0.88
0.57
・・
・・
・・
0.59
0.60
・・
0.31
0.71
p51
0.27
p53
0.20
・・
p54
・・
・・
0.26
Web教材の回答集計
p55
・・
・・
・・
0.45
2010.2.1から2010.6.15の
期間に回答のあった
22,282件の答案のうち同
一人物の重複回答を除く
9,410人の回答から
p57
0.18
・・
0.16
0.27
・・
p60
・・
・・
0.24
0.66
0.56
0.56
p64
0.14
・・
0.25
・・
・・
・・
0.49
p67
・・
0.20
・・
0.35
・・
・・
0.48
0.35
p68
・・
・・
・・
・・
0.37
・・
・・
0.23
・・
p50
p51
p53
p54
p55
p57
p60
p64
p67
・・・
・・・
例2
個別の答案の件数
例えば64→68はN=89人
のデータ
p50
p54
→
・・・
・・・
→
←→
p57
←→
p64
→
←→
p55
p60
p68
→
→
p51
p53
・・
・・・
→
→
→
・・・
→
p67
p68
16
本研究の概要(3) 実データでの検証 確率・正答率データ
γ* jk 
例2
βp
q
による

p s jk
q sj
2
立体の表面積
IRSグラフ
68
扇形の面積
立体の体積
67
反比例
57
比例
54
64
反比例のグラフ
55
60
比例
53
比例反比例グラフ
xy座標
51
xy座標
50
は項目番号
17
本研究の概要(3)
実データでの検証確率・正答率データ
γ* jk 
例2と同じWeb教材
の回答集計
βp
q

p s jk
q sj
による
2
方程式(分数係数)
個別の答案の件数
38
例えば34→28は
N=68人のデータ
文字の使用
28
18
例3
34
IRSグラフ
文字を
使った式
式の値1
例1
31 関係を表す式
速さと時間
24
21
22
文字を
使った式
前出の
方程式
は、この1粒
1次方程式
41
は項目番号
18
□ まとめ □
• 順序性係数を回帰係数で表し,データが確率である場合に拡張する可能性を
探った.
*
jk
(1,0データ→) γ
 1
α βp
q

γ
*
(確率→)
q
jk

βp
q
p s jk

q sj
2
• 相関係数との関係から順序性係数の有意性を判断した.
(1,0データ→)
γ
*
jk
p( 1  q )
r
q( 1  p )

γ
*
(確率→)
jk
p sk

r
q sj
• データが確率である場合の順序性係数(試案)を実データに適用して,順序関
係(因果関係)がどのくらい解明できるかを調べ,よい結果が得られた.
方程式(分数係数)
立体の表面積
文字の使用
式の値1
28
例3
34
21
立体の体積
67
18
文 字 を
使った式
68
扇形の面積
38
31
方程式
22
反比例
54
5
7
比例
関係を表す式
1次方程式
41
例2
xy座標
速さと時間
24
文 字 を
使った式
64
反比例
のグラフ
xy座標
5
5
6
0
比例反比例
グラフ
比例
53
50
51
19
□ ポイント □
・・・確率データに順序性係数を適用する方法
(1) 変数を標準化せず、0≦p,q≦1の確率として使う(αを使うため)
できないものの例 身長と体重の関係 ←単位を変えても値域が0~1にならない
できるものの例 アンケート項目間の関係 ←確率になるものは、構造が求められる
(ただし、本研究では潜在変数は使わない)
(2) 順序性係数を回帰係数で表す
γ* jk  1 
cN
( c  d )( a  c )
γ* jk
c
 1 c  d
ac
N
α
γjk*  1 
c
cd
α βp
q

q
(3) α(βp)とqの比によって順序性を解釈する
が大きいと、pからqへの影響は小さい
(逆に、小さいと
・・・ 大きい)
他の
分析方法
本研究
q αβp
回帰係数βまたは相関係数 rによって影響の大小を判
断(因果の「向き」は係数だけでは判断できない)
の大小で「向き」を判断
20
ダウンロード

この頁(PPT)参照