簡易流行病學與生物統計學
三十三、2
×3列聯表的卡方檢定
作者:吳聰賢醫師
護理人員在職訓練第2講我花極大精力介紹卡方檢定(x2 test),希望帶領大家看得懂衛生署疾病管制局「疫情報導」裡面的報表,縱然無法理解卡方分布(x2 distribution)的來源,想不通自由度(degree
of freedom,df)的涵義,更分不清各類卡方檢定的使用範圍和方法,如葉氏修正(Yates’ correction)、費歇準確檢定(Fisher’s exact test)、Likelihood ratio chi-square、Continuity adj.
chi-square、Mantel-Haenszel chi-square McNemar’s
test、適合度檢定(Goodness-of-fit test)、波以松檢定(Poisson test)等不同的檢定方法,事實上,除了數學家、統計學家外,有多少人真正了解卡方檢定?還不是迷迷糊糊在使用,而迷迷糊糊在使用總比不會使用好,對一門科學逃避它、或否定它,都不是良好的態度;不須妄自菲薄,別人勝過自己也只不過那一點點。
中毒
|
沒中毒
|
||
有喝可樂
|
a
|
b
|
|
沒喝可樂
|
c
|
d
|
|
再次回憶護理人員在職訓練第2講的內容,上圖是2 ×2列聯表(contingency
table),A類別變項(variable)指『中毒、沒中毒』,B類別變項(variable)指『有喝可樂、沒喝可樂』,當然顛倒過來也可以,A類別變項可指『有喝可樂、沒喝可樂』,B類別變項可指『中毒、沒中毒』;『中毒』、『沒中毒』就是A類別變項的分類(item),『有喝可樂』、『沒喝可樂』就是B類別變項的分類(item),其自由度算法如下:
自由度=(A類別變項的分類數-1)×(B類別變項的分類數-1)
自由度=(2-1) ×(2-1)= 1
今天介紹2 ×3列聯表(contingency table),可不可以說成3 ×2列聯表?隨您高興,一般普遍說法是2
×3列聯表,舉在職訓練第2講的例子,
放射線治療
|
化學治療
|
開刀治療
|
|
死亡
|
a
|
b
|
c
|
存活
|
d
|
e
|
f
|
A類別變項『放射線治療、化學治療、開刀治療』有3個分類數,B類別變項『死亡、存活』有2個分類數,此即是2 ×3列聯表。
自由度=(A類別變項的分類數-1)×(B類別變項的分類數-1)
自由度=(3-1) ×(2-1)= 2
肺癌
|
非肺癌
|
|
重度抽菸
|
a
|
b
|
輕度抽菸
|
c
|
d
|
不抽菸
|
e
|
f
|
A類別變項『肺癌、非肺癌』有2個分類數,B類別變項『重度抽菸、輕度抽菸、不抽菸』有3個分類數,這也是2 ×3列聯表,自由度也是2,圖1、和圖2均是2 ×3列聯表。
自由度=(A類別變項的分類數-1)×(B類別變項的分類數-1)
自由度=(2-1) ×(3-1)= 2
依照在職訓練第2講所教的方法,不管用筆計算、直接從microsoft excel 儲存格做運算、利用microsoft excel 的統計函數做運算、或則利用SAS(Statistical analysis system)從事卡方檢定運算,計算出的卡方值(x2 value)代表何意義?勝算比(odds ratio)如何計算?這個問題困擾我很久無法解決,後來用分層的方式來破解,類似變異數分析(analysis of variance,ANOVA)是多重t檢定的觀念。我把2 ×3列聯表分割成3個2 ×2列聯表,
放射線治療
|
化學治療
|
|
死亡
|
a
|
b
|
存活
|
d
|
e
|
放射線治療
|
開刀治療
|
|
死亡
|
a
|
c
|
存活
|
d
|
f
|
化學治療
|
開刀治療
|
|
死亡
|
b
|
c
|
存活
|
e
|
f
|
在自由度為2,計算出的卡方值(x2 value)大於5.99,代表三個分割後的2 ×2列聯表,其中至少有一個2 ×2列聯表的卡方值(x2 value)大於3.84;換句話說,2 ×3列聯表達統計學意義,代表三個分割後的2 ×2列聯表至少有一個2 ×2列聯表達統計學意義,類似變異數分析(analysis of variance,ANOVA),在多重t檢定,只要有一組t檢定達統計學意義,則此變異數分析即統計學意義。關於變異數分析(analysis of variance,ANOVA)以後會詳談。
自由度
|
P值
0.1 0.05 0.01
|
1
2
3
4
5
6
7
8
9
10
|
2.71 3.84 6.63
4.61 5.99 9.21
6.25 7.81 11.34
7.78 9.49 13.28
9.24 11.07 15.09
10.64 12.59 16.81
12.02 14.07 18.48
13.36 15.51 20.09
14.68 16.92 21.67
15.99 18.31 23.21
|
勝算比(odds ratio)又如何計算?2 ×3列聯表無法計算勝比,只當分割後變成三個2 ×2列聯表才能計算算勝比,三個2 ×2列聯表有三個勝算比。
勝算比A(odds ratio)=(a ×e)÷(b ×d)
勝算比B(odds ratio)=(a ×f)÷(c ×d)
勝算比C(odds ratio)=(b ×f)÷(c ×e)
以上想法似乎得意,但擔心是一廂情願的迷思,民國90年3月26、27日(星期一、二),於南投縣鹿谷鄉的米堤大飯店,參加行政院衛生署的九十年度生命統計工作研討會,曾將此想法請教中央健康保險局會計室統計科李丕準科長,結果竟得到認同,讓我雀躍三尺,欣喜萬分。
0 意見:
張貼留言