簡易流行病學與生物統計學 三十三、2 ×3列聯表的卡方檢定

簡易流行病學與生物統計學
三十三2 ×3列聯表的卡方檢定
作者吳聰賢醫師
護理人員在職訓練第2講我花極大精力介紹卡方檢定(x2 test),希望帶領大家看得懂衛生署疾病管制局「疫情報導」裡面的報表,縱然無法理解卡方分布(x2 distribution)的來源,想不通自由度(degree of freedomdf)的涵義,更分不清各類卡方檢定的使用範圍和方法,如葉氏修正(Yates correction)、費歇準確檢定(Fishers exact test)、Likelihood ratio chi-squareContinuity adj. chi-squareMantel-Haenszel chi-square McNemars test、適合度檢定(Goodness-of-fit test)、波以松檢定(Poisson test)等不同的檢定方法,事實上,除了數學家、統計學家外,有多少人真正了解卡方檢定?還不是迷迷糊糊在使用,而迷迷糊糊在使用總比不會使用好,對一門科學逃避它、或否定它,都不是良好的態度;不須妄自菲薄,別人勝過自己也只不過那一點點。
                
中毒
沒中毒

有喝可樂
a
b

沒喝可樂
c
d





再次回憶護理人員在職訓練第2講的內容,上圖是2 ×2列聯表(contingency table),A類別變項(variable)指『中毒、沒中毒』,B類別變項(variable)指『有喝可樂、沒喝可樂』,當然顛倒過來也可以,A類別變項可指『有喝可樂、沒喝可樂』,B類別變項可指『中毒、沒中毒』;『中毒』、『沒中毒』就是A類別變項的分類(item),『有喝可樂』、『沒喝可樂』就是B類別變項的分類(item),其自由度算法如下:
自由度=(A類別變項的分類數-1)×(B類別變項的分類數-1
自由度=(21) ×(21)= 1
今天介紹2 ×3列聯表(contingency table),可不可以說成3 ×2列聯表?隨您高興,一般普遍說法是2 ×3列聯表,舉在職訓練第2講的例子,
          
放射線治療
化學治療
開刀治療
死亡
a
b
c
存活
d
e
f




A類別變項『放射線治療、化學治療、開刀治療』有3個分類數,B類別變項『死亡、存活』有2個分類數,此即是2 ×3列聯表。
自由度=(A類別變項的分類數-1)×(B類別變項的分類數-1
自由度=(31) ×(21)= 2
                 
肺癌
非肺癌
重度抽菸
a
b
輕度抽菸
c
d
不抽菸
e
f
A類別變項『肺癌、非肺癌』有2個分類數,B類別變項『重度抽菸、輕度抽菸、不抽菸』有3個分類數,這也是2 ×3列聯表,自由度也是2,圖1、和圖2均是2 ×3列聯表。
自由度=(A類別變項的分類數-1)×(B類別變項的分類數-1
自由度=(21) ×(31)= 2
依照在職訓練第2講所教的方法,不管用筆計算、直接從microsoft excel 儲存格做運算、利用microsoft excel 的統計函數做運算、或則利用SASStatistical analysis system)從事卡方檢定運算,計算出的卡方值(x2 value)代表何意義?勝算比(odds ratio)如何計算?這個問題困擾我很久無法解決,後來用分層的方式來破解,類似變異數分析(analysis of varianceANOVA)是多重t檢定的觀念。我把2 ×3列聯表分割成32 ×2列聯表,

放射線治療
化學治療
死亡
a
b
存活
d
e
                       

放射線治療
開刀治療
死亡
a
c
存活
d
f


化學治療
開刀治療
死亡
b
c
存活
e
f
在自由度為2,計算出的卡方值(x2 value)大於5.99,代表三個分割後的2 ×2列聯表,其中至少有一個2 ×2列聯表的卡方值(x2 value)大於3.84;換句話說,2 ×3列聯表達統計學意義,代表三個分割後的2 ×2列聯表至少有一個2 ×2列聯表達統計學意義,類似變異數分析(analysis of varianceANOVA),在多重t檢定,只要有一組t檢定達統計學意義,則此變異數分析即統計學意義。關於變異數分析(analysis of varianceANOVA)以後會詳談。
自由度
P
0.1           0.05         0.01
1
2
3
4
5
6
7
8
9
10
2.71          3.84         6.63
4.61          5.99         9.21
6.25          7.81         11.34
7.78          9.49         13.28
9.24          11.07        15.09
10.64         12.59        16.81
12.02         14.07        18.48
13.36         15.51        20.09
14.68         16.92        21.67
15.99         18.31        23.21
勝算比(odds ratio)又如何計算?2 ×3列聯表無法計算勝比,只當分割後變成三個2 ×2列聯表才能計算算勝比,三個2 ×2列聯表有三個勝算比。
勝算比Aodds ratio)=(a ×e)÷(b ×d
勝算比Bodds ratio)=(a ×f)÷(c ×d
勝算比Codds ratio)=(b ×f)÷(c ×e
以上想法似乎得意,但擔心是一廂情願的迷思,民國9032627日(星期一、二),於南投縣鹿谷鄉的米堤大飯店,參加行政院衛生署的九十年度生命統計工作研討會,曾將此想法請教中央健康保險局會計室統計科李丕準科長,結果竟得到認同,讓我雀躍三尺,欣喜萬分。

0 意見:

張貼留言