簡易流行病學與生物統計學
十八、卡方分布(chi-square distribution)
自由度(degree of freedom)
作者:吳聰賢醫師
卡方分布(chi-square distribution)、自由度(degree of
freedom)
教科書說「卡方分布和常態分布有著密切的關係,它是由常態分布演導出來的,如果由平均數為μ,變異數為σ2之常態母群體中,抽取樣本數為n之全部可能之排列組合的幾個樣本,每一樣本都算出樣本中每一個體之Z值平方的總和=Σ()2,所有樣本之Z2值所形成的集合就是卡方分布。」,一陣眩昏,真想吐血,有看沒有懂,Σ()2與Σ【(觀察值-預期值)2/預期值】有何關係?自由度(degree of freedom)為1、或2的卡方分布圖,完全不像常態分布,自由度為4的卡方分布圖為偏右分布,自由度為10的卡方分布圖才接近常態分布,怎麼說卡方分布由常態分布演導出來?
不同自由度時,x2 值與機率分布圖
如Z表、t表,卡方分布也有卡方分布表,求得卡方值後,依照不同自由度,找出P值的臨界值,當卡方值大於臨界值即達統計上意義,如果卡方值小於臨界值即不達統計上意義,
自由度
|
P值
0.1 0.05 0.01
|
1
2
3
4
5
6
7
8
9
10
|
2.71 3.84 6.63
4.61 5.99 9.21
6.25 7.81 11.34
7.78 9.49 13.28
9.24 11.07 15.09
10.64 12.59 16.81
12.02 14.07 18.48
13.36 15.51 20.09
14.68 16.92 21.67
15.99 18.31 23.21
|
何為自由度(degree of
freedom)?有何意義?曾請教不少研究所同學,答案是「莫宰秧」,課堂上也請教過統計學老師,一樣得不到答案。
自由度=(A類別變項的分類數-1)×(B類別變項的分類數-1)
中毒
|
沒中毒
|
||
有喝可樂
|
107
|
53
|
|
沒喝可樂
|
2
|
9
|
|
上述例子,自由度=(2-1) ×(2-1)=1
上述例子,卡方值10.56,查卡方分布表自由度為1時,10.56大於3.84,P值<0.05,故達統計上意義。我們常見的卡方檢定大部分是2×2列聯表(contingency
table),記住3.84這個數目字很容易測定是否達統計上意義,我的口訣是「三八死沒人(台語)」
放射線治療
|
化學治療
|
開刀治療
|
|
死亡
|
a
|
b
|
c
|
存活
|
d
|
e
|
f
|
上述例子,自由度=(3-1) ×(2-1)=2
上述例子,如果計算結果卡方值大於5.99,查卡方分布表自由度為2時,卡方值大於5.99,P值<0.05,故達統計上意義。
放射線治療
|
化學治療
|
開刀治療
|
|
死亡
|
a
|
b
|
c
|
存活<5年
|
d
|
e
|
f
|
存活≧5年
|
g
|
h
|
i
|
上述例子,自由度=(3-1) ×(3-1)=4
上述例子,如果計算結果卡方值大於9.49,查卡方分布表自由度為4時,卡方值大於9.49,P值<0.05,故達統計上意義。
卡方分布圖起源不了解,自然無法搞懂自由度的涵義,有誰能傾囊相授?
0 意見:
張貼留言