簡易流行病學與生物統計學 十八、卡方分布(chi-square distribution) 自由度(degree of freedom)

簡易流行病學與生物統計學
十八卡方分布(chi-square distribution
自由度(degree of freedom
作者吳聰賢醫師
卡方分布(chi-square distribution)、自由度(degree of freedom
  教科書說「卡方分布和常態分布有著密切的關係,它是由常態分布演導出來的,如果由平均數為μ,變異數為σ2之常態母群體中,抽取樣本數為n之全部可能之排列組合的幾個樣本,每一樣本都算出樣本中每一個體之Z值平方的總和=Σ(2,所有樣本之Z2值所形成的集合就是卡方分布。」,一陣眩昏,真想吐血,有看沒有懂,Σ(2Σ(觀察值-預期值)2/預期值】有何關係?自由度(degree of freedom)為1、或2的卡方分布圖,完全不像常態分布,自由度為4的卡方分布圖為偏右分布,自由度為10的卡方分布圖才接近常態分布,怎麼說卡方分布由常態分布演導出來?

           不同自由度時,x2 值與機率分布圖

  Z表、t表,卡方分布也有卡方分布表,求得卡方值後,依照不同自由度,找出P值的臨界值,當卡方值大於臨界值即達統計上意義,如果卡方值小於臨界值即不達統計上意義,
            
自由度
P
0.1           0.05         0.01
1
2
3
4
5
6
7
8
9
10
2.71          3.84         6.63
4.61          5.99         9.21
6.25          7.81         11.34
7.78          9.49         13.28
9.24          11.07        15.09
10.64         12.59        16.81
12.02         14.07        18.48
13.36         15.51        20.09
14.68         16.92        21.67
15.99         18.31        23.21

  何為自由度(degree of freedom)?有何意義?曾請教不少研究所同學,答案是「莫宰秧」,課堂上也請教過統計學老師,一樣得不到答案。

  自由度=(A類別變項的分類數-1)×(B類別變項的分類數-1


中毒
沒中毒

有喝可樂
107
53

沒喝可樂
2
9






上述例子,自由度=(21) ×(21)=1
上述例子,卡方值10.56,查卡方分布表自由度為1時,10.56大於3.84P值<0.05,故達統計上意義。我們常見的卡方檢定大部分是2×2列聯表(contingency table),記住3.84這個數目字很容易測定是否達統計上意義,我的口訣是「三八死沒人(台語)」
           

放射線治療
化學治療
開刀治療
死亡
a
b
c
存活
d
e
f





上述例子,自由度=(31) ×(21)=2
上述例子,如果計算結果卡方值大於5.99,查卡方分布表自由度為2時,卡方值大於5.99P值<0.05,故達統計上意義。
          

放射線治療
化學治療
開刀治療
死亡
a
b
c
存活<5
d
e
f
存活≧5
g
h
i

上述例子,自由度=(31) ×(31)=4
上述例子,如果計算結果卡方值大於9.49,查卡方分布表自由度為4時,卡方值大於9.49P值<0.05,故達統計上意義。
卡方分布圖起源不了解,自然無法搞懂自由度的涵義,有誰能傾囊相授?

0 意見:

張貼留言