簡易流行病學與生物統計學 一O四、t檢定、配對t檢定

簡易流行病學與生物統計學
O四、t檢定配對t檢定
作者吳聰賢醫師
比較兩組資料平均值(mean)大小,是否達統計學差異性,必須靠t檢定(t-test)。如果異想天開,直接拿兩組資料的平均值做大小比較,未免被人笑掉大牙,因為只知平均值大小,兩者是否達統計學差異,不知道。類別變項(nominal variable,或稱類別尺度nominal scale)、序位變項(ordinal variable,或稱序位尺度ordinal scale)不適用t檢定,例如,男、女兩性類別變項,第一名、第二名、第三名排名序位變項,均不可用t檢定。縱然採用虛擬變項(dummy variable,見護理人員在職訓練第5講),女生為0男生為1,第一名為1、第二名為2、第三名為3,勉強算出平均值,採用t檢定也是無甚意義。
只有等距變項(interval variable,或稱等距尺度interval scale)和等比變項(ratio variable,或稱等比尺度ratio scale)始適用於t檢定,例如,東京市每日氣溫與台北市每日氣溫比較,東京大學男學生與台灣大學男學生身高比較,可以採用t檢定。
有公式可以算出t值,然後查t分布表,可以推論兩者是否達統計學意義。t分布表如何演算出來?牽扯其中的自由度(degree of freedomd.f.,樣本數減1即是自由度。東京大學100名男學生,與台灣大學100名男學生身高比較,100 1 99,此99即是自由度嗎?當然不是,如果這樣簡單,統計學還算統計學?)對分布表有何影響?已經超出理解的範圍,我莫哉秧。有人說,只要會用電腦統計套裝軟體,其餘的讓統計學家去傷腦筋。
t分布(t-distribution)又稱學生氏t分布(Students t-distribution),是統計學家W.S.Gosset以筆名Student發表的。t分布係由Z分布(Z-distribution)推演出來。t分布不是完美無缺,某些狀況下,誤差甚大,曾經被數位統計學家修正過,如R.A.Fisher
當兩組資料有某種關聯性,例如,前述前測與後測資料互有相關性,類似孿生兄弟。前測與後測均是同一個人的測量值,一般前測高者,後測也較高,前測低者,後測也較低。此時,不可用t檢定,必須用配對t檢定。t檢定與配對t檢定差異在那裡?我不知道,如果不用配對t檢定,其影響結果比例有多大,我也不知道。
微軟(microsoftExcel的「工具」列中的「資料分析」,提供15種主要統計方法,其中關於t檢定有四種:
1.  t檢定-成對母體平均數差異檢定。
2.  t檢定-兩個母體平均數差的檢定,假設變異數相等。
3.  t檢定-兩個母體平均數差的檢定,假設變異數不相等。
4.  z檢定-兩個母體平均數差異檢定。
第一種t檢定即是配對t檢定(paired t-test)。第四種z檢定,當樣本數無限大時,t值等於z值,使用t檢定或z檢定,其結果一樣。第二與第三種t檢定,差別在母群體變異數是否相等,其間的統計差別何在?何時使用第二種檢定,何時使用第三種檢定?我不知道,如何知道兩個母群體變異數(variance)是否相同?我不知道。分別使用第二與第三種檢定,可以得到相同的t值與不同的p值。
目前,新的套裝統計軟體,幫您省掉煩惱,不必去管變異數是否相同,電腦主動計算變異數是否相同,直接拋出單一個p值。如何主動幫您計算?我不知道,應該是使用概算,如果使用概算,是否又牽涉檯面下另外一個p質?概算中,再另一個概算,統計出來的東西有多少真實性?如果像ANOVAMANOVA,後面將述及,十幾個,甚至幾十個概算串聯起來,所得到的結果是否嚴重扭曲?
假設,十一位衛生署員工收縮壓的前測與後測情形如下:
  收縮壓前測值(mmHg)收縮壓後測值(mmHg
1.          132               129
2.          140               128
3.          150               154
4.          167               157
5.          143               136
6.          139               133
7.          158               162
8.          149               141
9.          156               152
10.         145               145
11.         150               140
點選第一種t檢定(成對母體平均數差異檢定),電腦軟體計算結果如下:
 
變數 1
變數 2
平均數
148.0909
143.36364
變異數
96.89091
134.45455
觀察值個數
11
11
皮耳森相關係數
0.880196

假設的均數差
0

自由度
10

t 統計
2.842761

P(T<=t) 單尾
0.008733

臨界值:單尾
1.812462

P(T<=t) 雙尾
0.017466

臨界值:雙尾
2.228139
 

點選第二種t檢定(兩個母體平均數差的檢定,假設變異數相等),結果如下:
 
變數 1
變數 2
平均數
148.090909
143.36364
變異數
96.8909091
134.45455
觀察值個數
11
11
Pooled 變異數
115.672727

假設的均數差
0

自由度
20

t 統計
1.030805

P(T<=t) 單尾
0.15746877

臨界值:單尾
1.724718

P(T<=t) 雙尾
0.31493755

臨界值:雙尾
2.08596248
 

點選第三種t檢定(兩個母體平均數差的檢定,假設變異數不相等),結果如下:
 
變數 1
變數 2
平均數
148.0909
143.36364
變異數
96.89091
134.45455
觀察值個數
11
11
假設的均數差
0

自由度
19

t 統計
1.030805

P(T<=t) 單尾
0.157788

臨界值:單尾
1.729131

P(T<=t) 雙尾
0.315576

臨界值:雙尾
2.093025
 

點選第四種z檢定(兩個母體平均數差異檢定),結果如下:
 
變數 1
變數 2
平均數
148.090909
143.36364
已知的變異數
96.89091
134.4545
觀察值個數
11
11
假設的均數差
0

z
1.0308051

P(Z<=z) 單尾
0.15131613

臨界值:單尾
1.644853

P(Z<=z) 雙尾
0.30263226

臨界值:雙尾
1.95996108
 

以上四種t檢定,整理列表如下:

自由度
t
p/臨界值(單尾)
p/臨界值(雙尾)
第一種
10111
2.843
0.009 / 1.813
0.018 / 2.228
第二種
2011112
1.031
0.157 / 1.725
0.315 / 2.086
第三種
1911113
1.031
0.158 / 1.729
0.316 / 2.093
第四種
無限大
1.031
0.151 / 1.645
0.303 / 1.960

自由度會影響t-分布,四種檢定有四種自由度,自由度為何如此計算?我不知道。第一種檢定,無論單尾或雙尾(見護理人員在職訓練第2講),p值均<0.05,達統計學意義,另外三種檢定,無論單尾或雙尾,p值均>0.05,不達統計學意義,很奇怪吧。
z值=1.645時,從最小值到臨界值(平均值+1.645 ×標準差),常態曲線所圍成的面積佔95%,區域外面積佔5%,此稱單尾檢定;當z值=1.96時,從此點(平均值-1.96 ×標準差)到臨界值(平均值+1.96 ×標準差),常態曲線所圍成的面積佔95%,區域外面積佔5%,此稱雙尾檢定。當檢定的數據落在那5%範圍內,一般訂為達統計學意義,即α = 0.05
東京大學與台灣大學男學生平均身高比較,檢定「兩個學校學生平均身高是否有差異?」屬雙尾檢定。可能東大高於台大,東大身高平均值落在97.5%面積外,臨界點為「台大身高平均值+1.96 ×標準差」。也可能東大低於台大,東大身高平均值落在2.5%面積內,臨界點為「台大身高平均值-1.96 ×標準差」,因為同時檢定高和低,同時檢定兩邊極端值(落在97.5%面積外和落在2.5%面積內),故稱「雙尾」,意指「雙端」。凡落在97.5%面積外或2.5%面積內,統計學上稱兩者「有顯著性差異」。
東京大學與台灣大學男學生平均身高比較,如果只檢定「東大身高平均值是否高於台大?」東大身高平均值落在95%面積外,臨界點為「台大身高平均值+1.645 ×標準差」。如果只檢定「東大身高平均值是否低於台大?」東大身高平均值落在5%面積內,臨界點為「台大身高平均值-1.645 ×標準差」,因為只檢定高或低一種,檢定單邊極端值(落在95%面積外或落在5%面積內),故稱「單尾」,意指「單邊」。凡落在95%面積外或5%面積內,統計學上稱兩者「有顯著性差異」。
t值觀念類似z值,t檢定延伸自z檢定,但是t值受限於自由度,不同的自由度有不同的臨界點。當t值大於臨界值,一定p值<0.05,達統計學意義,當t值小於臨界值,一定p值>0.05,未達統計學意義。由t值推算真正的p值,除了靠統計軟體,我懷疑人腦是否有辦法計算出來?

0 意見:

張貼留言