簡易流行病學與生物統計學
六、相對危險比(relative risk ratio,RR)
勝算比(odds ratio,OR)
作者:吳聰賢醫師
(表二)桃園縣某國小桿菌性痢疾感染相關危險因子之單變項分析
是
|
否
|
相對危
險性
|
信賴
區間
|
P值
|
|||
病例
(a)
|
非病例
(b)
|
病例
(c)
|
非病例
(d)
|
||||
食用禮拜一營養午餐
|
682
|
1603
|
26
|
48
|
0.79
|
0.47-1.31
|
0.396
|
食用禮拜二營養午餐
|
679
|
1609
|
31
|
41
|
0.56
|
0.34-0.92
|
0.015*
|
食用禮拜三營養午餐
|
675
|
1602
|
35
|
47
|
0.57
|
0.35-0.91
|
0.011*
|
食用禮拜四營養午餐
|
619
|
1601
|
78
|
47
|
0.23
|
0.16-0.34
|
0.000*
|
食用禮拜五營養午餐
|
535
|
1550
|
144
|
88
|
0.21
|
0.16-0.28
|
0.000*
|
*單變項結果具有顯著意義(p值<0.05)
(摘錄自行政院衛生署疫情報導第十三卷第一期第10頁)
(表三)桃園縣某國小桿菌性痢疾感染相關危險因子之多變項分析
係數
|
標準差
|
勝算比
|
信賴區間
|
P值
|
|
截距
|
-1.0636
|
0.3943
|
0.007
|
||
食用禮拜一營養午餐
|
0.8296
|
0.6491
|
2.292
|
8.17-0.64
|
0.2012
|
食用禮拜二營養午餐
|
0.5552
|
0.7909
|
1.742
|
8.21-0.37
|
0.4827
|
食用禮拜三營養午餐
|
0.3108
|
0.5552
|
1.365
|
4.05-0.46
|
0.5756
|
食用禮拜四營養午餐
|
-1.1814
|
0.3696
|
0.307
|
0.63-0.15
|
0.0014*
|
食用禮拜五營養午餐
|
-1.6166
|
0.2168
|
0.199
|
0.35-0.30
|
0.0001*
|
*p<0.05
(摘錄自行政院衛生署疫情報導第十三卷第一期第11頁)
相對危險比(relative risk ratio,RR)和勝算比(odds ratio)
大部分人將相對危險比和勝算比混淆不清,民國89年職業病醫學會年度大會在陽明大學舉行,我曾起立發言指正南部某大學教授論文報告的錯誤,我至今還懷疑此位知名教授是否知道自己所犯錯誤為何。
相對危險比(relative risk
ratio,RR)是真正的危險比,勝算比(odds ratio)不是真正的危險比,只是真正危險比的估計值,用勝算比來估計真正的危險比,不能代表真正危險比,可能很接近真正危險比,也可能失之毫釐,差之千里。假設彰化縣100萬人口,其中40萬人抽菸,60萬人不抽菸,抽菸者中16人罹患肺癌,不抽菸者中有6人得肺癌,
得肺癌
|
沒得肺癌
|
||
有抽菸
|
16人(a)
|
399984人(b)
|
40萬人(a+b)
|
沒有抽菸
|
6人 (c)
|
599994人(d)
|
60萬人(c+d)
|
22人(a+c)
|
999978人(b+d)
|
100萬人
(a+b+c+d)
|
抽菸罹患肺癌的發病率=a/(a+b)=16人/40萬人=4/10萬
不抽菸罹患肺癌的發病率=c/(c+d)=6人/60萬人=1/10萬
抽菸引肺癌的相對危險比(relative risk ratio)=「a/(a+b)」/ 「c/(c+d)」=(4/10萬)/(1/10萬)=4
抽菸引起肺癌的危險性是不抽菸者的四倍,記住!相對危險比(relative risk ratio)的分母是以全部母群體(general
population)總數計算,一般流行病學研究不可能整個群體所有個體均調查,所花人力、物力、及金錢太龐大,承擔不起,只能抽樣找樣本(sampling samples)、或隨意抽樣(non-randomized
samples)來調查,如台灣老年國民營養調查、和疫苗部分自費負擔調查,前者為抽樣找樣本(sampling
samples),或稱隨機抽樣(randomized samples),後者為隨意抽樣(non-randomized samples),或稱立意抽樣。
不管是病例對照研究(case-control study)、族群研究(cohort study)、或病例族群研究(case cohort study )均是用樣本、配對樣本、或抽樣樣本來估計真正的危險比,這種方法就是勝算比(odds ratio)。
假設彰化基督教醫院胸腔科有20位肺癌病患,其中10位有抽菸,另10位沒有抽菸,以相同性別、年齡、居住地、或加上社經地位配對,找出非肺癌的40位對照組,其中10位有抽菸,另外30位沒有抽菸,
得肺癌
|
沒得肺癌
|
||
有抽菸
|
10人(a)
|
10人(b)
|
20人(a+b)
|
沒有抽菸
|
10人(c)
|
30人(d)
|
40人(c+d)
|
20人(a+c)
|
40人(b+d)
|
60人
(a+b+c+d)
|
抽菸引起肺癌的勝算(odds,有稱暴露比)=(10/20)/(10/20)=10/10
不抽菸引起肺癌的勝算(odds,有稱暴露比)=(10/40)/(30/40)=10/30
抽菸引起肺癌的勝算比(odds ratio)=(10/10)/( 10/30)=3
抽菸引起肺癌的勝算比(odds ratio)的公式=(a×d)÷(c×b)
有一種似是而非的算法,沒人提醒自己錯一輩子也迷糊,說不定還洋洋得意:
抽菸引起肺癌的發病率=10人/20人
沒抽菸引起肺癌的發病率=10人/40人
抽菸引起肺癌的相對發病率=(10人/20人)/( 10人/40人)=2
此「2」既不是相對危險比(relative risk ratio,RR),也不是勝算比(odds ratio),以少數樣本而非母群,怎能計算真正的發病率?此是怪胎,不小心容易受騙。
(a) (表二)的『相對危險性』計算方式如下:
(a×d)÷(b×c)=(682×48)÷(1603×26)=0.79
可見其『相對危險性』是勝算比(odds ratio,OR),不是相對危險比(relative risk ratio,RR),此種中文翻譯易讓人誤解,或者本篇作者根本分不清相對危險比(relative risk ratio,RR)或勝算比(odds ratio,OR)?
如果以整個學校當母群體(general population)有何不可,母群體可大到全世界、全亞洲、全中國、全台灣,也可小到一個鄉鎮、一個鄰里、或一個學校,一個班級可不可以?當然可以,只是做推論統計時,不易達統計學意義(p<0.05)。
在表二,如果以整個學校當母群體,可以用下方法直接計算出相對危險比(relative risk ratio,RR):
吃營養午餐引起痢疾的相對危險比=「682/(1603+682)」/「26/(26+48)」=0.85
0.85相對危險比(RR)明顯不同於0.79勝算比(OR),此0.85用母群體觀念來計算,因桃園縣某國小全體學生均在研究之列,如果只是部分學生參與研究,採用樣本作研究,則0.85將變成怪胎,不是相對危險比(RR),也不是勝算比(OR),只是算數導出來的小丑把戲;再次強調,切記!只有整個群體(所謂母群體general
population)參與研究推演出來的才能稱為相對危險比(RR),否則只能計算勝算比(OR)。
(b) (表二)的『信賴區間』是『95%信賴區間』的簡稱。此表格統計採用類別變項的2×2列聯表的卡方檢定(x2 test,x是希臘24個字母中,第22個字母的小寫,英文讀成chi-萬國音標kai,x2
tst讀成chi-square test,中文音譯加意譯翻為卡方檢定-翻譯成卡平方檢定會較貼切),此類的統計總稱為卡方檢定,為何不稱為阿爾發平方檢定(α希臘第一個字母)?為何不稱為歐美歌平方檢定(ω希臘最後一個字母)?我莫宰秧。
類別變項是連續變項(如身高167、168、169、170、172.5、160.5公分就是連續變項,如體重50、52、54、60、62.4、67.5公斤就是連續變項,連續變項又分等比變項、和等距變項,以後詳談)、序列變項(或稱為等級變項,如競賽成績冠軍、亞軍、季軍、殿軍等,如班級成績第一名、第二名、第三名、第四名等)的相對辭,類別變項可翻譯成「種類變項」、或「性質變項」較易了解,如男、女生,如抽菸、不抽菸,如生病、不生病,如牛、羊、馬、豬等,如彰化縣衛生局、南投縣衛生局、台中市衛生局、台中縣衛生局等。卡方檢定在食品衛生課最常用得到,如去年六月芳苑食品中毒案,食品中毒的問卷調查一定包括拉肚子的病患:有幾個吃鴨肉?有幾個沒吃鴨肉?沒有拉肚子的家屬:有幾個吃鴨肉?有幾個沒吃鴨肉?作成2×2列聯表如下
拉肚子
|
沒有拉肚子
|
|
有吃鴨肉
|
a人
|
b人
|
沒有吃鴨肉
|
c人
|
d人
|
以『有吃鴨肉』、『沒有吃鴨肉』當作第一種類別變項,以『拉肚子』、『沒有拉肚子』當作第二種類別變項,2乘以2共有四種狀況,可用2欄2列表示,故稱為2×2列聯表,a人、b人、c人、和d人不是類別變項,也不是連續變項,只是用於計算的單一數據。
卡方檢定只用於2×2列聯表嗎?當然不是!2×3列聯表、2×4列聯表、2×5列聯表、2×6列聯表、2×7列聯表,甚至2×100列聯表都可以,不必特殊的套裝統計軟體,如SAS、SPSS統計軟體,只要microsoft excel內的統計軟體即可計算卡方值、和估計是否達統計學意義的P值,2×3列聯表(故意寫成3×2列聯表可不可以?當然可以,沒人會反對)舉例如下,其餘類推
得肺癌
|
沒有得肺癌
|
|
經常抽菸
|
a人
|
b人
|
偶而抽菸
|
c人
|
d人
|
不抽菸
|
e人
|
f人
|
卡方檢定可不可以3×3列聯表、或4×4列聯表?應該沒有,或許有好事之徒把3×3列聯表用3組2×3列聯表來表示未嘗不可,類似用變異數分析(analysis of variance,ANOVA)來多重檢定t test。
(表二)桃園縣某國小桿菌性痢疾感染,第一行『食用禮拜一營養午餐』可用2×2列聯表來表示,意思會更清楚,
病例
|
非病例
|
|
有食用禮拜一營養午餐
|
682人
|
1603人
|
無食用禮拜一營養午餐
|
26人
|
48人
|
『95%信賴區間』關聯到卡方分布(x2 distribution),在連續數據裡從最小值排到最大值可連成一條連續曲線,此曲線即是分布圖,簡稱分布(distribution),除了卡方分布,尚有常態分布(normal
distribution)、標準常態分布(standard normal distribution)、t分布、z分布、和F分布等,每一種分布各有其性質,每一條分布曲線所涵蓋面積均是100%,當只涵蓋95%面積時,把對應到區線上的數據寫出來,習慣上先寫最小值,然後寫最大值,曾見過某些研究論文顛倒寫,感覺很異類,此用短破折號連接的兩個數據即是『95%信賴區間』,例如(表二)首列(0.47-1.31)就是『95%信賴區間』,此信賴區間類似P值,從其數據可推論是否達統計學意義。
除了數學家、或統計學家,這些分布、及95%信賴區間的來源、曲線畫法、對應數據等觀念問題相當深奧,想了解它比登天還難,更甚者,在卡方分布,其分布曲線會隨自由度(freedom degree)改變而改變,另人懷疑有誰能將自由度的觀念說清楚講明白?如果能從套裝統計軟體跑出95%信賴區間、和P值,或者從前述各種分布,已由數學家、或統計學家寫成的分布表,查出臨界值(「臨界值」三個字太理論化,觀念空汎不實際,不知害死多少無辜學子,改成「關鍵值」觀念將很清楚),自己利用公式算出的數據,例如卡方值(x2 value),與臨界值比較,大於臨界值即達統計學差異,小於臨界值即未達統計學差異,能達此地步已相當高竿,說白一點,您已有研究所碩士班的程度;上述推論統計觀念、和實際運用,不是三言兩語能解釋清楚,非賣關子,敬請期待下回分曉。
(c) (表二)的P值(probability value)一樣不知害死多少莘莘學子,令人懷疑統計學家居心不良,外國學者從英文簡稱為P值,中國學者依樣畫葫蘆稱為P值有虧職守,P值的原文翻譯就是機率值、或概率值,為何不直接稱為機率值、或概率值?跟上述95%信賴區間一起思考會較容易瞭解,當統計學計算出一個數據大於95%信賴區間的最大值,或小於95%信賴區間的最小值(牽涉到單尾one-tail、雙尾two-tail的觀念,統計學這條路尚有波折,以後另會詳述-花公家24萬新台幣念研究所,公假沒計算在內,不回饋怎行?),也就是位於95%信賴區間所圍成百分之九十五面積以外的面積,100%-95%=5%,以外的面積是5%,也就是0.05(P值<0.05觀念的起源),借用一句童言童語,95%面積以內的叫「同一國的」,95%面積以外的(只有5%)叫做「不是同一國的」,「同一國的」代表甲、乙兩樣東西、或兩組東西是相似的,甚至相同的,即甲乙兩數據均落在95%面積內,統計學上表示兩者無差異性,稱為無統計學差異,簡稱無統計學意義,甚至簡稱為無意義(no significant),「不是同一國的」代表甲、乙兩樣東西、或兩組東西是不相同的,即甲乙兩數據分別落在95%面積內和外,面積內佔95%,面積外只佔5%,統計學上表示兩者有差異性,稱為有統計學差異,簡稱有統計學意義,甚至簡稱為有意義(significant)。
推論統計學其根源在檢定兩種互為相反的假設那個正確,虛無假設(null hypothesis,統計學習慣用H0表示)、和對立假設(alternative hypothesis,統計學習慣用H1表示),「虛無假設」、和「對立假設」此兩名詞極端空洞,讓人丈二金剛摸不著腦袋,如意譯為「無差異性假設」、和「有差異性假設」才使人恍然大悟,90年1月31日自由時報自由廣場,台北榮總教學研究部研究員兼主治醫師、和陽明大學醫學院內科教授郭正典寫了一篇文章:「null hypothesis被譯為虛無假設,這個翻譯讓人看了腦中一片虛無,心中一片茫然,不知它到底在說些什麼,null hypothesis的原意是a hypothesis of no
difference,正確翻譯應是無差異假設,我國許多生物統計學專家把它譯為虛無假設,實在很虛無。」以美國人、和中國人身高為例,「無差異性假設」就是「假設美國人平均身高和中國人平均身高相同,兩者沒有差異」,「有差異性假設」就是「假設美國人平均身高和中國人平均身高不相同,兩者有差異」,所謂「相同」是統計學上的相同,不是美國人平均身高180公分,中國人平均身高也要180公分,以95%信賴區間觀念來看,如果美國人平均身高的95%信賴區間最大值是190公分,最小值是170公分,如果中國人平均身高是172公分,落在最大值和最小值之間,則稱兩者在統計學上沒有差異性,如果中國人平均身高是168公分,或則192公分,落在最小值之外,或則落在最大值之外,則稱兩者在統計學上有差異性;反過來,以中國人平均身高的95%信賴區間來看瑪也通,如果美國人平均身高落在95%信賴區間之內,則稱兩者在統計學上沒有差異性,如果美國人平均身高落在95%信賴區間之外,則稱兩者在統計學上有差異性(以上說明只解釋95%信賴區間觀念,內容會誤導,以後詳談)。
中國醫藥學院環境醫學研究所郭憲文所長,在某學術研討會上曾親身經歷一個笑話,某大學教授作甲藥、和新發明乙藥功效比較研究,結果兩者沒有統計學上差異,他說:「乙藥和甲藥研究結果沒有統計學上差異,證明乙藥和甲藥功效一樣好。」是睜眼說瞎話、自欺欺人,還是不懂統計學?此教授犯了兩個錯誤,第一個錯誤:作研究的目的在追求統計學差異性,希望落在95%信賴區間之外,即P值<0.05,有些研究者更嚴苛自我要求,希望落在99%信賴區間之外,甚至99.9%信賴區間之外,即P值<0.01、或P值<0.001,當新發明乙藥功效不能落在95%信賴區間之外,大於最大值表示乙藥功效比甲藥好,小於最小值表示乙藥功效比甲藥壞(此為雙尾two tail觀念,在這裡應該追求大於最大值,不是小於最小值),沒有差異性代表乙藥沒有勝過甲藥,發明乙藥幹嘛!除非經濟考量,乙藥比甲藥便宜很多,第二個錯誤:乙藥跟甲藥沒有統計學差異,不代表乙藥跟甲藥功效一樣,這種說法在混淆視聽,嚴以律人,寬以待己,用5%面積嚴格要求別人,而用95%面積寬待自己,誰敢保證乙藥功效會跟甲藥一樣?難道不會落在95%信賴區間最小值旁邊,或許正落在2.5-5%區間內(雙尾觀念,在95%信賴區間,從無限小值到最小值佔2.5%面積,從無限大值到最最大值也佔2.5%面積)。
中國醫藥學院環境醫學研究所統計學梁文敏副教授,上課時說的一句話:「一陣春風,吹皺一湖春水」,平靜似鏡的湖面,不如春風拂過湖面,舞起陣陣漣漪,往外擴散,又擴散,讓人心神蕩漾,產生無限遐思,這也是統計學的最高境界,追求統計學的意義-significant。
0 意見:
張貼留言