簡易流行病學與生物統計學 六、相對危險比(relative risk ratio,RR) 勝算比(odds ratio,OR)

簡易流行病學與生物統計學
六、相對危險比(relative risk ratioRR
勝算比(odds ratioOR
作者吳聰賢醫師

(表二)桃園縣某國小桿菌性痢疾感染相關危險因子之單變項分析

相對危
險性
信賴
區間
P
病例
a
非病例
b
病例
c
非病例
d
食用禮拜一營養午餐
682
1603
26
48
0.79
0.47-1.31
0.396
食用禮拜二營養午餐
679
1609
31
41
0.56
0.34-0.92
0.015*
食用禮拜三營養午餐
675
1602
35
47
0.57
0.35-0.91
0.011*
食用禮拜四營養午餐
619
1601
78
47
0.23
0.16-0.34
0.000*
食用禮拜五營養午餐
535
1550
144
88
0.21
0.16-0.28
0.000*
       *單變項結果具有顯著意義(p值<0.05
(摘錄自行政院衛生署疫情報導第十三卷第一期第10頁)

(表三)桃園縣某國小桿菌性痢疾感染相關危險因子之多變項分析

係數
標準差
勝算比
信賴區間
P
截距
-1.0636
0.3943


0.007
食用禮拜一營養午餐
0.8296
0.6491
2.292
8.17-0.64
0.2012
食用禮拜二營養午餐
0.5552
0.7909
1.742
8.21-0.37
0.4827
食用禮拜三營養午餐
0.3108
0.5552
1.365
4.05-0.46
0.5756
食用禮拜四營養午餐
-1.1814
0.3696
0.307
0.63-0.15
0.0014*
食用禮拜五營養午餐
-1.6166
0.2168
0.199
0.35-0.30
0.0001*
*p0.05
(摘錄自行政院衛生署疫情報導第十三卷第一期第11頁)

相對危險比(relative risk ratioRR)和勝算比(odds ratio
大部分人將相對危險比和勝算比混淆不清,民國89年職業病醫學會年度大會在陽明大學舉行,我曾起立發言指正南部某大學教授論文報告的錯誤,我至今還懷疑此位知名教授是否知道自己所犯錯誤為何。
  相對危險比(relative risk ratioRR)是真正的危險比,勝算比(odds ratio)不是真正的危險比,只是真正危險比的估計值,用勝算比來估計真正的危險比,不能代表真正危險比,可能很接近真正危險比,也可能失之毫釐,差之千里。假設彰化縣100萬人口,其中40萬人抽菸,60萬人不抽菸,抽菸者中16人罹患肺癌,不抽菸者中有6人得肺癌,


得肺癌
沒得肺癌

有抽菸
16人(a
399984人(b
40萬人(ab
沒有抽菸
6人 (c
599994人(d
60萬人(cd

22人(ac
999978人(bd
100萬人
abcd

抽菸罹患肺癌的發病率=a/(a+b)16/40萬人=4/10
不抽菸罹患肺癌的發病率=c/(c+d)6/60萬人=1/10
抽菸引肺癌的相對危險比(relative risk ratio)=a/(a+b)/ c/(c+d)(4/10)/(1/10)4

  抽菸引起肺癌的危險性是不抽菸者的四倍,記住!相對危險比(relative risk ratio)的分母是以全部母群體(general population)總數計算,一般流行病學研究不可能整個群體所有個體均調查,所花人力、物力、及金錢太龐大,承擔不起,只能抽樣找樣本(sampling samples)、或隨意抽樣(non-randomized samples)來調查,如台灣老年國民營養調查、和疫苗部分自費負擔調查,前者為抽樣找樣本(sampling samples),或稱隨機抽樣(randomized samples),後者為隨意抽樣(non-randomized samples),或稱立意抽樣。
  不管是病例對照研究(case-control study)、族群研究(cohort study)、或病例族群研究(case cohort study )均是用樣本、配對樣本、或抽樣樣本來估計真正的危險比,這種方法就是勝算比(odds ratio)。
  假設彰化基督教醫院胸腔科有20位肺癌病患,其中10位有抽菸,另10位沒有抽菸,以相同性別、年齡、居住地、或加上社經地位配對,找出非肺癌的40位對照組,其中10位有抽菸,另外30位沒有抽菸,


得肺癌
沒得肺癌

有抽菸
10人(a
10人(b
20人(a+b
沒有抽菸
10人(c
30人(d
40人(c+d

20人(a+c
40人(b+d
60
a+b+c+d

抽菸引起肺癌的勝算(odds,有稱暴露比)=(10/20)/(10/20)10/10
不抽菸引起肺癌的勝算(odds,有稱暴露比)=(10/40)/(30/40)10/30
抽菸引起肺癌的勝算比(odds ratio)=(10/10)/( 10/30)3
抽菸引起肺癌的勝算比(odds ratio)的公式=(a×d)÷(c×b

  有一種似是而非的算法,沒人提醒自己錯一輩子也迷糊,說不定還洋洋得意
抽菸引起肺癌的發病率=10/20
沒抽菸引起肺癌的發病率=10/40
抽菸引起肺癌的相對發病率=(10/20)/( 10/40)2

  2既不是相對危險比(relative risk ratioRR),也不是勝算比(odds ratio),以少數樣本而非母群,怎能計算真正的發病率?此是怪胎,不小心容易受騙。

(a)  (表二)的『相對危險性』計算方式如下:
      a×d)÷(b×c)=(682×48)÷(1603×26)=0.79
      可見其『相對危險性』是勝算比(odds ratioOR),不是相對危險比(relative risk ratioRR),此種中文翻譯易讓人誤解,或者本篇作者根本分不清相對危險比(relative risk ratioRR)或勝算比(odds ratioOR)?
      如果以整個學校當母群體(general population)有何不可,母群體可大到全世界、全亞洲、全中國、全台灣,也可小到一個鄉鎮、一個鄰里、或一個學校,一個班級可不可以?當然可以,只是做推論統計時,不易達統計學意義(p0.05)。
      在表二,如果以整個學校當母群體,可以用下方法直接計算出相對危險比(relative risk ratioRR):
      吃營養午餐引起痢疾的相對危險比=682/(1603+682)/26/(26+48)0.85

      0.85相對危險比(RR)明顯不同於0.79勝算比(OR),此0.85用母群體觀念來計算,因桃園縣某國小全體學生均在研究之列,如果只是部分學生參與研究,採用樣本作研究,則0.85將變成怪胎,不是相對危險比(RR),也不是勝算比(OR),只是算數導出來的小丑把戲;再次強調,切記!只有整個群體(所謂母群體general population)參與研究推演出來的才能稱為相對危險比(RR),否則只能計算勝算比(OR)。
(b)  (表二)的『信賴區間』是『95%信賴區間』的簡稱。此表格統計採用類別變項的2×2列聯表的卡方檢定(x2 testx是希臘24個字母中,第22個字母的小寫,英文讀成chi-萬國音標kaix2 tst讀成chi-square test,中文音譯加意譯翻為卡方檢定-翻譯成卡平方檢定會較貼切),此類的統計總稱為卡方檢定,為何不稱為阿爾發平方檢定(α希臘第一個字母)?為何不稱為歐美歌平方檢定(ω希臘最後一個字母)?我莫宰秧。
  類別變項是連續變項(如身高167168169170172.5160.5公分就是連續變項,如體重5052546062.467.5公斤就是連續變項,連續變項又分等比變項、和等距變項,以後詳談)、序列變項(或稱為等級變項,如競賽成績冠軍、亞軍、季軍、殿軍等,如班級成績第一名、第二名、第三名、第四名等)的相對辭,類別變項可翻譯成「種類變項」、或「性質變項」較易了解,如男、女生,如抽菸、不抽菸,如生病、不生病,如牛、羊、馬、豬等,如彰化縣衛生局、南投縣衛生局、台中市衛生局、台中縣衛生局等。卡方檢定在食品衛生課最常用得到,如去年六月芳苑食品中毒案,食品中毒的問卷調查一定包括拉肚子的病患:有幾個吃鴨肉?有幾個沒吃鴨肉?沒有拉肚子的家屬:有幾個吃鴨肉?有幾個沒吃鴨肉?作成2×2列聯表如下


拉肚子
沒有拉肚子
有吃鴨肉
a
b
沒有吃鴨肉
c
d
  
  以『有吃鴨肉』、『沒有吃鴨肉』當作第一種類別變項,以『拉肚子』、『沒有拉肚子』當作第二種類別變項,2乘以2共有四種狀況,可用22列表示,故稱為2×2列聯表,a人、b人、c人、和d人不是類別變項,也不是連續變項,只是用於計算的單一數據。
  卡方檢定只用於2×2列聯表嗎?當然不是!2×3列聯表、2×4列聯表、2×5列聯表、2×6列聯表、2×7列聯表,甚至2×100列聯表都可以,不必特殊的套裝統計軟體,如SASSPSS統計軟體,只要microsoft excel內的統計軟體即可計算卡方值、和估計是否達統計學意義的P值,2×3列聯表(故意寫成3×2列聯表可不可以?當然可以,沒人會反對)舉例如下,其餘類推


得肺癌
沒有得肺癌
經常抽菸
a
b
偶而抽菸
c
d
不抽菸
e
f

  卡方檢定可不可以3×3列聯表、或4×4列聯表?應該沒有,或許有好事之徒把3×3列聯表用32×3列聯表來表示未嘗不可,類似用變異數分析(analysis of varianceANOVA)來多重檢定t test
  (表二)桃園縣某國小桿菌性痢疾感染,第一行『食用禮拜一營養午餐』可用2×2列聯表來表示,意思會更清楚,


病例
非病例
有食用禮拜一營養午餐
682
1603
無食用禮拜一營養午餐
26
48

  95%信賴區間』關聯到卡方分布(x2 distribution),在連續數據裡從最小值排到最大值可連成一條連續曲線,此曲線即是分布圖,簡稱分布(distribution),除了卡方分布,尚有常態分布(normal distribution)、標準常態分布(standard normal distribution)、t分布、z分布、和F分布等,每一種分布各有其性質,每一條分布曲線所涵蓋面積均是100%,當只涵蓋95%面積時,把對應到區線上的數據寫出來,習慣上先寫最小值,然後寫最大值,曾見過某些研究論文顛倒寫,感覺很異類,此用短破折號連接的兩個數據即是『95%信賴區間』,例如(表二)首列(0.47-1.31)就是『95%信賴區間』,此信賴區間類似P值,從其數據可推論是否達統計學意義。
  除了數學家、或統計學家,這些分布、及95%信賴區間的來源、曲線畫法、對應數據等觀念問題相當深奧,想了解它比登天還難,更甚者,在卡方分布,其分布曲線會隨自由度(freedom degree)改變而改變,另人懷疑有誰能將自由度的觀念說清楚講明白?如果能從套裝統計軟體跑出95%信賴區間、和P值,或者從前述各種分布,已由數學家、或統計學家寫成的分布表,查出臨界值(「臨界值」三個字太理論化,觀念空汎不實際,不知害死多少無辜學子,改成「關鍵值」觀念將很清楚),自己利用公式算出的數據,例如卡方值(x2 value),與臨界值比較,大於臨界值即達統計學差異,小於臨界值即未達統計學差異,能達此地步已相當高竿,說白一點,您已有研究所碩士班的程度;上述推論統計觀念、和實際運用,不是三言兩語能解釋清楚,非賣關子,敬請期待下回分曉。
(c)  (表二)的P值(probability value)一樣不知害死多少莘莘學子,令人懷疑統計學家居心不良,外國學者從英文簡稱為P值,中國學者依樣畫葫蘆稱為P值有虧職守,P值的原文翻譯就是機率值、或概率值,為何不直接稱為機率值、或概率值?跟上述95%信賴區間一起思考會較容易瞭解,當統計學計算出一個數據大於95%信賴區間的最大值,或小於95%信賴區間的最小值(牽涉到單尾one-tail、雙尾two-tail的觀念,統計學這條路尚有波折,以後另會詳述-花公家24萬新台幣念研究所,公假沒計算在內,不回饋怎行?),也就是位於95%信賴區間所圍成百分之九十五面積以外的面積,100%95%5%,以外的面積是5%,也就是0.05P值<0.05觀念的起源),借用一句童言童語,95%面積以內的叫「同一國的」,95%面積以外的(只有5%)叫做「不是同一國的」,「同一國的」代表甲、乙兩樣東西、或兩組東西是相似的,甚至相同的,即甲乙兩數據均落在95%面積內,統計學上表示兩者無差異性,稱為無統計學差異,簡稱無統計學意義,甚至簡稱為無意義(no significant),「不是同一國的」代表甲、乙兩樣東西、或兩組東西是不相同的,即甲乙兩數據分別落在95%面積內和外,面積內佔95%,面積外只佔5%,統計學上表示兩者有差異性,稱為有統計學差異,簡稱有統計學意義,甚至簡稱為有意義(significant)。
  推論統計學其根源在檢定兩種互為相反的假設那個正確,虛無假設(null hypothesis,統計學習慣用H0表示)、和對立假設(alternative hypothesis,統計學習慣用H1表示),「虛無假設」、和「對立假設」此兩名詞極端空洞,讓人丈二金剛摸不著腦袋,如意譯為「無差異性假設」、和「有差異性假設」才使人恍然大悟,90131日自由時報自由廣場,台北榮總教學研究部研究員兼主治醫師、和陽明大學醫學院內科教授郭正典寫了一篇文章:「null hypothesis被譯為虛無假設,這個翻譯讓人看了腦中一片虛無,心中一片茫然,不知它到底在說些什麼,null hypothesis的原意是a hypothesis of no difference,正確翻譯應是無差異假設,我國許多生物統計學專家把它譯為虛無假設,實在很虛無。」以美國人、和中國人身高為例,「無差異性假設」就是「假設美國人平均身高和中國人平均身高相同,兩者沒有差異」,「有差異性假設」就是「假設美國人平均身高和中國人平均身高不相同,兩者有差異」,所謂「相同」是統計學上的相同,不是美國人平均身高180公分,中國人平均身高也要180公分,以95%信賴區間觀念來看,如果美國人平均身高的95%信賴區間最大值是190公分,最小值是170公分,如果中國人平均身高是172公分,落在最大值和最小值之間,則稱兩者在統計學上沒有差異性,如果中國人平均身高是168公分,或則192公分,落在最小值之外,或則落在最大值之外,則稱兩者在統計學上有差異性;反過來,以中國人平均身高的95%信賴區間來看瑪也通,如果美國人平均身高落在95%信賴區間之內,則稱兩者在統計學上沒有差異性,如果美國人平均身高落在95%信賴區間之外,則稱兩者在統計學上有差異性(以上說明只解釋95%信賴區間觀念,內容會誤導,以後詳談)。
  中國醫藥學院環境醫學研究所郭憲文所長,在某學術研討會上曾親身經歷一個笑話,某大學教授作甲藥、和新發明乙藥功效比較研究,結果兩者沒有統計學上差異,他說:「乙藥和甲藥研究結果沒有統計學上差異,證明乙藥和甲藥功效一樣好。」是睜眼說瞎話、自欺欺人,還是不懂統計學?此教授犯了兩個錯誤,第一個錯誤:作研究的目的在追求統計學差異性,希望落在95%信賴區間之外,即P值<0.05,有些研究者更嚴苛自我要求,希望落在99%信賴區間之外,甚至99.9%信賴區間之外,即P值<0.01、或P值<0.001,當新發明乙藥功效不能落在95%信賴區間之外,大於最大值表示乙藥功效比甲藥好,小於最小值表示乙藥功效比甲藥壞(此為雙尾two tail觀念,在這裡應該追求大於最大值,不是小於最小值),沒有差異性代表乙藥沒有勝過甲藥,發明乙藥幹嘛!除非經濟考量,乙藥比甲藥便宜很多,第二個錯誤:乙藥跟甲藥沒有統計學差異,不代表乙藥跟甲藥功效一樣,這種說法在混淆視聽,嚴以律人,寬以待己,用5%面積嚴格要求別人,而用95%面積寬待自己,誰敢保證乙藥功效會跟甲藥一樣?難道不會落在95%信賴區間最小值旁邊,或許正落在2.5-5%區間內(雙尾觀念,在95%信賴區間,從無限小值到最小值佔2.5%面積,從無限大值到最最大值也佔2.5%面積)。
  中國醫藥學院環境醫學研究所統計學梁文敏副教授,上課時說的一句話:「一陣春風,吹皺一湖春水」,平靜似鏡的湖面,不如春風拂過湖面,舞起陣陣漣漪,往外擴散,又擴散,讓人心神蕩漾,產生無限遐思,這也是統計學的最高境界,追求統計學的意義-significant

0 意見:

張貼留言