簡易流行病學與生物統計學六、相對危險比（relative risk ratio，RR）勝算比（odds ratio，OR） ~ 吳聰賢醫師

簡易流行病學與生物統計學

六、相對危險比（relative risk ratio，RR）

勝算比（odds ratio，OR）

作者：吳聰賢醫師

（表二）桃園縣某國小桿菌性痢疾感染相關危險因子之單變項分析

	是		否		相對危險性	信賴區間	P值
	病例（a）	非病例（b）	病例（c）	非病例（d）	相對危險性	信賴區間	P值
食用禮拜一營養午餐	682	1603	26	48	0.79	0.47-1.31	0.396
食用禮拜二營養午餐	679	1609	31	41	0.56	0.34-0.92	0.015*
食用禮拜三營養午餐	675	1602	35	47	0.57	0.35-0.91	0.011*
食用禮拜四營養午餐	619	1601	78	47	0.23	0.16-0.34	0.000*
食用禮拜五營養午餐	535	1550	144	88	0.21	0.16-0.28	0.000*

*單變項結果具有顯著意義（p值＜0.05）

（摘錄自行政院衛生署疫情報導第十三卷第一期第10頁）

（表三）桃園縣某國小桿菌性痢疾感染相關危險因子之多變項分析

	係數	標準差	勝算比	信賴區間	P值
截距	-1.0636	0.3943			0.007
食用禮拜一營養午餐	0.8296	0.6491	2.292	8.17-0.64	0.2012
食用禮拜二營養午餐	0.5552	0.7909	1.742	8.21-0.37	0.4827
食用禮拜三營養午餐	0.3108	0.5552	1.365	4.05-0.46	0.5756
食用禮拜四營養午餐	-1.1814	0.3696	0.307	0.63-0.15	0.0014*
食用禮拜五營養午餐	-1.6166	0.2168	0.199	0.35-0.30	0.0001*

*p＜0.05

（摘錄自行政院衛生署疫情報導第十三卷第一期第11頁）

相對危險比（relative risk ratio，RR）和勝算比（odds ratio）

大部分人將相對危險比和勝算比混淆不清，民國89年職業病醫學會年度大會在陽明大學舉行，我曾起立發言指正南部某大學教授論文報告的錯誤，我至今還懷疑此位知名教授是否知道自己所犯錯誤為何。

相對危險比（relative risk ratio，RR）是真正的危險比，勝算比（odds ratio）不是真正的危險比，只是真正危險比的估計值，用勝算比來估計真正的危險比，不能代表真正危險比，可能很接近真正危險比，也可能失之毫釐，差之千里。假設彰化縣100萬人口，其中40萬人抽菸，60萬人不抽菸，抽菸者中16人罹患肺癌，不抽菸者中有6人得肺癌，

	得肺癌	沒得肺癌
有抽菸	16人（a）	399984人（b）	40萬人（a＋b）
沒有抽菸	6人（c）	599994人（d）	60萬人（c＋d）
	22人（a＋c）	999978人（b＋d）	100萬人（a＋b＋c＋d）

抽菸罹患肺癌的發病率＝a/(a+b)＝16人/40萬人＝4/10萬

不抽菸罹患肺癌的發病率＝c/(c+d)＝6人/60萬人＝1/10萬

抽菸引肺癌的相對危險比（relative risk ratio）＝「a/(a+b)」/ 「c/(c+d)」＝(4/10萬)/(1/10萬)＝4

抽菸引起肺癌的危險性是不抽菸者的四倍，記住！相對危險比（relative risk ratio）的分母是以全部母群體（general population）總數計算，一般流行病學研究不可能整個群體所有個體均調查，所花人力、物力、及金錢太龐大，承擔不起，只能抽樣找樣本（sampling samples）、或隨意抽樣（non-randomized samples）來調查，如台灣老年國民營養調查、和疫苗部分自費負擔調查，前者為抽樣找樣本（sampling samples），或稱隨機抽樣（randomized samples），後者為隨意抽樣（non-randomized samples），或稱立意抽樣。

不管是病例對照研究（case-control study）、族群研究（cohort study）、或病例族群研究（case cohort study ）均是用樣本、配對樣本、或抽樣樣本來估計真正的危險比，這種方法就是勝算比（odds ratio）。

假設彰化基督教醫院胸腔科有20位肺癌病患，其中10位有抽菸，另10位沒有抽菸，以相同性別、年齡、居住地、或加上社經地位配對，找出非肺癌的40位對照組，其中10位有抽菸，另外30位沒有抽菸，

	得肺癌	沒得肺癌
有抽菸	10人（a）	10人（b）	20人（a+b）
沒有抽菸	10人（c）	30人（d）	40人（c+d）
	20人（a+c）	40人（b+d）	60人（a+b+c+d）

抽菸引起肺癌的勝算（odds，有稱暴露比）＝(10/20)/(10/20)＝10/10

不抽菸引起肺癌的勝算（odds，有稱暴露比）＝(10/40)/(30/40)＝10/30

抽菸引起肺癌的勝算比（odds ratio）＝(10/10)/( 10/30)＝3

抽菸引起肺癌的勝算比（odds ratio）的公式＝（a×d）÷（c×b）

有一種似是而非的算法，沒人提醒自己錯一輩子也迷糊，說不定還洋洋得意：

抽菸引起肺癌的發病率＝10人/20人

沒抽菸引起肺癌的發病率＝10人/40人

抽菸引起肺癌的相對發病率＝(10人/20人)/( 10人/40人)＝2

此「2」既不是相對危險比（relative risk ratio，RR），也不是勝算比（odds ratio），以少數樣本而非母群，怎能計算真正的發病率？此是怪胎，不小心容易受騙。

（a）（表二）的『相對危險性』計算方式如下：

（a×d）÷（b×c）＝（682×48）÷（1603×26）＝0.79

可見其『相對危險性』是勝算比（odds ratio，OR），不是相對危險比（relative risk ratio，RR），此種中文翻譯易讓人誤解，或者本篇作者根本分不清相對危險比（relative risk ratio，RR）或勝算比（odds ratio，OR）？

如果以整個學校當母群體（general population）有何不可，母群體可大到全世界、全亞洲、全中國、全台灣，也可小到一個鄉鎮、一個鄰里、或一個學校，一個班級可不可以？當然可以，只是做推論統計時，不易達統計學意義（p＜0.05）。

在表二，如果以整個學校當母群體，可以用下方法直接計算出相對危險比（relative risk ratio，RR）：

吃營養午餐引起痢疾的相對危險比＝「682/(1603+682)」/「26/(26+48)」＝0.85

0.85相對危險比（RR）明顯不同於0.79勝算比（OR），此0.85用母群體觀念來計算，因桃園縣某國小全體學生均在研究之列，如果只是部分學生參與研究，採用樣本作研究，則0.85將變成怪胎，不是相對危險比（RR），也不是勝算比（OR），只是算數導出來的小丑把戲；再次強調，切記！只有整個群體（所謂母群體general population）參與研究推演出來的才能稱為相對危險比（RR），否則只能計算勝算比（OR）。

（b）（表二）的『信賴區間』是『95%信賴區間』的簡稱。此表格統計採用類別變項的2×2列聯表的卡方檢定（x² test，x是希臘24個字母中，第22個字母的小寫，英文讀成chi－萬國音標kai，x² tst讀成chi-square test，中文音譯加意譯翻為卡方檢定－翻譯成卡平方檢定會較貼切），此類的統計總稱為卡方檢定，為何不稱為阿爾發平方檢定（α希臘第一個字母）？為何不稱為歐美歌平方檢定（ω希臘最後一個字母）？我莫宰秧。

類別變項是連續變項（如身高167、168、169、170、172.5、160.5公分就是連續變項，如體重50、52、54、60、62.4、67.5公斤就是連續變項，連續變項又分等比變項、和等距變項，以後詳談）、序列變項（或稱為等級變項，如競賽成績冠軍、亞軍、季軍、殿軍等，如班級成績第一名、第二名、第三名、第四名等）的相對辭，類別變項可翻譯成「種類變項」、或「性質變項」較易了解，如男、女生，如抽菸、不抽菸，如生病、不生病，如牛、羊、馬、豬等，如彰化縣衛生局、南投縣衛生局、台中市衛生局、台中縣衛生局等。卡方檢定在食品衛生課最常用得到，如去年六月芳苑食品中毒案，食品中毒的問卷調查一定包括拉肚子的病患：有幾個吃鴨肉？有幾個沒吃鴨肉？沒有拉肚子的家屬：有幾個吃鴨肉？有幾個沒吃鴨肉？作成2×2列聯表如下

	拉肚子	沒有拉肚子
有吃鴨肉	a人	b人
沒有吃鴨肉	c人	d人

以『有吃鴨肉』、『沒有吃鴨肉』當作第一種類別變項，以『拉肚子』、『沒有拉肚子』當作第二種類別變項，2乘以2共有四種狀況，可用2欄2列表示，故稱為2×2列聯表，a人、b人、c人、和d人不是類別變項，也不是連續變項，只是用於計算的單一數據。

卡方檢定只用於2×2列聯表嗎？當然不是！2×3列聯表、2×4列聯表、2×5列聯表、2×6列聯表、2×7列聯表，甚至2×100列聯表都可以，不必特殊的套裝統計軟體，如SAS、SPSS統計軟體，只要microsoft excel內的統計軟體即可計算卡方值、和估計是否達統計學意義的P值，2×3列聯表（故意寫成3×2列聯表可不可以？當然可以，沒人會反對）舉例如下，其餘類推

	得肺癌	沒有得肺癌
經常抽菸	a人	b人
偶而抽菸	c人	d人
不抽菸	e人	f人

卡方檢定可不可以3×3列聯表、或4×4列聯表？應該沒有，或許有好事之徒把3×3列聯表用3組2×3列聯表來表示未嘗不可，類似用變異數分析（analysis of variance，ANOVA）來多重檢定t test。

（表二）桃園縣某國小桿菌性痢疾感染，第一行『食用禮拜一營養午餐』可用2×2列聯表來表示，意思會更清楚，

	病例	非病例
有食用禮拜一營養午餐	682人	1603人
無食用禮拜一營養午餐	26人	48人

『95%信賴區間』關聯到卡方分布（x² distribution），在連續數據裡從最小值排到最大值可連成一條連續曲線，此曲線即是分布圖，簡稱分布（distribution），除了卡方分布，尚有常態分布（normal distribution）、標準常態分布（standard normal distribution）、t分布、z分布、和F分布等，每一種分布各有其性質，每一條分布曲線所涵蓋面積均是100%，當只涵蓋95%面積時，把對應到區線上的數據寫出來，習慣上先寫最小值，然後寫最大值，曾見過某些研究論文顛倒寫，感覺很異類，此用短破折號連接的兩個數據即是『95%信賴區間』，例如（表二）首列（0.47-1.31）就是『95%信賴區間』，此信賴區間類似P值，從其數據可推論是否達統計學意義。

除了數學家、或統計學家，這些分布、及95%信賴區間的來源、曲線畫法、對應數據等觀念問題相當深奧，想了解它比登天還難，更甚者，在卡方分布，其分布曲線會隨自由度（freedom degree）改變而改變，另人懷疑有誰能將自由度的觀念說清楚講明白？如果能從套裝統計軟體跑出95%信賴區間、和P值，或者從前述各種分布，已由數學家、或統計學家寫成的分布表，查出臨界值（「臨界值」三個字太理論化，觀念空汎不實際，不知害死多少無辜學子，改成「關鍵值」觀念將很清楚），自己利用公式算出的數據，例如卡方值（x² value），與臨界值比較，大於臨界值即達統計學差異，小於臨界值即未達統計學差異，能達此地步已相當高竿，說白一點，您已有研究所碩士班的程度；上述推論統計觀念、和實際運用，不是三言兩語能解釋清楚，非賣關子，敬請期待下回分曉。

（c）（表二）的P值（probability value）一樣不知害死多少莘莘學子，令人懷疑統計學家居心不良，外國學者從英文簡稱為P值，中國學者依樣畫葫蘆稱為P值有虧職守，P值的原文翻譯就是機率值、或概率值，為何不直接稱為機率值、或概率值？跟上述95%信賴區間一起思考會較容易瞭解，當統計學計算出一個數據大於95%信賴區間的最大值，或小於95%信賴區間的最小值（牽涉到單尾one-tail、雙尾two-tail的觀念，統計學這條路尚有波折，以後另會詳述－花公家24萬新台幣念研究所，公假沒計算在內，不回饋怎行？），也就是位於95%信賴區間所圍成百分之九十五面積以外的面積，100%－95%＝5%，以外的面積是5%，也就是0.05（P值＜0.05觀念的起源），借用一句童言童語，95%面積以內的叫「同一國的」，95%面積以外的（只有5%）叫做「不是同一國的」，「同一國的」代表甲、乙兩樣東西、或兩組東西是相似的，甚至相同的，即甲乙兩數據均落在95%面積內，統計學上表示兩者無差異性，稱為無統計學差異，簡稱無統計學意義，甚至簡稱為無意義（no significant），「不是同一國的」代表甲、乙兩樣東西、或兩組東西是不相同的，即甲乙兩數據分別落在95%面積內和外，面積內佔95%，面積外只佔5%，統計學上表示兩者有差異性，稱為有統計學差異，簡稱有統計學意義，甚至簡稱為有意義（significant）。

推論統計學其根源在檢定兩種互為相反的假設那個正確，虛無假設（null hypothesis，統計學習慣用H₀表示）、和對立假設（alternative hypothesis，統計學習慣用H₁表示），「虛無假設」、和「對立假設」此兩名詞極端空洞，讓人丈二金剛摸不著腦袋，如意譯為「無差異性假設」、和「有差異性假設」才使人恍然大悟，90年1月31日自由時報自由廣場，台北榮總教學研究部研究員兼主治醫師、和陽明大學醫學院內科教授郭正典寫了一篇文章：「null hypothesis被譯為虛無假設，這個翻譯讓人看了腦中一片虛無，心中一片茫然，不知它到底在說些什麼，null hypothesis的原意是a hypothesis of no difference，正確翻譯應是無差異假設，我國許多生物統計學專家把它譯為虛無假設，實在很虛無。」以美國人、和中國人身高為例，「無差異性假設」就是「假設美國人平均身高和中國人平均身高相同，兩者沒有差異」，「有差異性假設」就是「假設美國人平均身高和中國人平均身高不相同，兩者有差異」，所謂「相同」是統計學上的相同，不是美國人平均身高180公分，中國人平均身高也要180公分，以95%信賴區間觀念來看，如果美國人平均身高的95%信賴區間最大值是190公分，最小值是170公分，如果中國人平均身高是172公分，落在最大值和最小值之間，則稱兩者在統計學上沒有差異性，如果中國人平均身高是168公分，或則192公分，落在最小值之外，或則落在最大值之外，則稱兩者在統計學上有差異性；反過來，以中國人平均身高的95%信賴區間來看瑪也通，如果美國人平均身高落在95%信賴區間之內，則稱兩者在統計學上沒有差異性，如果美國人平均身高落在95%信賴區間之外，則稱兩者在統計學上有差異性（以上說明只解釋95%信賴區間觀念，內容會誤導，以後詳談）。

中國醫藥學院環境醫學研究所郭憲文所長，在某學術研討會上曾親身經歷一個笑話，某大學教授作甲藥、和新發明乙藥功效比較研究，結果兩者沒有統計學上差異，他說：「乙藥和甲藥研究結果沒有統計學上差異，證明乙藥和甲藥功效一樣好。」是睜眼說瞎話、自欺欺人，還是不懂統計學？此教授犯了兩個錯誤，第一個錯誤：作研究的目的在追求統計學差異性，希望落在95%信賴區間之外，即P值＜0.05，有些研究者更嚴苛自我要求，希望落在99%信賴區間之外，甚至99.9%信賴區間之外，即P值＜0.01、或P值＜0.001，當新發明乙藥功效不能落在95%信賴區間之外，大於最大值表示乙藥功效比甲藥好，小於最小值表示乙藥功效比甲藥壞（此為雙尾two tail觀念，在這裡應該追求大於最大值，不是小於最小值），沒有差異性代表乙藥沒有勝過甲藥，發明乙藥幹嘛！除非經濟考量，乙藥比甲藥便宜很多，第二個錯誤：乙藥跟甲藥沒有統計學差異，不代表乙藥跟甲藥功效一樣，這種說法在混淆視聽，嚴以律人，寬以待己，用5%面積嚴格要求別人，而用95%面積寬待自己，誰敢保證乙藥功效會跟甲藥一樣？難道不會落在95%信賴區間最小值旁邊，或許正落在2.5-5%區間內（雙尾觀念，在95%信賴區間，從無限小值到最小值佔2.5%面積，從無限大值到最最大值也佔2.5%面積）。

中國醫藥學院環境醫學研究所統計學梁文敏副教授，上課時說的一句話：「一陣春風，吹皺一湖春水」，平靜似鏡的湖面，不如春風拂過湖面，舞起陣陣漣漪，往外擴散，又擴散，讓人心神蕩漾，產生無限遐思，這也是統計學的最高境界，追求統計學的意義－significant。

吳聰賢醫師

簡易流行病學與生物統計學六、相對危險比（relative risk ratio，RR）勝算比（odds ratio，OR）

0 意見:

張貼留言

受歡迎的文章

分類

回到首頁

按日期分類

搜尋此網誌

檢舉濫用情形

關於我自己

逐夢藏東平安歸：（一二二）緊急洩洪山坡頂