簡易流行病學與生物統計學
十一、P值(probability value)
作者:吳聰賢醫師
民國86年1月15日上任彰化市大竹區衛生所主任,冥冥中註定步先父吳茂林後塵吃公家飯,當起公衛醫師,隔天就開始接觸社區健康評估工作,隔一年,本所亦參與衛生所高血壓、糖尿病、及高血脂症慢性病醫療門診模式,又開始學習另一項新工作,剖肝割胃的外科專科醫師似乎不善內科慢性病治療,當年第一課葉彥伯課長專程到本所陪讀「高血壓防治手冊-高血壓偵測、控制與治療流程指引」,行政院衛生署編,中老年病防治系列叢書1,前數天先分配章節,然後衛生所每位同仁當天做讀書報告,我還保留當年影印給同仁的讀書報告,報告結尾,我提出四點疑問請教:
1、何謂相對體重指數?
2、何謂相對危險度?
3、何謂以世界標準人口做年齡修正?
4、何謂x2 test(卡方統計)、η值、P值?
可能時間不允許,或則非三言兩語能解釋清楚,葉課長只糾正x是希臘文,不是英文,不應該唸成「eks 」,需唸成「chi」,x2 test唸成「chi-square test」,中文音譯併意譯翻為「卡方檢定(卡平方檢定略稱)」。以世界標準人口做年齡修正,如標準化死亡率就是以標準人口做修正,怎樣以世界標準人口做年齡修正前面已提過,今天再次加強P值觀念、和介紹卡方檢定。
P值(probability value, P是英文字母大寫)
P值一詞讓不少學子驚懼,不如直接從英文probability value翻譯為機率值、或概率值較親切,統計學上,有差異性假說(alternative
hypothesis or reject hypothesis,教科書、統計學家翻譯為對立假說,曾害我腦筋繞不少冤枉路)是否達統計學意義均以P值來表示,為什麼無差異性假說(null hypothesis,教科書、統計學家翻譯為虛無假說,害我腦筋也虛無一陣)從沒人提起是否達統計學意義?從沒人想用P值來表示?套用蔣公一句話:「生命的意義在創造宇宙繼起的生命,生活的目的在改善人類全體的生活」,科學家的創造、或發明,追求比舊有的東西更新穎、快速、與美好,如果與舊有的東西一樣,沒有差異性存在,創造、或發明它幹嘛?還須費心用統計學、或P值去證明兩者沒有差別?
藥理學家發明甲藥,如果效能沒有比原有乙藥好,發明甲藥幹麼?還辛苦用統計學去證明兩者沒有差別,說明兩者一樣好、或一樣壞?藥理學家發明甲藥的目的,就是想要比乙藥好,何必證明兩者沒有差別;為檢驗實驗結果的數據,不是瞎貓碰到死耗子恰巧撞上,而是真正的好,故需用統計學方法去證明兩者有差別。
是否達統計學意義用P值表示,依照科學的嚴謹性、追求事務的完美性,統計學家將P值定成下列三個等級,嚴謹性逐漸增加,第一級最常用,嚴謹性可接受。
P值<0.05,有意義與無意義的臨界值(可稱臨界點、切點)是0.05,即P值小於5%,以常態分布曲線面積觀念來想,實驗結果的數據落在95%面積以外的區域。
P值<0.01,有意義與無意義的臨界值(可稱臨界點、切點)是0.01,即P值小於1%,以常態分布曲線面積觀念來想,實驗結果的數據落在99%面積以外的區域。
P值<0.001,有意義與無意義的臨界值(切點)是0.001,即P值小於0.1%,以常態分布曲線面積觀念來想,實驗結果的數據落在99.9%面積以外的區域。
為何P值<0.001比P值<0.01嚴謹,P值<0.01比P值<0.05嚴謹?因為P值<0.05犯第一類錯誤(type-Ⅰ error,又稱為α-error)的機會是5%,所謂第一類錯誤就是把沒有差異的東西誤認為有差異,如上面的例子,甲藥與乙藥效能沒有差別,由於實驗數據的碰巧,認為甲藥比乙藥好,這種錯誤稱為第一類錯誤,P值<0.01犯第一類錯誤的機會是1%,而P值<0.001犯第一類錯誤的機會更小,只有0.1%,犯錯誤越少,嚴謹性當然越好。
另有所謂第二類錯誤(type-Ⅱ error,又稱為β-error),就是把有差異的東西誤認為沒有差異,例如甲藥與乙藥效能有差別,甲藥比乙藥好,由於實驗數據的碰巧,認為甲藥與乙藥沒有差別,這種錯誤稱為第一類錯誤。
嚴謹性可用另一種方式思考,檢力(power
of test)可譯成檢驗能力,即正確推翻無差異性假設之能力,用(1-β)表示;(1-α)會是什麼?正確推翻有差異性假說之能力,相同的想法,如果新的與舊的東西一樣,沒有差異性存在,創造、或發明它幹嘛?還須費心用統計學、或P值去證明兩者沒有差別?(1-α)無意義啦!
第一類誤差與第二類誤差示意圖
檢力:能正確推翻虛無假設(無差異性假設)
0 意見:
張貼留言