簡易流行病學與生物統計學
九十三、獨立預測因子
作者:吳聰賢醫師
體能差、抽煙、喝酒、藥物濫用、高血脂症、肥胖等因子,似乎與心血管疾病的罹病率(morbility rate)和總死亡率(total mortality rate)都有關。假設,以「體能差」單一因子(univariate)當作獨立變項(independent variable,或稱自變項、因變項、預測變項,見彰化縣衛生所護理人員在職訓練第5講P.4),做簡單迴歸分析(simple
regression model),因只取單一因子,故稱「簡單」,亦稱單因子迴歸分析(univariate
regression model),若顯示統計學上有意義的差異(p值<0.05,即p值<5%),代表體能差者,其心血管疾病的罹病率和總死亡率也高。
假設,以「體能差」、「抽煙」、「喝酒」、「藥物濫用」、「高血脂症」、「肥胖」等六個多發性因子(multivariate)當作獨立變項,做複迴歸分析(multiple
regression model),因取多因子,故稱「複」,亦稱多因子迴歸分析multivariate
regression model,若顯示統計學上有意義的差異(p值<0.05,即p值<5%),代表體能差者,其心血管疾病的罹病率和總死亡率也高。
前者,只考慮「體能差」與心血管疾病的罹病率和總死亡率的關係,不去考慮其他五項因子的影響,是眼不見為淨的鴕鳥心態。後者,除了考慮「體能差」與心血管疾病的罹病率和總死亡率的關係外,也顧忌到其他五項因子的影響,但是把六項因素拋在一起,混合處理,不只把「體能差」的影響扭曲了,其他五項因子也如哈哈鏡般忸怩變形,誰與誰相互影響?哪幾個相互影響?誰的影響佔幾分?搞不清楚。
統計學家發明「調整(adjustment)」法,或稱「控制(control)」法,把「抽煙」、「喝酒」、「藥物濫用」、「高血脂症」、「肥胖」五項因子,利用複迴歸分析,經過「調整(adjustment)」後,檢驗「體能差」單獨對心血管疾病的罹病率和總死亡率的關係。所謂「調整」即把每一個案,關於「抽煙」、「喝酒」、「藥物濫用」、「高血脂症」、「肥胖」等變項,轉變成同一基本值,然後大家在同一立足點做分析比較。若「體能差」顯示統計學意義,此「體能差」即稱獨立預測因子(independent predictive factor)。
何謂「轉變成同一基本值」?教科書說:「利用最小平方法(least squares method),求得各自變項與應變項的直線關係。」莫哉殃,無法理解。
我曾請教幾位研究生,「何為調整(adjustment)?」大家膚淺的,略知一二概念,但深入探討,「如何調整(adjustment)?」則為之詞窮,或瞠目咋舌,「知之為知之,不知為不知」者,則坦稱不懂。所謂調整,不似虛擬變項(dummy variable),用0或1代入方程式所想像的簡單。課堂上,統計學老師的解說,有聽沒懂,如隔靴搔癢,「莫哉殃!」學問搞不懂,渾身不舒暢,有若督任二脈閉塞。
我多次告訴唸高二的小兒子,「加油!哪天教老爸統計學。」小兒子不是數理資優生,而是數理天才,我都叫他「genius」。每次考完月考,都會聽他說,「數學、化學、物理考題太簡單了,看不出我的實力!」「物理全校我最強,我自創一種思維方式,不必背公式,可以一以貫之。」他很自負,「清交我穩上!」但也很自卑,「不要叫我考醫學院,太難了。」小兒子的第一志願是清華材料工程。
今年(91年)8月,明道中學將派15位學生,北上參加全國性數學競賽,小兒子是其中一位。每次考完試,他都會說,「數學太簡單了,我只用一半時間就交卷。」兩、三天後說,「可惜,有一題漏了寫。」或者說,「真可惜,有一題計算錯誤,不然我就是全校第一。」想起民國59年大學聯考,數學考題我一題也不會,竟矇到20分,有天壤之別。
小兒子很自負他的排列組合,目前在學統計。幾天前,我持續煩他問題,正在打電動的他回話,「統計學第一步要學排列組合,第二步要學概算,我拿排列組合的書給您看好了。」民國78年,小兒子四、五歲,上幼稚園小班,與大兒子同時上「功文數學」,剛從「1+1=2,1+2=3」算起。有一次,全家爬台中大坑山,在停車場入口處買玉米,小販賣四條玉米30元,小兒子隨口答說一條玉米7元5角。我很驚訝,「您怎麼算的?」孩子沒學過乘法或除法,連減法老師也沒教。我已經忘記他怎麼回答,只記得,當時我愣住了,搞不清楚為甚麼他竟用這種奇怪的方法來計算。
0 意見:
張貼留言