簡易流行病學與生物統計學九十三、獨立預測因子 ~ 吳聰賢醫師

簡易流行病學與生物統計學

九十三、獨立預測因子

作者：吳聰賢醫師

體能差、抽煙、喝酒、藥物濫用、高血脂症、肥胖等因子，似乎與心血管疾病的罹病率（morbility rate）和總死亡率（total mortality rate）都有關。假設，以「體能差」單一因子（univariate）當作獨立變項（independent variable，或稱自變項、因變項、預測變項，見彰化縣衛生所護理人員在職訓練第5講P.4），做簡單迴歸分析（simple regression model），因只取單一因子，故稱「簡單」，亦稱單因子迴歸分析（univariate regression model），若顯示統計學上有意義的差異（p值＜0.05，即p值＜5%），代表體能差者，其心血管疾病的罹病率和總死亡率也高。

假設，以「體能差」、「抽煙」、「喝酒」、「藥物濫用」、「高血脂症」、「肥胖」等六個多發性因子（multivariate）當作獨立變項，做複迴歸分析（multiple regression model），因取多因子，故稱「複」，亦稱多因子迴歸分析multivariate regression model，若顯示統計學上有意義的差異（p值＜0.05，即p值＜5%），代表體能差者，其心血管疾病的罹病率和總死亡率也高。

前者，只考慮「體能差」與心血管疾病的罹病率和總死亡率的關係，不去考慮其他五項因子的影響，是眼不見為淨的鴕鳥心態。後者，除了考慮「體能差」與心血管疾病的罹病率和總死亡率的關係外，也顧忌到其他五項因子的影響，但是把六項因素拋在一起，混合處理，不只把「體能差」的影響扭曲了，其他五項因子也如哈哈鏡般忸怩變形，誰與誰相互影響？哪幾個相互影響？誰的影響佔幾分？搞不清楚。

統計學家發明「調整（adjustment）」法，或稱「控制（control）」法，把「抽煙」、「喝酒」、「藥物濫用」、「高血脂症」、「肥胖」五項因子，利用複迴歸分析，經過「調整（adjustment）」後，檢驗「體能差」單獨對心血管疾病的罹病率和總死亡率的關係。所謂「調整」即把每一個案，關於「抽煙」、「喝酒」、「藥物濫用」、「高血脂症」、「肥胖」等變項，轉變成同一基本值，然後大家在同一立足點做分析比較。若「體能差」顯示統計學意義，此「體能差」即稱獨立預測因子（independent predictive factor）。

何謂「轉變成同一基本值」？教科書說：「利用最小平方法（least squares method），求得各自變項與應變項的直線關係。」莫哉殃，無法理解。

我曾請教幾位研究生，「何為調整（adjustment）？」大家膚淺的，略知一二概念，但深入探討，「如何調整（adjustment）？」則為之詞窮，或瞠目咋舌，「知之為知之，不知為不知」者，則坦稱不懂。所謂調整，不似虛擬變項（dummy variable），用0或1代入方程式所想像的簡單。課堂上，統計學老師的解說，有聽沒懂，如隔靴搔癢，「莫哉殃！」學問搞不懂，渾身不舒暢，有若督任二脈閉塞。

我多次告訴唸高二的小兒子，「加油！哪天教老爸統計學。」小兒子不是數理資優生，而是數理天才，我都叫他「genius」。每次考完月考，都會聽他說，「數學、化學、物理考題太簡單了，看不出我的實力！」「物理全校我最強，我自創一種思維方式，不必背公式，可以一以貫之。」他很自負，「清交我穩上！」但也很自卑，「不要叫我考醫學院，太難了。」小兒子的第一志願是清華材料工程。

今年（91年）8月，明道中學將派15位學生，北上參加全國性數學競賽，小兒子是其中一位。每次考完試，他都會說，「數學太簡單了，我只用一半時間就交卷。」兩、三天後說，「可惜，有一題漏了寫。」或者說，「真可惜，有一題計算錯誤，不然我就是全校第一。」想起民國59年大學聯考，數學考題我一題也不會，竟矇到20分，有天壤之別。

小兒子很自負他的排列組合，目前在學統計。幾天前，我持續煩他問題，正在打電動的他回話，「統計學第一步要學排列組合，第二步要學概算，我拿排列組合的書給您看好了。」民國78年，小兒子四、五歲，上幼稚園小班，與大兒子同時上「功文數學」，剛從「1＋1＝2，1＋2＝3」算起。有一次，全家爬台中大坑山，在停車場入口處買玉米，小販賣四條玉米30元，小兒子隨口答說一條玉米7元5角。我很驚訝，「您怎麼算的？」孩子沒學過乘法或除法，連減法老師也沒教。我已經忘記他怎麼回答，只記得，當時我愣住了，搞不清楚為甚麼他竟用這種奇怪的方法來計算。

吳聰賢醫師

簡易流行病學與生物統計學九十三、獨立預測因子

0 意見:

張貼留言

受歡迎的文章

分類

回到首頁

按日期分類

搜尋此網誌

檢舉濫用情形

關於我自己

老之將至喜相迎：（二O九）網路關閉請見諒