簡易流行病學與生物統計學
六十七、類別變項、序位變項、等距變項、等比變項
作者:吳聰賢醫師
在統計學上,變項(variable)的種類非常重要,不同種類的變項採用不同的統計方法,『在職訓練第2講』提到的卡方檢定,不管是2 ×2列聯表(contingency
table)、或2 ×3、或4 ×5列聯表,每一種變項必須是類別變項,如「中毒、沒中毒」、「有喝可樂、沒喝可樂」、或「放射線治療、化學治療、開刀治療」等,其『中毒』、
『沒中毒』就是類別變項;而類別變項、序列變項無法使用於t test,t
test只用於等距變項、及等比變項;另外用等距變項、及等比變項算出的相關係數稱為皮爾森相關係數(Pearson
product-moment coefficient),如果用序位變項算出的相關係數不能稱為皮爾森相關係數,必須稱為等級相關係數(rank correlation),雖然兩者計算方法一樣。
1. 類別變項(nominal variable)
採用類別尺度(nominal scale,有譯為名義尺度)者稱之。例如「性別」分成男、和女兩種;「血型」分成A、B、O、AB四種;「衛生局」分成防疫課、企劃課、醫政課、藥政課、保健課、食品衛生課等七課四室。
為了方便起見、或有些電腦軟體無法鍵入中文,在問卷調查編碼(questionnaire coding)、或SAS統計套裝軟體應用上,會使用「1」代表男性、「2」代表女性;使用「1」代表A血型、「2」代表B血型、「3」代表O血型、「4」代表AB血型,這些數字仍然代表類別變項,不具有大小、差距、或倍數的意義。
2. 序位變項(ordinal variable)
採用序位尺度(ordinal scale)者稱之。例如彰化縣衛生局民國90年開始實施「5S運動」,年度第二季考核,防疫課得95分排名第一、保健課92分排名第二、企劃課90分排名第三、檢驗課89分排名第四….等,第一、二、三、四等名次就是序位變項,有大小順序關係,沒有差距、或倍數的意義。
3. 等距變項(interval variable)
採用等距尺度(interval scale)者稱之。例如攝氏40度、攝氏20度、攝氏0度等就是等距變項,我們可以說攝氏40度、和攝氏20度相差20度,與攝氏20度、和攝氏0度相差20度,兩者的差距是一樣的,故名等距變項,但絕不能說攝氏40度是攝氏20度的兩倍,因為攝氏0度不是『絕對的0度』,假設攝氏零下20度為『絕對的0度』,那麼攝氏40度不是攝氏20度的兩倍,而是(40 +20) ÷(20 +20)= 1.5倍。
或許您會問:「不是有絕對溫度嗎?」,『絕對溫度(absolute temperature)』於1848年由英國物理學家克爾文所提出,根據其推算,認為攝氏零下273.16度是溫度的起點,攝氏40度就是絕對溫度313.16度,攝氏20度就是絕對溫度293.16度,313.16度 ÷293.16度 =
1.0682221,這樣的倍數關係,溫度不是是可以劃為等比變項?實際上,『絕對零度(absolute
zero攝氏零下273.16度)』是一個推估值,從無辦法使物體達到絕對零度。如果有一天,科技達到此水準,能使物體達到絕對零度,是不是『溫度』就會變成等比變項?
4.
等比變項(ratio variable)
採用等比尺度(ratio scale,有譯為比率尺度)者稱之。例如重量、年齡、長度、時間等都是等比變項。
等比變項、和等距變項能提供較多的資訊,屬較高級的資料,能降級轉變為序位變項、和類別變項,序位變項也能降級轉變為類別變項;但是序位變項、和類別變項因資料不夠,無法轉變為等比變項、和等距變項。
0 意見:
張貼留言