簡易流行病學與生物統計學 四十八、隨機、與隨意抽樣種類

簡易流行病學與生物統計學
四十八隨機、與隨意抽樣種類
作者吳聰賢醫師
隨機抽樣法又稱機率抽樣法(probability sampling),母群體內每一個體被抽中的機率(probability)相同,如果機率不相等,在結果分析時必須效正,由此種方法抽取的樣本統計值(statistic)才適合做統計推論,稱為推論統計學(inferential statistics),其種類一般教科書有詳細說明不另解釋,只做思考性問題探討:
1.  簡單隨機抽樣法(simple random sampling):例如抽籤,從大竹國小某一班40位同學抽出4位同學當樣本,用此4位同學來推估40位同學。除抽籤外,可用愛國獎券搖獎方式(lottery procedure)、亂數表(list of random numbers)、或電腦軟體microsoft excel亂數產生器作隨機抽樣,統計套裝軟體SAS亦可用亂數產生器作隨機抽樣,我不會,誰能指教?
2.  分層抽樣法(stratified samplingstratum拉丁文,層的意思,單數為stratum,複數為strata,後面加上-fy當動詞,後面加上-fied以過去分詞當形容詞;如果以分組抽樣法『組』的觀念來思考較易了解):亦稱為比率抽樣法(proportional sampling),屬二階段抽樣法,第一階段依照母群體的特性分層,分兩層、或多層,層與層特性不同,層與層間為互斥集合,所有層組成全集合,第二階段利用簡單隨機抽樣法,從各層等比率抽出樣本,此為比率抽樣法(proportional sampling)的來源,例如把母群體(population)依照性別男、女分成兩個次母群體(subpopulation),從大竹國小某一班40位同學分成30位男生、10位女生兩組,依照抽籤、和1/10比率方式,抽出3位男生、和1位女生共4位同學組成樣本,用此4位同學來推估40位同學。
3.  集束抽樣法(cluster sampling,有人譯為叢式抽樣法、或部落抽樣法):亦屬二階段抽樣法,第一階段將母群體分組,稱為cluster(串、束、叢、群、體),每一束特性相似,均類似母群體,第二階段利用簡單隨機抽樣法,抽出一個束、或多個束組成樣本,例如求彰化市大竹區20歲以上成人平均身高,依照行政區域劃分,大竹區有22個里,每一個里等於一個束,利用抽籤方式,抽出一個里、或兩個里、或多個里組成樣本,用這些里來推估22個里。
4.  系統抽樣法(systematic sampling,有人譯為等距抽樣法、或等間隔抽樣法):英美系國家喜用系統性誤差(systematic error)、系統性紅斑性狼瘡(systematic lupus erythematosus)等系統性名詞,systematic or systemic含有系統的、制度的、順序的、全身的等意思,翻譯為順序抽樣法、全身性紅斑性狼瘡較容易瞭解,不過系統性誤差(systematic error)不知有何更好的翻譯?例如求彰化市民眾對衛生局服務品質好壞的電話訪問調查,利用電話簿,每隔100名抽取一名來組成樣本,用這些樣本來推估彰化市24萬人口。
5.  多步驟抽樣法(multi-stage sampling):稱為混合抽樣法較簡單明瞭,不過將失去逐步抽樣的涵義(step by step),如果稱為多步驟混合抽樣法會更好;應用上述4種抽樣法,採用其任何2種、或2種以上的混合抽樣法。
隨意抽樣法或稱立意、或任意抽樣法,亦稱為非機率抽樣法(non- probability sampling),樣本代表性有問題,不能說是樣本統計值(statistic),只能說計算值(calculating value),此值不適合做統計推論,信度、和效度均差之千里,但理論歸理論,實際應用上屢見不鮮,難怪證據醫學(見彰化縣衛生所護理人員第3講)把全球文獻分為值得看、和不值得看兩部分,值得看部分低於2%;隨意抽樣法分成2種,一般教科書較少提及:
1.  便利抽樣法(convenience sampling):為方便、或故意,級任老師從一班40位同學任意挑出4位同學義務勞動,頑皮搗蛋的同學一定被選上;中國醫藥學院環境醫學研究所學生研究香菸中尼古丁在人體內的代謝,此研究當然從同學中徵召若干志願者為其實驗樣本。
判斷抽樣法(judgement sampling):依照研究者知識、或經驗的主觀判斷來取樣,例如研究者將抽菸分成不曾抽菸、一天抽一包菸以內、一天抽一包到兩包菸、一天抽兩包菸以上等4組,這種分層適當嗎?有何學理根據?是否個人主觀判斷?此種抽樣易受個人偏見(personal bias)所影響。

0 意見:

張貼留言