簡易流行病學與生物統計學
四十七、系統性誤差與抽樣誤差
作者:吳聰賢醫師
不管儀器誤差、或人為誤差統稱為系統性誤差(systematic error or systemic error,systematic等於systemic),其他因季節、氣候、磁場、光線、噪音等因素所引起的誤差,亦稱為系統性誤差,簡單一句話:「非因隨機抽樣所引起的誤差,統稱為系統性誤差」,此種命名直接從英文字面翻譯,無法理解,不如依照二分法,稱為非抽樣性誤差(non- sampling error)較好理解,很可惜,非抽樣性誤差(non-
sampling error)另有涵義,後面將述及,不可亂用。
抽樣誤差(sampling error)是以隨機抽樣(randomized sampling)的樣本統計值(statistic)來推估母群體(population)的參數(parameter),會有不可避免的誤差,稱為抽樣誤差。如中國醫藥學院全校男同學平均身高172.5公分,隨機抽樣10名男同學,計算其平均身高為169.5公分,用169.5公分來推估172.5公分免不了會有誤差,此即抽樣誤差。
樣本統計值(statistic)有人稱為樣本統計量、或簡稱為統計量,因為母群體數目一般均龐大無法計算、或不方便計算,如台灣地區20歲以上成人的平均身高,學術研究一定用樣本來計算,不會用母群體來計算,故統計量一定指樣本統計量,這種簡稱不會混淆;在statistic後面加上s(statistics)是統計學,兩者意義不同,當然,如果有2個以上樣本,其樣本統計值(statistic)必須是複數-樣本統計值們(statistics)。
母群體參數(parameter)有稱為母數、或稱為特徵量數,為空中閣樓,屬虛構數字,如台灣地區20歲以上成人的平均身高,不可能有此數字,如果屬有限數目、或容易數的母群體就不需煩勞統計學了;電腦術語參數(parameter)與此統計學參數(parameter)南海北海、風馬牛不相及,讓不少人腦筋打結,譯為母數、或特徵量數一樣不知所云。
如果不是用隨機抽樣,而採用隨意、立意、或任意抽樣的計算值(calculating value)來推估母群體的參數,其所造成的誤差可不可以稱為抽樣誤差(sampling error)?當然不可以,除非扯爛污,抽樣(sampling)單指隨機抽樣,隨機抽樣才有統計學的推演意義,非隨機抽樣使統計學變成一推爛泥巴,沒有統計學的推演意義。非隨機抽樣所造成的誤差,有人稱為非抽樣誤差(non-sampling error),為避免混淆,所以系統性誤差(systematic
error)不能稱為非抽樣誤差(non-sampling error);當從事無限次抽樣,理論上,抽樣誤差一定小於非抽樣誤差。
0 意見:
張貼留言