這邊順便談談統計好了, 就當作是接續前面看似無關聯的主題第五項..
第五個是"淺談統計方法":
前面曾提到的科學研究方法主要是 "假設演繹法 hypothetical-deductive method", 它是奠基於嚴謹的邏輯哲學過程, 雖然它不是唯一的科學研究方法, 但是卻是最核心的部分, 其它還有幾種方法, 但多仍不脫重複 "假設->理論建立->比對" 這樣的一個過程, 頂多初始點可能不是從假設開始..
這邊舉一反應例:
f(X0,X1,X2.....Xn)=Z(x)
X0~Xn 是變因, Z(x) 是現象, 透過多次的 "假設->理論建立->比對" 過程, 我們可以逐次建立 X0~Xn 與 Z(x) 之間的關係與理論; 裡面的變因, 可能有一大部分都與 Z 無關, 但都是要經過這樣抽絲剝繭的一個過程, 才能確立, 譬如:
f(X0,X1....Xn) = f(X1,X11,X15)=Z(x)...關係
f(x11) = A(X11)^3, f(X15) = B(X15)^2, f(x1) = -CX1
....各變因反應方程....
f(X1,X11,X15) = f(X11)+f(X15)+ f(X1)
f(X1,X11,X15) = A(X11)^3+B(X15)^2-CX1 = Z(x)
....理論反應方程....
我們可以從單設 X0 = -100~100 其它都為 0 開始, 重複過程到 Xn = -100~100 其它都為 0 為止, 觀察 Z(x) 的變化, 逐次建立上述反應方程式..
但這種方法卻有一個大問題, 若變因項數量很多時, 這種方法, 因為每個個案都要先比對過 N 個變因, 要花費很多時間 = N, 尤其若碰到 M 個個案, 每個個案都是 f(x0~xn) 時, 複雜度是呈等比級數地變高, 實驗的過程可謂曠日費時 = M*N; 對於要快速界定分類 Z(x) 的要求時, 這種方法緩不濟急..
統計方法剛好相反, 它是從界定少數條件來分類 Z(x) 開始做起, 一樣舉上述例子, 我們統計 Z(x) 的表現行為, 可以很快速地界定 X 與 Z 的關係範圍是從 X0~X(n/2) 或是另一半(這邊假設是單一條件的二分法); 這種做法, 被大量用於公共衛生流行病學領域與媒體抽樣調查; 因為它要求立即篩檢 M 個可疑份子, 只要經過 M 次比對即可得出, 而不是耗時等候每個個案的 X11, X15, X1 及其加權 A,B,C 與反應模式 f(X11), f(X15), f(X1)..
舉 SARS 為例, 因為有立即遏止流行的迫切需求, 篩檢條件就是 "發燒" 與 "咳嗽" 兩個, 同時符合這兩者的您, 就要先被隔離, 至於您是不是 SARS 患者, 關起來後再慢慢研究你..
同樣地, 以統計方法, 花費時間來調查手機與口腔癌的關係時, 因為篩檢條件是 "重度的手機使用", 在排除具備生活條件差異的個案後, 可以立即篩檢出 M 個 "重度手機使用與口腔癌" 的關聯個案, 並與 "無重度使用, 但仍得口腔癌" 個案之間的比較, 可確立它們之間是有關聯 f(X0~X(n/2))=z(x); 但是在 X0~X(N/2) 之中, 譬如調查假設對象 "電磁波" 與山賊所舉例的 "鋰電池, 烤漆與多說話" 的幾個可能變因中, 哪一個才是主要(加權)變因? 其反應是什麼? 卻是不可得知..
因為, 條件有時是很難分割的, 譬如手機的使用, 您可能很難要求調查對象拿著一個擁有完全硬體架構, 卻不會發射電波的手機, 或是沒電池還能用的手機, 重複同樣生活歷史, 而且患者生理條件要回復到五年前的狀態..
由此可知, 統計方法不是不能用, 它有它的優點, 但相對的有它的侷限性, 我們可以把篩檢條件增多到 N 個, 以縮小可疑份子範圍, 但是同樣地也會面臨 M*N 的難題; 而且條件的訂定, 要先確認與假設對象的關聯性多寡, 否則就容易發生拿牛頭去對馬嘴的窘態; 此處篩檢條件是 "動物的頭", 假設鎖定對象是 "馬嘴", 符不符合? 以篩檢條件看當然符合; 若就此下定論呢? 按那個躲起來不吭聲的人的思維, 牛頭對馬嘴的理論是成立的; 這就是單以統計方法來成立理論, 最為人詬病的地方....
目前我們看到電磁波議題在公共衛生醫學領域及其新聞相關報導, 都只在其間的關聯性調查 f(X0~X(n/2))=Z(x), 也就是符合篩檢條件, 但目前連進一步的分類變因與其加權因子都還未確立, 根本不能奢談電磁波會不會致癌; 這就是為什麼山賊在看待這些議題, 抱持中性態度的原因..
書籤