從前念國中時,班上老師衡量學生有沒有考試作弊(抄隔壁同學的答案)的方法是,拿同一份考卷再給疑似作弊的同學回答。如果前後兩次的成績差很多,就可以合理懷疑這名同學很有可能是抄其他同學的答案,因為學習不會辜負你,只要你有認真,通常唸進去的知識短期內不會忘掉。
心理學家發展許多捕捉人類特徵的方法,用巨大帶有磁場的儀器畫出活動中的腦或者使用量表來確認受測者的心理狀態,無論哪種方法都需先確認兩件事:工具測量的結果相當穩定,而且有測到我們當初使用這個工具的目的。
對學生施測智力測驗,儘管只施測一次,但我們會假設,短期內同個學生每次做相同測驗的結果都會差不多,而且這份測驗顯然是要測量學生的聰明程度或解決問題的能力,如果測驗的結果如果不能做到這點,甚至是反映一個人的攻擊程度,那這份智力測驗顯然是薪水小偷,沒有做該做的事。
為了明確描述這兩個概念,心理學家用信度(reliability)來指稱測驗結果的穩定性或一致性,而用效度(validity)來指稱測驗結果符合目的程度。在這點上,國中老師與心理學家可說是有志一同,只是兩者檢測的對象不同。老師想檢測學生對作答一致性,考驗學生腦內的知識是不是內化成個人的一部分,能穩定輸出。心理學家則是檢測工具本身的穩定性與有效性,每次都能準確捕捉一個人的心理特性。
做過智力測驗的人可能深有所感,看著類似魔術方塊的圖形在選項裡翻來覆去,就能量測一個人的聰明程度嗎?其實每種心理測驗背後,都理論與實務的觀察為依據,並且經過大量驗證,通常都具有良好的信度與效度。回答魔術方塊的疑問,答案是肯定的,這些圖目確實能捕捉一個人聰明的程度,它反應一個人維持心像與旋轉心像的能力,跟你在腦中憑空撥算盤,列算式計算一加一很有關係。
談到信度與效度,一個簡明好懂的例子是量體重。如果你站上一台體重計,顯示 70 公斤(ok,別太激動這只是舉例,假設你是男生)。如果你再站上去一次,顯示 45 公斤。此時,你的腦中一定會浮現一個想法,這個體重計壞了。所以,我們對體重計的一個基本要求是:每次的數值都需要穩定落在一個範圍內,前後不能差太多。體重計的一致性與穩定性就是信度。
除了信度之外,我們佔上體重計是為了量體重(好啦,有些體重計可以量體脂),如果你站上體重計,它卻顯示你的身高,很顯然違反你站上體重計的目的,那這台體重計的量測過程就不具有效度,因為它不是一個有效的測量。
借用量體重的例子,我們可以整理出信度與效度的關係:有效度的測驗必然有信度,因為有效的含意包含結果的穩定性;然而,有信度的測驗,卻不必然有效度。你站上體重計是為了知道「正確的體重」(儘管你很不想面對),所以有效度的體重計,不論量幾次,量出來的結果都是正確的體重,數值相當穩定。
只有信度的體重計就不是如此,儘管它能穩定的測量體重,但每次測量的結果都不是正確的數值(45 公斤?),反而在一個錯誤的數值上打轉。這不是我們站上體重計的目的,所以這台體重計不具有效度,頂多能在連續吃了幾天鹽酥雞當宵夜後的某個晚上拿出來自欺。
沒有留言:
張貼留言