2021/10/10

變異數(variance)

心理學家常常需要一口氣交代一大群人的特徵,他們習慣用平均這個代表值來描述一群人的心理狀態,像是芬蘭是全世界最快樂的國家,指的是全芬蘭的人平均起來的快樂程度,高於其他各個國家人口的平均。這麼做的理由很簡單,要說出一群人的所有細節相當繁瑣耗時,與其逐一描述(聽眾也不可能記得),不如用代表值,不僅好說明,聽的人也好理解。

然而,使用平均數來描述,會忽略一些細節。假如有兩個小班制的班級,A班五名學生的身高剛好都是 170 ,而B班五名學生的身高分別是:145、150、170、190、195,儘管兩個班級的平均身高相同,B班個體差異的情況明顯較大,是什麼造成這麼班級的身高有這麼劇烈的落差?可能值得關注。

因此,心理學家會使用變異數(variance)來描述一筆資料的分散程度,當變異數越大,表示資料之間的差距越明顯,統計學家將變異數開根號之後,會形成名為標準差的指標,無論是變異數還是標準差,兩者都是說明分散程度的指標。再對AB兩個班級施測常見的七點量尺情緒量表,結果A班級所有同學的得分都是 4 ,一個情緒不好不壞的結果;然而,B個班級的結果為:1、1、4、7、7。雖然兩個班級的情緒,平均的結果看起來一樣一樣,可是B個班級的學生情緒明顯比較極端,這時就得考量同學們的互動、教學方式等可能因素是否會影響情緒狀態之間的差異。

變異數的大小除了表示資料集中的程度,也表示資料之間相當穩定,沒有少數極端的個案。當資料越集中,我們越能縮小範圍,精準描繪某個結果。以B班的情況來說,乍看之下,班上同學的情緒處於中間正常狀態,然而仔細觀察每個同學的情緒,就會發現,需要幫忙的同學很多,因為他們的情緒遠遠偏離正常值。如果我們只考量平均數這個代表值,很可能會忽略人群中的獨特個案,你用「普普通通」來描述那些心情非常好與非常壞的同學,當然很不適切。

這給我們重要的啟示,平均數只是我們初步了解一筆資料的概況,而不能反映資料內部的細節,所以當我們知道平均數時,得進一步追問,它的變異數又是如何呢?這個平均是怎麼計算出來的?如果變異數很大,我們就能想像這筆資料相當不穩定,對於結果的精準性就無法那麼有信心。

選舉前的民調或各種檢測候選人的調查資料,若你夠細心,你會發現有些調查裡,除了說明候選人的施政表現平均的情況如何之外,還會附上標準差,告訴你受訪者的意見大多落在哪個範圍裡。如果受訪者之間的落差沒有很大,集中在負評的位置,那沒有疑義,這名候選人,顯然做得不好或不討人喜歡;如果落差很大,就表示這名候選人得評價兩極,表面上看起來受到負評,然而同時也有極端的愛好者或鐵粉支持者。

沒有留言:

張貼留言