2021/10/08

平均數(mean)

你現在是一名異性戀國中女生,對交往對象的身高有異常的堅持,對方非得要 180 公分以上,你才可能考慮交往。雖然會讓一些男生相當不服氣,不過你也沒有比較好過,因為國中生裡超過 180 公分的男生相當少,可以說情路堪慮。全校有三個年級,每個年級有三十個班,你努力打聽。一天下午打掃時間,你趁摸魚,詢問身旁的朋友一年七班的男生有多高?

到這裡,畫面必須定格,請你想想對方會怎麼回答?理想但囉嗦甚至有點狗仔風味的回答是,你的同學將一年七班的所有男生的身高,從頭到尾都回報過。不過,現實生活中,我們比較可能聽到的答案是:

「沒特別高,大概 170 公分吧。」

日常生活中,「平均」其實是相當模糊的概念,不過很方便,能夠用來代表某個範圍內的資料。當你的同學說一年七班的男生大概 170 公分,這背後的意思是這班大部分男生的身高在 170 公分上下,省去說明從男生 1 號到最後一號的時間,直接說出一個代表值,儘管不精確,卻簡單易懂好溝通。所以比較兩個班級的身高時,我們不會把兩班的男生逐一捉對出來廝殺比較,而是計算兩個班級的平均,直接一較高低。

然而,代表值不一定能反映群體中每個個體的狀況,那些坐在一年七班教室後排,身高超過 180 公分的同學想必忿忿不平,170 公分沒有彰顯他們的高大,所以要如何選出代表值就是需要考慮的要點。一般而言,我們會使用平均(mean)作為代表值,不過平均有三種類型,包括算術平均數(average)、中位數(median)與眾數(mode),雖然每一種都能作為描述資料的代表值,彼此之間卻有明顯的差異。

算術平均數的來由,想必你不陌生。在你更小的年紀,期中考要努力準備四個科目。成績出來,你發現某個科目的成績,低於隔壁的同學,他因此嘲笑你。此時,你發現你剩下的科目都比他高,你可能會脫口而出,要求對方來比各科的平均分數。這種平均數,是加總所有的觀察值,再除以觀察的個數所求得。

算術平均數相當平易近人,幾乎天天都會碰到,但它很容易受到極端值的影響,一但觀察值有極端的數值,就容易讓算術平均數往值端值靠近。這就不得不提一個會讓彩券行遭人噴漆的強力文案:

「恭賀本店開出千萬頭彩!據統計,一百個人來本店買彩券,平均每人獲利十萬。」

直覺的想像是一百個人買彩券,大家都中了十萬元上下的彩金,這當然是一種可能,不過,也有可能的是 99 個人什麼都沒中,而有一個人獨得一千萬,兩種情況在算術平均數上的結果都是十萬,但是,第二種情況顯示大部分人一毛錢都沒拿的事實,明顯受到極端值一千萬所掩蓋。

如果你想減少被極端值愚弄的機會,也許可以試試看選用中位數當代表值,中位數是將觀察值由小到大排列,並找出正中間的數值就是中位數。中位數較少受到極端值所影響,而且還能提供一些資訊,因為所處正中間的位置,所以中位數以下的人佔了全體個數的一半,同理中位數以上的人也佔了一半。政府宣布應屆畢業生就業起薪的中位數是 25000 元,我們可以馬上知道有一半的畢業生,起薪不到 25000 元。

還有一種平均是找出觀察值中重複出現最多次的數值,叫做眾數。原理相當好懂,重複出現最多次的數值,最有機會能代表整個群體。以 30 個人的班級來說,有 10 個人的身高剛好都是 170 ,這時,有人想知道這個班級的身高,說出最常出現的數值便能代表整個班級。可是,眾數在重複出現的次數不夠多的時候往往會失靈,如果同樣的班級,只有 2 個人的身高是 170 ,其餘的人身高都不重複,雖然 170 也是眾數,但不見得能代表整個班級了。

心理學家習慣使用平均數來描繪人群的特性。全世界人類的智力測驗的成績大約在 100 分上下、北歐國家的人比其他地區的人還要快樂等等,都是以平均數最為群體的代表值來討論。只是在研究中,心理學家會採用哪一類的平均,完全是看目的而定。走出學術高塔,當你發現保險業務員開始提到男性在平均幾歲的時候會罹癌,平均幾歲的時候會得慢性病,你就得留意他說的平均是哪一種平均數?算術平均數、中數還是與眾數,任何一個都可能改變原本的說明,影響你要不要簽下躺在他公事包口,蠢蠢欲動的保單。

沒有留言:

張貼留言