2021/07/26

母群(population)與樣本(simple)

心理學家從統計學家身上學到許多事,現在心理學的研究結果,有很大部分都是使用統計學的方法所得到的結論。

統計學家關心的事,其實和國中男生好奇暗戀的女生究竟喜不喜歡自己差不多。比如景翔要如何確定在教室另一側的子韻究竟喜不喜歡自己呢?

如果子韻的一言一行很常提到某個人,很有可能是他很在意這個人。所以最簡單的方式就是隨時留意子韻的行為:看他跟朋友聊天的時候有沒有談到景翔。臉書上有沒有寫到景翔。夜深人靜的時候有沒有想著景翔,然後滑開景翔的 IG 看一看。他在放學的路上有沒有把其他男同學認成景翔。或者景翔在的地方,他有沒有笑得更頻繁......好,你應該懂我的意思了。

如果有辦法知道子韻的所有行為,那景翔自然就能輕易從中判斷什麼時候要買好鮮花禮物準備告白,甚至連告白的橋段都可以省了,直接牽起子韻的手。

現實是,景翔做不倒。他只能在子韻來學校的時後,偷偷觀察子韻的言行,而且觀察到的數量還很有限。要從這些少的可憐的訊息中判斷子韻究竟喜不喜歡自己。

子祥並不孤單,統計學家也有一樣的煩惱。統計學家好奇各種議題,舉凡身高、體重、一週多少錢吃垃圾食物、性經驗次數、生殖器長短、私下看A片的時間(希望你不是公開看)。他們劃分出一群想研究,深感興趣的對象群體,這個群體就叫做母群(population)。

但統計學家的財力與時間有限,不太可能找來母群中所有的個體來做調查,因此他們只好從母群抽選一些個體當作樣本(simple)來觀察,再從樣本的回答與特性推論母群的情況。

比如全臺灣高中生,一個月裡有多少次離家出走的想法。母群相當明確,就是正在就讀臺灣高中的人,但統計學家不可能開車環島,逐一問過每一位高中生,加上有些學生足不出戶或蹺課成性,根本找不到人。所以他們只好從這些高中生裡面選出一些人來當樣本,再從樣本的回答,合理推論全臺灣高中生的情況。

聽起來相當耳熟。景翔對子韻的所有行為相當好奇,這些行為就是母群。但景翔不可能觀察到子韻的所有行為(請不要跟蹤或爬到人家家裡的窗戶外面偷看),只能用相當有偏頗的觀察當作樣本,也就是子韻上學時候的表現,來推論他在其它時候的行為。

這種推論需要技術,統計學家想盡辦法減少樣本推論母群時所產生時的誤差,尤其是當你手中的樣本數與母群差異過大,會讓推論不成立,像是你看到某個女生對你笑過幾次,就以為對方愛上自己了,說不定他剩下的時間更常對另一個男生笑。這時,統計學家會建議你增加觀察的樣本數量,當你的觀察樣本越多,越接近母群,自然更能得到真實的情況(即便真時的情況你不見得能接受)。

有時候觀察的數量不是重點,而是要用對方法抽出代表性樣本(representative sample),這些樣本更能反映母群體的特性。比如子韻在臉書上的文字內容與最常偷看誰的 IG 都是能彰顯他喜歡誰的代表性行為,觀察這些行為或許才是重點。

許多人告白失敗,是因為只觀察到少數或特定的行為,就過度推論對方的心意。現在景翔已掌握要領,忙著安裝「誰在看我 IG」那一類的 APP 。我們就別再打擾他。

Note:

1. 母群裡的個體不一定要是人,比如商業上的研究對象,常常是企業。

2. 母群有時候也翻作母體。

沒有留言:

張貼留言