心事備忘錄: 母群（population）與樣本（simple）

心理學家從統計學家身上學到許多事，現在心理學的研究結果，有很大部分都是使用統計學的方法所得到的結論。

統計學家關心的事，其實和國中男生好奇暗戀的女生究竟喜不喜歡自己差不多。比如景翔要如何確定在教室另一側的子韻究竟喜不喜歡自己呢？

如果子韻的一言一行很常提到某個人，很有可能是他很在意這個人。所以最簡單的方式就是隨時留意子韻的行為：看他跟朋友聊天的時候有沒有談到景翔。臉書上有沒有寫到景翔。夜深人靜的時候有沒有想著景翔，然後滑開景翔的 IG 看一看。他在放學的路上有沒有把其他男同學認成景翔。或者景翔在的地方，他有沒有笑得更頻繁......好，你應該懂我的意思了。

如果有辦法知道子韻的所有行為，那景翔自然就能輕易從中判斷什麼時候要買好鮮花禮物準備告白，甚至連告白的橋段都可以省了，直接牽起子韻的手。

現實是，景翔做不倒。他只能在子韻來學校的時後，偷偷觀察子韻的言行，而且觀察到的數量還很有限。要從這些少的可憐的訊息中判斷子韻究竟喜不喜歡自己。

子祥並不孤單，統計學家也有一樣的煩惱。統計學家好奇各種議題，舉凡身高、體重、一週多少錢吃垃圾食物、性經驗次數、生殖器長短、私下看Ａ片的時間（希望你不是公開看）。他們劃分出一群想研究，深感興趣的對象群體，這個群體就叫做母群（population）。

但統計學家的財力與時間有限，不太可能找來母群中所有的個體來做調查，因此他們只好從母群抽選一些個體當作樣本（simple）來觀察，再從樣本的回答與特性推論母群的情況。

比如全臺灣高中生，一個月裡有多少次離家出走的想法。母群相當明確，就是正在就讀臺灣高中的人，但統計學家不可能開車環島，逐一問過每一位高中生，加上有些學生足不出戶或蹺課成性，根本找不到人。所以他們只好從這些高中生裡面選出一些人來當樣本，再從樣本的回答，合理推論全臺灣高中生的情況。

聽起來相當耳熟。景翔對子韻的所有行為相當好奇，這些行為就是母群。但景翔不可能觀察到子韻的所有行為（請不要跟蹤或爬到人家家裡的窗戶外面偷看），只能用相當有偏頗的觀察當作樣本，也就是子韻上學時候的表現，來推論他在其它時候的行為。

這種推論需要技術，統計學家想盡辦法減少樣本推論母群時所產生時的誤差，尤其是當你手中的樣本數與母群差異過大，會讓推論不成立，像是你看到某個女生對你笑過幾次，就以為對方愛上自己了，說不定他剩下的時間更常對另一個男生笑。這時，統計學家會建議你增加觀察的樣本數量，當你的觀察樣本越多，越接近母群，自然更能得到真實的情況（即便真時的情況你不見得能接受）。

有時候觀察的數量不是重點，而是要用對方法抽出代表性樣本（representative sample），這些樣本更能反映母群體的特性。比如子韻在臉書上的文字內容與最常偷看誰的 IG 都是能彰顯他喜歡誰的代表性行為，觀察這些行為或許才是重點。

許多人告白失敗，是因為只觀察到少數或特定的行為，就過度推論對方的心意。現在景翔已掌握要領，忙著安裝「誰在看我 IG」那一類的 APP 。我們就別再打擾他。

Note：

1. 母群裡的個體不一定要是人，比如商業上的研究對象，常常是企業。

2. 母群有時候也翻作母體。

心事備忘錄

2021/07/26

母群（population）與樣本（simple）

沒有留言:

張貼留言