可以有超過一半的考生低於平均嗎?


  •  
  •  
  •  
  •  

大學學測成績很快就要在明天(2/18)開獎了,相信許多考生都感到非常緊張。不過這也讓聞史迭想到前幾年的一則新聞,大意說有立委質疑數學考太難,導致有將近一半的考生低於均標。

 

另外,立委楊瓊瓔、蔣乃辛也質疑,今年學測數學太難,近五成考生低於均標,零分人數也超過二千一百人,會抹殺學生學習數學的興趣,因此要求大學入學考試的數學題目不要出太難。

自由時報 2010/5/27

姑且不論學測的成績其實是經過換算的級分制,重點是,有將近一半的考生低於均標,合理嗎?各位聰明的讀者應該早就看出來了,如果這兩位立委講的真的是「均標」的話,那一點問題都沒有。為什麼?讓我們來看一下均標的定義:

  • 頂標:成績位於第88百分位數之考生級分
  • 前標:成績位於第75百分位數之考生級分
  • 均標:成績位於第50百分位數之考生級分
  • 後標:成績位於第25百分位數之考生級分
  • 底標:成績位於第12百分位數之考生級分

——維基百科

也就是說,「均標」就是中位數的意思;假設考生有十萬人,那均標就取決於成績排名第五萬的人,他的級分。

104年度學測的統計分佈。圖取自聯合報。

但是接著,我們要更深層地來檢視這個問題,或者說,我們來驗證兩個問題:考的成績低於均標的考生有可能超過一半嗎? 又,考的成績高於均標的考生有可能超過一半嗎?

首先我們要先釐清一件事情:分數只有15種有限的可能。除非缺考或者違反重大的考試規則,否則基本上只要有到考(而且原始分數超過 0.01 分——基本上單選題一題都沒猜中的機率非常的低)分數都會有一級分。也就是說,有非常多人會跟你「同分」。如果王小明恰好是全部考生排名第50%的那位,那其他跟他同級分的同學,都沒有考低於均標。到這邊,我們幾乎已經可以確定,除非全國只有小明剛好考了,例如說,7級分,否則級分低於均標的人,永遠不可能會超過一半,但是就是幾乎一半。相對的,我們也可以繼續推理出:成績低於或等於均標的考生,一定會超過一半。

所以說,無論是「全國有將近一半考生低於均標」或者「全國有超過一半考生的成績等於或者低於均標」都是雖然正確,但是幾乎等於廢話的敘述。講好聽一點,就是建立樣本數非常大的情況下,上面的敘述幾乎是恆真的。

上面討論的「均標」,其實就是統計學說的「中位數」。另一個更常用來表示群體的統計特徵的數字,就是「平均值」。平均值的定義相信大家都非常熟悉:如果樣本數有 ,那麼一群樣本  的平均值就是:

\mu = \frac{ \sum_{i=1}^{N} x_i }{N}

讓我們現在來設想兩種極端的情形。在第一個情境下,三年二班全班共有10個人,除了王小明考0分之外,其他9人都考100分,所以全班的平均是90,而且除了王小明之外,有9個人都考高於平均。(順道一提,全班沒有一個人考高於「均標」,因為均標就是100了)

反過來說,如果全班只有王小明考100,其他9人都考0分,那自然就有高達9人低於平均了,而且還有超過一半的人考低於均標呢。

在已知樣本的分佈的情況下,或者可以假設我們知道樣本的分佈的情形下,平均是一個非常有用的數字,因為我們得以用一個單一的數字來代表一群數字。如果我們還知道標準差,那我們知道的就更多了,幾乎可以用已知的數學模型來敘述整組資料。

我們在前面已經用實際的例子討論了正常的情況(學測的成績分布)以及極端的例子(小明班上的成績),那麼,到底有沒有一個霸氣的數學定理,可以講一句絕對會成立的事情呢?舉例來說,學測成績的例子中,我們假設全國的考生非常多,而且每個級分都有複數個考生落在該組,才得以得出上面說的,立委說的是廢話的結論。

其實是有的,這個定理叫做馬可夫不等式( Markov Inequality)。

P\{ x\geq a\mu \} \leq \frac{1}{a}

這個不等式說了什麼呢?這個式子中的  表示平均值,而  則是一個任意大於1的常數。如果現在我們讓  等於1,那我們就得到不等式

P\{x \geq \mu \} \leq 1

也就是說,任意一個樣本都大於或等於平均值,是一點也不讓人意外的,或者說有可能全班都考等於或大於平均。但是如果是  或者  呢?那我們就可以說,如果全班的平均是40分,那麼全班考試成績超過80分的人,不會超過一半;而成績超過120的人,不會超過三分之一強(畢竟滿分可能也才一百)。

雖然平均值等等「數據」,常常被誤會甚至誤用,甚至讓人陷入數字的迷思,乃至盲目追求數字,例如全台灣人口平均每個人有一顆睪丸,就是最好的例子。但是藉由馬可夫不等式的幫助,我們還是可以在平均值之外多看到一些數字背後的資訊,例如全台灣大約有一半的人有兩顆睪丸


  •  
  •  
  •  
  •  

Comments

comments

二月 17th, 2016 by