2019年12月6日星期五

利用Benford's Law檢測區議會選舉結果

就今屆區議會選舉,光頭警長質疑票數和投票人數嚴重不符,因此要求重新點票。有趣的事,經某Facebook專頁調查後,發現有人不懂得使用Excel,未有將付有*號的當選人票數計入,給果引發誤會。光頭警長主動查驗選舉結果,可謂其志可嘉,但只靠「加數」要求核查票數,層次略嫌不足。

有沒有較高層次的檢測方法?有的,就是2009年伊朗總統大選中,一戰成名的「Benford’s Law(本福特定律)」。話說當年歐洲一位學者,發現某候選人在各區的得票數字,以7字開頭的特別多,不符合本福特定律。此結果被引用作為選舉舞弊證據之一,為當年伊朗綠色革命充當火藥引。本福特定律指在一堆自然產生而且相關數值中,字頭為「1」的機率最高大約30.1%,其次是「2」和「3」分別是17.6%和12.5%,餘下字頭的數值愈大,出現的機率就愈少。

所謂自然產生,是指不經人工修飾、沒有上下限制,而且不是發明或分配出來。例如各國人口、河流長度、股票價格、會計帳目、選舉結果等都屬於自然產生。相反,設有最低工資的薪金、電話號碼、藍球員身高、六合彩結果等,就不是自然產生。


如何應用於檢查選舉?理論很簡單,只要統計所有選票的字頭分布,再與本福特定律預期值對比,若兩者存在巨大差異,代表選票數字好大可能經人為竄改或捏造。利用此定律分析本屆區議會選舉結果,圖A紅線代表所有候選人得票字頭分布,綠線代表本福特預期分布。結果顯示以1為字頭票數較預期少,2和3卻較預期多,其餘位數則大致與預期相若。嘩!結果不就是說香港選舉造假?冷靜!大部分選舉都有兩個特性,影響分析的準確度,就是選區大小會被劃分致相等,以及選民傾向支持少數派。



以香港而言,選舉法例規定在劃分選區時,每選區的人口不得高或低於標準人口基數的25%,今年的基數為16,599人,即是每個選區的人口限制在12,449人至20,749人之間。再者,因修例風波令今屆選民有懲罰建制的心思,這兩點相信是選票字頭分布與本福特定律不一致的原因。明明顯示有異,現在卻諸多解釋,瓜瓜你講晒啦!稍安毋躁,為改善本福特定律的準確度,有學者提出檢查第二位數。方法和上述一樣,不同的只是第二位數分布曲線沒有第一位數那麼傾斜。分析結果在圖B,紅線為今年選配第二位數分布。除0外,其他位數大致符合本福特預期分布。更重要是,以相同方法分析2015年區議會選舉結果(藍線),曲線形態與本屆大致相若。換句話說,若然說今屆造假,上一屆也一樣造假。

總括而言,上述分析結果反映出,本屆選舉不似有造假跡象。再講,香港的選舉一向以公平公正和制度建全見稱,整個點票過程又經公眾現場監察,指選舉不公甚至舞弊,請拿出具體證據,不然只是輸打贏要耍無賴了吧?

原文刊於:am730 2019-12-06

&&&&&&&&

沒有留言:

LinkWithin

Blog Widget by LinkWithin