此網頁為2014年的香港大學民意研究計劃檔案網頁,不會再作更新。若需瀏覽最新資料,請到網址 http://hkupop.hku.hk
This is the archived webpage of HKU POP SITE of the year 2014 and no longer updated. For latest information, please visit http://hkupop.hku.hk.

如何統計七一大遊行人數返回

蘇鑰機
(香港中文大學新聞與傳播學院副教授)
陳素娟
(香港大學統計及精算系講師)
 

註:本文只代表作者個人意見,與所屬大學立場無關。

 

香港每年都有各種大小遊行示威活動,而在一些較大型的如六四燭光晚會和去年底的反基本法遊行中,巿民都很關心參加的人數。集會遊行的主辦者通常都會提供一個數字,而警方有時也會提供另一個數字,但兩者往往相差很大。一般人認為,主辦者的數字很可能是高估的,而警方的數字則傾向於保守,於是大家只有在這兩個數字之間自行猜估,或乾脆把兩者求個平均數。

 

究竟在大型集會遊行中能否準確地計算出參加人數?如何計算?這不單是民眾有興趣的資料,也是在學理上一項挑戰題目。一群曾對「基本法市民意見書彙編」進行重新分析的學者,希望研究此題目,並利用七月一日反基本法大遊行作為個案。研究組的成員包括科技大學的馬嶽,浸會大學的趙維生,香港大學的蔡世增、鍾庭耀、陳素娟,中文大學的陳健民及蘇鑰機,並加上十位同學義務幫忙。本文是根據是項研究的設計、嘗試及檢討寫成的,希望可以對日後相關的工作有些參考作用。

 

計算的挑戰

 

為何以往很少人嘗試對遊行示威人數作科學化的統計?原因有很多,其中包括以下數點。一是大型的遊行人數眾多,根本不能在現場用人手即時點算。二是集會的人會坐下來,計算人數較好辦,但遊行的人是不停流動的,而且速度不同,不可以用靜止的方格形式來數人頭。三是如果遊行隊伍長,遊行所用時間也久,不能用幾個定點的簡單抽樣再作推算,因為這樣的誤差會很大。四是遊行的路線可能不只一條,群眾加入的時間和地點也有不同,令精確的計算更不可能。

 

雖然有上述的困難,但也非不可克服。在有限的資源情況,研究組決定採取的方法如下:在遊行的主路線軒尼詩道上選擇兩座天橋,在天橋上架設攝錄機,抽樣拍攝遊行的過程,並決定每小時抽樣攝錄四分鐘(如四時正、四時十五分、四時卅分、四時四十五分,餘此類推),即抽樣比例為十五分一。每小時攝錄後,研究組馬上把錄影帶運送到一個設有放映器材的地方,用定格在電視大屏幕上點算人數。研究組原先希望在遊行當天的晚上,便可計算出參加者的總人數。

 

這個方法是否可行,有賴下列假設是成立的:(一)遊行路線是單一的,所有參加者都經過研究組的拍攝點。(二)每一小段(十五分鐘)的遊行者流量相若,從而可用抽樣的分鐘所得數據作推算。

 

研究組特別用了兩個點作人數統計,這兩個點是在軒尼詩道與波斯富街交界的天橋,及軒尼詩道與柯布連道交界的天橋,以防有些人只經過其中一點便離隊,又可作互相印證之用。

 

實際的困難

 

在正式運作時,七名研究組學者加上十位同學共同進行實地調查工作。第一項困難是,原本雖然用上了三十多吋的大電視屏幕,但定鏡點算人頭也不容易,因為定鏡後畫面質素下降,而且數人頭也很費時。一分鐘的畫面,大約要用近半小時才能完成。因此,如果遊行長達六小時,到晚上九時許才結束,在當晚就很難有完整的統計數字。

 

第二項困難是攝錄機的擺放位置及角度。選擇適當的位置很重要,地點一定要能拍攝到最多人經過,最好在不同地點都進行攝錄。鏡頭面對前方一定要是直線,器材應放在天橋上的路中央,一旦遊行人士佔用兩邊道路都沒問題,並且要能拍攝到行人道上的情況。在畫面上最好能有一些「參考點」如電燈柱、交通燈等,以方便在計數時作為依據。

 

研究組在這方面的經驗不足,後來才發現在波斯富街和軒尼詩道上的天橋位面對的是大彎路,天橋上又有透明玻璃,因此拍攝的效果不理想,最後被逼放棄此點所得的數據。之前研究組把器材放在路的一邊,怎料後來人群佔用了兩邊馬路,要修正位置時卻因天橋上人太多而變得不可行。

 

第三項困難是,研究組發覺每十五分鐘取樣一分鐘的決定並非最佳,因為人流節奏變得很快,例如在下午四時許經過柯布連道天橋的人流,每分鐘只有三、四百人,而且每十五分鐘的數字也有頗大差別。但到晚上七時後,每分鐘的人流高達一千三百人,而每分鐘之間人數相差可以是二百人。最理想的做法是進行全程錄影,在看過影片後,根據人流的轉變而調節抽樣比例,例如當人流節奏轉變得快時每十分鐘抽取樣本。

 

第四項困難是所選取的地點數目太少。研究組只採用了兩個地點,但有些人在維園出來後便已散去,根本未有走到軒尼詩道。也有人在金鐘之後才加入遊行隊伍,這些人士都不在研究組所設的鏡頭中出現,因此未能計算在遊行人數之中。最佳的安排是多設錄影點,包括維園一帶和金鐘及中環,甚至在政府總部門外。

 

第五項困難是,研究組沒有預料到有部分遊行人士另組隊伍,在告士打道向西行。故研究組沒有在告士打道設置攝錄機,所以就沒有計算這些人。後來經多方瞭解,確定了這支經告士打道出發的小隊伍的遊行時段,估計人流及計算此段遊行的人數。研究組借助警方公佈的數字及遊行主辦者的估計作為參考,又加上事後進行的民意調查所得的數據,再結合錄影資料以推算遊行人數。這種做法當然仍未算理想,但在資源和客觀條件限制下,研究組已盡了最大努力。

 

推算的結果

 

研究組在七月一日,全日抽樣攝錄沿軒尼詩道西行經過灣仔修頓球場的柯布連道天橋底的遊行人士,以推算經過該計算點的遊行人數,得出的數字是二十六萬四千人。研究組本來打算在七月一日晚上即時公佈點算結果,但發現經過該處的遊行人士只佔全部遊行人士的一部分,因為當日不少遊行人士在維園起步點久候折返、或者沒有行畢全程、或者是沿告士打道或其他途徑繞過灣仔、或只在金鐘或中環加入遊行等。因此,研究組認為要在掌握更多數據後,方可推算全部遊行人士數目。

 

研究組遂於七月二日至五日期間,以隨機抽樣電話訪問形式,成功訪問了二千二百零六位年滿十八歲的巿民,回應率是百分之六十八點七,其中四百八十九位曾參與七月一日遊行。他們回答了下列兩條問題:(一)你遊行時有沒有在軒尼詩道經過灣仔修頓球場對開的馬路?(二)你在下午六點的時候是否正在遊行當中,包括正在維園附近集結?在四百八十九位曾參與遊行的巿民中,百分之五十七點一曾於軒尼詩道經過灣仔修頓球場對開馬路,百分之七十五點四於黃昏六時正在街上聚集。

 

此外,研究組從電台的聽眾憶述現場情況及研究組成員的親身參與得知,當天從五點半開始有人龍自告士打道出發向西遊行,龍尾則在接近六時於維園出發。假設此路線的人流佔用兩條行車線,及以每秒七個人的速度前進(此假設建基於相約時段在軒尼詩道的流量),則在這半小時內,約有一萬三千人經過。

 

有了上述的數據後,研究組便可推算七一大遊行的參加人數。研究組使用兩個不同的方法,其一是基於在柯布連道天橋上所算得的人數,再加上經民意調查資料而推算的其他人數,包括在告士打道遊行人士及在維園或金鐘/中環起步而未踏足軒尼詩道的人士,從而計算出總人數。

 

研究組把經過計算點的二十六萬四千人,除以經過天橋計算點人數的百分之五十七點一(百分比A),推算出參與遊行的整體人數為四十六萬二千人。若採用百分之九十五的信心程度,百分比A的誤差率應為正或負百分之四點五,即整體遊行人數的上下限為四十二萬九千至五十萬二千人。

 

另一個方法是利用警方公佈的數字,再補充它未有計算的人數而作推算。警方表示,在七月一日下午六時正,曾利用高空拍攝技術,並用計算方格的方法,得出當時在整條遊行路線中,包括起點和終點,共有卅五萬人。研究組認為警方公佈的三十五萬於黃昏六時正在街上聚集的遊行人士,並未包括於黃昏六時前已遊行完畢,或者仍未去到集結地點的遊行人士,也不包括沿告士打道遊行的人。

 

研究組把警方公佈的三十五萬遊行人士,加上原先未有包括在告士打道遊行的一萬三千人,共得三十六萬三千人作為基數。然後用此基數除以在該時集結人數的百分之七十五點四(百分比B),推算得另一遊行人士總數,結果是四十八萬一千人。同樣採用百分之九十五的信心程度,百分比B的誤差率應為正或負百分之三點九,即整體遊行人數的上下限為四十五萬八千至五十萬八千人。

 

這兩個方法所得結果很接近,令研究組加強了對此結果的信心,而且這結果與主辦者所稱的五十萬人也很接近。研究組在軒尼詩道上統計到的遊行人數,和另外一些獨立團體所得出的數字也很相近,都是大約二十六萬人,這又互相印證了用錄影計算出來的結果。

 

小結

 

研究組所計算出來的遊行總人數,和主辦者的估計頗為吻合。一方面這可能是彼此都能夠貼近真實的情況,另方面是因為在事前大家都知道有不同的團體,將會用不同方法計算遊行人數,彼此預期在事後會作比較。這個互動過程令大家的推算都變得較為謹慎,不會隨意高估或低估,因而令大家的數字趨向接近。由不同的組織分別作計算,並互相比較參考,肯定對估計真正人數有正面作用。

 

經過這次實地計算,研究組掌握了一些經驗。在以後進行同類的計算時,可改善一些方法上的漏洞和不足。研究組相信引用這套經過實踐的統計方法,在一定誤差範圍內能呈現真確數據。畢竟數字的作用是給市民一個心理上的印象,四十六萬、四十八萬和五十萬所傳遞的政治意義分別不大,只要不是把它錯誤估計為二十萬或八十萬,便算基本完成任務了。