網頁

2013年8月6日 星期二

[Sampling] 利用方區樣本估計母體密度和大小

拍攝者 Jake Sun

2013年8月3日的「凱道送仲丘」是台灣史上最大規模由公民自發的社會運動,主辦單位稱有25萬人,而警政單位則稱約有11萬人。到底為什麼會差這麼多?在這種不售票的大型集會,又要如何估算人數呢?傳統直觀的估算方式是每單位(常用是平方公尺)多少人去乘上總單位數(總平方公尺面積),但若是繼續問那這個估計的變異數或誤差界限呢?這時就會卡住了!有簡單的估算方法嗎?有!在抽樣方法中有一個方區樣本估計法有提供簡單的估計式計算變異數或誤差界限


假設區域面積為 $A$ ,總共有 $N$ 個面積為 $a$ 的小區塊, $A=Na$隨機從 $N$ 個小區塊中抽出 $n$ 個,每一個小區塊稱為方區(quadrat)(不論這小區塊是否為方形,皆稱為方形樣區。)

令 $m_i$ 為第 $i$個樣區所包含的元素個數,則母體(面積 $A$ )中的總元素個數 $M$ 為 $M=\sum\limits^N_{i=1}m_i$
令 $\lambda=\frac{M}{A}$ 為元素的密度。

若在隨機選擇面積為 $a$ 的樣區中,元素個數為 $m_i$ 則 

為每一個樣區(per quadrat)中元素個數的估計式。


在假設元素為隨機地分散情況下

密度 $\lambda$ 的估計式


密度的估計變異數 

總合 $M$ 的估計式  

$\hat{M}$  的估計變異數  


若以凱道西至公園路,中山南路北至徐州路、南至大中至正門附近,仁愛路和信義路都東到林森南路的範圍來看,這樣的面積未扣除行道樹、景福門等,面積約為 $A=49027$ 平方公尺。(令共有$N=49027$個面積為 $a=1$ 平方公尺樣區, $A=Na$隨機從 $N$ 個小區塊中抽出 $n$ 個樣區 



http://www.flickr.com/photos/pancala/9439768179/sizes/l/in/photostream/

假設活動當天隨機抽出 $n=50$ 個樣區,得到樣區內人數資料如下表





由上表資料可得  $\sum\limits^{50}_{i=1}m_i=158$
則密度為  $\displaystyle\hat{\lambda}=\frac{\bar{m}}{a}=\frac{1}{1}\left(\frac{158}{50}\right)=3.16$  人/平方公尺

若人群是隨機分佈在欲估計的區域內,則密度估計變異數


所以人數總合估計為  

人數總合估計值取 $154926$
人數總合估計的變異數  


所以估計的標準差約為 $12325.19$ 取 $12326$,在 $95\%$ 信心水準下的誤差界限為 $1.96\times 12326=24158.96$ 取 $24159$
估計總數介於


但以上總數的估計值為某個時間點的靜態估計值,未考量到活動期間流動的參與人數

若現場有較完整的空照圖 (例:多台遙控直升機進行連拍或攝影),或許憑藉著目前圖形辨識技術和電腦運算能力,可以將參與的群眾更精確地"數"出來!

其他估計方法或想法可參考 [延伸閱讀]



[參考資料]

Elementary Survey Sampling, 6th Edition, Scheaffer & Mendenhall & Ott, 抽樣調查, 林定香審閱


[延伸閱讀]
[1]仲夏夜裡有多少人送仲丘?  http://pansci.tw/archives/46749

[2]用imagej分析凱道上能有多少人  http://a-chien.blogspot.tw/2013/08/imagej.html


[3]精算遊行人數,專家提方法  http://www.mdnkids.com.tw/nie/nie_indicate/Unit7/W-980525-15/W-980525-15.htm
警方估算人數的方式:
警方估算方式為一平方公尺內有三人,依此標準,
中山南路景福門到愛國西路段面積為一萬四千餘平方公尺
中山南路景福門到徐州街段面積為一萬五千餘平方公尺
仁愛路景福門到杭州南路段面積為兩萬兩千餘平方公尺
信義路景福門到杭州南路段面積為兩萬兩千餘平方公尺
凱達格蘭大道景福門到公園路段面積為七千五百平方公尺
景福門周邊不含景福門,面積約七千三百平方公尺

[4]究竟有多少人參加遊行? http://citypatterns.blogspot.tw/2013/08/blog-post.html