區域抽樣
出自 MBA智库百科(https://wiki.mbalib.com/)
區域抽樣(Area Sampling)
目錄 |
群體抽樣的一種形式,樣本空間按區域進行劃分,選定某抽樣區域,如一個縣、一個行政區、一個街區,從中確定調查對象。
區域抽樣的常用方法[1]
常用的區域抽樣方法包括依據戶籍資料的容量比例概率抽樣法(probability proportionto size,PPS)、住戶中抽取被訪者、按居住地地圖法抽樣。
- (一)按戶籍資料的PPS抽樣
在實際抽樣中,應用範圍最廣的多階段抽樣方法是分層多階段區域抽樣。只要研究總體能以區域進行劃分,就可以採用分層多階段抽樣方法。
例如,調查某省城市居民的血壓水平,這是一次全省性的調查,可以利用區域劃分總體來進行分層多階段抽樣。
- 1.確定總的抽樣比和各級抽樣單位
假設某省城市居民共有1000萬人,計劃抽取5000名居民,那麼總的抽樣比為
F=n/N=5000/10000000=0.0005
此次抽樣為4級抽樣,各級的抽樣單位分別為市、區、居委會、居民。在全省按行政區劃和地理位置抽取4個市,每個市抽取5個區,每個區抽取5個居委會,每個居委會抽取50名居民,即樣本規模為
4×5×5×50=5000(人)
- 2.對初級抽樣單位進行分層。計算每層樣本規模
結合調查地區的經濟水平和地理位置,將初級抽樣單位分為4個層次。假設某一層的居民總數為100萬人,那麼按照比例分配樣本,該層的樣本規模為
1000000×0.0005=500(人)
取層內初級抽樣單位數目n為4,那麼市的子樣本人數為500÷4=125(人),區的子樣本人數為125÷5=25(人),居委會的子樣本人數為25÷5=5(人)。
- 3.在各層抽取初級抽樣單位
①對層內的初級抽樣單位進行排序:從普查資料或其他部門的相關資料中,獲得初級抽樣單位的規模測量值,然後按一定方式將各層內的初級抽樣單位排列起來。排列方式主要有以下兩種:一是事先獲得初級抽樣單位的某個與測量變數密切相關的變數信息,將初級抽樣單位按這個變數值排列,例如按每個縣學生的身高進行排序;二是將各個初級抽樣單位在地圖上用線串起來,然後根據此線穿過初級抽樣單位的先後順序進行排列。
②按層內初級抽樣單位的排列順序,將規模測量值進行累加。
③採用系統抽樣方法:首先計算抽樣間距
K=該層規模測量值的總和/層內初級抽樣單位數目此例中
K=1000000/4=250000
④然後在1~250000的範圍內隨機抽取一個數a作為起點,再抽出n個初級抽樣單位。那麼抽中的號碼分別為a,a+K,…,a+(n-1)K。
此例中假設抽取了隨機數字57890,那麼抽中的號碼依次是57890、307890、557890、807890。因此,相對應的4個市被抽中。具體數據參見表。
- 表:PPS法抽取初級抽樣單位
PSU序號 | 規模測量值 | 累積規模測量值 | 抽中的號碼 |
1 | 112897 | 112897 | 57890 |
2 | 101210 | 214107 | |
3 | 127642 | 341749 | 307890 |
4 | 138869 | 480618 | |
5 | 137978 | 618596 | 557890 |
6 | 129976 | 748572 | |
7 | 135679 | 884251 | 807890 |
8 | 115749 | 1000000 |
- 4.抽取次級抽樣單位
第二級抽樣是從每個被抽中的市裡抽取5個區。第三級抽樣是從每個被抽中的區中各抽取5個居委會。第四級抽樣是從每個被抽中的居委會抽取一定數量的樣本。計劃樣本量為前面計算過的5。第四級抽樣的抽樣比為計劃樣本量除以第α市內第β區的第γ居委會的規模測量值。那麼,第四級抽樣的期望樣本量為該階段的抽樣比乘以實際居委會規模數。假設此時某抽中居委會的規模測量值為80,而實際規模測量值為128,則該居委會實際應抽取的居民數為
d=5/80×128=8(人)
- 5.確定各級抽樣單位的數目
確定各級抽樣單位數目時主要考慮兩方面因素的影響:一是各階段抽樣總體的性質,包括總體的規模和異質性程度。一般來說,總體規模越大,樣本規模越大。但是,當總體增長到一定數量時,樣本的增長速度則遠遠跟不上,變化不明顯,這在前面的章節中已有過詳細介紹。總體的異質性較高,樣本規模越大,反之亦然。此外,還要考慮到研究者所擁有的人力、物力和時間。在其他條件不變的前提下,抽樣的初級抽樣單位越多,樣本覆蓋面越廣,代表性也就越好。但這也意味著要花費的人力、物力和時間越多。
6.PPS抽樣中應註意的問題
在某些情況下,抽樣單位的規模可能比抽樣間距大,那麼,無論隨機抽樣的起點在哪裡,該抽樣單位都可能被抽中,而且可能被抽中兩次。解決這個問題的方法有兩個:一是如果該抽樣單位被抽中兩次,將其視為兩個抽樣單位,並從中選取兩倍的次一級抽樣單位;另一種方法是找出規模大於抽樣間距的抽樣單位,讓它們組成一個獨立的層,然後按總抽樣比計算該層的樣本規模,再抽取次一級抽樣單位。
- (二)住戶中抽取被訪者
區域抽樣中往往採用多階抽樣方法,抽樣單位依次為市(地區)—縣—鄉(區)—村(街道)—居民組(居委會)—住戶。研究者以家庭為分析單位,收集相關資料。在實際調查中,不僅需要抽取住戶為樣本,同時還要在住戶中抽取一名成年人作為訪談對象,這就是戶內抽樣(within.householdsampling)。下麵介紹比較常用的戶內抽樣中的Kish選擇法,利用這種方法,抽取的每戶家庭中所有成年人(例如,18歲以上者)被抽中成為樣本的概率相等。
Kish選擇法的具體步驟如下:
研究者首先編製8種不同的抽樣表,編號分別為A、B1、B2、C、D、E1、E2、F,相應的每種表的數量分別占抽樣表總數的1/6、1/12、1/12、1/6、1/6、1/12、1/12、1/6。每份問卷都有一種抽樣表,因此問卷也被分成8種。抽樣表的格式見表。
- 表:Kish選擇表
住戶中18歲
以上人口數 | 抽
取 成 年 住 戶 成 員 的 號 碼 | 抽樣表的次序 | |||||||
A | B1 | B2 | C | D | E1 | E2 | F | ||
1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | |
2 | 1 | 1 | 1 | 1 | 2 | 2 | 2 | 2 | |
3 | 1 | 1 | 1 | 2 | 2 | 3 | 3 | 3 | |
4 | l | 1 | 2 | 2 | 3 | 3 | 4 | 4 | |
5 | 1 | 2 | 2 | 3 | 4 | 3 | 5 | 5 | |
≥6 | 1 | 2 | 2 | 3 | 4 | 5 | 5 | 6 |
首先,研究者要將住戶成員的基本情況進行完整記錄,包括年齡、性別、與戶主關係。然後,對每戶家庭的成年人進行編號和排序,排序的基本原則是男性在前,女性在後;年紀大的在前,年紀小的在後。也就是最年長的男性排在第一,依次是次年長的男性,第三年長的男性,以此類推。最年長的女性排在最年幼的男性之後,其他女性依次排序。例如,某戶家庭成員中的成年人有祖父、祖母、父親、母親、兒子,那麼排序依次為祖父、父親、兒子、祖母和母親。
研究員可以根據抽樣表,從住戶成員情況登記表上抽取訪問對象。例如,某住戶的成年人共有5名,排序為:祖父、父親、兒子、祖母、母親。若調查表為A類,則抽取祖父;若調查表為B1、B2類,則抽取父親;若調查表為C、E1類,則抽取兒子;若調查表為D類,則抽取祖母;若調查表為E2、F類,則抽取母親。
抽樣調查中研究者應儘可能完整地將所有家庭成員的情況填入登記表中,這樣研究者不僅可以收集到家庭資料,也可以獲得被調查家庭成員的個人資料。按照這種方法獲得的樣本,在性別、年齡、文化程度等方面的分佈往往接近於總體人群的分佈,因此,可以利用這些資料來描述該抽樣區域內居民的總體狀況。
- (三)按居住地地圖法抽樣
在區域抽樣中,抽取住戶時需要一份完整的居民名單作為抽樣框,通常是根據戶籍資料制定的。如果現有的戶籍資料不完整,或沒有現有的戶籍資料時,可以利用居住地地圖法進行抽樣。
按居住地地圖法抽樣的具體步驟如下:
- 1.將抽樣區域進行分層
按一定的準則對將要抽樣的城區、街道等行政區域進行分層,分層數目根據需要而定,然後在每層內抽取所需的樣本。
- 2.選擇適合抽樣的地圖
首先要註意地圖的出版日期。由於地圖的時效性強,更新非常快,所以要註意資料的日期,最好能找到最新出版的地圖。同時,還應註意地圖的比例尺。一般來說,地圖比例尺愈大,誤差愈小,圖上測量精度愈高。但太精密的地圖一般是由專業部門使用,不太適合抽樣時使用。因此,要根據實際情況選擇合適的地圖。研究表明,研究者使用1/25000的地圖時誤差較小,不超過5戶。
- 3.在地圖上選出坐標點
在選定的地圖上繪製二維網格,再根據一定規則從地圖上抽取一些二維坐標點。然後,到實地進行考察,根據實地的地理位置、地貌狀況,對坐標點進行恰當的修正,儘量減少偏差。
- 4.培訓調查員
在調查開始之前,應對調查員進行培訓。讓其瞭解研究的目的、實施的步驟等,以減少在工作中出現的誤差。調查員應熟悉地圖上的坐標點,對調查區域的情況有個初步瞭解。還要對調查員進行步測訓練。在不適合用尺測量距離時,就可通過調查員的步伐數計算大致距離。具體做法是:讓調查員在200米長的直線跑道上來回走幾次,記錄下步伐數和時間,計算出每個調查員每步的平均距離。
- 5.調查員到實地瞭解坐標點
按照一定原則確定坐標點的調查順序,調查員按該順序對坐標點進行調查。調查員應到實地將實地坐標點的地理位置、地貌狀況一一記錄。
- 6.抽取住戶
每個坐標點對應的是一個樣本戶,如果坐標點對應的是樓房,則用隨機的方法選取該樓上的一個住戶進行調查。這裡的“戶”是指以郵差送信地址為單位的戶。例如,幾個人合租了一套房子,他們用相同的郵政地址,那麼合租的幾人都應被視為是這一“戶”的成員。也就是說,利用居住地地圖法抽樣的總體是由那些人們居住的地址形成的“戶”組成的。
還可以採用整群抽樣。各坐標點對應的戶成為首戶,從首戶開始,按門牌號,相鄰的若幹戶形成一個群,再對整群進行調查。
- ↑ 葉冬青.醫學社會科學研究方法.中國科學技術大學出版社,2011.07.