抽樣框

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

抽樣框(Sampling Frame)

目錄

什麼是抽樣框

  抽樣框又稱“抽樣框架”、“抽樣結構”,是指對可以選擇作為樣本的總體單位列出名冊或排序編號,以確定總體的抽樣範圍和結構。設計出了抽樣框後,便可採用抽簽的方式或按照隨機數表來抽選必要的單位數。若沒有抽樣框,則不能計算樣本單位的概率,從而也就無法進行概率選樣。

  好的抽樣框應做到:完整而不重覆。

  常見的抽樣框:大學學生花名冊、城市黃頁里的電話列表、工商企業名錄、街道派出所里居民戶籍冊、意向購房人信息冊……。在沒有現成的名單的情況下,可由調查人員自己編製。應該註意的是,在利用現有的名單作為抽樣框時,要先對該名錄進行檢查,避免有重覆、遺漏的情況發生。以提高樣本對總體的代表性。

  例如:要從10000名職工中抽出200名組成一個樣本,則10000名職工的名冊,就是抽樣框。

抽樣框的誤差

  抽樣框誤差便是因不准確或不完整的抽樣框而引起的誤差。問題是,從包含抽樣誤差的抽樣框中抽取的樣本有時無法正確地代表調研目標的實際情況,這就存在抽樣框誤差。舉個例子,以電話號碼薄作為抽樣框,在對某地區所有住戶進行的某種意向調查時,就存在著抽樣框誤差。

  理想抽樣框的標準是能夠實現目標總體與抽樣總體的一致,然而在實踐中由於設計或是資料本身等方面的原因,目標總體與抽樣總體往往不一致,無法保證樣本的代表性,而且由於目標總體單位數不准確,對總體進行估計時就會產生估計量偏倚,增大其方差。這種誤差並不是來自抽樣的隨機性,而是產生於不完善的抽樣框,因此稱為抽樣框誤差。抽樣框誤差是一種非抽樣誤差

  抽樣框誤差主要來自:

  1、丟失目標總體單位

  丟失目標總體單位也被稱為“涵蓋不足”,是指抽樣框沒有覆蓋全部目標總體單位,有些目標單位沒有在抽樣框中出現,因而也就沒有機會被選人樣本,這些單位成為丟失目標單位。對丟失的總體單位不能發現並糾正會造成調查中對總量的估計偏低。

  2、包含非目標單位

  包含非目標單位也被稱為“過涵蓋”,是指抽樣框中包含了一些不屬於研究對象的非目標總體單位。這種偏差的影響很大,但是潛在威脅卻通常會小一些。因為可以在調查中辨認出非目標元素並把它們剔除。一般情況下,由於抽樣框中存在非目標總體單位,容易造成估計量的高估。

  3、丟失目標單位和包含非目標單位共存

  丟失目標單位和非目標單位共存是指在抽樣框中既有丟失目標單位,也有包含非目標單位。在實際調查中,丟失目標單位不易被查覺和發現,具有較大的隱蔽性,相比之下,包含非目標單位的抽樣框誤差的威脅性要小些。因為在調查過程中,非目標單位容易被髮現,並予以剔除。此外,如果丟失目標單位和非目標單位數量相當,也相互抵消,估計量是否會產生偏差也難以斷定。這要取決於丟失目標單位和非目標單位的數量特征是否有顯著差異。

  4、複合連接

  複合連接是指抽樣框單元與目標總體單元不完全一一對應,而是存在一對多、多對一或是多對多模式的現象。在前一種模式中,若進行簡單隨機抽樣,能保證每個目的總體單位以同等的可能性被抽中。在後兩種模式中進行簡單隨機抽樣,每個目的總體單位被抽中的概率是不同的,從而使估計量產生偏斜。例如:若某銀行想瞭解其客戶的情況進行一次抽樣調查,則該行所有客戶構成目的總體。選擇的抽樣框是銀行的來往帳目,這就構成了多對一模式。若在這個框中進行抽樣,則來往帳目多的客戶被抽中的可能性則較大,反之來往帳目少的客戶被抽中的可能性很小,而兩種客戶通常會有較大差異,從而造成樣本的偏斜,使估計量產生偏差。

  5、不正確的輔助信息

  不正確的輔助信息誤差也被稱為稱為“內容上的偏差”,這種誤差的主要影響是降低估計的精度。許多抽樣框中包含了輔助信息,可用於特殊的抽樣設計和估計技術。可用這些輔助信息來進行分層抽樣,對規模大小的測度用於與規模成比例的概率抽樣。如果輔助信息的特征與研究的調查變數的特征高度相關,還可以用於比率估計和回歸估計。但是這些輔助信息可能有錯誤,或者是一些抽樣單位不具備輔助信息,那麼就會對抽樣精度產生巨大的影響。

  6、抽樣框老化

  抽樣框老化又被稱為“抽樣框過時”或“不准確的抽樣框”,是指隨著時間的推移,抽樣總體與目標總體產生極大的偏差,即原來的抽樣框不符合實際情況,必須進行更新。最典型的例子,就是隨著城市建設的大規模展開,許多地區已被改造,地址發生了變化,如果仍按以前的抽樣框去抽樣,那麼精度就會難以控制。

  可以採取以下方法減少抽樣框誤差:

  1、在抽選樣本之前,要對抽樣框加以檢查,發現可能存在的問題,進行識別、處理,並採取一定措施加以補救。

  可以和普查或其他調查資料的總值或記錄等相比較、分析,進而查明是否存在遺漏。可以利用客觀現實的相互聯繫,找出平衡關係,推算是否有偏差。發現存在問題時,要及時進行補救。當一些目標總體單位對調查結論不會產生太大影響時,可重新把抽樣框定義為可以得到的目標總體單位,將抽樣框視為舊抽樣框所能提供的總體。當抽樣框不能涵蓋抽樣總體時,就可以採用輔助抽樣框,採用此法要避免目標單位的重疊。

  2、聯接遺漏單位法,就是指把抽樣樣本遺漏的個體和抽樣樣本中某個值相聯接,其聯接規則必須在調查前明確規定。其前提條件是在抽樣過程中能發現被遺漏的單位。

  此外,對抽樣框進行清查是最費力、最繁瑣也是效果最好的一種方法。在臨近調查前,重新獨立構建抽樣框的全部或部分。

抽樣框與抽樣單元

  抽樣框與抽樣單元是抽樣的一對基本範疇。其單元滿足“與實際總體的每個單元之間存在確定的對應關係,憑藉這種對應關係可以找到實際總體中特定的一個或一些單元”條件的實際總體的映射總體稱為抽樣框,構成映射總體的單元則稱為抽樣單元。

  換言之,包含所有抽樣單元的總體稱為抽樣框,構成抽樣框的單元稱為抽樣單元。

  事實上,為了方便抽樣的實施,必須擁有一個目錄性清單,這個目錄性清單中的每個目錄項與實際總體的每個單元之間存在確定的對應關係,即根據一個目錄項總可以找到實際總體中特定的一個或一些單元。抽樣框就是這種一個目錄性清單。

  抽樣框可能以各種形式出現:名單、手冊、地圖、數據包……。由於無論抽樣框採取何種形式,在抽樣之後,調查者必須能夠根據抽樣框找到具體的抽樣單元。因此,抽樣框必須是有序的,即抽樣單元必須編號,且根據某種順序進行了排列;抽樣框中包含的抽樣單元務必要“不重不漏”,否則將出現抽樣誤差。

  抽樣單元不僅指構成抽樣框的目錄項,同時還表示該目錄項所對應的實際總體特定的一個或一些單元。形象地說,不僅是影子,還是影子所反映的實體。儘管目前所見的抽樣文獻對此不置一詞,但讀者記住這一點仍大有裨益。為了區分抽樣單元的這兩種不同意義,實體抽樣單元又稱為樣本單元或樣本點。

  抽樣單元不一定是組成總體的最小單位——基本單元。抽樣單元可能包含一個或一些基本單元,最簡單的情況是只包含一個基本單元。在簡單隨機抽樣中,抽樣單元即為基本單元;而在整群抽樣中,群即為抽樣單元,而群可能包含相當多的基本單元,比如在手機調查中我們抽中一棟居民樓,居民樓是抽樣單元,而樓中的每個居民就是基本單元。

本條目對我有幫助54
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目

本条目由以下用户参与贡献

Zfj3000,鲈鱼,Dan,方小莉.

評論(共1條)

提示:評論內容為網友針對條目"抽樣框"展開的討論,與本站觀點立場無關。
218.75.196.* 在 2014年4月4日 10:52 發表

ere

回複評論

發表評論請文明上網,理性發言並遵守有關規定。

MBA智库
打开APP

以上内容根据网友推荐自动排序生成