統計數據處理
出自 MBA智库百科(https://wiki.mbalib.com/)
統計數據處理(Statistical Data Processing)
目錄 |
統計數據處理是指使用電腦對常規的統計報表、專項統計調查表和其他統計資料等載體上的數據進行錄入(讀入)、審核編輯、彙總、製表、列印和計算等操作的過程。
(1) 對統計數據進行採集、整理,並按一定的數據格式放入電腦。
(2)在數據輸入過程中,對原始統計數據進行預審、編碼、邏輯檢查、修改、更新和簡單的算術運算等。
(3) 對統計數據進行分類、合併、邏輯校正等操作。
(4) 對數據進行分類彙總,以及製作各式綜合彙總表和過錄表。輸出各式列印表和種類數據文件。
統計資料是指反映大量社會經濟現象的數量特征和規律性的數字資料。統計工作是搜集、整理和分析統計資料併進行推論的工作。可見,統計工作基本任務就是對統計資料的處理。
- 1.一般過程
根據統計學理論,我們知道統計數據處理過程一般分為:統計資料搜集、統計資料整理和統計資料分析及預測等三個階段。其中,統計資料搜集的目的是獲取與研究目的相關的大量原始、基層數據;整理階段的處理對象是大量統計個體,是對個體的逐項處理;而分析研究階段的數據處理對象是統計總體,是在彙總基礎上對總體特征及規律的研究。
- 2.電腦統計數據處理過程
電腦數據處理過程是以電腦為中心的數據處理過程。它和手工、機械數據處理方式一樣,也包括三個階段,即:數據搜集→數據加工→數據輸出。
(1)數據處理的第一階段就是數據的搜集。搜集是指按一定的目的要求獲取原始統計資料的過程。數據處理質量在很大程度上取決於搜集到的原始數據的完整性和真實性。統計數據搜集的手段很多,它既可以手工方式進行,也可藉助互聯網和電腦以自動方式進行。統計數據搜集方式有:統計報表制度、各種普查、抽樣調查、典型調查、重點調查等。
數據搜集核心是:數據的識別、採集和組織,即有目標的選擇那些能反映事物運動過程屬性的數據,將其及時、完整搜集起來並按一定層次加以組織。只有這樣才能清晰地反映事物活動全過程。
(2)數據加工是數據處理的核心,一般包括數據編碼、錄入、審核、分組、彙總、計算、存貯、傳輸等內容。
在電腦中,廣義的數據是指能被電腦處理的各種對象。為了使電腦能識別不同的數據並加以迅速處理,應對數據進行編碼,也就是通過一定的數字、符號來表達所得到的客觀事實。
據資料經編碼分類後,由錄入人員將其輸入電腦。在數據組織中,很重要的工作是將數據輸入到電腦,並按照規範的要求組成各種形式的資料庫,再由資料庫管理系統對其進行管理。
數據審核是數據搜集的重要環節。所謂數據審核,就是對全部輸入數據,設想其可能出現的差錯,並設法對其進行檢驗。對查出的有錯誤的數據,考慮改正和補救的方法等。
統計彙總就是按照數據的特征(數字或字母)或按照數據的某種屬性,將原始數據分成若幹類型,並得出合計結果的處理過程。統計資料的彙總是統計資料整理的中心內容。
數據處理過程必然要涉及到大量數據的存儲問題。電腦為存貯數據提供了各種存貯設備,如硬碟、軟盤、光碟、磁帶、快閃記憶體等。
電腦進行數據傳輸可以分為機內傳輸和機外傳輸。機內傳輸主要是通過電腦的硬體和軟體進行傳輸,如從光碟傳到記憶體,從磁帶傳到記憶體再傳到磁碟等;此外,還有一種傳輸是脫離主機直接在外部設備之間交換數據,這稱為離線傳輸。機外傳輸主要是通過通訊線路(共用或專用線路)進行的,一般稱為聯機系統。在聯機系統中數據發生一般是隨機的,需要及時進行處理和輸出,這種方式也稱為鏈接傳輸。
(3)數據輸出是將加工後所得到的信息,通過各種方式輸出,以滿足統計業務工作或電腦管理工作的需要。輸出方式很多,如列印、顯示、圖樣、聲音等。
現代化管理要求對統計數據進行快速、適時、有效地處理,並且可以在部門、地區之間,甚至在國家之間進行快速數據通訊,從而能及時為國民經濟和領導部門的決策服務。這些要求,必須使用快捷、安全、準確的輸出系統才能得以實現。目前,統計數據處理一般都是指電腦統計數據處理。如下圖是一個統計報表彙總系統的數據處理過程:
其中:“錄入”是對大量採集的數據進行整理並按一定的格式輸入(或光電掃描、語音錄入、磁介質數據格式轉換等)到磁介質(硬碟、軟盤、磁帶、光碟等)中去;“審核”是對錄入(或傳輸入)的數據進行正確性判斷,保證得到正確的數據;“分組”是對錄入的數據按照統計的要求,對數據進行分類、合併等操作;“製表”是對分組彙總後的數據按照統計表的格式加上標題、題註、表側、表頂、表體、腳註等內容。由圖可見,以上各環節都是在相應的電腦程式下完成的。
- 3.電腦統計數據處理的特點
一般而言,統計數據整理屬於“海量數據處理”範疇,其特點是:“量大、高效、質高、數據利用率高”。
“量大”,統計需處理的數據一般都是海量數據,同時,其數據處理需動用的人力、物力也很大,數據處理的程式也較複雜;
“高效”,統計數據處理一般都有嚴格的時間限制,必須在規定的時間內完成任務。同時,由於處理的數據量大,還必須考慮到高效的數據錄入,高速的數據計算,電腦內、外部存儲設備等的有效利用情況等;
“質高”,統計數據處理必須做到科學、準確、及時,特別是反映社會經濟現象的重要統計數據;
“數據利用率高”,統計數據的處理還必須考慮數據的共用和進一步深加工的需要,使處理後的數據能夠適應不同層次、不同用戶的需要,以利於信息資源的有效利用。
電腦統計數據處理,為“獲取信息資源的最大化”提供了可能。如下圖是手工、電腦數據處理對信息增減的對比示意圖。
利用電腦,可以高效、廣泛搜集到各種統計數據,並對大量採集到的數據進行整理,按一定的格式存儲起來以利於數據共用;可以在數據加工階段發揮電腦數據處理的優勢,對原始統計資料進行各種分組、集成和計算,儘可能多的挖掘出各種有用信息;可以在數據提供階段根據用戶的不同需要而輸出各種結果,滿足個性化的需求。與傳統手工統計數據處理方式相比較,電腦統計數據處理方式在獲取統計信息資源最大化方面有著明顯的優勢。
- 4.電腦統計數據處理的方式
電腦統計數據處理方式通常有集中批處理和聯機實時處理系統。
(1)集中批處理是統計部門廣泛使用的一種處理方式。集中批處理是把一批統計數據處理任務,包括統計數據及任務要求一起交給計算中心,統計數據處理專業人員按系統具備的數據處理能力,對這批數據處理任務的性質和特點做出合理的安排,使電腦系統用最短的時間保質、保量地完成這批任務。在集中批處理進行的過程中,不需要其他用戶干預。由於批處理是把作業彙集在一起進行處理,因此,處理效率比較高。
採用集中批處理方式,數據源就在機房或可將數據源彙集後在機房處理,且處理結果不必要實時返回,這種集中批處理方式也是通常所指的機房處理方式。
(2)實時處理是在數據產生的同時,立即進行處理,併在規定的時間內返回處理的結果。實時處理已廣泛應用在網上直報、網路調查等統計工作中,也廣泛應用於飛機票、車船票預約系統和銀行業務、交通控制、過程式控制制、生產管理,倉庫管理等領域。
採用實時處理,數據源一般是分散的,而且處理結果實時響應。這時系統必然是多終端的聯機系統,終端分佈在各數據源,通過通信線路連接終端和主機,這就是通常所指的聯機處理方式。一般的實時事物處理系統和經營管理系統都採用這一方式。應該指出,在聯機終端上也可以提交批處理作業,而且聯機系統的基礎是電腦及通信網路。
嗯,可否具體點呢?