大數據思維
出自 MBA智库百科(https://wiki.mbalib.com/)
大數據思維包括全樣思維、容錯思維和相關思維。
第一,大數據的全樣思維
“大數據”與“小數據”的根本區別在於大數據採用全樣思維方式,小數據強調抽樣。抽樣是數據採集、數據存儲、數據分析、數據呈現技術達不到實際要求,或成本遠超過預期的情況下的權宜之計。
隨著技術的發展,在過去不可能獲取全樣數據,不可能存儲和分析全樣數據的情況都將一去不復返。大數據年代是全樣的年代,抽樣的場景將有利於小,最終消失在歷史長河中。
第二,大數據的容錯思維
在小數據年代,我們習慣了抽樣。由於抽樣從理論上講結論就是不穩定的。一般來說,全樣的樣本數量比抽樣樣本數量的很多倍,因此抽樣的一丁點錯誤,就容易導致結論的“失之毫釐謬以千里”。為保證抽樣得出的結論相對靠譜,人們對抽樣的數據精益求精,容不得半點差錯。
大數據年代,因為我們採集了全樣數據,而不是一部分數據,數據中的異常、紕漏、疏忽、錯誤都是數據的實際情況,我們沒有必要進行任何清晰,其結果是最接近客觀事實的。
第三,大數據的相關思維
在大數據年代,我們不追求抽樣,而追求全樣。當全部數據都加入分析的時候,由於只要有一個反例,因果關係就不成立,因此在大數據時代,因果關係變得幾乎不可能。而另一種關係就進入大數據專家的眼裡:相關關係。
比如說很多男人去超市買了啤酒後會順便買紙尿褲,但不是買啤酒就一定買紙尿褲。因此,啤酒喝紙尿褲的關係不能算因果關係,而只能是一種相關關係。同樣,女孩子裙子的長短與經濟熱度、摩天大廈與經濟危機的關係都是一種相關關係,不是因果關係。