數據思維
出自 MBA智库百科(https://wiki.mbalib.com/)
目錄 |
數據思維是用數據來探索、思考事物的一種思維模式,用數據來發現問題、洞察規律、探索真理。企業的數字化轉型過程需要的數據思維,就是用數據思考,用數據說話、用數據管理、用數據決策。[1]
數據思維簡單來說就是面對一些業務問題的時候, 我們能不能通過數據的方法去做分析從而給出建議來解決業務問題他的核心有兩個,第一個是數據敏感度, 第二個是數據方法經驗。數據敏感度,就是在意思里看到一個業務的問題是否可以轉化為數據問題, 看到一個數字, 是否可以看到數據背後的問題數據方法經驗,就是利用數據建模的方法和數據分析的方法解決實際的問題,這些也構成了數據思維的一部分。數據分析的方法有很多,常見的有:漏斗分析,相關性分析,5w2h, 對比分析,分群分析等等。[2]
數據思維的特點[1]
數據思維具有可簡化、可量化、可創新、追求真理等特點。
1、數據思維是一種簡化思維
我們當下生活在一個信息浩大龐雜的時代,我們的身邊充斥著各種正面的、負面的、片面的、全面的、真實的、虛假的,各種各樣、真真假假的信息,一不小心就會被紛繁複雜的因素所干擾。在紛繁的信息中我們思考問題要善於簡化,抓住重點,聚焦核心問題,以終為始、抽絲剝繭、多維度收集信息、多角度思考問題,找到高效的解決方案。
2、數據思維是一種量化思維
數據化的核心是量化,所有的業務都可以用數據來量化描述。在我們的工作中,用數據來量化業務是十分常見的,不論是企業高層領導作出的年度經營報告,還是企業日常的生產計劃、採購計劃、銷售完成情況等都需要用數據來量化描述。確少數據描述的工作報告,無論詞藻再華麗,語言再優美,結構再嚴謹,其內容都是蒼白無力的。數據量化一切,當文字變成數據、當溝通變成數據、當考核變成數據,皆可被量化的一切事物,正在將數據化變成社會發展的主旋律。
3、數據思維是一種創新思維
數據是一種“可再生資源”,我們能直觀看到、感受到的價值只是數據價值的“冰山一角”。數據具有可重覆使用,組合使用,跨平臺使用的特點,企業可以通過多維度的數據採集、融合、重組、擴展和再利用,突破部門邊界、業務邊界、系統邊界、技術邊界的束縛,創新新模式,開拓新領域,確立新決策,不斷發掘數據背後所隱藏的“價值”。
4、數據思維是一種追求真理的思維
雖然我們說“數據不僅能夠記錄歷史,還能預測未來!”。但是,我更要給你強調的是“數據不是萬能的”。要知道,世間萬物的關係是非常複雜的,我們雖然可以用數據來對其簡化,但簡化必然會導致誤差;我們也可以用數據來對其進行量化,但卻無法窮盡。更要知道,數據都是歷史的,而萬物是動態變化的,現有的知識都是也有真偽的。因此,我們需要深入探究數據的真實性、客觀性,不斷探尋隱藏在數據背後的真相,追求真理永無止境。
數據思維的六角度模型[3]
數據思維是應用數據科學的原理、方法、技術來解讀事物和解決現實場景中問題的底層思維邏輯。數據思維是數據分析背後的底層認知和基本邏輯,是產生數據分析方法的方法論,各種數據分析方法本質上都是數據思維的輸出結果和表現形式。
那麼,問題來了,完整的數據思維是怎麼形成的呢?筆者給出了一個數據思維六角度模型,從描述、定位、需求、應用、技術和價值角度對數據思維進行了闡釋,這六個角度基本上能概括用數據來分析和解決問題的過程和機理。
1、描述角度:描述是數據最基本的功能。當然,用數據來描述事物或者業務問題時,首先要確定的是描述的對象,然後拆解出合適的描述維度,再將維度分解為更細粒度的指標。分解指標時需要註意定義、口徑和計算方法,還要明確指標的數據來源、數據格式和更新頻次等。最後形成一定的描述框架,用數據的語言進行表達。描述角度要完成的是用數據刻畫研究對象,這是數據思維的起點。
2、定位角度:這個角度考察的是研究對象在數據價值鏈條上的位置。數據價值鏈的參與主體的角色分為硬體支撐廠商、數據源、技術支撐廠商、交易市場和數據消費者等,有時候我們的研究對象可能同時具備多種身份。例如:研究某些自媒體創作者時,他們既是數據的生產者或者稱之為數據源,也是數據的消費者,因為他們在創作內容對外輸出的同時,也在與粉絲們互動、在吸收和加工外界輸入的數據。當然,面對具體問題時,我們對研究對象的角色定位會有一個傾向性的側重。還是以自媒體創作者為例,當我們研究其影響力時,我們更側重於將其定位為內容的生產者,用數據的語言來描述就是數據源。定位角度是從數據視角對研究對象在功能和地位上的界定,是我們啟動思考的前置條件。
3、需求角度:要不要用到數據來分析和解決問題還要根據當事人對我們提出的需求來決定。當我們面對的任務僅僅是描述研究對象時,就不用再“自作多情”的搞一堆數據分析模型了;在當事人面臨一些問題或困境的局面下,需要我們幫助解決問題時,這時候就可以啟動需求分析了。我們要思考的問題包括:當事人面臨的問題是什麼,問題有多嚴重,問題是否具有普遍性,能否用數據的語言來描述需求和界定問題,是否具備從數據角度出發解決問題的基礎。從需求角度界定場景與問題是我們引入數據視角前應完成的思考內容,是對思考範圍和目標的鎖定。
4、應用角度:在明確問題和需求之後就要構建數據分析與應用的思路了。我們要思考包括:當事人提出的問題用數據視角可以“翻譯”為哪種類型的數學問題,這類問題的解決思路有哪幾種,當前情況下用數據分析和解決此類問題是否具有可行性,實際操作過程中可能面臨哪些數據問題。應用角度要求我們先要理解需求和問題,然後再建立起基於數據視角的分析和解決問題的思維框架。
5、技術角度:技術無疑是為應用服務的,在應用數據的思維框架下,我們心目中應建立起技術落地方案的流程圖。也就是說對於技術落地要做到“心中有數”:現有數據能支持做哪些事情,用數據分析和解決問題要分哪幾個步驟,每個步驟需要用到什麼樣的工具,需要用到什麼演算法和分析模型,需不需要搭建數據平臺,如何保證數據的安全等等。技術角度要求我們要有預見性,能提前在心中梳理出技術落地的路徑與方案,這是數據思維與實際問題深度融合的關鍵環節。
6、價值角度:在從思考進入實操之前,我們要做的最後一件事情就是要分析數據角度分析和解決問題的價值。我們要考量的是:從數據角度分析和解決問題是不是當前的最優解,這樣做有什麼樣的價值,這樣做的價值如何量化和評估,這種模式下能否將數據價值長期化、產品化。因此,價值角度是數據思維的終點,是我們完成數據思維閉環的最後一環。
綜上所述,從描述角度入手用數據刻畫研究對象,再從定位角度看清其在數據價值鏈上的位置,然後洞察需求、界定問題,將業務問題轉化為數學問題,思考解決問題的方法和技術實現方案,最後用數據來評估這套模式的價值、完成思考的閉環,六個角度環環相扣,用數據來貫穿,這就是我所理解的數據思維的形成路徑。
數據思維的關鍵點[4]
01 數據不是越多越好,模型不一定越複雜越好
一提到“數據思維”,我們常常會聽到這樣的說法,一定要積累海量的數據、一定要用上複雜的演算法和模型、一定要實現對業務的顛覆式創新。事實是這樣嗎?晉梅認為,數據思維的本質,不是追求數據的積累或是演算法的複雜度,而是要清楚地知道,如何用好數據、更好地解決實際問題。
“比如說,有的企業的基礎設施不夠完善,業務線上化程度和數據積累也很有限。但他們在業務邏輯上想得很透、對業務流程的拆解很到位、對提升和增長所需要重點關註的環節抓得很準。在重要環節上,他們敢於提出問題和關鍵假設,然後有的放矢地去積累數據。他們及時復盤,基於分析結果一邊優化、一邊提出新的問題和假設——在這個過程中,即便他們只使用了幾張不超過 10M 的 Excel 表格、只運用了小學生都能熟練掌握的四則運算,我們也不會認為這樣的企業沒有‘數據思維’、算不上‘數據驅動’。”晉梅強調,“能夠踏實做到這一步的企業,就算是已經吃透‘數據思維’的內核了。”
她舉了個例子:拿所有銀行都在做的公眾號來說,即便是在沒有後臺許可權的情況下,運營分析師也能根據有限的公開數據——比如推文標題、位置和時間、內容和形式等信息,判斷出某個分行或者業務部門在特定時間段內對公眾號渠道的定位是什麼、重點關註哪些客群、營銷什麼產品和服務、主推什麼賣點和權益、覆蓋廣度和投入力度如何等等。如果進一步結合每個推文的閱讀量、轉發量、點贊量、評論關鍵詞等數據,還可以做定性和定量的主題分析,圍繞分行或業務部門經營目標有針對性地給出內容運營的優化思路和測試路徑,甚至還能在用戶運營和權益規劃方面給到非常有價值的建議。
換言之,數據是否具備業務價值,不完全取決於規模或體量,而是看是否能解決需求或問題。即便數據資源有限,在特定場景下也可能創造價值。反之,數據體量大固然蘊藏著更大的潛力、更多的可能性,但如果沒想清楚要解決什麼問題、為什麼利用數據就能提供更有效的解決思路、如何使用數據才能達到預期效果這些問題,就會既增加數據成本、更增加決策難度。
那麼,越來越流行的 AI 分析工具以及複雜的模型或演算法又是不是必選項呢?晉梅的答案依然是否定的。“和到底是要用鏟子還是挖掘機、要用水果刀還是手術刀這類問題一樣,我們要分析數據、挖掘洞察,應該選擇什麼方法、使用什麼工具,依然需要具體情況具體分析,合理、有效、划算的才是好的。”
比如,當下非常火的短視頻或直播,對於擁有海量用戶和內容的平臺來說,需要相對複雜和專業的演算法來識別用戶的偏好、內容類目,通過給用戶和內容分別打上標簽,進行及時和準確的推薦,以此增加用戶的粘性、催生更多有需求的內容。
但是,在這個生態中,能利用數據去成就和放大業務價值的,除了專業的演算法團隊,還有運營團隊。在直播的過程中,運營全程緊盯人氣數據、帶貨數據,分析觀眾畫像、流量來源、觀眾互動和商品轉化,捕捉有可能影響交易量的潛在因素,通過持續測試和優化投放策略、調整直播間的“人 - 貨 - 場”來創造價值。
“在這個過程中,他們常用的分析方法在絕大多數情況下並不涉及複雜演算法和數學模型,很多運營指標也只是基本的加減乘除,但這完全不妨礙優秀的運營人員利用數據去解決轉化的問題。”晉梅表示,“我合作過不少頂級的運營,他們不會寫 SQL、沒聽過邏輯回歸、也弄不懂 GBDT,但他們把堅持數據驅動作為信仰,是真正具備數據思維並從中獲益的人。”
所以,在她看來,是否需要 AI 分析工具、使用什麼複雜度的模型,先要明確業務的目標,基於這個目標去做細化拆解、梳理環節,提出關鍵問題和假設,再結合數據的實際情況,綜合評估不同方案的可行性、投產比、優勢短板後再做選擇。
02 數據是錦上添花,而不是救命稻草
尤其是在數字化愈演愈烈的當下,市場上不乏打著“數字化轉型”的旗號販賣焦慮者,也不缺把“數字化”當作救命稻草,或者拿著錘子到處找釘子的企業。越是這樣,企業越是要從做業務的初心和商業的底層邏輯出發,對自身的核心競爭力有清晰的定位,對市場需求和趨勢發展有客觀的判斷,對數據科學的優勢和局限性有必要的認知。否則,很容易陷入先把“數據思維”當作萬金油,一頓操作猛如虎卻沒有感受到業務突飛猛進的尷尬境地。到了最後,只能“甩鍋”給數據。
以這些年業界對 Capital One 的解讀風向變化為例:晉梅表示,因為短短幾十年 Capital One 就躋身全美頭部銀行,很多人給它貼上了“大數據風控先驅”的標簽,而後冒出來很多主打“大數據風控”的公司,號稱他們的風控模型里用了成千上萬個特征,智能到恨不得每分每秒都在自我迭代,甚至可以連模型帶繫數從 A 銀行直接遷移到B銀行去幫後者快速冷啟動。但隨著後期 Capital One 遇上股價波動、業務調整,業界同樣著急下結論——表示“Capital One 走下神壇”。
那麼,事實果真如此嗎?晉梅解釋道,“成就 Capital One 的肯定不是所謂的‘大數據風控’,Capital One 也沒有什麼秘密武器,只是一直遵循著‘提出問題、分析問題、解決問題’的結構性思維方式,讓數據恰如其分地發揮價值罷了。”
據她介紹,在日常的業務推進過程中,Capital One 的演算法模型團隊會頻繁和業務反覆溝通金融產品要素、目標客群、推廣渠道、營銷策略、市場環境和巨集觀趨勢。雙方不僅對業務的歷史、現狀、未來規劃都有充分共識,還會對建模樣本的選擇策略、模型的框架、建模的方法、模型適用性、模型的驗證、上線後的監控、可能會出現哪些問題、出現這些問題後的應對預案等信息去做充分的討論——包括對入模的原始數據、衍生特征的業務價值和投入成本客觀評估,以及對關鍵變數的繫數從符號到數值是否合理、映射到業務上代表著什麼等問題逐一明確。
“脫離了具體業務和場景的模型不但很難放大數據的價值、甚至可能帶來毀滅性的災難。”晉梅強調,“在 Capital One 工作這麼多年給我的啟示就是,永遠不要在沒梳理清楚‘產品 - 營銷 - 運營’閉環的業務邏輯和關鍵問題之前,盲目扎入漫無邊際的數據海洋;不預設問題、說不明白要驗證什麼的建模和分析,都是低效甚至無效的。“
所以,商業的本質,歸根結底還是供給和需求的匹配,是用對的產品或服務、在對的時間和空間、以對的方式滿足用戶的需求。對於大多數企業來說,直接創造價值的不是數據本身,而是讓數據助力實現供給和需求之間的極致匹配。
換句話說,企業自身如果沒有好的商業模式、好的產品和服務、好的客戶體驗,那麼即便是再先進的技術、再優秀的演算法模型、再多的數據也無法幫助它扭轉乾坤——比如風靡一時的共用單車,背後也有海量數據在驅動資源配置,但是商業模式變現慢、服務管理不完善等問題同樣導致了它最終的失敗。過度高估數據價值,指望數據創造奇跡,讓本就不符合邏輯的商業模式翻身,那多半會失望而歸。
03 要運用數據,先忘掉“數據”
“所以,我覺得‘數據思維’,歸根結底是因為有了數據加持,從而更有底氣和把握做出正確決策,繼而更高效地解決問題的思維。我們不能拘泥於字面上的、狹義的‘數據’這個詞本身。”晉梅強調,“甚至可以試著先忘掉‘數據’,捋一捋業務模式、搞清楚要解決的核心問題到底是什麼;在此基礎之上,再引入數據、考慮數據能幫到什麼,進而刷新對業務模式和核心問題的理解。”
具體來說:第一,理解業務、提出問題;第二,拆解成多個子問題;第三,逐個分析和評估;第四,總結和決策。晉梅表示,這種結構化思維指導下的、解決問題的框架在如今的數字化背景下非常適用。
“首先,企業要明確目前業務上面臨的核心問題是什麼,大家充分探討和論證、要達成共識;然後,是對問題進行拆解,可以根據業務流程、關鍵要素或者部門職能等維度細分成多個子命題。圍繞每個子命題要敢於提出關鍵假設、圈定測試範圍、排好優先順序;第三步用包含數據分析在內的手段,對第二步拆解出來的問題和假設進一步量化、驗證和評估。最後一步,基於前面的分析結果,總結和決策。在落地執行、業務迭代的過程中一定還會碰到新的挑戰、出現新的問題,這時候再從第一步開始、螺旋式推進。”
以銀行的權益運營為例:
第一步,明確要解決的問題是,通過豐富的權益持續滿足客戶的需求,提升客戶體驗、加強客戶的粘性,繼而提升客戶的經營價值;
第二步,要做到在對的時間、把對的權益、以對的兌換積分金額和對的兌換方式去滿足客戶的需求。可以按照“人 - 貨 - 場”的運營模型進行細分拆解,圍繞著每一個維度,做好基礎標簽體系的建設,梳理交互環節,根據可提升空間和價值明確優先順序;
第三步,對關鍵環節開展數據採集、積累、分析和建模並提煉洞察。比如,通過兌換數據,可以把同一個 AUM 層級的客戶按照兌換品類的偏好進一步細分群,也可以評估兌換流程的轉化效率、從而定位優化兌換體驗的環節,還可以根據權益單品的兌換熱度調整選品策略和組合策略;
最後,通過對這些信息的綜合分析,業務團隊和運營人員就可以更有據可依地開展分群運營、渠道優化、商品管理和供應商管理等工作。
晉梅告訴 InfoQ 記者,很多企業尤其是技術人員在推動數字化的過程中,經常把自己局限在第三步,沒有考慮具體問題和具體場景的全貌,只是接受一個籠統的需求、確認下欄位的口徑就開始做分析和模型,最後往往不能提供業務用得上、切實輔助決策的輸出。
比如,建模同學 M 接到需求說要給 A 產品做信用評分卡,他兢兢業業找出來 A 產品的歷史數據、認認真真建模和回測,感覺都沒問題了就交付給策略同學 P 使用。沒過多久,策略同學 P 就抱怨 M 的評分卡不好使,時靈時不靈。
後來才發現,業務團隊為了完成增長 KPI,自行調整了 A 產品的受眾群體,把過去只聚焦在優質客群的 A 產品推向基數更大但信用資質略差的客群。為此,他們新增了 A 產品的進件合作渠道,在展示坑位、流量費用等方面也都做了調整。但是,在推進這些嘗試的過程中,他們只使用了過去優質客群的歷史表現數據,自然,M 同學原來建立的評分卡的有效性就非常有限。
所以,晉梅認為,解決問題的經典框架中的每一步如果沒有放在整體邏輯中去考慮,很難有價值可言。上面這個例子的漏洞就出在沒有對問題進行合理的拆分和定位。除此之外,還有的企業會在第一步明確問題的過程中,就開始出現目標上的偏差。
“比如,有些銀行在做 APP 的時候要拼日活數據,為了達標玩命地在 App 里添加功能,儼然一副要和位元組拼內容、和騰訊拼社交、和 PDD 拼電商的架勢。且不說銀行 App 在這類比拼中到底有什麼優勢,就說日活數據的提升如何與銀行經營指標掛鉤?或者流量真的來了,銀行要用什麼產品和服務去承接去變現?而這些接得住流量需求的產品和服務目前是什麼狀況、有沒有需要優化的地方、優化的節奏又是什麼?完整的商業模式、業務鏈路和實現節奏企業自己是要先想清楚的。否則就是盲目投入,很可能錢花了不少卻總說不清產出在什麼地方。”
也就是說,這背後要求企業對自身業務的走勢有清晰認知和合理的規劃,能夠識別和解決到業務的“真問題”而不是“偽需求”。
04 每個人都該有“業務體感”和“數據思維”
那麼,在一個企業當中,究竟誰應該具備這種結構性思維和解決問題的能力?在傳統認知中,我們通常認為創造業務價值並且在這個過程中負責解決具體問題的,是沖在前線的業務部門。而技術部門扮演的是執行者的角色,只要在幕後負責接收業務需求,然後針對性地做開發、找技術、做模型。
但是,時過境遷,如今數字化轉型的背後需要源源不斷的技術內燃力,技術已經成為其中的關鍵角色,這意味著過去這一套協作模式無法奏效。
所以,晉梅的答案是——無論是一線的業務人員還是中後臺的技術人員,所有人都應該具備上面所說的解決問題的思維和能力——更確切來說,每個人都要有“業務體感”和“數據思維”。
她講了某區域銀行的例子:“在診斷這家銀行營銷系統時發現,他們很多營銷活動的響應率居然都能達到 90% 以上。即便是非常牛的互聯網爆款產品,也很難達到這麼高的響應。所以,當我們把這些數據拉出來看的時候,就發現了問題。這些高響應率活動的營銷方式都是簡訊,而這個所謂的響應率其實是送達用戶手機的比例,除了被攔截的簡訊,超過 90% 多都能送達。事實上,簡訊送達後用戶並不一定會點擊參與這些營銷活動,而這一步的點擊率是比簡訊觸達率更具業務價值的指標。更讓我震驚的是,這個數值高達 90%、以‘響應率’自居的指標,在這家銀行的營銷系統里已經靜靜躺了幾年了。”
在晉梅看來,這就是缺少“業務體感”,進而對數據的業務意義和價值、對數據所反映出來的業務漏洞也不敏感的一種表現。很多企業拼命花錢做項目、上技術,最後要麼沒效果、要麼說不清楚效果,就宣告項目失敗,其實背後可能不是技術水土不服,而是圍繞業務閉環本身該做的思考和論證太過敷衍和草率。
但是,現實情況是,這種兼具“業務體感”和“數據思維“的人才非常稀缺,他的基本能力要求是既要懂業務又要懂技術,複合能力疊加,培養難度也加倍。晉梅指出,企業要解決的當務之急,需要業務人員與技術人員的“雙向奔赴”。
“一方面,技術一定要去理解業務,明確業務目標、流程和痛點,你要清楚自己通過哪些技術、演算法能產生什麼樣的影響,帶來什麼樣的價值;另一方面,業務對技術的理解,不要只在大數據、人工智慧這些熱詞錶面,比如,當你的業務對技術、對數據的依賴越來越重,起碼要知道關鍵技術的基礎原理、構建邏輯、優勢、短板和局限性等。”晉梅指出。
05 業務技術雙向奔赴——“說人話”比“造新詞”更重要
很多人認為,技術與業務人員之間的隔閡是天然存在的,由於工作內容的差異,雙方關心的問題並不相同,無法在同一套話語體系下溝通是非常普遍的現象。晉梅表示,這個問題不是沒有解,但也沒有捷徑。
“業務、技術、數據等核心部門首先都不要迴避這個問題,其次要一起迎接這個挑戰。技術不要認為業務背景的人肯定聽不懂技術和數據,高段位技術的一個重要能力,就是讓業務人員聽懂技術的價值;同樣,業務也不要認為技術人員弄不明白商業模式,高段位業務一定要具備的重要能力,就是簡單、直接地講清楚業務本質。”
據晉梅介紹,Capital One 把這樣的文化觀念通過制度和流程的方式做了固化和沉澱。
比如,在人才招聘過程中,無論是業務、數據還是技術崗,面試時都會安排一輪案例分析。主導這一輪的面試官都是 VP 級別的高管、擁有一票否決權。而在整整一小時、和高管 1V1 的面試中,候選人會被提供一個具體的業務問題,圍繞著這個問題會被給到業務背景、數據報表等信息,但這些信息不是一次性、一股腦給到候選人的(這也符合我們在實際工作中碰到的情況),而是由候選人和 VP 展開多輪互動,詢問、確認、提出假設、分析解讀、給出建議,然後再被提供更多信息後,進一步分析和優化建議。
也就是說,在整個面試過程中,候選人身上沒有“業務崗”、“數據崗”、“技術崗”的標簽,而是一個先快速吸收背景知識,然後提出問題、分析問題和解決問題的角色。
再比如,在部門協作過程中,Capital One 模型團隊在每一次對模型進行調整時,都會和業務充分溝通調整的原因和方式,調整前後的對比,新模型的優勢、短板和局限性;反之,業務團隊每一次做業務策略調整時也會把調整背景、調整方向、預判影響等信息同步給模型團隊。並且,在整個流程中,雙方不是對立的狀態,也不是各自扛各自的指標,而是一起扛業務最終的收益。
此外,Capital One 在培訓體系中還有一個比較有意思的做法,是在內部培訓中設立了一門叫做“COF Lessons Learned”的課程。這是一門不斷積累案例的培訓,積累的都是公司付出過代價、在踐行數據驅動業務的道路上實實在在踩過的“坑”。而培訓的老師,首選是那些曾親身參與和經歷過這些“坑”的同事、尤其是負責人。案例的內容很豐富,包括對這些項目的業務背景、入坑復盤,梳理當初的思路是什麼、為什麼會出現問題、是哪個點沒有考慮清楚、或者溝通上不夠順暢,最後導致了什麼樣的業務結果等等。
並且,為了讓每一位員工清醒認識數據中既有真相、也有盲區,模型會揭示規律、也會製造錯覺,Capital One 還有另一門叫做“Statistical Pitfalls”的內訓課,專門講述各類統計模型和數據分析在支撐業務決策的應用過程中,可能存在的局限性和常見的誤區。
“任何技術、任何工具,只有對它的優勢、短板、適用性、局限性等有客觀的認識,才能把好鋼用在刀刃上、真正發揮它的價值。而在這個過程中,前臺不應該自詡為商業奇才、中後臺也不應該以‘技術大神’自居,探討問題要以表達清楚、闡述明白為目標,不刻意、不做作。”晉梅強調。
建議一[1]
1、培養對數據的敏感度
數據敏感度是對數據感知、計算、理解能力,是通過數據的表象理解事物本質的程度。對數據敏感的人,看到數據能夠找出問題,找到規律,發現機會或做出決斷;對數據不敏感的人,看到數據只會問這是什麼,這反映了什麼,這能說明什麼?對數據毫無敏感而言的人,“數據就是數據”,甚至不會想到以上問題。
人並非天生就會對數據產生敏感度,人們對數據的敏感度來源於經驗的積累,看的數據越多,種類越豐富,處理的問題越多、敏感性就越強。因此,數據敏感度是可以培養的。
所謂培養數據敏感度,本質上就是培養通過數據發現問題、解決問題的能力,可以從以下幾個方面入手:
質量評估,對數據的表象和質量進行評估,判斷數據是否完整、是否準確、是否符合業務規範?
識別真偽,能夠對數據的真假做出判斷,看出數據中存在的貓膩,例如:年度報告,本事業部今年老員工的離職率為0,實際上新入職的員工有大批離職的。
找到因果,能夠通過數據找到事物之間因果關係,從而找到產生問題的主要原因和根本原因。例如:產品銷量下降了,直接原因是客戶量減少了,本質原因是市場出現了更具競爭力的產品。
找出關聯,能夠通過數據多維採集和分析找到事物之間關聯關係,關聯分析是洞察事務本質的重要方式,關鍵點在於數據維度全、數據樣本完整且具有足夠的代表性。
判別優劣,能夠通過數據的對比判斷事物的好壞優劣,例如:季度銷售完成率為50%的報告,如果沒有歷史數據作為對比很難判斷出這個季度銷售業績的好壞。
洞察規律,能夠從數據中找到事物發展的規律,例如:古人為了農業生產需要,順應自然規律,通過對春夏秋冬、冷熱交替的不同時間的記錄和研究,總結出來了二十四節氣。
預測預估,能夠從已知的數據中提取到的規則,從而對未知的業務影響作出預測。
2、培養理解和使用數據的能力
“數據為王,業務是核心”,與其說培養理解數據的能力,不如說是理解業務的能力。只有將數據置於業務場景中,數據才能變得有意義。企業數據化轉型過程中,要求數據管理和數據分析人員懂業務,理解數據的對業務價值;要求業務人員要懂數據、會使用數據。
對於數據管理或數據分析人員,要能夠看得懂數據並理解數據背後的業務含義。
作為數據管理或數據分析人員,首先需要你摸清楚企業的核心業務價值鏈,甚至企業多處行業的整個產業鏈業務情況。其次,你需要逐步瞭解企業都涉及哪些業務域,每個業務域中包含哪些業務流程,每個業務流程之間的斜街關係,以及每個業務的輸入輸出等。最後,在理清楚業務域以及業務流程的輸入輸出後,需要對詳細列出每個業務的績效考核指標(KPI),再通過對每個指標進行更細緻的拆分,最終落地的內容數據數據分析所需的報表、指標、維度、明細等。
對於業務人員,要懂數據,會使用數據指導業務開展。
數據源於業務,並服務於業務。作為業務人員,首先你要知道數據對業務的重要性,清楚數據的標準,按標準規範輸入數據,並確保數據結果的正確輸出。其次,你要能夠識別業務數據的真偽,判斷數據質量的優劣,並能夠為數據質量的改善提供必要的改進建議。最後,你還需要加強對數據管理和數據分析工具的掌握,利用數據管理工具將數據合理、正確、規範的管理起來;利用數據分析工具自助進行分析建模、場景設計、數據探索、價值挖掘。
3、培養問題拆解的能力
數據思維的核心在於用數據發現並解決問題,學會用結構化、量化的思維方式去分析問題、拆解問題、解決問題,能夠讓我們事半功倍。
假如你是一家零售企業的數據分析師,日常主要工作是銷售數據的採集、整合、處理和分析。有天,公司領導突然讓你寫一個PPT,談一談如何用數據做業務預判、如何用數據賦能業務,提升產品銷量,實現業務增值?
這是一個典型的開放式問題,第一,缺乏明確目標和範圍,例如:哪些業務需要研判,業務遇到的問題是什麼;第二,缺乏明確的判斷依據和標準,例如:產品銷量要提高多少?很多數據項目往往都死於此,這時候就需要有問題拆解的思維。數據賦能業務的過程一定是一個循序漸進的,逐步建立共識的過程。
例如基於以上問題:
首先,要搞清楚業務的目標是否明確,如果目標不明確,則先明確目標。例如:通過收集和分析現有的數據報表情況對銷售業務現狀進行研判,找出改進點。
第二,在明確業務目標之後,要搞清楚是否有業務判斷的標準,判斷標準一定要建立起來,不然提升多少才算好都不知道,事後難免陷入扯皮和糾結。例如:XX產品同比增長20%
第三,定了判斷標準之後,要分析用什麼樣的策略支撐實現這個目標。例如:優化推薦演算法、增加線下營銷活動等。
第四,在明確了實施策略之後,要制定策略執行計劃。例如:演算法的升級需要誰來負責、什麼時間完成?
第五,在明確行動計劃之後,還需要通過數據來監控執行情況,並實時反饋執行的效果。
4、培養用數據說話的習慣
數字化時代,每個人都應該具有量化思維,習慣用數據說話。用數據說話不是單純的使用“數字”,而是用數據來支持觀點,做到有理有據。
第一,在一定程度上,數據就是證據和事實,用數據說話,能夠增強你的說服力
任何觀點都會有破綻,但數據擺在那裡卻難以讓人反駁。如果你是企業銷售主管,給領導彙報銷售情況,不要說你的市場競爭多激烈,你的銷售人員多努力,你的目標多高遠,直接說你增加了多少客戶,提升了多少客單量、實現了多少銷售業績、增加多少項目漏斗,這樣的彙報效果會更好一些。
第二,數據可以揭露問題,發現本質,用數據說話,可以輔助你做出正確的決策
數字化下,企業管理不僅需要管理者豐富的管理經驗,還需要有多維的數據支撐。如果你是一個企業領導,你更願意做薄利多銷,還是堅持確保每一單都要保證一定的利潤?貌似選擇哪個方案都可以,關鍵是要看具體的場景和數據支撐。正常情況下,假如是批產的產品,可以考慮薄利多銷,以量取勝;假如是定製產品,就需要考慮一定的利潤空間。如果只是從利潤角度考慮,有產品定價數據、銷量數據就能容易做出決策,但如果還需要考慮產品的市場定位,客戶的回頭率,企業的售後服務能力等因素,就不能只考慮價格和銷量兩個維度信息,應該建立多維度分析模型,以幫助你做出更合理的決策。
第三,用數據說話要有量化思維,簡化思維,還要儘量避免使用太過專業的術語
量化,有利於對事物(業務)給出一個判斷標準,例如:提高產品銷量,提升用戶活躍度,到底銷售多少算是提高?怎樣的用戶才算活躍用戶?只有將指標進行量化,才能推動達成共識。
簡化,有利於抓住主要矛盾,直擊事物(問題)的本質,擺脫各種複雜情況,輕鬆應對難題。例如:某企業要其對10W+條物資編碼進行治理,通過對歷史數據分析,發現這些物資編碼中,有40%3年之內只用過一次,還有10%在業務中從來沒有使用過。基於這個分析結果,發現企業真正要花力氣治理的數據只有5W多條,而不是10W條。簡化的思維就是對複雜問題進行拆解、降維、極限歸納,篩選並只使用相關數據,從而找到簡單且可行的解決方案。
用數據說話本質上還是溝通,為提升溝通的效率,要儘可能使用“標準語言”,或者對方能夠聽得懂的語言。從這點上講,數據治理就顯得十分重要,統一企業的數據標準,明確業務術語、指標、維度的業務含義、規則等,能夠提升業務部門之間、業務與IT之間的溝通效率。
建議二[5]
首先,要時常關註數據,對數據敏感。這一點其實我們每天都在做,只不過很多人關註的大部分數據都可能是娛樂性質的罷了,還有一些可能由新聞報道得到。例如:很多人都通過微博或者今日頭條等新聞資訊客戶端獲取數據。
比如:小米和美團點評誰又上市了,誰的股票漲了,誰的市值高;哪些明星又發生了什麼事,誰偷稅漏稅了,被罰了多少錢,誰又參演電影了,哪部電影的票房高等。這些其實都是數據,只不過你關註的點大多數是娛樂性質偏多一些的。
而數據產品經理更應該關註大數據行業的一些數據,當然你有時間的話也可以去關註一些自己感興趣的模塊,養成查找數據的能力,可以關註更多領域的更多數據,獲取更多領域的知識。
這就需要我們提升自己查找數據的能力,例如:通過百度搜索指數、艾瑞數據、TalkingData、阿裡數據、微信搜索指數等,這些網站都有針對一 些領域、關鍵字的數據分析和統計,多查一查、看一看,對於瞭解感興趣的事物都是很有幫助的。
其次,多思考數據背後的東西,把數據轉化成知識,讓數據產生真正的價值。 在很多時候,數據可能就是一個冰冷的數字,或者一些簡單的折線圖等圖表,但是經過我們的分析和思考,這些冷冰冰的數字就會轉化成挖掘寶藏的鑰匙,幫助我們做一些決策分析,讓我們更客觀地瞭解事物。
我們來看一看拼多多背後的數據:拼多多上市讓很多人都意想不到,甚至有一些人在它上市後才知道拼多多的名字,一個 2015 年 9 月才成立的公司,僅僅運營 3 年便成功上市,活躍用戶數突破了 3 億個。外界都很好奇為什麼拼多多的成長速度這麼快,覺得拼多多上的有些商品質量一般,只是通過拼團的方式銷售,商品價格比較低。
但是,如果我們分析拼多多背後的數據就會發現,拼多多的成功看似不可思議,其實是理所當然的!這些數據背後反映了最真實的用戶。
從用戶收入來看,大部分用戶的人均收入不足 3000 元,根據國家統計局 2017 年發佈的《中華人民共和國 2017 年國民經濟和社會發展統計公報》數據顯示:2017 年全國人均全年可支配收入為 2.6 萬元,這樣一算人均月可支配收入僅為 2000 多元,我們或許沒有意識到這個問題,也沒有註意到這個數據,而拼多多的主流用戶就是這些三四五線城市的用戶,以及大量的鄉鎮和農村用戶。
再從用戶消費的品類來看,極光大數據顯示:拼多多的用戶中約 65% 來自 三四五線城市,這些用戶的收入都普遍偏低。拼多多平臺上銷售的貨物價格低廉, 剛好可以滿足這些用戶的需求。這些都是生活在“北上廣”的人所體會不到的, 而在一些小城市仍然有些人經常會發砍價的鏈接。通過數據我們發現,拼多多能夠積累到 3 億個用戶絕非偶然。
最後,要多與人溝通,不要偏執,在相信數據之前,要有勇氣否定自己的一 些經驗和想法,做到時常關註數據,多思考數據背後的東西。現在的互聯網時代衍生出了很多新的玩法和新的事物,已經遠遠超出了我們過去的認知,不要一味地堅持自己的想法而放棄傾聽其他人的觀點。
人在很多時候是很有意思的,特別是越在沒有人認同你的觀點的時候,就越希望說服別人認同你。在做數據產品經理工作的時候,我們要註意避免這個問題,多溝通而不要固執己見,並要註意溝通的方式,多獲取別人的信息和數據。
很多時候被別人說服很簡單,但是完全接受別人的想法,並說服自己接受是一件困難的事情。放棄偏執,通過交流,獲取別人的數據和知識,結合自己的認識,做進一步的決策,這才是一個數據產品經理應該有的態度。
數據思維的認知誤區[1]
數據思維具有可簡化、可量化、可創新、追求真理等特點。數字化時代,每個人都應該建立起用數據思考,用數據說話、用數據管理、用數據決策的思維模式,培養用數據來發現問題、解決問題能力。
數據很重要,然而,企業在數據驅動的數字化轉型的過程中, 也要避免掉入數據思維中的認知陷阱。
1、數據收集,越大越好?
數字化時代,隨著企業對數據的重要性的認識越來越高,以及數據收集的技術、方法越來越完善,即便是小公司也可能輕易擁有海量的“大數據”。企業在數據的收集和分析和過程中,應避免掉入“大而不全”的陷阱。
大,主要是指數據的量大,規模大,體量大;
全,指的是數據要全面、完整,考慮的數據維度要足夠多。
給大家講一個戰國“孫龐鬥智”的故事:
在馬陵之戰中,龐涓善於數據分析,一場戰役過後,它能夠通過分析戰敗敵軍丟棄的“竈”分析出敵軍的人數和戰力情況。而孫臏反其道而用之,通過編造“使齊軍入魏地為十萬竈,明日為五萬竈,又明日為三萬竈”的數據,成功實施了誘敵深入,殺死了龐涓。龐涓之死,不僅在於其過於輕敵,但更重要的數據收集的不全面。孫臏撤退的過程中,錶面在不斷減少吃飯的竈坑,卻在暗地裡偷偷增兵,如果龐涓能夠在觀察仔細一些,數據在收集全面一些,不難發現孫臏的“陰謀詭計”。
企業的數據分析也一樣,不一定是收集的數據量越大越好,而更應該註重數據的完整性,重視數據治理,以實現全維度、全過程、全場景的數據分析,支持企業的數字化轉型。
2、有數據就一定有真相?
數據作為當前時代重要的生產要素其重要性是不言而喻的,但是有數據不一定有真相。
早在2008年的時候,iPhone手機剛剛誕生不到一年,並沒有體現出如今這樣的優勢,手機界的霸主依然是諾基亞和摩托羅拉。那時候,移動端智能終端設備還存在諸多不成熟的地方,很多人認為智能手機就只是一種時尚,這股時尚風潮也會很快過去,手機還得是要質量可靠,皮實耐用的。
而Nokia也不是完全沒有重視智能手機,他曾經做了一個高達100萬人參與的調研樣板,而在那個智能手機尚未普及,概念都不夠清晰的年代,絕大多數的用戶壓根不清楚調研所指的手機和他們自己所用的手機有何區別,大多數用戶面對這樣廣泛而粗略的調研,回答非常簡單:沒有興趣。
畢竟:“誰會想攜帶一部笨重而續航差的智能手機呢?更何況它還那麼脆弱”。
但是誰又會想到,在不久之後,人們為了購買一臺智能手機,寧可去借錢,甚至去“賣腎”!
因此,有數據也不一定有真相。數據很重要,但也不要過於迷信數據。數據分析樣本的片面性、時效性、數據本身的質量缺陷都會導致數據結果失真。即使數據分析結果是真實的,也需要我們在實踐中不斷去驗證。
3、數據讓管理變得簡單?
隨著數據收集和存儲變得越來越簡單和低價,即使是小公司也能擁有“大數據”。從而基於數據的整合、加工、處理、分析和挖掘,幫助企業發現業務中問題,幫助企業做出科學合理的決策,“數據驅動管理”的時代已經到來。 但是世間萬物都存在不確定性,企業管理也一樣。管理決策、數據分析都存在一定的不確定性,即便擁有了百分百客觀的數據分析,也無法保證決策結果的百分百正確。
企業管理中的不確定性,來自於影響企業管理決策的各種因素的變化速度和複雜性。這些因素包括企業內部管理因素,例如:組織機構、人員、產品、業務流程、信息系統等,以及外部環境因素,例如:競爭環境、政治環境、法律環境、經濟環境等。複雜性帶來信息的膨脹和因素之間的因果關係模糊,快速變化使得決策難以跟上變化的速度。
數據分析中的不確定性,來自於數據收集,數據處理,數據分析等過程的不確定性,數據收集是否完整和齊全,數據處理是否合理和準確,數據分析是否及時和有效,結果的解讀是否標準一致等等,幾乎每一個環節都存在不確定性 不確定性讓管理變得撲朔迷離,各種表象掩蓋了事實。如果企業管理者缺乏對信息和數據的洞察力,缺乏透過信息表象追溯本源的分析判斷能力,缺乏大局觀和利弊差異的決斷能力,缺乏決策後可能後果的預測預防推算能力,即使有了客觀完整的數據,也不會讓企業管理變得簡單。
數據能夠為業務賦能,但也要清楚事物是動態變化的,任何預測都存在不確定性,必經結合現狀和需求,通過“數據和業務的雙引擎驅動”循序漸進的推動企業的數字化轉型。
1.估算北京市一日賣出的油條數量
供給和需求層面分析問題
角度一(需求層面):北京市一天賣出的油條=早飯吃油條的人數*每人吃的油條的數量北京市約有人口 2000 萬人,假設 20 人中有 1 人選擇早飯吃油條,則有 2000÷20=100 萬人。每人每次吃 1 根油條。 因此,北京市一天賣出約100*1=100 萬根油條
角度二(供給層面):北京市一天賣出的油條=北京油條店的數目*每家店賣出的油條數目北京市面積約 16410 平方千米,五環內面積約 735 萬平方千米,若每 1 平方千米有 2 家油條店,則有 735*2=1470 家;五環外有約 15700 平方千米,若每兩平方千米有 1 家油條店,則有 15700÷2=7850 家。由此,北京共有油條店約 9320 家。假設每家油條店每天賣出 100 根油條。那麼,北京市一天賣出 9320*100=93.2 萬根油條 結果分析:根據兩個角度的估算,北京市一天可以賣出的油條數量約在 100 萬左右。仍有一些因素可能導致誤差,如五環內外油條店的分佈密度尚待考證,可通過抽樣調查使其更為精準。
如何估算京東一日訂單量?
角度一:京東一日訂單量=(中國網民數量*使用京東的比例)÷用京東購物的天數 間隔據《中國互聯網路發展狀況統計報告》統計顯示,截至 2018 年 12 月,我國網民規 模達 8.29 億。據調查,京東市場占有比約為16%,則假設網民中正在使用京東的 比例為 16%,則有 1.326 億人。若京東用戶平均每一個月用京東購物一次,則京東一日訂單量=13260萬÷30=442 萬
角度二:京東一日訂單量=京東物流配送人員人數*每日可送達訂單數京東訂單由京東物流負責配送,京東共有 18 萬物流配送人員。根據招聘信息,一 位物流配送員每天工作 10 小時,每月休息 4 天,則每天工作 8 小時 40分鐘。若配 送一個訂單需要 15 分鐘,則一天可送約 35 單。由此,京東一日訂單量=18*35=630 萬結果分析:根據兩個角度的估算,京東一日訂單量約為 400~700 萬。仍有一些因素 可能導致誤差,如京東用戶使用京東購物頻率尚未考證,可用過用戶調查使其更為準確。
- ↑ 1.0 1.1 1.2 1.3 “企業數字化轉型:聊聊數據思維 .騰訊新聞. 2022-7-22
- ↑ 漁好學.什麼是數據思維?.知乎.2021-05-02
- ↑ “數據思維的六角度模型.鳥哥筆記. 2020-11-19
- ↑ “數據思維的關鍵是什麼?.一個數據人的自留地. 2022-10-05
- ↑ 梁旭鵬.數據產品經理必備思維之——數據思維.人人都是產品經理.2019-04-01