数据思维
出自 MBA智库百科(https://wiki.mbalib.com/)
目录 |
数据思维是用数据来探索、思考事物的一种思维模式,用数据来发现问题、洞察规律、探索真理。企业的数字化转型过程需要的数据思维,就是用数据思考,用数据说话、用数据管理、用数据决策。[1]
数据思维简单来说就是面对一些业务问题的时候, 我们能不能通过数据的方法去做分析从而给出建议来解决业务问题他的核心有两个,第一个是数据敏感度, 第二个是数据方法经验。数据敏感度,就是在意思里看到一个业务的问题是否可以转化为数据问题, 看到一个数字, 是否可以看到数据背后的问题数据方法经验,就是利用数据建模的方法和数据分析的方法解决实际的问题,这些也构成了数据思维的一部分。数据分析的方法有很多,常见的有:漏斗分析,相关性分析,5w2h, 对比分析,分群分析等等。[2]
数据思维的特点[1]
数据思维具有可简化、可量化、可创新、追求真理等特点。
1、数据思维是一种简化思维
我们当下生活在一个信息浩大庞杂的时代,我们的身边充斥着各种正面的、负面的、片面的、全面的、真实的、虚假的,各种各样、真真假假的信息,一不小心就会被纷繁复杂的因素所干扰。在纷繁的信息中我们思考问题要善于简化,抓住重点,聚焦核心问题,以终为始、抽丝剥茧、多维度收集信息、多角度思考问题,找到高效的解决方案。
2、数据思维是一种量化思维
数据化的核心是量化,所有的业务都可以用数据来量化描述。在我们的工作中,用数据来量化业务是十分常见的,不论是企业高层领导作出的年度经营报告,还是企业日常的生产计划、采购计划、销售完成情况等都需要用数据来量化描述。确少数据描述的工作报告,无论词藻再华丽,语言再优美,结构再严谨,其内容都是苍白无力的。数据量化一切,当文字变成数据、当沟通变成数据、当考核变成数据,皆可被量化的一切事物,正在将数据化变成社会发展的主旋律。
3、数据思维是一种创新思维
数据是一种“可再生资源”,我们能直观看到、感受到的价值只是数据价值的“冰山一角”。数据具有可重复使用,组合使用,跨平台使用的特点,企业可以通过多维度的数据采集、融合、重组、扩展和再利用,突破部门边界、业务边界、系统边界、技术边界的束缚,创新新模式,开拓新领域,确立新决策,不断发掘数据背后所隐藏的“价值”。
4、数据思维是一种追求真理的思维
虽然我们说“数据不仅能够记录历史,还能预测未来!”。但是,我更要给你强调的是“数据不是万能的”。要知道,世间万物的关系是非常复杂的,我们虽然可以用数据来对其简化,但简化必然会导致误差;我们也可以用数据来对其进行量化,但却无法穷尽。更要知道,数据都是历史的,而万物是动态变化的,现有的知识都是也有真伪的。因此,我们需要深入探究数据的真实性、客观性,不断探寻隐藏在数据背后的真相,追求真理永无止境。
数据思维的六角度模型[3]
数据思维是应用数据科学的原理、方法、技术来解读事物和解决现实场景中问题的底层思维逻辑。数据思维是数据分析背后的底层认知和基本逻辑,是产生数据分析方法的方法论,各种数据分析方法本质上都是数据思维的输出结果和表现形式。
那么,问题来了,完整的数据思维是怎么形成的呢?笔者给出了一个数据思维六角度模型,从描述、定位、需求、应用、技术和价值角度对数据思维进行了阐释,这六个角度基本上能概括用数据来分析和解决问题的过程和机理。
1、描述角度:描述是数据最基本的功能。当然,用数据来描述事物或者业务问题时,首先要确定的是描述的对象,然后拆解出合适的描述维度,再将维度分解为更细粒度的指标。分解指标时需要注意定义、口径和计算方法,还要明确指标的数据来源、数据格式和更新频次等。最后形成一定的描述框架,用数据的语言进行表达。描述角度要完成的是用数据刻画研究对象,这是数据思维的起点。
2、定位角度:这个角度考察的是研究对象在数据价值链条上的位置。数据价值链的参与主体的角色分为硬件支撑厂商、数据源、技术支撑厂商、交易市场和数据消费者等,有时候我们的研究对象可能同时具备多种身份。例如:研究某些自媒体创作者时,他们既是数据的生产者或者称之为数据源,也是数据的消费者,因为他们在创作内容对外输出的同时,也在与粉丝们互动、在吸收和加工外界输入的数据。当然,面对具体问题时,我们对研究对象的角色定位会有一个倾向性的侧重。还是以自媒体创作者为例,当我们研究其影响力时,我们更侧重于将其定位为内容的生产者,用数据的语言来描述就是数据源。定位角度是从数据视角对研究对象在功能和地位上的界定,是我们启动思考的前置条件。
3、需求角度:要不要用到数据来分析和解决问题还要根据当事人对我们提出的需求来决定。当我们面对的任务仅仅是描述研究对象时,就不用再“自作多情”的搞一堆数据分析模型了;在当事人面临一些问题或困境的局面下,需要我们帮助解决问题时,这时候就可以启动需求分析了。我们要思考的问题包括:当事人面临的问题是什么,问题有多严重,问题是否具有普遍性,能否用数据的语言来描述需求和界定问题,是否具备从数据角度出发解决问题的基础。从需求角度界定场景与问题是我们引入数据视角前应完成的思考内容,是对思考范围和目标的锁定。
4、应用角度:在明确问题和需求之后就要构建数据分析与应用的思路了。我们要思考包括:当事人提出的问题用数据视角可以“翻译”为哪种类型的数学问题,这类问题的解决思路有哪几种,当前情况下用数据分析和解决此类问题是否具有可行性,实际操作过程中可能面临哪些数据问题。应用角度要求我们先要理解需求和问题,然后再建立起基于数据视角的分析和解决问题的思维框架。
5、技术角度:技术无疑是为应用服务的,在应用数据的思维框架下,我们心目中应建立起技术落地方案的流程图。也就是说对于技术落地要做到“心中有数”:现有数据能支持做哪些事情,用数据分析和解决问题要分哪几个步骤,每个步骤需要用到什么样的工具,需要用到什么算法和分析模型,需不需要搭建数据平台,如何保证数据的安全等等。技术角度要求我们要有预见性,能提前在心中梳理出技术落地的路径与方案,这是数据思维与实际问题深度融合的关键环节。
6、价值角度:在从思考进入实操之前,我们要做的最后一件事情就是要分析数据角度分析和解决问题的价值。我们要考量的是:从数据角度分析和解决问题是不是当前的最优解,这样做有什么样的价值,这样做的价值如何量化和评估,这种模式下能否将数据价值长期化、产品化。因此,价值角度是数据思维的终点,是我们完成数据思维闭环的最后一环。
综上所述,从描述角度入手用数据刻画研究对象,再从定位角度看清其在数据价值链上的位置,然后洞察需求、界定问题,将业务问题转化为数学问题,思考解决问题的方法和技术实现方案,最后用数据来评估这套模式的价值、完成思考的闭环,六个角度环环相扣,用数据来贯穿,这就是我所理解的数据思维的形成路径。
数据思维的关键点[4]
01 数据不是越多越好,模型不一定越复杂越好
一提到“数据思维”,我们常常会听到这样的说法,一定要积累海量的数据、一定要用上复杂的算法和模型、一定要实现对业务的颠覆式创新。事实是这样吗?晋梅认为,数据思维的本质,不是追求数据的积累或是算法的复杂度,而是要清楚地知道,如何用好数据、更好地解决实际问题。
“比如说,有的企业的基础设施不够完善,业务线上化程度和数据积累也很有限。但他们在业务逻辑上想得很透、对业务流程的拆解很到位、对提升和增长所需要重点关注的环节抓得很准。在重要环节上,他们敢于提出问题和关键假设,然后有的放矢地去积累数据。他们及时复盘,基于分析结果一边优化、一边提出新的问题和假设——在这个过程中,即便他们只使用了几张不超过 10M 的 Excel 表格、只运用了小学生都能熟练掌握的四则运算,我们也不会认为这样的企业没有‘数据思维’、算不上‘数据驱动’。”晋梅强调,“能够踏实做到这一步的企业,就算是已经吃透‘数据思维’的内核了。”
她举了个例子:拿所有银行都在做的公众号来说,即便是在没有后台权限的情况下,运营分析师也能根据有限的公开数据——比如推文标题、位置和时间、内容和形式等信息,判断出某个分行或者业务部门在特定时间段内对公众号渠道的定位是什么、重点关注哪些客群、营销什么产品和服务、主推什么卖点和权益、覆盖广度和投入力度如何等等。如果进一步结合每个推文的阅读量、转发量、点赞量、评论关键词等数据,还可以做定性和定量的主题分析,围绕分行或业务部门经营目标有针对性地给出内容运营的优化思路和测试路径,甚至还能在用户运营和权益规划方面给到非常有价值的建议。
换言之,数据是否具备业务价值,不完全取决于规模或体量,而是看是否能解决需求或问题。即便数据资源有限,在特定场景下也可能创造价值。反之,数据体量大固然蕴藏着更大的潜力、更多的可能性,但如果没想清楚要解决什么问题、为什么利用数据就能提供更有效的解决思路、如何使用数据才能达到预期效果这些问题,就会既增加数据成本、更增加决策难度。
那么,越来越流行的 AI 分析工具以及复杂的模型或算法又是不是必选项呢?晋梅的答案依然是否定的。“和到底是要用铲子还是挖掘机、要用水果刀还是手术刀这类问题一样,我们要分析数据、挖掘洞察,应该选择什么方法、使用什么工具,依然需要具体情况具体分析,合理、有效、划算的才是好的。”
比如,当下非常火的短视频或直播,对于拥有海量用户和内容的平台来说,需要相对复杂和专业的算法来识别用户的偏好、内容类目,通过给用户和内容分别打上标签,进行及时和准确的推荐,以此增加用户的粘性、催生更多有需求的内容。
但是,在这个生态中,能利用数据去成就和放大业务价值的,除了专业的算法团队,还有运营团队。在直播的过程中,运营全程紧盯人气数据、带货数据,分析观众画像、流量来源、观众互动和商品转化,捕捉有可能影响交易量的潜在因素,通过持续测试和优化投放策略、调整直播间的“人 - 货 - 场”来创造价值。
“在这个过程中,他们常用的分析方法在绝大多数情况下并不涉及复杂算法和数学模型,很多运营指标也只是基本的加减乘除,但这完全不妨碍优秀的运营人员利用数据去解决转化的问题。”晋梅表示,“我合作过不少顶级的运营,他们不会写 SQL、没听过逻辑回归、也弄不懂 GBDT,但他们把坚持数据驱动作为信仰,是真正具备数据思维并从中获益的人。”
所以,在她看来,是否需要 AI 分析工具、使用什么复杂度的模型,先要明确业务的目标,基于这个目标去做细化拆解、梳理环节,提出关键问题和假设,再结合数据的实际情况,综合评估不同方案的可行性、投产比、优势短板后再做选择。
02 数据是锦上添花,而不是救命稻草
尤其是在数字化愈演愈烈的当下,市场上不乏打着“数字化转型”的旗号贩卖焦虑者,也不缺把“数字化”当作救命稻草,或者拿着锤子到处找钉子的企业。越是这样,企业越是要从做业务的初心和商业的底层逻辑出发,对自身的核心竞争力有清晰的定位,对市场需求和趋势发展有客观的判断,对数据科学的优势和局限性有必要的认知。否则,很容易陷入先把“数据思维”当作万金油,一顿操作猛如虎却没有感受到业务突飞猛进的尴尬境地。到了最后,只能“甩锅”给数据。
以这些年业界对 Capital One 的解读风向变化为例:晋梅表示,因为短短几十年 Capital One 就跻身全美头部银行,很多人给它贴上了“大数据风控先驱”的标签,而后冒出来很多主打“大数据风控”的公司,号称他们的风控模型里用了成千上万个特征,智能到恨不得每分每秒都在自我迭代,甚至可以连模型带系数从 A 银行直接迁移到B银行去帮后者快速冷启动。但随着后期 Capital One 遇上股价波动、业务调整,业界同样着急下结论——表示“Capital One 走下神坛”。
那么,事实果真如此吗?晋梅解释道,“成就 Capital One 的肯定不是所谓的‘大数据风控’,Capital One 也没有什么秘密武器,只是一直遵循着‘提出问题、分析问题、解决问题’的结构性思维方式,让数据恰如其分地发挥价值罢了。”
据她介绍,在日常的业务推进过程中,Capital One 的算法模型团队会频繁和业务反复沟通金融产品要素、目标客群、推广渠道、营销策略、市场环境和宏观趋势。双方不仅对业务的历史、现状、未来规划都有充分共识,还会对建模样本的选择策略、模型的框架、建模的方法、模型适用性、模型的验证、上线后的监控、可能会出现哪些问题、出现这些问题后的应对预案等信息去做充分的讨论——包括对入模的原始数据、衍生特征的业务价值和投入成本客观评估,以及对关键变量的系数从符号到数值是否合理、映射到业务上代表着什么等问题逐一明确。
“脱离了具体业务和场景的模型不但很难放大数据的价值、甚至可能带来毁灭性的灾难。”晋梅强调,“在 Capital One 工作这么多年给我的启示就是,永远不要在没梳理清楚‘产品 - 营销 - 运营’闭环的业务逻辑和关键问题之前,盲目扎入漫无边际的数据海洋;不预设问题、说不明白要验证什么的建模和分析,都是低效甚至无效的。“
所以,商业的本质,归根结底还是供给和需求的匹配,是用对的产品或服务、在对的时间和空间、以对的方式满足用户的需求。对于大多数企业来说,直接创造价值的不是数据本身,而是让数据助力实现供给和需求之间的极致匹配。
换句话说,企业自身如果没有好的商业模式、好的产品和服务、好的客户体验,那么即便是再先进的技术、再优秀的算法模型、再多的数据也无法帮助它扭转乾坤——比如风靡一时的共享单车,背后也有海量数据在驱动资源配置,但是商业模式变现慢、服务管理不完善等问题同样导致了它最终的失败。过度高估数据价值,指望数据创造奇迹,让本就不符合逻辑的商业模式翻身,那多半会失望而归。
03 要运用数据,先忘掉“数据”
“所以,我觉得‘数据思维’,归根结底是因为有了数据加持,从而更有底气和把握做出正确决策,继而更高效地解决问题的思维。我们不能拘泥于字面上的、狭义的‘数据’这个词本身。”晋梅强调,“甚至可以试着先忘掉‘数据’,捋一捋业务模式、搞清楚要解决的核心问题到底是什么;在此基础之上,再引入数据、考虑数据能帮到什么,进而刷新对业务模式和核心问题的理解。”
具体来说:第一,理解业务、提出问题;第二,拆解成多个子问题;第三,逐个分析和评估;第四,总结和决策。晋梅表示,这种结构化思维指导下的、解决问题的框架在如今的数字化背景下非常适用。
“首先,企业要明确目前业务上面临的核心问题是什么,大家充分探讨和论证、要达成共识;然后,是对问题进行拆解,可以根据业务流程、关键要素或者部门职能等维度细分成多个子命题。围绕每个子命题要敢于提出关键假设、圈定测试范围、排好优先级;第三步用包含数据分析在内的手段,对第二步拆解出来的问题和假设进一步量化、验证和评估。最后一步,基于前面的分析结果,总结和决策。在落地执行、业务迭代的过程中一定还会碰到新的挑战、出现新的问题,这时候再从第一步开始、螺旋式推进。”
以银行的权益运营为例:
第一步,明确要解决的问题是,通过丰富的权益持续满足客户的需求,提升客户体验、加强客户的粘性,继而提升客户的经营价值;
第二步,要做到在对的时间、把对的权益、以对的兑换积分金额和对的兑换方式去满足客户的需求。可以按照“人 - 货 - 场”的运营模型进行细分拆解,围绕着每一个维度,做好基础标签体系的建设,梳理交互环节,根据可提升空间和价值明确优先级;
第三步,对关键环节开展数据采集、积累、分析和建模并提炼洞察。比如,通过兑换数据,可以把同一个 AUM 层级的客户按照兑换品类的偏好进一步细分群,也可以评估兑换流程的转化效率、从而定位优化兑换体验的环节,还可以根据权益单品的兑换热度调整选品策略和组合策略;
最后,通过对这些信息的综合分析,业务团队和运营人员就可以更有据可依地开展分群运营、渠道优化、商品管理和供应商管理等工作。
晋梅告诉 InfoQ 记者,很多企业尤其是技术人员在推动数字化的过程中,经常把自己局限在第三步,没有考虑具体问题和具体场景的全貌,只是接受一个笼统的需求、确认下字段的口径就开始做分析和模型,最后往往不能提供业务用得上、切实辅助决策的输出。
比如,建模同学 M 接到需求说要给 A 产品做信用评分卡,他兢兢业业找出来 A 产品的历史数据、认认真真建模和回测,感觉都没问题了就交付给策略同学 P 使用。没过多久,策略同学 P 就抱怨 M 的评分卡不好使,时灵时不灵。
后来才发现,业务团队为了完成增长 KPI,自行调整了 A 产品的受众群体,把过去只聚焦在优质客群的 A 产品推向基数更大但信用资质略差的客群。为此,他们新增了 A 产品的进件合作渠道,在展示坑位、流量费用等方面也都做了调整。但是,在推进这些尝试的过程中,他们只使用了过去优质客群的历史表现数据,自然,M 同学原来建立的评分卡的有效性就非常有限。
所以,晋梅认为,解决问题的经典框架中的每一步如果没有放在整体逻辑中去考虑,很难有价值可言。上面这个例子的漏洞就出在没有对问题进行合理的拆分和定位。除此之外,还有的企业会在第一步明确问题的过程中,就开始出现目标上的偏差。
“比如,有些银行在做 APP 的时候要拼日活数据,为了达标玩命地在 App 里添加功能,俨然一副要和字节拼内容、和腾讯拼社交、和 PDD 拼电商的架势。且不说银行 App 在这类比拼中到底有什么优势,就说日活数据的提升如何与银行经营指标挂钩?或者流量真的来了,银行要用什么产品和服务去承接去变现?而这些接得住流量需求的产品和服务目前是什么状况、有没有需要优化的地方、优化的节奏又是什么?完整的商业模式、业务链路和实现节奏企业自己是要先想清楚的。否则就是盲目投入,很可能钱花了不少却总说不清产出在什么地方。”
也就是说,这背后要求企业对自身业务的走势有清晰认知和合理的规划,能够识别和解决到业务的“真问题”而不是“伪需求”。
04 每个人都该有“业务体感”和“数据思维”
那么,在一个企业当中,究竟谁应该具备这种结构性思维和解决问题的能力?在传统认知中,我们通常认为创造业务价值并且在这个过程中负责解决具体问题的,是冲在前线的业务部门。而技术部门扮演的是执行者的角色,只要在幕后负责接收业务需求,然后针对性地做开发、找技术、做模型。
但是,时过境迁,如今数字化转型的背后需要源源不断的技术内燃力,技术已经成为其中的关键角色,这意味着过去这一套协作模式无法奏效。
所以,晋梅的答案是——无论是一线的业务人员还是中后台的技术人员,所有人都应该具备上面所说的解决问题的思维和能力——更确切来说,每个人都要有“业务体感”和“数据思维”。
她讲了某区域银行的例子:“在诊断这家银行营销系统时发现,他们很多营销活动的响应率居然都能达到 90% 以上。即便是非常牛的互联网爆款产品,也很难达到这么高的响应。所以,当我们把这些数据拉出来看的时候,就发现了问题。这些高响应率活动的营销方式都是短信,而这个所谓的响应率其实是送达用户手机的比例,除了被拦截的短信,超过 90% 多都能送达。事实上,短信送达后用户并不一定会点击参与这些营销活动,而这一步的点击率是比短信触达率更具业务价值的指标。更让我震惊的是,这个数值高达 90%、以‘响应率’自居的指标,在这家银行的营销系统里已经静静躺了几年了。”
在晋梅看来,这就是缺少“业务体感”,进而对数据的业务意义和价值、对数据所反映出来的业务漏洞也不敏感的一种表现。很多企业拼命花钱做项目、上技术,最后要么没效果、要么说不清楚效果,就宣告项目失败,其实背后可能不是技术水土不服,而是围绕业务闭环本身该做的思考和论证太过敷衍和草率。
但是,现实情况是,这种兼具“业务体感”和“数据思维“的人才非常稀缺,他的基本能力要求是既要懂业务又要懂技术,复合能力叠加,培养难度也加倍。晋梅指出,企业要解决的当务之急,需要业务人员与技术人员的“双向奔赴”。
“一方面,技术一定要去理解业务,明确业务目标、流程和痛点,你要清楚自己通过哪些技术、算法能产生什么样的影响,带来什么样的价值;另一方面,业务对技术的理解,不要只在大数据、人工智能这些热词表面,比如,当你的业务对技术、对数据的依赖越来越重,起码要知道关键技术的基础原理、构建逻辑、优势、短板和局限性等。”晋梅指出。
05 业务技术双向奔赴——“说人话”比“造新词”更重要
很多人认为,技术与业务人员之间的隔阂是天然存在的,由于工作内容的差异,双方关心的问题并不相同,无法在同一套话语体系下沟通是非常普遍的现象。晋梅表示,这个问题不是没有解,但也没有捷径。
“业务、技术、数据等核心部门首先都不要回避这个问题,其次要一起迎接这个挑战。技术不要认为业务背景的人肯定听不懂技术和数据,高段位技术的一个重要能力,就是让业务人员听懂技术的价值;同样,业务也不要认为技术人员弄不明白商业模式,高段位业务一定要具备的重要能力,就是简单、直接地讲清楚业务本质。”
据晋梅介绍,Capital One 把这样的文化观念通过制度和流程的方式做了固化和沉淀。
比如,在人才招聘过程中,无论是业务、数据还是技术岗,面试时都会安排一轮案例分析。主导这一轮的面试官都是 VP 级别的高管、拥有一票否决权。而在整整一小时、和高管 1V1 的面试中,候选人会被提供一个具体的业务问题,围绕着这个问题会被给到业务背景、数据报表等信息,但这些信息不是一次性、一股脑给到候选人的(这也符合我们在实际工作中碰到的情况),而是由候选人和 VP 展开多轮互动,询问、确认、提出假设、分析解读、给出建议,然后再被提供更多信息后,进一步分析和优化建议。
也就是说,在整个面试过程中,候选人身上没有“业务岗”、“数据岗”、“技术岗”的标签,而是一个先快速吸收背景知识,然后提出问题、分析问题和解决问题的角色。
再比如,在部门协作过程中,Capital One 模型团队在每一次对模型进行调整时,都会和业务充分沟通调整的原因和方式,调整前后的对比,新模型的优势、短板和局限性;反之,业务团队每一次做业务策略调整时也会把调整背景、调整方向、预判影响等信息同步给模型团队。并且,在整个流程中,双方不是对立的状态,也不是各自扛各自的指标,而是一起扛业务最终的收益。
此外,Capital One 在培训体系中还有一个比较有意思的做法,是在内部培训中设立了一门叫做“COF Lessons Learned”的课程。这是一门不断积累案例的培训,积累的都是公司付出过代价、在践行数据驱动业务的道路上实实在在踩过的“坑”。而培训的老师,首选是那些曾亲身参与和经历过这些“坑”的同事、尤其是负责人。案例的内容很丰富,包括对这些项目的业务背景、入坑复盘,梳理当初的思路是什么、为什么会出现问题、是哪个点没有考虑清楚、或者沟通上不够顺畅,最后导致了什么样的业务结果等等。
并且,为了让每一位员工清醒认识数据中既有真相、也有盲区,模型会揭示规律、也会制造错觉,Capital One 还有另一门叫做“Statistical Pitfalls”的内训课,专门讲述各类统计模型和数据分析在支撑业务决策的应用过程中,可能存在的局限性和常见的误区。
“任何技术、任何工具,只有对它的优势、短板、适用性、局限性等有客观的认识,才能把好钢用在刀刃上、真正发挥它的价值。而在这个过程中,前台不应该自诩为商业奇才、中后台也不应该以‘技术大神’自居,探讨问题要以表达清楚、阐述明白为目标,不刻意、不做作。”晋梅强调。
建议一[1]
1、培养对数据的敏感度
数据敏感度是对数据感知、计算、理解能力,是通过数据的表象理解事物本质的程度。对数据敏感的人,看到数据能够找出问题,找到规律,发现机会或做出决断;对数据不敏感的人,看到数据只会问这是什么,这反映了什么,这能说明什么?对数据毫无敏感而言的人,“数据就是数据”,甚至不会想到以上问题。
人并非天生就会对数据产生敏感度,人们对数据的敏感度来源于经验的积累,看的数据越多,种类越丰富,处理的问题越多、敏感性就越强。因此,数据敏感度是可以培养的。
所谓培养数据敏感度,本质上就是培养通过数据发现问题、解决问题的能力,可以从以下几个方面入手:
质量评估,对数据的表象和质量进行评估,判断数据是否完整、是否准确、是否符合业务规范?
识别真伪,能够对数据的真假做出判断,看出数据中存在的猫腻,例如:年度报告,本事业部今年老员工的离职率为0,实际上新入职的员工有大批离职的。
找到因果,能够通过数据找到事物之间因果关系,从而找到产生问题的主要原因和根本原因。例如:产品销量下降了,直接原因是客户量减少了,本质原因是市场出现了更具竞争力的产品。
找出关联,能够通过数据多维采集和分析找到事物之间关联关系,关联分析是洞察事务本质的重要方式,关键点在于数据维度全、数据样本完整且具有足够的代表性。
判别优劣,能够通过数据的对比判断事物的好坏优劣,例如:季度销售完成率为50%的报告,如果没有历史数据作为对比很难判断出这个季度销售业绩的好坏。
洞察规律,能够从数据中找到事物发展的规律,例如:古人为了农业生产需要,顺应自然规律,通过对春夏秋冬、冷热交替的不同时间的记录和研究,总结出来了二十四节气。
预测预估,能够从已知的数据中提取到的规则,从而对未知的业务影响作出预测。
2、培养理解和使用数据的能力
“数据为王,业务是核心”,与其说培养理解数据的能力,不如说是理解业务的能力。只有将数据置于业务场景中,数据才能变得有意义。企业数据化转型过程中,要求数据管理和数据分析人员懂业务,理解数据的对业务价值;要求业务人员要懂数据、会使用数据。
对于数据管理或数据分析人员,要能够看得懂数据并理解数据背后的业务含义。
作为数据管理或数据分析人员,首先需要你摸清楚企业的核心业务价值链,甚至企业多处行业的整个产业链业务情况。其次,你需要逐步了解企业都涉及哪些业务域,每个业务域中包含哪些业务流程,每个业务流程之间的斜街关系,以及每个业务的输入输出等。最后,在理清楚业务域以及业务流程的输入输出后,需要对详细列出每个业务的绩效考核指标(KPI),再通过对每个指标进行更细致的拆分,最终落地的内容数据数据分析所需的报表、指标、维度、明细等。
对于业务人员,要懂数据,会使用数据指导业务开展。
数据源于业务,并服务于业务。作为业务人员,首先你要知道数据对业务的重要性,清楚数据的标准,按标准规范输入数据,并确保数据结果的正确输出。其次,你要能够识别业务数据的真伪,判断数据质量的优劣,并能够为数据质量的改善提供必要的改进建议。最后,你还需要加强对数据管理和数据分析工具的掌握,利用数据管理工具将数据合理、正确、规范的管理起来;利用数据分析工具自助进行分析建模、场景设计、数据探索、价值挖掘。
3、培养问题拆解的能力
数据思维的核心在于用数据发现并解决问题,学会用结构化、量化的思维方式去分析问题、拆解问题、解决问题,能够让我们事半功倍。
假如你是一家零售企业的数据分析师,日常主要工作是销售数据的采集、整合、处理和分析。有天,公司领导突然让你写一个PPT,谈一谈如何用数据做业务预判、如何用数据赋能业务,提升产品销量,实现业务增值?
这是一个典型的开放式问题,第一,缺乏明确目标和范围,例如:哪些业务需要研判,业务遇到的问题是什么;第二,缺乏明确的判断依据和标准,例如:产品销量要提高多少?很多数据项目往往都死于此,这时候就需要有问题拆解的思维。数据赋能业务的过程一定是一个循序渐进的,逐步建立共识的过程。
例如基于以上问题:
首先,要搞清楚业务的目标是否明确,如果目标不明确,则先明确目标。例如:通过收集和分析现有的数据报表情况对销售业务现状进行研判,找出改进点。
第二,在明确业务目标之后,要搞清楚是否有业务判断的标准,判断标准一定要建立起来,不然提升多少才算好都不知道,事后难免陷入扯皮和纠结。例如:XX产品同比增长20%
第三,定了判断标准之后,要分析用什么样的策略支撑实现这个目标。例如:优化推荐算法、增加线下营销活动等。
第四,在明确了实施策略之后,要制定策略执行计划。例如:算法的升级需要谁来负责、什么时间完成?
第五,在明确行动计划之后,还需要通过数据来监控执行情况,并实时反馈执行的效果。
4、培养用数据说话的习惯
数字化时代,每个人都应该具有量化思维,习惯用数据说话。用数据说话不是单纯的使用“数字”,而是用数据来支持观点,做到有理有据。
第一,在一定程度上,数据就是证据和事实,用数据说话,能够增强你的说服力
任何观点都会有破绽,但数据摆在那里却难以让人反驳。如果你是企业销售主管,给领导汇报销售情况,不要说你的市场竞争多激烈,你的销售人员多努力,你的目标多高远,直接说你增加了多少客户,提升了多少客单量、实现了多少销售业绩、增加多少项目漏斗,这样的汇报效果会更好一些。
第二,数据可以揭露问题,发现本质,用数据说话,可以辅助你做出正确的决策
数字化下,企业管理不仅需要管理者丰富的管理经验,还需要有多维的数据支撑。如果你是一个企业领导,你更愿意做薄利多销,还是坚持确保每一单都要保证一定的利润?貌似选择哪个方案都可以,关键是要看具体的场景和数据支撑。正常情况下,假如是批产的产品,可以考虑薄利多销,以量取胜;假如是定制产品,就需要考虑一定的利润空间。如果只是从利润角度考虑,有产品定价数据、销量数据就能容易做出决策,但如果还需要考虑产品的市场定位,客户的回头率,企业的售后服务能力等因素,就不能只考虑价格和销量两个维度信息,应该建立多维度分析模型,以帮助你做出更合理的决策。
第三,用数据说话要有量化思维,简化思维,还要尽量避免使用太过专业的术语
量化,有利于对事物(业务)给出一个判断标准,例如:提高产品销量,提升用户活跃度,到底销售多少算是提高?怎样的用户才算活跃用户?只有将指标进行量化,才能推动达成共识。
简化,有利于抓住主要矛盾,直击事物(问题)的本质,摆脱各种复杂情况,轻松应对难题。例如:某企业要其对10W+条物资编码进行治理,通过对历史数据分析,发现这些物资编码中,有40%3年之内只用过一次,还有10%在业务中从来没有使用过。基于这个分析结果,发现企业真正要花力气治理的数据只有5W多条,而不是10W条。简化的思维就是对复杂问题进行拆解、降维、极限归纳,筛选并只使用相关数据,从而找到简单且可行的解决方案。
用数据说话本质上还是沟通,为提升沟通的效率,要尽可能使用“标准语言”,或者对方能够听得懂的语言。从这点上讲,数据治理就显得十分重要,统一企业的数据标准,明确业务术语、指标、维度的业务含义、规则等,能够提升业务部门之间、业务与IT之间的沟通效率。
建议二[5]
首先,要时常关注数据,对数据敏感。这一点其实我们每天都在做,只不过很多人关注的大部分数据都可能是娱乐性质的罢了,还有一些可能由新闻报道得到。例如:很多人都通过微博或者今日头条等新闻资讯客户端获取数据。
比如:小米和美团点评谁又上市了,谁的股票涨了,谁的市值高;哪些明星又发生了什么事,谁偷税漏税了,被罚了多少钱,谁又参演电影了,哪部电影的票房高等。这些其实都是数据,只不过你关注的点大多数是娱乐性质偏多一些的。
而数据产品经理更应该关注大数据行业的一些数据,当然你有时间的话也可以去关注一些自己感兴趣的模块,养成查找数据的能力,可以关注更多领域的更多数据,获取更多领域的知识。
这就需要我们提升自己查找数据的能力,例如:通过百度搜索指数、艾瑞数据、TalkingData、阿里数据、微信搜索指数等,这些网站都有针对一 些领域、关键字的数据分析和统计,多查一查、看一看,对于了解感兴趣的事物都是很有帮助的。
其次,多思考数据背后的东西,把数据转化成知识,让数据产生真正的价值。 在很多时候,数据可能就是一个冰冷的数字,或者一些简单的折线图等图表,但是经过我们的分析和思考,这些冷冰冰的数字就会转化成挖掘宝藏的钥匙,帮助我们做一些决策分析,让我们更客观地了解事物。
我们来看一看拼多多背后的数据:拼多多上市让很多人都意想不到,甚至有一些人在它上市后才知道拼多多的名字,一个 2015 年 9 月才成立的公司,仅仅运营 3 年便成功上市,活跃用户数突破了 3 亿个。外界都很好奇为什么拼多多的成长速度这么快,觉得拼多多上的有些商品质量一般,只是通过拼团的方式销售,商品价格比较低。
但是,如果我们分析拼多多背后的数据就会发现,拼多多的成功看似不可思议,其实是理所当然的!这些数据背后反映了最真实的用户。
从用户收入来看,大部分用户的人均收入不足 3000 元,根据国家统计局 2017 年发布的《中华人民共和国 2017 年国民经济和社会发展统计公报》数据显示:2017 年全国人均全年可支配收入为 2.6 万元,这样一算人均月可支配收入仅为 2000 多元,我们或许没有意识到这个问题,也没有注意到这个数据,而拼多多的主流用户就是这些三四五线城市的用户,以及大量的乡镇和农村用户。
再从用户消费的品类来看,极光大数据显示:拼多多的用户中约 65% 来自 三四五线城市,这些用户的收入都普遍偏低。拼多多平台上销售的货物价格低廉, 刚好可以满足这些用户的需求。这些都是生活在“北上广”的人所体会不到的, 而在一些小城市仍然有些人经常会发砍价的链接。通过数据我们发现,拼多多能够积累到 3 亿个用户绝非偶然。
最后,要多与人沟通,不要偏执,在相信数据之前,要有勇气否定自己的一 些经验和想法,做到时常关注数据,多思考数据背后的东西。现在的互联网时代衍生出了很多新的玩法和新的事物,已经远远超出了我们过去的认知,不要一味地坚持自己的想法而放弃倾听其他人的观点。
人在很多时候是很有意思的,特别是越在没有人认同你的观点的时候,就越希望说服别人认同你。在做数据产品经理工作的时候,我们要注意避免这个问题,多沟通而不要固执己见,并要注意沟通的方式,多获取别人的信息和数据。
很多时候被别人说服很简单,但是完全接受别人的想法,并说服自己接受是一件困难的事情。放弃偏执,通过交流,获取别人的数据和知识,结合自己的认识,做进一步的决策,这才是一个数据产品经理应该有的态度。
数据思维的认知误区[1]
数据思维具有可简化、可量化、可创新、追求真理等特点。数字化时代,每个人都应该建立起用数据思考,用数据说话、用数据管理、用数据决策的思维模式,培养用数据来发现问题、解决问题能力。
数据很重要,然而,企业在数据驱动的数字化转型的过程中, 也要避免掉入数据思维中的认知陷阱。
1、数据收集,越大越好?
数字化时代,随着企业对数据的重要性的认识越来越高,以及数据收集的技术、方法越来越完善,即便是小公司也可能轻易拥有海量的“大数据”。企业在数据的收集和分析和过程中,应避免掉入“大而不全”的陷阱。
大,主要是指数据的量大,规模大,体量大;
全,指的是数据要全面、完整,考虑的数据维度要足够多。
给大家讲一个战国“孙庞斗智”的故事:
在马陵之战中,庞涓善于数据分析,一场战役过后,它能够通过分析战败敌军丢弃的“灶”分析出敌军的人数和战力情况。而孙膑反其道而用之,通过编造“使齐军入魏地为十万灶,明日为五万灶,又明日为三万灶”的数据,成功实施了诱敌深入,杀死了庞涓。庞涓之死,不仅在于其过于轻敌,但更重要的数据收集的不全面。孙膑撤退的过程中,表面在不断减少吃饭的灶坑,却在暗地里偷偷增兵,如果庞涓能够在观察仔细一些,数据在收集全面一些,不难发现孙膑的“阴谋诡计”。
企业的数据分析也一样,不一定是收集的数据量越大越好,而更应该注重数据的完整性,重视数据治理,以实现全维度、全过程、全场景的数据分析,支持企业的数字化转型。
2、有数据就一定有真相?
数据作为当前时代重要的生产要素其重要性是不言而喻的,但是有数据不一定有真相。
早在2008年的时候,iPhone手机刚刚诞生不到一年,并没有体现出如今这样的优势,手机界的霸主依然是诺基亚和摩托罗拉。那时候,移动端智能终端设备还存在诸多不成熟的地方,很多人认为智能手机就只是一种时尚,这股时尚风潮也会很快过去,手机还得是要质量可靠,皮实耐用的。
而Nokia也不是完全没有重视智能手机,他曾经做了一个高达100万人参与的调研样板,而在那个智能手机尚未普及,概念都不够清晰的年代,绝大多数的用户压根不清楚调研所指的手机和他们自己所用的手机有何区别,大多数用户面对这样广泛而粗略的调研,回答非常简单:没有兴趣。
毕竟:“谁会想携带一部笨重而续航差的智能手机呢?更何况它还那么脆弱”。
但是谁又会想到,在不久之后,人们为了购买一台智能手机,宁可去借钱,甚至去“卖肾”!
因此,有数据也不一定有真相。数据很重要,但也不要过于迷信数据。数据分析样本的片面性、时效性、数据本身的质量缺陷都会导致数据结果失真。即使数据分析结果是真实的,也需要我们在实践中不断去验证。
3、数据让管理变得简单?
随着数据收集和存储变得越来越简单和低价,即使是小公司也能拥有“大数据”。从而基于数据的整合、加工、处理、分析和挖掘,帮助企业发现业务中问题,帮助企业做出科学合理的决策,“数据驱动管理”的时代已经到来。 但是世间万物都存在不确定性,企业管理也一样。管理决策、数据分析都存在一定的不确定性,即便拥有了百分百客观的数据分析,也无法保证决策结果的百分百正确。
企业管理中的不确定性,来自于影响企业管理决策的各种因素的变化速度和复杂性。这些因素包括企业内部管理因素,例如:组织机构、人员、产品、业务流程、信息系统等,以及外部环境因素,例如:竞争环境、政治环境、法律环境、经济环境等。复杂性带来信息的膨胀和因素之间的因果关系模糊,快速变化使得决策难以跟上变化的速度。
数据分析中的不确定性,来自于数据收集,数据处理,数据分析等过程的不确定性,数据收集是否完整和齐全,数据处理是否合理和准确,数据分析是否及时和有效,结果的解读是否标准一致等等,几乎每一个环节都存在不确定性 不确定性让管理变得扑朔迷离,各种表象掩盖了事实。如果企业管理者缺乏对信息和数据的洞察力,缺乏透过信息表象追溯本源的分析判断能力,缺乏大局观和利弊差异的决断能力,缺乏决策后可能后果的预测预防推算能力,即使有了客观完整的数据,也不会让企业管理变得简单。
数据能够为业务赋能,但也要清楚事物是动态变化的,任何预测都存在不确定性,必经结合现状和需求,通过“数据和业务的双引擎驱动”循序渐进的推动企业的数字化转型。
1.估算北京市一日卖出的油条数量
供给和需求层面分析问题
角度一(需求层面):北京市一天卖出的油条=早饭吃油条的人数*每人吃的油条的数量北京市约有人口 2000 万人,假设 20 人中有 1 人选择早饭吃油条,则有 2000÷20=100 万人。每人每次吃 1 根油条。 因此,北京市一天卖出约100*1=100 万根油条
角度二(供给层面):北京市一天卖出的油条=北京油条店的数目*每家店卖出的油条数目北京市面积约 16410 平方千米,五环内面积约 735 万平方千米,若每 1 平方千米有 2 家油条店,则有 735*2=1470 家;五环外有约 15700 平方千米,若每两平方千米有 1 家油条店,则有 15700÷2=7850 家。由此,北京共有油条店约 9320 家。假设每家油条店每天卖出 100 根油条。那么,北京市一天卖出 9320*100=93.2 万根油条 结果分析:根据两个角度的估算,北京市一天可以卖出的油条数量约在 100 万左右。仍有一些因素可能导致误差,如五环内外油条店的分布密度尚待考证,可通过抽样调查使其更为精准。
如何估算京东一日订单量?
角度一:京东一日订单量=(中国网民数量*使用京东的比例)÷用京东购物的天数 间隔据《中国互联网络发展状况统计报告》统计显示,截至 2018 年 12 月,我国网民规 模达 8.29 亿。据调查,京东市场占有比约为16%,则假设网民中正在使用京东的 比例为 16%,则有 1.326 亿人。若京东用户平均每一个月用京东购物一次,则京东一日订单量=13260万÷30=442 万
角度二:京东一日订单量=京东物流配送人员人数*每日可送达订单数京东订单由京东物流负责配送,京东共有 18 万物流配送人员。根据招聘信息,一 位物流配送员每天工作 10 小时,每月休息 4 天,则每天工作 8 小时 40分钟。若配 送一个订单需要 15 分钟,则一天可送约 35 单。由此,京东一日订单量=18*35=630 万结果分析:根据两个角度的估算,京东一日订单量约为 400~700 万。仍有一些因素 可能导致误差,如京东用户使用京东购物频率尚未考证,可用过用户调查使其更为准确。
- ↑ 1.0 1.1 1.2 1.3 “企业数字化转型:聊聊数据思维 .腾讯新闻. 2022-7-22
- ↑ 渔好学.什么是数据思维?.知乎.2021-05-02
- ↑ “数据思维的六角度模型.鸟哥笔记. 2020-11-19
- ↑ “数据思维的关键是什么?.一个数据人的自留地. 2022-10-05
- ↑ 梁旭鹏.数据产品经理必备思维之——数据思维.人人都是产品经理.2019-04-01