工业大数据分析
出自 MBA智库百科(https://wiki.mbalib.com/)
目录 |
工业大数据分析是利用统计学分析技术、机器学习技术、信号处理技术等技术手段,结合业务知识对工业过程中产生的数据进行处理、计算、分析并提取其中有价值的信息、规律的过程。大数据分析工作应本着需求牵引、技术驱动的原则开展。在实际操作过程中,要以明确用户需求为前提、以数据现状为基础、以业务价值为标尺、以分析技术为手段,针对特定的业务问题,制定个性化的数据分析解决方案。
工业大数据分析的直接目的是获得业务活动所需各种的知识,贯通大数据技术与大数据应用之间的桥梁,支撑企业生产、经营、研发、服务等各项活动的精细化,促进企业转型升级。
工业大数据的分析要求用数理逻辑去严格的定义业务问题。由于工业生产过程中本身受到各种机理约束条件的限制,利用历史过程数据定义问题边界往往达不到工业的生产要求,需要采用数据驱动+模型驱动的双轮驱动方式,实现数据和机理的深度融合,能较大程度去解决实际的工业问题。
工业数据分析的基本任务和直接目标是发现与完善知识,企业开展数据分析的根本目标却是为了创造价值。这两个不同层次的问题,需要一个转化过程进行关联。为了提高分析工作的效率,需事先制定工作计划。
数据分析起源于用户的业务需求,相同的业务需求会有多个可行方案,每一个方案又有若干可能的实现途径。例如,面对减少产品缺陷的业务需求,可以分成设备故障诊断和工艺优化等方案。而设备诊断又可进一步根据设备和机理的不同,分成更明确的途径,如针对特定设备特定故障的诊断。遇到复杂问题,这些途径可能会被再次细分,直至明确为若干模型。首先了解到的输入输出关系,如特定参数与设备状态之间的关系,这些关联关系即为知识的雏形,然后需要寻找适当的算法,提取和固化这些知识。
知识发现是个探索的过程,并不能保证每次探索都能成功,上述计划本质上是罗列了可能的方案。只要找到解决问题的办法,并非每一条方案或途径都需要进行探索。在不同的途径中,工作量和成功的概率、价值成本都是不一样的,一般尽量挑选成功概率大、工作量相对较小、价值大成本低的路径作为切入点,尽量减少探索成本。在项目推进或者探索的过程中,还会根据实际的进程,对预定的计划及顺序进行调整。计划制定和执行过程,本质上体现了领域知识和数据分析知识的融合。其中,方案和途径的选择,要兼顾业务需求和数据条件。
根据业务目标的不同,数据分析可以分成四种类型:
描述型分析:描述型分析用来回答“发生了什么”、体现的“是什么”知识。工业企业总的周报、月报、商务智能(BI)分析等,就是典型的描述型分析。描述型分析一般通过计算数据的各种统计特征,把各种数据以便于人们理解的可视化方式表达出来。
诊断型分析:诊断型分析用来回答“为什么会发生这样的事情”。针对生产、销售、管理、设备运行等过程中出现的问题和异常,找出导致问题的原因所在,诊断分析的关键是剔除非本质的随机关联和各种假象。
预测型分析:预测型分析用来回到“将要发生什么?”。针对生产、经营中的各种问题,根据现在可见的因素,预测未来可能发生的结果。
处方型(指导型)分析:处方型(指导型)分析用来回答“怎么办”的问题。针对已经和将要发生的问题,找出适当的行动方案,有效解决存在的问题或把工作做得更好。
业务目标不同,所需要的条件、对数据分析的要求和难度就不一样。大体上说,四种问题的难度是递增的:描述性分析的目标只是便于人们理解;诊断式分析有明确的目标和对错;预测式分析,不仅有明确的目标和对错,还要区分因果和相关;而处方式分析,则往往要进一步与实施手段和流程的创新相结合。
同一个业务目标可以有不同的实现路径,还可以转化成不同的数学问题。比如,处方型分析可以用回归、聚类等多种办法来实现,每种方法所采用的变量也可以不同,故而得到的知识也不一样,这就要求要对实际的业务问题有着深刻的理解,并采用合适的数理逻辑关系去描述。
工业大数据分析的根本目标是创造价值。工业对象的规模和尺度不同,价值点也有所不同,数据分析工作者往往要学会帮助用户寻找价值。价值寻找遵循这样一个原则:一个体系的价值,决定于包含这个体系的更大体系。所以,确定工作的价值时,应该从更大的尺度上看问题。对象不同,隐藏价值的地方往往也不尽相同。下面是常见的价值点。
1、设备尺度的价值点
船舶、飞机、汽车、风车、发动机、轧机等都是设备。设备投入使用之后,首先面对的就是如何使用,包括如何使用才能有更好的性能或更低的消耗、如何避免可能导致造成损失的使用;其次是如何保证正常使用,也就是如何更好更快更高效地解决设备维修、维护、故障预防等问题。除此之外,从设备类的生命周期看问题,分析下一代设备进行设计优化、更方便使用等问题。
2、车间尺度的价值点
按照精益生产的观点,车间里面常见的问题可以划分为七种浪费:等待的浪费、搬运的浪费、不良品的浪费、动作的浪费、加工的浪费、库存的浪费、制造过多(早)的浪费。数据分析的潜在价值,也可以归结到这七种浪费。一般来说,这七种浪费的可能性是人发现的,处理问题的思路是人类专家给出的。人们可以用数据来确定他们是否存在、浪费有多少,并进一步确定最有效的改进方法。
3、企业尺度的价值点
除了生产过程,工业企业的业务还包括研发设计(创新)、采购销售、生产组织、售后服务等多方面的工作。相关工作的价值,多与跨越时空的协同、共享、优化有关。比如,把设计、生产、服务的信息集成起来;加强上下级之间的协同、减少管理上的黑洞;把历史数据记录下来,对工业和产品设计进行优化;把企业、车间计划和设备控制、反馈结合起来等等。随着企业进入智能制造时代,这一方面的价值将会越来越多。然而,问题越是复杂,落实阶段的困难越大,应在价值大小和价值落地直接取得平衡。
4、跨越企业的价值点
跨越企业的价值点包括供应链、企业生态、区域经济、社会尺度的价值。这些价值往往涉及到企业之间的分工、协作、以及企业业务跨界重新定义等问题,是面向工业互联网的新增长点。
工业大数据分析工作的特点和理念,往往不同于商务大数据分析。其本质原因是工业过程对分析结果的精度、可靠度要求高,而工业对象和过程本身的复杂性也高。同时,工业界追求可靠性,对相关问题往往已经有了相对深入的研究。数据分析得到的知识,必须超越人们以往已有的知识,才能创造价值。这也提高了数据分析的价值创造门槛。换而言之,工业大数据的分析,往往要在更差的条件下得到更好的结果。
工业大数据分析困难程度的增加,会引发分析方法的质变。对于复杂的工业过程数据分析,人们往往要强调因果性,而不能仅仅止步于相关关系;强调领域知识和数据分析过程的深度融合,而不是漠视已有的领域知识;强调复杂问题简单化,而不是追求算法的复杂和高深。这些思想变化的本质,都是问题复杂度的增加引发的。
工业对象复杂度的增加,也会导致分析工作失败可能性的显著增加。要提高数据分析的工作效率,关键之一就是设法降低分析过程失败的概率,所以数据分析的前期准备性工作和后期的评估和验证工作就显得特别重要。
1) 设定不具备价值的目标
数据分析的目的是获得新知识或者对知识进行更加深刻、准确的认识,而不是去证明领域内常识的正确性或研究已有的知识。分析师缺乏领域常识时,就不容易分辨哪些知识才是值得研究的,进而耽误了大量时间。例如:有人要分析化学元素对材料性能的影响,终于发现某个元素对性能有显著影响,而该知识已是领域内的常识,造成了较高的探索成本。
2) 业务上难以实施的目标
获得知识的目的是为了应用,预测和控制是典型的应用,但是并非所有的数据都能用来预测和控制。比如,用于预测的数据应该在事件发生之前产生;用于控制的变量要考虑经济可行性。
3) 分析难度过大的目标
数据分析是为业务需求服务的,要注意避免研究投入高、产出低的问题。有些分析结果虽然很好,但是花费了大量的时间和精力,大大超出预期,从投入产出比上看,未必合适。与此同时,也有些分析结果非常好、非常有用,甚至出乎人们的预料,而花的时间也非常少。这些现象表明,我们对分析结果的投入产出比事先缺乏认识。
1) 不能及时终止子目标
在很多情况下,数据条件往往不能支撑预期的目标,往往会导致分析项目高投入、低产出的问题。导致这种情况的原因,未必是数据分析算法的问题,而是数据本身的问题。数据质量很低时,难以得到高质量的分析结果。为避免这种情况,应事先对数据的质量和条件进行评估。
2) 目标衡量的失误
数据分析师往往把“平均精度”作为衡量分析结果的唯一标准。对于可靠性要求很高的工业问题,此种做法有较大的漏洞和潜在风险。有些精度很高的模型,在实际中应用时,却发现根本无法达到预定的效果,甚至得到与期望完全相反的结果、给企业造成很大的损失。导致这种现象的典型原因,是没有区分相关性和因果性或者没有仔细研究这些分析结果适用的范围,比如独立同分布特性。由于工业数据反映的是“系统性”,这种问题的发生是常见的。工业界对结论的可靠性要求很高,对分析结果的评估,是值得仔细研究的问题,而多数团队对这个问题的重要性认识不足。
3、避免失误的方法
欲避免数据分析工作的陷阱,就须事先了解可能遇到的问题和困难,以避免在工作过程中遇到不必要的麻烦,提高数据分析的价值创造能力。
数据分析遇到的问题,往往来源于数据分析师对业务过程、目标等认识不清。这些问题的根源往往都是前期的准备工作做得不够、匆匆进入后面的工作所导致,即工业领域的数据分析不能仅仅把数据分析工作看成利用单纯的数据分析技巧的过程,而是数据分析和领域知识融合的过程。“胜兵先胜而后求战,败兵先战而后求胜”。在进行深入的数据分析之前,必须对业务需求、专业领域背景知识、数据的基本情况作尽可能深入的理解,明确问题的内涵,要避免在“最后一公里”上“上功亏一篑”。
要正确评估问题的难度。尽量用少的时间代价换取高的成功率和更多的价值。同时,要学会选择合适的方法解决合适的问题,还要对分析结果的可靠度有科学的评估办法,避免技术在应用中出现负面作用。
- 《工业大数据分析指南》.工业互联网产业联盟.2019-2