工業大數據分析

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

目錄

什麼是工業大數據分析

  工業大數據分析是利用統計學分析技術、機器學習技術、信號處理技術等技術手段,結合業務知識對工業過程中產生的數據進行處理、計算、分析並提取其中有價值的信息、規律的過程。大數據分析工作應本著需求牽引技術驅動的原則開展。在實際操作過程中,要以明確用戶需求為前提、以數據現狀為基礎、以業務價值為標尺、以分析技術為手段,針對特定的業務問題,制定個性化的數據分析解決方案。

  工業大數據分析的直接目的是獲得業務活動所需各種的知識,貫通大數據技術與大數據應用之間的橋梁,支撐企業生產、經營、研發、服務等各項活動的精細化,促進企業轉型升級。

  工業大數據的分析要求用數理邏輯去嚴格的定義業務問題。由於工業生產過程中本身受到各種機理約束條件的限制,利用歷史過程數據定義問題邊界往往達不到工業的生產要求,需要採用數據驅動+模型驅動的雙輪驅動方式,實現數據和機理的深度融合,能較大程度去解決實際的工業問題。

工業大數據分析的基本過程

  工業數據分析的基本任務和直接目標是發現與完善知識,企業開展數據分析的根本目標卻是為了創造價值。這兩個不同層次的問題,需要一個轉化過程進行關聯。為了提高分析工作的效率,需事先制定工作計劃。

  數據分析起源於用戶的業務需求,相同的業務需求會有多個可行方案,每一個方案又有若幹可能的實現途徑。例如,面對減少產品缺陷的業務需求,可以分成設備故障診斷和工藝優化等方案。而設備診斷又可進一步根據設備和機理的不同,分成更明確的途徑,如針對特定設備特定故障的診斷。遇到複雜問題,這些途徑可能會被再次細分,直至明確為若幹模型。首先瞭解到的輸入輸出關係,如特定參數與設備狀態之間的關係,這些關聯關係即為知識的雛形,然後需要尋找適當的演算法,提取和固化這些知識。

  知識發現是個探索的過程,並不能保證每次探索都能成功,上述計劃本質上是羅列了可能的方案。只要找到解決問題的辦法,並非每一條方案或途徑都需要進行探索。在不同的途徑中,工作量和成功的概率、價值成本都是不一樣的,一般儘量挑選成功概率大、工作量相對較小、價值大成本低的路徑作為切入點,儘量減少探索成本。在項目推進或者探索的過程中,還會根據實際的進程,對預定的計劃及順序進行調整。計劃制定和執行過程,本質上體現了領域知識和數據分析知識的融合。其中,方案和途徑的選擇,要兼顧業務需求和數據條件。

工業大數據分析的類型

  根據業務目標的不同,數據分析可以分成四種類型:

  描述型分析:描述型分析用來回答“發生了什麼”、體現的“是什麼”知識。工業企業總的周報、月報、商務智能(BI)分析等,就是典型的描述型分析。描述型分析一般通過計算數據的各種統計特征,把各種數據以便於人們理解的可視化方式表達出來。

  診斷型分析:診斷型分析用來回答“為什麼會發生這樣的事情”。針對生產、銷售、管理、設備運行等過程中出現的問題和異常,找出導致問題的原因所在,診斷分析的關鍵是剔除非本質的隨機關聯和各種假象。

  預測型分析:預測型分析用來回到“將要發生什麼?”。針對生產、經營中的各種問題,根據現在可見的因素,預測未來可能發生的結果。

  處方型(指導型)分析:處方型(指導型)分析用來回答“怎麼辦”的問題。針對已經和將要發生的問題,找出適當的行動方案,有效解決存在的問題或把工作做得更好。

  業務目標不同,所需要的條件、對數據分析的要求和難度就不一樣。大體上說,四種問題的難度是遞增的:描述性分析的目標只是便於人們理解;診斷式分析有明確的目標和對錯;預測式分析,不僅有明確的目標和對錯,還要區分因果和相關;而處方式分析,則往往要進一步與實施手段和流程的創新相結合。

  同一個業務目標可以有不同的實現路徑,還可以轉化成不同的數學問題。比如,處方型分析可以用回歸、聚類等多種辦法來實現,每種方法所採用的變數也可以不同,故而得到的知識也不一樣,這就要求要對實際的業務問題有著深刻的理解,並採用合適的數理邏輯關係去描述。

工業大數據分析的價值

  工業大數據分析的根本目標是創造價值。工業對象的規模和尺度不同,價值點也有所不同,數據分析工作者往往要學會幫助用戶尋找價值。價值尋找遵循這樣一個原則:一個體系的價值,決定於包含這個體系的更大體系。所以,確定工作的價值時,應該從更大的尺度上看問題。對象不同,隱藏價值的地方往往也不盡相同。下麵是常見的價值點。

  1、設備尺度的價值點

  船舶、飛機、汽車、風車、發動機、軋機等都是設備。設備投入使用之後,首先面對的就是如何使用,包括如何使用才能有更好的性能或更低的消耗、如何避免可能導致造成損失的使用;其次是如何保證正常使用,也就是如何更好更快更高效地解決設備維修、維護、故障預防等問題。除此之外,從設備類的生命周期看問題,分析下一代設備進行設計優化、更方便使用等問題。

  2、車間尺度的價值點

  按照精益生產的觀點,車間裡面常見的問題可以劃分為七種浪費:等待的浪費、搬運的浪費、不良品的浪費、動作的浪費、加工的浪費、庫存的浪費、製造過多(早)的浪費。數據分析的潛在價值,也可以歸結到這七種浪費。一般來說,這七種浪費的可能性是人發現的,處理問題的思路是人類專家給出的。人們可以用數據來確定他們是否存在、浪費有多少,併進一步確定最有效的改進方法。

  3、企業尺度的價值點

  除了生產過程工業企業的業務還包括研發設計(創新)、採購銷售、生產組織、售後服務等多方面的工作。相關工作的價值,多與跨越時空的協同、共用、優化有關。比如,把設計、生產、服務的信息集成起來;加強上下級之間的協同、減少管理上的黑洞;把歷史數據記錄下來,對工業和產品設計進行優化;把企業、車間計劃和設備控制、反饋結合起來等等。隨著企業進入智能製造時代,這一方面的價值將會越來越多。然而,問題越是複雜,落實階段的困難越大,應在價值大小和價值落地直接取得平衡。

  4、跨越企業的價值點

  跨越企業的價值點包括供應鏈、企業生態、區域經濟、社會尺度的價值。這些價值往往涉及到企業之間的分工、協作、以及企業業務跨界重新定義等問題,是面向工業互聯網的新增長點。

工業大數據與商務大數據分析

  工業大數據分析工作的特點和理念,往往不同於商務大數據分析。其本質原因是工業過程對分析結果的精度、可靠度要求高,而工業對象和過程本身的複雜性也高。同時,工業界追求可靠性,對相關問題往往已經有了相對深入的研究。數據分析得到的知識,必須超越人們以往已有的知識,才能創造價值。這也提高了數據分析的價值創造門檻。換而言之,工業大數據的分析,往往要在更差的條件下得到更好的結果。

  工業大數據分析困難程度的增加,會引發分析方法的質變。對於複雜的工業過程數據分析,人們往往要強調因果性,而不能僅僅止步於相關關係;強調領域知識和數據分析過程的深度融合,而不是漠視已有的領域知識;強調複雜問題簡單化,而不是追求演算法的複雜和高深。這些思想變化的本質,都是問題複雜度的增加引發的。

  工業對象複雜度的增加,也會導致分析工作失敗可能性的顯著增加。要提高數據分析的工作效率,關鍵之一就是設法降低分析過程失敗的概率,所以數據分析的前期準備性工作和後期的評估和驗證工作就顯得特別重要。

工業數據分析中的常見問題

1、業務和數據理解不當導致的失誤

  1) 設定不具備價值的目標

  數據分析的目的是獲得新知識或者對知識進行更加深刻、準確的認識,而不是去證明領域內常識的正確性或研究已有的知識。分析師缺乏領域常識時,就不容易分辨哪些知識才是值得研究的,進而耽誤了大量時間。例如:有人要分析化學元素對材料性能的影響,終於發現某個元素對性能有顯著影響,而該知識已是領域內的常識,造成了較高的探索成本。

  2) 業務上難以實施的目標

  獲得知識的目的是為了應用,預測和控制是典型的應用,但是並非所有的數據都能用來預測和控制。比如,用於預測的數據應該在事件發生之前產生;用於控制的變數要考慮經濟可行性。

  3) 分析難度過大的目標

  數據分析是為業務需求服務的,要註意避免研究投入高、產出低的問題。有些分析結果雖然很好,但是花費了大量的時間和精力,大大超出預期,從投入產出比上看,未必合適。與此同時,也有些分析結果非常好、非常有用,甚至出乎人們的預料,而花的時間也非常少。這些現象表明,我們對分析結果的投入產出比事先缺乏認識。

2、建模和驗證過程的失誤

  1) 不能及時終止子目標

  在很多情況下,數據條件往往不能支撐預期的目標,往往會導致分析項目高投入、低產出的問題。導致這種情況的原因,未必是數據分析演算法的問題,而是數據本身的問題。數據質量很低時,難以得到高質量的分析結果。為避免這種情況,應事先對數據的質量和條件進行評估。

  2) 目標衡量的失誤

  數據分析師往往把“平均精度”作為衡量分析結果的唯一標準。對於可靠性要求很高的工業問題,此種做法有較大的漏洞和潛在風險。有些精度很高的模型,在實際中應用時,卻發現根本無法達到預定的效果,甚至得到與期望完全相反的結果、給企業造成很大的損失。導致這種現象的典型原因,是沒有區分相關性和因果性或者沒有仔細研究這些分析結果適用的範圍,比如獨立同分佈特性。由於工業數據反映的是“系統性”,這種問題的發生是常見的。工業界對結論的可靠性要求很高,對分析結果的評估,是值得仔細研究的問題,而多數團隊對這個問題的重要性認識不足。

  3、避免失誤的方法

  欲避免數據分析工作的陷阱,就須事先瞭解可能遇到的問題和困難,以避免在工作過程中遇到不必要的麻煩,提高數據分析的價值創造能力

  數據分析遇到的問題,往往來源於數據分析師對業務過程、目標等認識不清。這些問題的根源往往都是前期的準備工作做得不夠、匆匆進入後面的工作所導致,即工業領域的數據分析不能僅僅把數據分析工作看成利用單純的數據分析技巧的過程,而是數據分析和領域知識融合的過程。“勝兵先勝而後求戰,敗兵先戰而後求勝”。在進行深入的數據分析之前,必須對業務需求、專業領域背景知識、數據的基本情況作儘可能深入的理解,明確問題的內涵,要避免在“最後一公裡”上“上功虧一簣”。

  要正確評估問題的難度。儘量用少的時間代價換取高的成功率和更多的價值。同時,要學會選擇合適的方法解決合適的問題,還要對分析結果的可靠度有科學的評估辦法,避免技術在應用中出現負面作用。

參考文獻

  • 《工業大數據分析指南》.工業互聯網產業聯盟.2019-2
本條目對我有幫助0
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目投訴舉報

本条目由以下用户参与贡献

Tracy.

評論(共0條)

提示:評論內容為網友針對條目"工業大數據分析"展開的討論,與本站觀點立場無關。

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

闽公网安备 35020302032707号