淘新聞

三大案例分享:如何用物聯網資料來構建工業智慧 | 硬創公開課

得益於物聯網和工業4.0的興起,最近幾年,不少企業已經通過物聯網的手段,建立起了資料獲取,監控和展示的平臺。對於資料的深層次應用,例如利用最新的機器學習演算法,對資料進行智慧化提升,則是目前工業用戶進行數位化轉型的必由之路。

從現在的趨勢來看,人工智慧的熱點領域都集中在語言、圖像交互類, 或者商業應用類。對於工業領域,基於物聯網獲取的流式資料,如何通過人工智慧來實現效率提升?在使用這些資料的過程中,如何避免踩坑,順利進行方案的部署?這是工業界需要解決的問題。為此,本期硬創公開課,雷鋒網邀請了覺雲科技CEO常偉來為大家講解如何用物聯網資料來構建工業智慧。

嘉賓介紹

常偉先生是覺雲科技的的創始人及CEO,在成立覺雲科技前,他來自於微軟上海,是物聯網方案部門負責人,負責基於雲端的物聯網的服務元件設計和推廣,包括了Azure的PaaS和SasS的服務在中國的落地,提供雲端的資料接入,協定轉換,服務分配,平臺集成,分析和展示。主要客戶包括上海觀致,中國福特、中國通用等企業。

以下內容整理自本期公開課,雷鋒網做了不改變願意的編輯:

整個互聯網到物聯網走到現在是可以通過資料其解決一些問題的。

在資訊化時代,我們經歷了從資料到資訊到知識再到智慧的過程,我們也相信在商業、工業領域都有大量的資訊或者資料,而這些資料的價值就需要業界來挖掘,最後才會走到金字塔頂端智慧所要解決的問題。

大家常見的是交互類的智慧,例如語音辨識、圖像識別等,毋庸置疑,這是現在很熱門的一類課題,但今天講的內容主要聚焦工業領域,怎麼利用工業智慧解決工業領域的問題。

演算法是基礎

這張圖片列舉了常見的幾種演算法,分類、回歸、推薦、異常點檢測、聚類。分類主要是用來區分不同的群體,回歸主要用來預測,例如預測一台設備什麼時候發生故障;推薦主要解決的是,用戶買了商品A之後,可以推薦商品B或者C;異常點檢測主要針對沒有歷史記錄如何在一個向量集來找出異常點。

現在這些演算法都已經存在,我們的任務主要是利用這些演算法來應用到商業應用或者工業應用當中。

工業物聯網的範圍很大,包括資料傳輸、採集、通信以及平臺的展示等。覺雲目前做的是工業演算法和模組。這處於工業物聯網中游的位置,即拿到工業領域的流失資料後,再進行智慧分析得出結果後在跟企業應用系統做集成。

工業智慧怎麼做?

在工業智慧裡面,一般使用的資料是流式資料,採集的資料大部分來自設備端的資料,例如,泵、變速箱和機床這些和設備相關的變數。

在採集完資料後,可以通過演算法模型進行建模評估,評估完之後就可以給客戶提供預測性維護、能效管理以及品質管制等。

針對不同業務領域提供演算法模型,這些演算法模型還會推送出一些結果。最後還會有不同的部署方式。有兩種,一種是結果會嵌入到現有的設備管理系統平臺,第二種是會構建SaaS服務平臺,例如機床診斷模組。

大資料分析專案的基本流程

工業大資料分析是最近一兩年有了工業物聯網後才興起的。目前覺雲是基於既有經驗,已經有行業的know how,可以在8周的時間裡進行部署。

在這期間,主要做兩大工作:第一階段是資料的準備,包括資料導入、資料清洗和基本的視覺化;第二部分是資料建模,包括特徵和演算法的選擇、模型測試和評估。這兩大工作後面會結合實際案例作分析。

在這兩部分工作做完後,就是資料運營了。上述模型通過視覺化之後會部署到現有的平臺或者是SaaS服務雲。在這部分,需要有日常的運營工作,例如應用端的部署、分值計量和衡量指標,到最後還會回饋到第一個階段,演算法不是一成不變的,隨著資料的積累、故障調優,會重新回饋到第一階段。所以實際上,演算法是在雲端或者在本地的自學習的演算法,隨著資料的積累,也會更加智慧。

案例分享

一、電梯預測性維護

電梯是量很大的設備,對安全品質要求很高。在電梯的智慧化轉型過程中,有三個階段。

第一階段以安全監控為主,主要是東芝、日立這些日系企業通過匯流排系統收集電梯運行的即時資料,根據預先定義的閾值(例如最高速度)進行報警。

第二階段就是三菱電梯通過歷史資料進行存儲,然後對地洞次數、執行時間做統計。統計指的是資料分析來預測電梯的健康狀況。第一階段和第二階段主要用的是歷史資料或者是人工統計的方式來做分析。

第三階段就是智慧預測了,這一階段可以通過電機匯流排和外加感測器的方式來收集即時資料,這些資料可以從系統層面來分析故障、能耗等。與此同時,隨著這些資料的積累,還可以建立一個回修專家系統,像OTIS、蒂森克虜伯這些公司已經在做這部分工作。

Gartner曾對蒂森克虜伯的方案做出這樣評價,它是電梯預測性維護的第一個方案,它可以告訴技術工人怎麼去維護。蒂森是一家德國高端電梯公司,在北美一共有一百萬的電梯在運行。蒂森和微軟、CGI合作,通過物聯網監控平臺BlueBox,可以把資料即時上傳到雲端,在雲端進行資料存儲分析,最後把結果展現到終端,所以售後團隊就可以提前知道電梯的情況,這樣就可以實現停機時間縮短一半。

雖然很多都能做到即時監控,但大資料需要做的是用雲來做即時的分析。

這張圖顯示了某台電梯在某個位置的健康狀況。從圖中可以看到,這台設備的健康指數是70%,這其中採集了溫度、電梯速度高速、電梯門關門時間等,通過這些數值的綜合評估來給電梯做健康值的打分。

下一步就是即時性預測。採集這些電梯變數之後,通過分析就可以得出預測,再對工作人員進行通知,設備在幾天之後會出現故障。

這是蒂森電梯的應用架構

從圖中可以看出,BlueBox獲取資料後,進行前端處理並做存儲。事實上,在這一階段,做存儲並不容易,流式資料的採集、展示和分析,對資料品質要求很高。此外,還可以利用機器學習來對即時監控做評判。

做大資料分析出發點是解決使用者痛點,工業物聯網和傳統交互體驗的人工智慧相比,最大的區別就是工業智慧解決的是顯示存在的問題。預測維護可以説明客戶進行提前預警、備貨,減少人力成本;創建新的可靠性標準;即時監控,可以給電梯提供商、業務和用戶帶來安全保障。

二、變速箱預測性維護

和電梯一樣,變速箱也是一台成套設備,由電機、減速箱、驅動器、鋼絲繩等部分組成。而對成套設備做預測性維護並非是預測成套設別的生命週期,最終都是對系統的組成單元做預測性維護,把問題聚焦。

這是整體的分析框架

資料來源來自客戶,包括報警資料、類比資料(電流電壓溫度等)、數位資料(開關位置)、標籤描述。拿到這些資料後,就要做相應的資料存儲和分析。這裡主要做兩部分工作:1.視覺化,主要目的發現問題的時間分佈在哪,從該圖可以看出,我們收集到的資料量非常大,類比資料175M,數位資料10M,報警歷史記錄有1740條。。

然後再通過機器學習進行建模,對故障模型進行分析,分析後把故障預測的結果推送到視覺化工具。

在之前的案例中我們發現,每個這些問題發生的頻率是不同的。變速箱過熱是常態問題,5個月一共發生了1340起,占到了整個故障的77%,如果能準確預測這類問題,那麼就能結局大部分問題。

除此之外,需要注意的是,有些問題之間也存在關聯,例如變速箱過熱會產生其它的問題。當某天變速箱過熱問題特別集中,我們要分析這其中的原因,這對資料建模、特徵分析、特徵工程非常有説明。

拿到資料做完分析之後,下一個工作是要工程處理。

工業智慧資料有個特點:低維高頻,維度不多(相比購買行為預測的變數很少),但是頻次很高,每秒都在採集。所以,我們需要有相應的處理辦法:對感測器的資料做聚合,最大、最小、中值、標準方差等,主要目的是讓初始變數更加豐富,變數越多預測的準確性也越高。

然後是資料建模。對於故障預測,我們進行了多個模型的選擇,尤其是在分類和異常檢測方面。分類是要告訴設備是否會壞,這會用到二元分類、回歸、多元分類和異常點檢測。

建模後要進行模型評估

這張圖顯示的是,在自由的演算法包中進行評估來預測下5個小時內發生變速箱過熱的概率。右下角是預測的對比值(邏輯回歸、增強決策樹、決策樹、支持向量機):

最終評估下來,增強決策樹演算法在準確性、精准度等擁有很好的表現,所以最後選擇用這個算來作為變速箱過熱的預測。

最後是模型部署。做完模型之後,輸出的結果是一條記錄,例如變速箱在未來5個小時發生過熱的概率是多少。這之後有三種選擇:第一是和現場維修工單系統對接,第二是把結果推送到系統監控平臺,另外也會發郵件提醒給管理人員。

從目前來看,能做資料獲取的公司一般都具備這樣的維修工單系統平臺。

變速箱智慧化主要給客戶帶來了四個方面的價值:提升設備、人員的生產力;減少故障停機,提高客戶滿意度;建立智慧碼頭;構建新的價值體系。

另外,這個案例還得出了一個結論:如果要做成套設備的話,一定要從元件開始做預測。

三、通過預測性模型進行刀具故障預測

在工業製造裡面,機床最核心的問題就是刀具問題。實際上,刀具之於機床就如牙齒之於人類,如果刀具發生問題能提前感知,才能第一時間修復。

如果問題發生之後,再去修復就已經產生了廢品,這也會造成更大的損失。

上圖顯示的是某公司通過控制器收集了不同機床運行的資料,包括電流、電壓等。這裡有幾個原則:因為影響刀具壽命的變數很多,所以需要人工智慧演算法來預測;另外,可以和多年經驗曲線進行結合;刀具壽命是非線性關係,一定要通過即時資料進行線上學習。

應用大資料演算法形成智慧化機床設備管理體系之後,會根據資料建模分為兩大問題:第一類,刀具會不會發生故障,第二類是多久發生故障。

針對第一類問題,用分類模型來解決,例如選擇用邏輯回歸、決策樹還是神經網路來告訴我們會不會壞,如果會壞,就來到下一個問題。預測多久發生故障,則主要用決策樹、泊松回歸、神經網路回歸等來告訴設備提供商設備多久會壞。

總結

之前,我們看到的智慧演算法主要聚焦在商業或者交互領域,現在我們正在嘗試把智慧演算法帶到工業領域。

工業智慧,解決問題的演算法體系主要分為三大類:第一是預測性維護,這對於基於物理損耗為主的設備是最行之有效的演算法;第二類是能效管理;第三類是品質管制。

精彩問答

Q:對於流程工業生產環境下的生產設備故障預測,在資料獲取匯總階段,需要考慮哪些因素?或者需要哪些資料登錄呢?

A:這裡面有兩個層次的問題:第一個是自上而下來做,現在流程工業裡面,DCS(雷鋒網注:分散式控制系統,Distributed Control System)已經採取了很多資料,現在我們用這些DCS資料,我們可以做一些基本預測性維護;

第二種是自下而上,以泵為例,DCS有些資料是關於泵的,但是有些資料是沒有的,在這種情況下,一定是前裝+後裝的方式。前裝就是利用DCS固有的資料,後裝就是加裝一些沒有的資料,這樣配合才能準確預測泵或者管道的預測性維護的點。

我認為前裝方式所拿到的資料是最好的,後裝則更具挑戰。

Q:阿裡雲正式發佈了ET工業大腦。這個大腦目前已經被用在了協鑫光伏工廠裡,可以提高1%的生產良品率。常偉老師如何看待這個產品?對傳統工廠來說,怎麼選擇?

A:阿裡雲這個是上文提到的第三類解決方案,品質管制方案。對於生產良品率來說,每個工廠都要case by case做分析,對傳統工廠肯定需要找一個比較靠譜的方案。

Q:小型工廠缺乏資料的積累,以您的經驗來看,對我們來說接入大資料方案需要考慮哪些問題?

A:小型工廠我建議採用SaaS解決方案,現在很多服務商提供一些現成的SaaS解決方案,幫助現有的工廠機床、泵等做到雲端,然後再來根據資料做分析,對小型工廠來說,這種方案還是比較靠譜可行的。

Q:國內政府一直在喊數位化轉型,從目前來看,國內技術是否成熟了?

A:從現在來看,尤其是對製造企業而言,技術是比較成熟了,數位化轉型無非是資料獲取、傳輸、存儲和分析這幾塊。目前的企業在幾部分都有比較成熟的解決方案,不過有些企業的管理水準有待提高。

大家一直在談我們的工業水準比較低,現在有一個問題是我們的管理能力是否能支援中國製造2020。

Q:工業化轉型最大的挑戰是什麼?怎麼去克服這些問題?

A:最大的挑戰我們認為有兩個方面:一個是人的管理水準;第二個是技術方面的問題。

覺雲有一個客戶是做刀具的,通過傳統的方式他認為沒有法提升了。他們希望通過數位化的方式來提取資料,來告訴他這種刀具在加工哪種材料和工藝是最佳的,這就可以幫助他去挑戰國外一些企業。

目前來看,數位化轉型是解決技術問題的主要方式。做數位化平臺第一步是建立數位化預測,第二步是數位化工單系統,第三步建立和工藝之間的關係,這幾步下來最少要2-3年,所以工廠要對這個週期有一個認知。