淘新聞

從引擎聲預測車輛故障!深度學習應用於通用聲音識別

有一個困擾眾多司機的問題:什麼時候對愛車進行檢修?

大多數車主會定期去 4S 店或修理店進行保養。但眾所周知,常規保養不是“體檢”,車輛已經存在的問題未必會發現。那麼,難道只有當汽車在路上拋錨,我們才知道該送修了嗎?

這不但效率低,而且危險。當開車有急事(比如趕高鐵參加重要會議),或是在高速路上發生故障,那簡直是驚魂一刻。

對此,以色列一家名為 3DSignals 的初創公司提出了解決方案:

讓 AI 監聽早期的預警信號,比如發動機的聲音變化,來判斷車輛是否即將拋錨。

這項技術依賴於深度學習(deep learning),來理解機械設備的噪音模式,並提前預測可能發生的問題。

雷鋒網獲知,3DSignals 已開始與歐洲汽車巨頭們接觸,討論把這項深度學習技術應用於汽車以及汽車零部件製造設備的前景,以即時監控可能存在的問題。還有消息稱他們看中了自動駕駛計程車運營市場,與一家自動駕駛公司進行了初步溝通。

3DSignals 聯合創始人、演算法負責人 Yair Lavi 表示:

“一個計程車乘客很可能只在乎到達目的地。即便乘坐車輛有了故障,只要沒有拋錨,他也懶得報告。所以,對於計程車運營公司來說,3DSignals 的解決方案很有吸引力。”

深度學習已經被穀歌、Facebook 這樣的互聯網巨頭廣泛應用于圖像、語音辨識應用中。但用它來識別普通聲音信號——比如機器的運轉聲音,倒是一件少有公司涉足的稀罕事。因此,3DSignals 希望能成為這個細分市場的領軍者。

編者注:深度學習一直是雷鋒網關注的核心領域之一。想要瞭解“什麼是深度學習?”的讀者,請參考雷鋒網“

深度學習大講堂

”系列文章,

大神Yann LeCun親授:如何自學深度學習技術並少走彎路

,以及 

周志華KDD China技術峰會現場演講:深度學習並不是在“模擬人腦”

Yair Lavi 解釋說:“全世界都在用深度學習進行圖像識別,這是至今最新最火的應用。另外,AI 行業還有一部分在做深度學習的語音辨識。我認為專注於通用聲音識別的公司可能是極少數,我們是其中之一。

這是我的目標:

成為通用聲音深度學習的帶頭人

。”

製造工廠應用

3DSignals 為每一名客戶安裝超聲波麥克風,它能監測到 100 千赫以內的音訊。相比之下,人耳只能捕捉 20 赫茲至 20 千赫的聲音。該公司的物聯網服務把麥克風與計算設備連接起來,後者能處理一部分的資料,然後把資訊上傳到雲端,由深度學習演算法完成工作。客戶可以隨時通過聯網設備,比如手機和平板電腦,來查看機械設備的狀態。

3DSignals 系統流程示意:損壞的刀片,超聲波感測器,資料收集裝置,即時警報

他們的第一批客戶來自重工業領域,監測設備包括製造廠的圓形切割刀片和水電站的渦輪機。

開始,這些公司購買的是 3DSignals 不基於深度學習的初級服務。它是對特定零件(比如圓形切割鋸)進行基礎物理學建模的軟體,能預測這些零件什麼時候會達到磨損上限。

第二級服務使用了深度學習演算法,監測麥克風傳來的聲音中奇怪、不正常的頻段。訓練深度學習的樣本是標誌著機器發生普通故障的聲音模式。

第三級服務同樣採用了深度學習,只有它才能根據聲音分辨出具體的故障種類。但在此之前,客戶必須説明 3DSignals 訓練深度學習演算法:為特定聲音模式加上標籤,標明這屬於哪種故障。

Lavi 說道:“一段時間之後,我們不僅能指出故障 A 何時會發生,我們還能在它發生之前就(肯定地)說:你會在五小時內遭遇故障 A。有些問題不會立即出現,有一個惡化的過程。”

經過訓練之後,3DSignals 的深度學習演算法能以 98 % 的精確度預測特定故障。

但目前,使用 3DSignals 系統的客戶尚無法體驗這個級別的性能。他們仍在創建訓練資料庫,人工為關聯特定故障的聲音信號加入標籤。

3DSignals 表示,使用它的系統之後:

製造廠能降低 80% 的人為操作失誤;

延長 50% 的圓形切割鋸使用壽命;

降低 40% 的切割鋸突然損壞事件;

平均 15% 的生產線速度提升。

展望

這家只有一歲的初創公司目前只有 15 名員工。但它發展速度相當快,已經拿到了以色列企業家 Dov Moran 的 330 萬美元投資,後者是 USB 快閃記憶體的發明者之一。

Lavi 和他的聯合創始人同伴們正在把目光朝向幾個大市場,包括汽車和水電之外的能源市場。在 2017,他們計畫了好幾輪吸引風投的融資活動。如果一切順利,3DSignals 會在增長中的“可預測設備維護”市場繼續保持領先,向工廠、發電廠、車主提供服務。即將誕生的無人駕駛汽車市場同樣是一片藍海:它們會使人類司機變為乘客,脫離了駕駛體驗;這使得能通過聲音判斷設備狀態的深度學習 AI 肩負更大的責任。對於一家初創公司來說,有機會能在通用聲音識別領域成為領軍者非常有前途。

Lavi 說:“對我們來說,成為通用聲音識別的深度學習專家至關重要,因為當前的學術論文尚未涵蓋該領域。”

對初創科技企業來說,合理的定位是生存下去的必要條件。

via 

ieee