淘新聞

著重發力智慧家居,思必馳從“成長榜”到“最佳雇主”的進擊

雷鋒網「新智造」正在啟動“新智造成長榜2017”評選活動,我們將對人工智慧與機器人行業進行大規模報導、梳理和調研,並聯合數十家著名投資機構根據這些創新公司的技術實力、商業能力和成長性進行深度評選,最終從多個領域分別選出一些極具潛力成長性的創新公司。如果你想參與我們的評選,可點擊

「報名」

連結,或通過郵箱xinzhizao@leiphone.com聯繫我們!

去年8月12日,在第一屆CCF-GAIR 全球人工智慧與機器人峰會舉辦的當晚,CCF-GAIR的承辦方雷鋒網聯合近30家創投與資本機構、資深學者與產業界代表一起,共同為25家創業公司頒出AIR Top 25成長榜(今年正式更名為「新智造成長榜」)榜單。

此次AIR Top 25成長榜旨在發現在未來3年內在人工智慧和機器人領域最具成長性的行業創新群體。雷鋒網與上述近30名來自資本、學界、業界的代表一起,從130餘家人工智慧、機器人、智慧駕駛等領域的創業公司中篩選,並最終形成了AIR Top 25成長榜單,智慧語音技術開放平臺思必馳也成為了上榜企業的其中之一。

而今據第一屆CCF-GAIR峰會已經有很長一段時間了,第二屆的CCF-GAIR峰會即將在今年7月7日召開,在開始之前,雷鋒網「新智造」對去年上榜的企業做了一次回訪,聊一下他們近一年來的發展狀況,本篇就是雷鋒網「新智造」對思必馳的回訪內容。

業務偏重變化

思必馳的CMO龍夢竹告訴雷鋒網「新智造」,過去這一年對思必馳來說,最大的變化之一,就是智慧家居領域在總體業務的重點程度提升了很多,這其中有三個業務領域的產品發展得最快:分別是音箱、白電和故事機。

從解決方案來說,音箱和故事機的解決方案這兩個是重點。

而機器人市場方面,較去年來講,消費機器人在今年也稍微降溫了一些,讓思必馳在這方面也有所調整。

智慧玩具市場的升溫,讓智慧型機器人整體的市場有些下降,所以我們在消費機器人領域的業務重點程度也降了些。但是關於故事機我們最近也在爭論,是應該把故事機看做一個智慧家居的產品還是看成一個微型的機器人,這個還沒有個準確的說法。

在此前,思必馳在車載方面發力很猛,市場能能夠見到諸多後視鏡都在使用思必馳的方案,今年以來,隨著車機4G功能的提升,智慧車機的整體市場發展明顯迅速升溫,思必馳也加重了對智慧車機的發力程度。

另外,近一年,思必馳的合作客戶按照數量來算,大概增長了30%左右。其中一些標誌性的客戶和產品都是大家耳熟能詳的,比如小米互聯網音箱、聯想的電視、音箱以及海爾的馨廚冰箱等等。

技術反覆運算和突破

系統反覆運算

對於思必馳的對話作業系統AIOS來說,在去年CCF-GAIR峰會至今,期間最重大的變革就是完成了3.0版本的升級。

據介紹,AIOS15年10月推出,在去年CCF-GAIR峰會的時候是2.0版本,而現在最新的版本是已經是AIOS 3.3了,也就是說,從去年大會到現在,AIOS已經升級版本大概四五次了。

技術突破

龍夢竹告訴雷鋒網「新智造」,近一年,思必馳在技術上有了兩個重大的突破。

抗噪語音辨識

去年下半年,思必馳在抗噪語音辨識方面推出了一個新的演算法模型——VDCNN。

一直以來,雜訊環境下的語音辨識都是一個難題。

目前基於深度學習的主流語音辨識技術及引擎,已經可以在很多信噪比相對比較好的環境下取得良好的準確率,但是在面對真實環境下的多類別強雜訊情況環境(比如車載雜訊、家居遠場回聲等),性能變會急劇下降,遠遠不能滿足實際應用的需求。

為此,思必馳上海交大聯合實驗室對此問題進行了研究,歷時一年多推出了VDCNN演算法模型。

根據思必馳官方技術介紹中的描述:

相比于傳統語音模型僅使用1至2層卷積層,思必馳通過堆疊較小的卷積層和池化層,將語音模型中的卷積層的深度提高到了10層以上。利用小卷積核更加精細的局部刻畫能力和頻率不變性描述,能夠更好地在語音模型的內部實現了聲學自動降噪的能力。

龍夢竹告訴雷鋒網「新智造」,該演算法在雜訊環境語音辨識的業界基準庫Aurora4上,取得了7.09%的詞錯誤率,而國際的平均水準是10%左右。

解碼框架

在通常語境下,大詞彙連續語音辨識由於詞彙量龐大且沒有固定語法,會造成搜索空間非常龐大,導致識別速度緩慢等問題。

目前,通過離線基於WFST的搜索空間預優化、線上逐幀同步維特比解碼、結合可變幀率分析等傳統做法都可以加快語音辨識速度,但是,離線優化效果有限,逐幀搜索計算量大,而大量剪枝演算法會引入搜索誤差。因此目前主流的大詞彙連續語音辨識系統只能工作在雲端。

近來,連接時序模型(CTC)取代傳統隱瑪律科夫模型(HMM),被應用到語音辨識中,其特點顯著,能夠針對識別序列進行整體建模,帶來更好的前後文建模能力,使語音辨識的建模單元顯著減少,並使龐大搜索空間相應減小。

另一方面,模型本身建模了多幀對一個音素的映射關係,使得模型輸出的聲學資訊集中。根據模型輸出特點,適宜採用更長的搜索步長,由逐幀同步解碼,轉變為音素同步解碼,從而減少了搜索計算量。

思必馳結合以上兩點改進,研發了新型解碼框架Phone Synchronous Decoding,使語音辨識系統的速度累積提高20-30倍,記憶體下降50%以上,從而使得大詞彙連續語音辨識可以應用於離線手持設備;而基於該系統提出的置信度演算法,得益于集中的聲學資訊和相應設計的優化演算法,取得近一倍的提升。顯著改善了語音辨識系統的使用者體驗。

以上就是思必馳在去年CCF-GAIR至今在產品和技術上的成長,此外,龍夢竹還告訴雷鋒網「新智造」,思必馳今年還會繼續參加第二屆CCF-GAIR峰會,並且他們最近還在準備另外的一些技術,不過還在保密階段,屆時會在大會上一舉公佈。

人員變動和融資

自去年CCF-GAIR至今,思必馳已經完成了一輪融資,即去年9月份的C輪融資,具體的金額和資方都沒有公佈。

龍夢竹告訴雷鋒網「新智造」,在去年10月,思必馳已經從這筆融資中拿出幾千萬來做員工的福利政策,比如員工可以享受30萬的購房免息款。

在員工方面,思必馳目前員工將近300人,而去年CCF-GAIR期間只有200左右,較去年增加了近百人,據悉,在新招員工中,技術研發和專案產品占大部分,因為拓展了一些新專案,在專案開發和商務產品團隊建設方面都需要投入。

從“成長榜”到“最佳雇主”

去年的成長榜TOP 25,和今年即將推出的「新智造成長榜」一樣,旨在未來3年內在人工智慧和機器人領域最具成長性的行業創新群體,其中評選上榜的標準其中一條是具有「三年十倍增量的潛質」。

去年思必馳估值10億,今年年初已經達到了20億。

 三年十倍,也是我們的目標,目前看應該是靠譜的。

經過一年的成長,今年思必馳仍會參加今年7月7日的CCF-GAIR峰會,據悉,今年峰會上,思必馳方面還會有更多更大的料要爆。此外,思必馳除了報名了新的「新智造成長榜」的評選,還參加了雷鋒網聯合旗下人工智慧頻道AI科技評論、環球科學以及BOSS直聘共同重磅推出的AI領域雇主評選榜——「2017 AI 最佳雇主」的評選活動,從“成長榜”到“最佳雇主”,見證了思必馳的成長,也證明了我們榜單對未來的預見力。