淘新聞

他比蘋果還早研發出光學防抖,現在卻加入做“機器人眼睛”的創業大軍

雷鋒網【新智造】按:SLAM 技術最早被用於核潛艇的海底定位,近年來逐漸進入民用領域,尤其是掃地機器人在消費市場的推廣,使得SLAM作為機器視覺的解決方案,備受重視。基於三維視覺的 vSLAM 技術也被廣泛應用與機器人、VR、自動駕駛等智慧設備上。本篇文章為雷鋒網新智造頻道 SLAM 專題的其中一篇,對初創企業遠形時空的報導,主要介紹了其用於智慧設備的視覺感知感測器和配套的軟體解決方案,以及創始團隊對於市場、技術的看法。

雷鋒網正在啟動“新智造成長榜2017”評選活動,我們將對人工智慧與機器人行業進行大規模報導、梳理和調研,並聯合數十家著名投資機構根據這些創新公司的技術實力、商業能力和成長性進行深度評選,最終從多個領域分別選出一些極具潛力成長性的創新公司。如果你想參與我們的評選,可點擊

「報名」

連結,或通過郵箱xinzhizao@leiphone.com聯繫我們!

華中科大光電子專業畢業後,李昌檀先後在索尼、飛利浦、聯想等大廠裡工作了十幾年,具體工作略有差別,但核心一直沒變,那就是圍繞“光電子”,做手機攝像頭的系統、硬體、底層軟體和集成。

在這個行當裡,李昌檀取得了不少成績,比如在 iphone 還沒有光學防抖功能的時候,他做了中國第一款光學防抖手機,雖然由於各種原因,賣的並不好。十多年的研究,李昌檀希望自己能站在更高的維度上來看產品,他想知道使用者真實的需求是什麼,也想知道如何能做出有用的產品,但大廠分工細緻,層級嚴格,已經無法滿足他的需求。

於是,2014年李昌檀開始了第一次創業,作為初始團隊加入了一個 VR 公司 。這次創業最大的收穫,就是讓他結識了黃石生博士。黃石生畢業於清華大學電腦系,師從電腦圖形學領域的胡事民教授,在過去一直專注於圖像與視頻等媒體的研究,在圖形學與視覺領域的頂級學術會議(SIGGRAPH/SIGGRAPH Asia/TVCG)上,發表過四篇文章。

相識一年之後,李昌檀聯合黃博士,創辦遠形時空,開始了第二段創業生涯。李昌檀對雷鋒網新智造說:

我們要做一些有用的事情,技術門檻高,是一門手藝活,有很多坑,需要一個一個爬出來,不是模式的創新,也沒有很大的杠杆。

這個手藝活,就是基於視覺的 vSLAM 軟硬體解決方案。在李昌檀看來,原先做的手機,現在流行的VR、無人車、無人機等沒有本質的區別,都是用於人機交互的一個工具,底層技術是相通的。但有個區別在於,原先做相機,主要是讓人看,現在是要讓機器能夠看懂。

雷鋒網新智造瞭解到,SLAM 技術的全稱為 simultaneous localization and mapping ,即即時定位及地圖構建,SLAM 並不是一項新技術,國內外都有數十家公司在研究。黃石生介紹說,無論是定位還是地圖,分開做都不是難事,難點在於結合,同時要保證即時。

SLAM 不僅僅是一項技術,其實更是一個包含感測器和演算法實現的系統。在感測器方面,可以選擇的比較多,比如雷射雷達、攝像機、視覺里程計、GPS等,主流的是雷射雷達和攝像機。

有了感測器感知環境之外,還需要演算法實現,讓機器“看得見”。遠形時空選擇的解決方案是攝像頭+慣性導航+演算法。黃石生認為,這樣的解決方案,有以下幾個優勢:

小型化

雖然雷射雷達精度可以達到毫米級,但在工程上無法小型化,尤其是旋轉式的雷射雷達。從目前在自動駕駛領域的實現來看,都需要給雷射雷達預留很大的空間,在 VR/AR 等小型設備上,幾乎沒有用武之地。

成本低

雷射雷達成本相當高昂,旋轉式的雷射雷達成本在8000-80000美元之間,固態雷達相對便宜不少,但相比攝像頭還是非常昂貴,這對於廠商來說,成本很高。

回應頻率高

雷射雷達的回應頻率不如攝像頭,可以輕鬆達到50-60赫茲,慣性導航則更高,可以達到1000赫茲,這樣輸出資訊時就非常快。

擴展性強

使用攝像頭的解決方案,除了用來即時定位構建地圖外,用戶還可以利用它擴展其他功能,比如人臉識別、手勢等其他視覺識別的功能。

特別就 VR 領域而言,現有的視覺解決方案都是由外而內的追蹤,比如通過 Lighthouse 和 Constellation 的高精度追蹤系統,而遠形時空提供的 SLAM 解決方案,則不需要配合,是一體化的解決方案。

但以攝像頭為主的解決方案採集到的信息量大,背後需要配套非常強大的演算法來進行處理。經過李昌檀和黃石生的努力,在雙目 SLAM 和單目 SLAM 兩方面,演算法和性能都有了非常大的提升。

在vSLAM學術研究方面,有很多優秀的工作,有的已經開源(例如ORBSLAM、LSD-SLAM、OKVIS、DSO、ORB-VIO、SVO等),為追求準確性這些方法往往採用計算強度很高的視覺優化(Bundle Adjustment),導致計算功耗很難降低,而純視覺的 SLAM 往往受光照條件、高速旋轉運動、抖動等等影響而產生不穩定,因此,這些方法在產品化在實際產品化過程中有較大難度。

遠形時空推出的雙目 SLAM 和單目 SLAM ,不僅僅依靠攝像頭,還輔助慣性☆禁☆感測器(即 Visual-Inertial SLAM),很大程度上克服了純視覺 SLAM 的缺點。另外,為提高穩定性和精度,遠形時空團隊在感測器硬體、慣性輔助的圖像特徵追蹤、丟失重定位等核心技術方面都做了優化,提高了 vSLAM 的穩定性和精度。

雙目 SLAM 表現

單目 SLAM 表現

遠形時空團隊推出的雙目 SLAM 和單目 SLAM 的精度均在釐米級,drift 小於1%,而計算功耗很小,比同類產品減小超過至少一半以上的計算量,最低時只是1/4左右。

在機器視覺領域,其實存在著眾多玩家,比如百度前日剛收購的矽谷公司 xPerception,其定位和業務範圍與遠形時空非常類似,國內還有格靈深瞳、速感科技、Human+、拓視覺等初創企業。面對競爭相對激烈的市場,李昌檀認為:

其實我們也看到一些比較優秀的創業團隊,我們覺得非常好,大家能夠一起教育市場,把這個市場做大。而且,暫時還沒有一個可以通吃產品,我們非常希望做一個能用在很多領域的產品,但實際上還不存在通用的解決方案。所以,無論競爭是否激烈,必須得在某一個細小的領域紮根下來,再拓展更容易一些。

目前,遠形時空基於這種解決方案,做出了一個嵌入式的硬體產品,並將首先在 VR 領域進行落地,國內外各有一家 VR 廠商已在洽談合作,預計在年內會有進一步消息。現在公司共有10人左右的技術團隊,已完成數百萬的天使輪融資,即將開始下一輪的融資計畫,大概千萬量級。新一輪融資將會用於產品量產、新品研發、團隊擴充三個方面。