淘新聞

電腦視覺+深度學習 格林深瞳要用人臉識別技術讓世界無處遁形

OFweek安防網訊 沿著玉帶路向前,滿地的銀杏樹葉,紅的黃的鋪滿了這條狹窄冷清的道路。道路左手旁是京密引水渠,與之僅一座矮牆之隔的,就是頤和園。古老的樹木探出身,迎著北京初冬的風肆意而舞。雲彩就這樣悠閒地晃蕩在淡藍色的調染盤上,在陽光照射下,若隱若現的分了層,白色的如玉,灰暗的如影,交錯著呈現出古老廟宇殿堂的莊嚴和肅靜。格靈深瞳就在路盡頭的一側,門口端坐著兩隻石獅,院子裡某處隱藏著人眼攝像機。敞亮的屋內,橫排擺放著的不是香爐書畫,而是最先進的電腦,桌前則坐著最優秀的科技人才。
古老與現代,傳統與科技就這樣交融著,時空穿越般地打亂了時間和空間的界限。大千世界溶于這一方院落,場景魔幻又現實,如夢又寫真。
人工智慧成掘金場大市場點燃中國創業熱土
Gartner公司公佈了2017年具備戰略意義的重大科技發展趨勢,這十大技術趨勢可總結概括為:以智慧為中心,通過數位化實現萬物互聯。Gartner預計,這些趨勢在未來五年內會迅速增長、高度波動,預計達到臨界點。在十大趨勢排名前三的分別為人工智慧和高級機器學習、智慧App以及智慧事物。人工智慧和高級機器學習由許多科技和技術(例如,深度學習、神經網路、自然語言處理)組成。更先進的技術超越了傳統的基於規則的演算法,以創建理解、學習、預測、適應和潛在地自主操作的系統,使機器真正具備類人的“大腦”。未來,智慧將無處不在。
在回到中國前,畢業于布朗大學的趙勇就職穀歌公司,讓世界科技領域聞之興奮的穀歌眼鏡就出自他所在的團隊之手。職位是令人豔羨的、生活是富足的、接觸到的是來自世界頂級的最前沿資訊、任職的都是穀歌的大腦部門。但這一切都沒能阻擋他踏上回國創業之路。
上海復旦大學研究生畢業後的趙勇選擇遠去美國繼續深造。此去經年,在美國讀書工作已十年有餘,他親眼驗證了中國國際地位的變遷。“我2003年到美國,那個時候美國媒體對中國的報導是非常少的,即便偶爾出現在報端也是負面新聞。但是到了2010年,突然間發現全世界大多有趣的事都是發生在中國。” 2010年,《TIMES》雜誌對過去十年間發生的國際大事進行了回顧,所關注的只有一個主題:CHINA。這篇文章由三次榮獲普利策獎的Thomas L.Friedman撰寫,從中國社會、文化、政治、經濟、科技等領域事無巨細的報導和描寫了中國在十年間的變化和進步,這一切讓趙勇萌生了回國的念頭。
“美國有亞馬遜、穀歌、Facebook,中國有BAT,但整個歐洲卻沒有一個能讓人印象深刻的互聯網公司。goole.com在美國市場佔有率是60 %,但是在歐洲則高達95%。不是歐洲人不懂技術,而是他們沒有統一文化的區域,因為他們的語言都是分裂的,沒有足夠大的市場。在中國,餓了吧這樣的公司可以在一兩年內變得很強大是與大市場有著密切關係的。”
在谷歌任職時,趙勇每年都會抽出2個月時間回到中國進行調研。在他看來,美國生活的十幾年,讓他錯過了中國發展最快的時間,這是一筆很大的損失。2012年底,趙勇在矽谷認識了徐小平,一次深談後,趙勇決定回國:“恨不得馬上就辭職。”回國後,他為自己選定的方向是電腦視覺。
“電腦視覺 深度學習” 助力智慧未來提前到場
根據艾瑞諮詢預計,2020年全球人工智慧市場規模將達到1190億元,年複合增速約19.7%;同期中國人工智慧市場規模將達91億元,年複合增速超50%。時間倒退回2013年,趙勇剛剛回國並打算在電腦視覺領域大展宏圖時,卻遭受了現實的打擊。顯然這一年,中國創業的標籤是可穿戴設備和O2O。對於他而言的偉大事業還鮮有人瞭解。
“很多人問我為什麼不依靠穀歌眼鏡的技術做一個趙勇眼鏡或者格靈眼鏡,但對我來說這是違背職業道德的。更何況在我看來,電腦視覺有更加美好的未來。”
不斷接觸投資人,不斷受挫,“有投資人告訴我,中國不適合技術創新,創新的成本太高了。”在堅持了一年後,穀歌以約6億美元的價格收購了英國初創公司DeepMind Technologies。自此,創投圈開始刮起了人工智慧之風,投資商們迅速轉變了想法。但快速局部的火熱後接踵而來的是過度炒作,趙勇將其形容為“泡沫”。9月後,經歷股災的投資市場變冷,人工智慧落地等一系列問題也再一次提升了融資的難度。幸運的是,重壓之下產生了巨大動力,“我們開始思考賺錢的問題。這個壓力使得我們6個月內解決了很多問題,產品也快速落地。同時也對格靈深瞳未來的發展方向和路徑做出了更加清晰的判斷和規劃。”
面對資料的大爆炸以及對未來的憧憬,人們開始探索更廣闊的世界。技術的衍變將人們推向了視覺搜索的時代。在這個空間中,一切的圖像,不管是平面的還是立體的,都可以被標注、被搜索。科幻電影中所呈現的令人眼花繚亂的技術,已經不僅是夢想。在這個巨大的寶藏掩蓋下,下一個獨角獸或許正在蠢蠢而動,伺機爆發,誰能最先定義智慧未來,誰就掌握著先機。
成立之初,格靈深瞳利用三維電腦視覺增加了物體的深度資訊,更完整真實地還原了物體資訊,解決了相互遮擋、比例混淆、影隨人動等問題,提高了智慧檢測和分析的準確度。並借由深度學習説明電腦像人一樣在真實世界中吸收、學習和理解複雜的資訊,完成高難度的識別任務。
成立三年,格靈深瞳已經借助自主研發的深瞳技術在人和車的檢測、跟蹤與識別方面居於世界領先水準。三年中,趙勇帶領團隊成員先後研發了皓目行為分析儀、威目車輛大資料系統、威目視頻結構化系統、威目人臉識別系統、威目視圖大資料平臺、深瞳人眼攝像機。“最困難的時期就是現在,因為我們開始需要為自己負責了。剛開始是理想驅動,沒有現實的壓力,甚至不需要考慮競爭對手,因為我們僅僅是北京20萬創業企業中的一個。現在隨著我們逐漸擴大的規模,開始需要制定長遠的戰略,需要不斷分析我們的機會在哪,我們的競爭對手是誰。”