雷鋒網按:2016 即將畫上句號,當我們回顧這一年的科技進展時,雷鋒網很難不聯想到一個詞——深度學習。當它從研究室中脫胎而出,並成為今年的當紅熱詞,實際上我們已經意識到深度學習的來臨。從 AlphaGo 到 Google Translate,雷鋒網也做過不少覆蓋和解析。Cade Metz 為 Wired 撰文回顧了與深度學習同行的這一年,雷鋒網編譯,未經許可不得轉載。
在澳大利亞西海岸,Amanda Hodgson 正在操控無人機飛躍海面,無人機可以幫助他們在水面上拍攝照片,利用這些照片,可以定位澳大利亞珀斯灣的儒艮(也就是我們俗稱的海牛)——世界上最珍貴的瀕臨滅絕保護動物之一。雖然照片拍攝的非常成功,但 Hodgson 和她的團隊很快就遇到了一個新問題:如果僅靠肉眼甄別,他們沒有能力從所有拍攝的約 4.5 萬張照片中找到儒艮的身影。所以,她決定把這個工作交給一個深度神經網路來處理。
神經網路是一種機器學習模型,舉個例子,Facebook 公司可以在其平臺上的 news feed 裡識別照片中的人臉。再比如你的安卓手機可以識別出你所問的問題,然後幫你運行穀歌搜尋引擎。這些神經網路都是類比了人類大腦,然後利用資料模型分析大量資料,進行自主學習各種事物。 現在,身為珀斯莫道克大學海洋生物學家的 Hodgson, 也在使用同樣的技術在拍攝的數萬張開放水域照片中尋找儒艮,這套神經網路是基於穀歌開源機器學習軟體 TensorFlow 開發的。
正如 Hodgson 所解釋的,檢測這些儒艮需要特殊的定點精准度,因為它們通常都是潛伏在海洋表面,而且身體顏色和水面折射的波光很相似,所以分辨起來難度很大。不過,這並沒有難倒神經網路系統,它們可以識別出分佈在珀斯灣 80% 的儒艮。
目前,這個專案仍處於早期階段,但已經向人們展示出了深度學習技術在過去一年裡的強大影響力。2016 年,深度學習技術幫助“AlphaGo”戰勝了世界頂級圍棋手李世石,要知道就在幾個月之前,還沒有人能相信機器可以做到這一點。而打敗圍棋世界冠軍,不過是機器學習領域裡的一個“小插曲”而已,如今,機器學習已經不再是“忽悠”人的小把戲,更不是什麼黑科技了,隨著我們即將邁入 2017 年,像穀歌、Facebook、微軟和亞馬遜這些科技巨頭也開始推廣這一技術,這些互聯網巨頭加大了開源軟體和雲計算服務的部署,深度學習的實際應用逐漸增多。
全新的機器翻譯
在過去的幾年裡,神經網路顛覆了很多領域,比如 Google Photos 應用讓圖像識別上升到了一個新高度;而 Google Now 和微軟小娜這些數字助手在語音辨識上也獲得了重大突破。今年,機器學習技術開始應用到翻譯領域,該技術可以將一種語言自動翻譯成另外一種語言。今年九月,穀歌推出了全新的“穀歌神經機器翻譯”服務,完全通過神經網路來運行,這套全新的翻譯引擎在翻譯特定語言的時候,能夠將誤差率降低 55-85%。
通過導入大量現有的翻譯資料,谷歌開始訓練這些神經網路,當然,有些訓練資料品質並不高,包括之前版本的谷歌翻譯應用所翻譯的資料。但是這些資料中也包含人類翻譯專家所做的高品質翻譯資料。事實上,深度學習技術最讓人著迷的地方,就是它可以克服資料品質參差不齊的問題,只要給神經網路足夠多的資料,讓它去學習,即使裡面有各種缺陷,也一樣能獲得比較好的學習效果。
Mike Schuster 是一名谷歌高級工程師,他坦誠地表示,目前谷歌翻譯距離完美還比較遙遠,不過應用機器學習的谷歌翻譯體現的是一種技術突破,因為谷歌翻譯服務現在完全依賴於深度學習,所以未來穀歌想要改善、優化這項服務就會變得更加簡單。谷歌可以專注於優化系統整體,而不是像過去那樣一個個去優化機器翻譯服務裡的小模組。
與此同時,微軟也在嘗試在翻譯應用中使用機器學習技術。就在這個月,微軟公司發佈了新版翻譯應用 Microsoft Translator,可以翻譯九種不同語言的即時對話。根據微軟公司負責人工智慧研究的副總裁 Harry Shum 透露,全新的翻譯系統同樣完全依賴於神經網路,不要小看它,因為這意味著微軟的機器翻譯能力很可能會在短時間內快速提升,獲得重大突破。
全新的對話聊天
在 2016 年,深度學習技術在聊天機器人領域裡得到了廣泛應用,其中最讓人關注的就是穀歌的 Google Allo,這款聊天機器人在今年秋季正式發佈,它可以分析使用者接收到的文本和照片,然後給予推薦和智能回復。Allo 聊天機器人是基於谷歌前期一項名為“智慧回復(Smart Reply)”的技術研發出來的,後者更類似於電子郵件自動回復資訊。深度學習在聊天機器人應用的很好,很大一部分原因是因為它尊重了今天機器學習技術的局限性。實際上,Allo 聊天機器人對話的回復通常比較簡短,而且它通常也會給出幾個建議,這主要是因為目前人工智慧技術還無法正確地處理所有事情。
在 Allo 聊天機器人裡,神經網路不僅可以利用穀歌搜尋引擎回答用戶提出的問題,同時它還能夠將用戶詢問的問題回饋給穀歌公司,幫助他們優化答案。在谷歌搜索產品經理 David Orr 看來,如果沒有深度學習技術的支持,Allo 聊天機器人本身根本沒有回答任何問題的能力。他說道:
你需要使用升級網路——至少這是我們目前找到的唯一解決方案,我們不得不使用所有現在能夠掌握的最先進的技術。
不過,神經網路真正無法做到的,其實是將一個實際對話持續下去,從這個角度來看,無論科技大咖們如何吹噓自己的技術如何先進,聊天機器人依然有很長的路要走。不過,穀歌、Facebook、以及其他科技巨頭旗下的研究人員會不斷探索深度學習技術,希望能夠儘快實現這一願景。得益于這些研究人員的努力,我們已經看到了語音辨識、圖像識別、以及機器翻譯得到了巨大進步,而聊天機器人會話將會是他們需要攻克的下一個前沿陣地。
全新的資料中心
今年夏天,谷歌人工智慧工程師 Demis Hassabis 和 Google DeepMind 實驗室團隊推出了人工智慧“AlphaGo”,並且打敗了圍棋世界冠軍。不過,除了“AlphaGo”之外,他們還構建了一套人工智慧應用,可以幫助谷歌高效運營全世界範圍內的電腦資料中心網路。這項技術名為強化深度學習,該技術曾應用在早期圍棋人工智慧和 DeepMind 服務裡面。現在,谷歌利用強化深度學習技術管理旗下資料中心運營,比如人工智慧可以決定什麼時候打開資料中心內數千台電腦伺服器的冷卻風扇開關、什麼時候打開資料中心的窗戶強化冷卻效果、或是什麼之後關閉昂貴的空調製冷等等。據悉,人工智慧可以高效管理一個資料中心內 120 多項功能。
人工智慧的確高效,穀歌已經節省了數億美元成本,換句話說,穀歌在 2014 年以 6.5 億美元的高價收購 DeepMind,現在基本上“回本兒”了。現在,DeepMind 正計畫在穀歌所有計算設備上部署感測器,這樣就能收集更多資料,説明訓練人工智慧達到更高的管理水準。
全新的雲計算服務
科技巨頭們已經開始在自己的產品和服務中推動機器學習技術的應用,不過他們同樣希望在其他領域裡施展拳腳。2015 年末,穀歌開源了 TensorFlow。在過去的一年時間裡,TensorFlow 軟體造福了很多人,其中就包括前文提到的澳大利亞生物學家 Amanda Hodgson。與此同時,穀歌、微軟、以及亞馬遜等公司也開始在自己的雲計算服務中應用深度學習技術,任何程式師或公司都可以開發自己的 App,“人工智慧即服務”已然成為了互聯網三大巨頭最重要的核心業務。
在過去的十二個月,由於人工智慧行業發展的日益火爆,這一領域裡的人才也變得炙手可熱。作為這一領域裡的翹楚之一,斯坦福大學教授李飛飛最近被穀歌挖去,負責人工智慧雲計算業務。亞馬遜公司也挖來了卡耐基梅隆大學教授 Alex Smolna,負責旗下人工智慧雲計算業務。互聯網巨頭們還是盡可能地籠絡全球人工智慧技術人才,好消息是,這些人才並沒有拘泥於自己的小圈子,他們都願意將自己的研究成果分享給大家。
隨著人工智慧技術的不斷進化,計算科學家所扮演的角色也在發生轉變,未來也許真的不需要人工程式師去編寫代碼軟體了,反而需要更多人才去訓練神經網路學習,所以掌握這一技能的人會更具競爭優勢。像穀歌和 Facebook 這樣的大企業,他們不僅招募了大量新型人才,同時也在積極引導自己的員工擁抱新技術——未來,我們的科技或許真的會由人工智慧來定義,而且會影響到每個人的生活。
VIA
wired