淘新聞

深度學習是如何成為 Facebook 理解用戶的傳聲筒的?

Facebook 建立的根基就是了解用戶一舉一動並將它們掌握的各種資料打包賣給廣告商,隨後它們會將掙來的錢用於研發,為用戶提供更多新鮮有用的功能,如視頻和購物,而通過這些新功能,它就能繼續加深對用戶的瞭解。

Facebook搭建的這套網路實現了雙贏,用戶可以盡享交流和對話的便利,Facebook 也能借此發展壯大。當然,用戶獲得良好體驗的背景下,是 Facebook 資料工程師辛勤的勞動,因為我們是誰,喜歡什麼,時間都花在哪這些資料非常繁雜,它們根本沒有結構。

那麼資料工程師面對的是多浩大的工程呢?雷鋒網瞭解到,每分鐘全世界會有 12 億人在 Facebook 上上傳 13.6 萬張照片,更新 29.3 萬次狀態。因此,即使是 Facebook 的技術大牛,也只能從這些無結構的資料中截取一些有價值的部分,而這部分通常是最難量化和處理的。

不過,現在資料工程師們有了強援——深度學習。深度學習技術讓機器能學著自己對資料進行分類。最典型的例子就是深度學習圖像分析工具,無需人類專門教導,機器就能識別出哪些圖片包含有貓咪,而這一“神技”背後,是機器對大量圖片的分析。“書讀百遍,其義自現”,機器通過讀圖看出了圖片包含的資訊,懂得了到底哪類圖片會包含貓咪。

通過對資料的量化,分析工具能洞察出所需資訊,並完成對非結構化資料的結構化工作。在此過程中,分析工具會試圖回答類似包含貓咪的圖片中某家公司產品出現的頻率如何?我們應該專門針對愛貓人士推出這款產品的廣告嗎的問題。

隨著深度學習演算法變得越來越複雜,它們能處理的資料也越來越多,文字、圖片甚至視頻都不在話下。

下面,我們就來共同盤點幾種深度學習的特定用例,利用該技術,Facebook 不但為用戶提供了方便,還完成了對我們的深入瞭解。

1. 文本分析

如今,Facebook 上使用者分享的大多數資料依然是文本化的。雖然視頻和圖片可能包含千言萬語,但回答簡單問題時你根本用不上那麼多單詞,那些用不到的資料就會成為雜訊,如果不加區分的對其進行精細化處理,就是在浪費 Facebook 的存儲和分析能力。

為了讓機器更好的理解文本,Facebook 開發了名為 DeepText 的工具,它能自動學習並通過分析上下文來理解文本大意。同時,神經網路這可分析單詞之間的關係並以此理解不同單詞組合會產生什麼語義的變化。由於這屬於半自動的無監督學習,因此演算法無需始終參考資料。

這就意味著在學習過程中 DeepText 不會被拼寫、俚語或語言風格所困。事實上,Facebook 稱這項技術“與語言本身無關”,因為它已經給單詞貼了標籤,因此可以輕鬆的在不同的語境間進行切換。

眼下,該工具已經可以根據使用者的言語直接找出他們的“願望清單”並智慧的進行推薦了。

2. 面部識別

除了 DeepText ,Facebook 還有一個名為 DeepFace 的應用,這次它要識別的可不是貓咪,而是人臉了。Facebook 對該應用信心滿滿,它們聲稱 DeepFace 絕對沒有臉盲症,它認人的能力早已超越人類,準確度高達 97%(最強的人類只有 96%)。

不過,此類技術的應用也遭到了隱私保護人士的反對,他們認為 Facebook 做的太過了,這種在照片上給人臉貼標籤的行為是人們通向自由的阻礙。歐盟立法者同意該觀點,為了保護歐盟公民,2013 年時它們就要求 Facebook 在歐盟禁用此類工具。而在當時,Facebook 使用的面部識別工具還只是初期產品,深度學習技術並未介入。

對於該技術帶來的隱私困擾,Facebook 也相當小心,它們的研發一直處於秘密狀態,直到此類案子有了結果才敢放出自己的研究成果。

3. 定向廣告

與穀歌類似,Facebook 也要靠廣告來掙錢,因此如何精准的進行定向廣告投送就成了社交網路巨頭的頭等大事。在廣告推送問題上,Facebook 則用到了深度學習的基石——深度神經網路。通過該技術,機器在瞭解用戶行為習慣的基礎上,就能將他們進行精確分類,然後再定向發送適合用戶的廣告。

4. 設計 AI 應用

為了找出最有效的深度學習應用,Facebook 還用到了名為 Flow 的超級系統,該系統每個月會利用深度學習分析法模擬運行 30 萬個機器學習模型,這樣以來工程師就能找出最有效的模型並從中發現商機。

開源

Facebook 是開源計畫的有力支持者之一,因此 Facebook 人工智慧研究所的大部分工作成果對全世界都是透明的。眼下,社交網路巨頭的深度學習研究都集中在 Torch 平臺,該平臺主要注重深度學習和神經網路技術的研發。

展望未來

深度學習在 Facebook 的未來發展中必然會扮演重要角色。雖然 Facebook 依然謹守自己對深度學習未來應用願景的秘密,但外界早已看出些許端倪。未來,深度學習能讓盲人擁有識圖的能力,因為它可以自動生成圖片的文字描述。同時,該技術還能預測貧困地區對於網路的需要,説明 Facebook 推進自己的免費網路計畫。從長遠來看,Facebook 在 AI 上的努力能讓全社會受益。

Via. 

Forbes