特寫 | 人工智慧背後的臨時工：穀歌如何訓練AI識別網路視頻品質？

分類＼手機
時間＼2017-04-25

雷鋒網按：

我們都關注人工智慧有多厲害，它們可以在圍棋、德州撲克和人臉識別上戰勝人類，但人工智慧變得聰明，背後是海量資料的支撐，而且這些資料是需要標注的。因而隨著人工智慧的繁榮，從事資料標注的人也越來越多。

Wired的這篇文章

就介紹了穀歌如何雇傭人工標注YouTube視頻來訓練AI。本文由雷鋒網編譯。

目前，Google 的“廣告品質評估員”已廣泛存在於全國各地。這些臨時雇員通常由外部機構代為聘請，其工作即是為 YouTube 視頻過濾暴力、敏感廣告資訊。這一工作目前單憑電腦本身尚無法完成，Google現在也似乎迫切需要這些人的説明。

YouTube 每天都會出售數百萬條視頻廣告，廣告播出位置會由系統自動分配，所以廣告商往往不知道自己的廣告具體會在哪條視頻後播放。最近，這種“不確定性”令 Google 大為頭疼，公司甚至因此受到相關方的審查。

Google 方面則一直積極解釋，以防止輿論擴大化。在他們看來，媒體其實誇大了視頻廣告問題，目前已標記的視頻數尚未達總數的千分之一，Google 首席行銷官 Philipp Schindler 也表示這個問題根本不足為訓。

由於 Google 超過 90 ％的收入都來源於廣告，因此他們也需要快速解決問題來防止廣告商撤位。但是，YouTube 每天都有近 60 萬小時的新視頻上傳量，如此巨大的數量使得採用人工過濾很困難，軟體所要處理完成的標記量可謂“前所未有”。但問題是，公司仍然需要投入人力進行 AI 訓練。因此，Google 仍然依賴於人工完成廣告標記工作，以此構建好AI學習所需的數據。

評估員任務

技術公司會長期雇用內容管理員，這項工作也隨著人們上傳和分享量的增加而變得越來越重要。有廣告評估員說，他們的角色不僅僅在於監控視頻，他們會閱讀評論，標記使用者之間的濫用行為；會檢查 Google提供的各種網站，確保符合公司標準；也會按類別進行網站分類，點擊廣告連結查看狀態正常與否。

具體而言，某些情況下評估員們需要在不到兩分鐘內查看幾小時長的影片，這就意味著這份工作更強調數量和速度。此外，他們也不僅只是將視頻簡單標記為不合適——從標題到內容，他們都需要進行細緻的評估並進行分類。存在評估內容與既定已有類別不匹配的情況時，他們會將材料標記為“不可評估類”。

也多名廣告評估員說，公司要求他們觀看內容震撼的視頻，比如有人試圖在車上殺自己的狗——視頻中的人放火燒了自己的車，然後走出來以一槍結束了自己的生命。此外，還有人會看暴力侵害婦女兒童和動物的視頻。其實評價員們並不知道 Google 是如何進行視頻任務選取與下達的- 他們只有在開始工作的才能看到視頻的標題和縮略圖。

總而言之，Google 仍然需要人力來協助處理 YouTube 的廣告問題。公司高管和代表們也一再強調，只有機器智慧才能解決 YouTube 中的規模化任務問題，但是在 Google 機器或其他任何人都能夠自覺識別不宜言論之前，這樣的工作仍然需要依賴人去完成。

Google 發言人 Chi Hea Cho 說：“我們一直將技術與人類評論結合進行綜合分析已被標記的內容，因為對於視頻的理解是很主觀的。最近我們也增加人力加快評估速度，這些評論有助於我們完善演算法很有説明。”

評估員來源

據悉，廣告品質評估員這一工作開始於 2004 年。雇傭機構的始祖是ABE，他們會付給大家每小時 20 美元的薪水，但是 2006 年 WorkForceLogic 收購了 ABE 之後，評估員工作條件就不如從前了。2012 年，一家名為 ZeroChaos 的公司收購 WorkForceLogic，如今則採取合同制方式進行人員雇傭。

廣告評估員可以隨時隨地工作，滿足每週 10 小時的最低工作要求即可。只是這項工作不是那麼穩定，雖然大多數人都蠻喜歡這份工作，但他們幾乎沒有機會成為永久的全職員工。

本次調查的廣告評估員都是通過 ZeroChaos 聘用的，大家每小時賺取 15 美元，每週最多可以工作 29 個小時。如果每週工作時長達到 25 個小時，則可申請福利，但是想達到這個工作量可以說相當困難。有人說他們會面臨毫無預兆就被解雇的情況，公司一封電子郵件，你們的勞務關係就終止了。

實際上由於無法與 Google 直接進行明確的溝通，評估者對這份工作會產生不安全感。穀歌只會給評估員一個通用郵箱用於工作方面的聯繫，並且採用自動回復方式回答大家的郵件。也就是說，Google 會告訴評估員他們所做的工作相當重要，也會非常重視工作成果評估，但他們並不會給出詳細說明解釋原因。

Google 會將已審查的內容整合到廣告評估員的任務中用以績效衡量。這些測試內容會通過郵件的方式混雜在日常任務中一起發給評估員們，並以最終成績來評估大家的表現，沒有通過測試的人會面臨解雇危險。

即使如此，每小時 15 美元的酬勞仍然高於大多數城市的最低工資。會有人很高興 ZeroChaos 給他的工作機會。

評估員與AI

跨技術行業的大公司雇用臨時員工參加用於培訓AI系統的重複任務。一位廣告評估員曾在幾年前參與評估了 Microsoft Bing 的搜索結果，他們每人每小時要流覽多達80頁的搜索結果。LinkedIn 和 Facebook 也會通過進行類似的任務測試。

臨時性工作所帶來的安全感的缺乏和廣泛存在的短期合同工，使得現任和之前的雇員們感到不安，他們認為，Google 正在漸漸失去系統知識和經驗，這些東西原本為那些工作上投入了更多時間的雇員所掌握。他們花時間花時間訓練新人，接著又把他們掃地出門，實在是浪費時間。

但是，通過人類廣告評估員也許會找到能夠使 AI 更為聰明的最佳做法。AI 需要許多內容輸入，特別是一些令人反感的內容，所以定期輸入培訓人員資料更適合於訓練 AI。為機器輸入更為多元的資訊，結果自然會更好。

另一方面，AI 研究人員普遍認為，不良的人類習氣不一定會影響機器學習，反而可能會由於特別工作環境和經驗而產生更微妙的影響。康奈爾大學 AI 教授 Bart Selman 說：“人們通常的觀點是訓連 AI 模型需要大量的資訊輸入。這種觀點適用於一般情況，但涉及道德判斷時，我們就要考慮到大多群體中會存在明顯的根深蒂固的偏見的，人們認為男性會比女性更好的勝任某些工作就是明證。所以，如果你是通過一般性或以往的資訊輸入訓練 AI，那麼必然也會受這些資訊中所隱藏偏見的影響。”

“你應該不想用那些普通人的日常做法來訓練AI的道德吧，那些對於潛在的偏見和倫理問題有著更為深入、仔細思考的想法才是你所想要的資訊輸入。”Selman 說。

Google 員工在 Mountain View 總部享有絕佳的環境，而典型的廣告評估員的生活卻與之相差甚遠。為世界上最有價值的科技公司工作意味著享有優渥的福利和極高的薪水，但也可能意味著作為臨時工作者，你僅僅是在培訓這些公司的機器做同樣的工作。

via：

wired