淘新聞

揭秘鑒黃師:智能鑒黃時代來臨 這份神秘職業如何轉型?


文 / 天下網商記者 陸文斌
圖 / 丁明
輕鬆、月入鬥金和飽眼福是外界對鑒黃師的臆測,而在現實世界中,他們的生活遠沒有外界謠傳的那麼香豔。
生無可戀、麻木,在對話過程中,這些是鑒黃師趙凱重複最多的形容詞。他曾經一天最多審圖數萬張,而現在,智慧技術的發展正在一點點將他從這樣的生活狀態解救出來。
阿裡安全部稱,阿裡現在鑒黃進入了智慧時代,99.9%的圖片交由人工智慧機器鑒定。而鑒黃師的工作職責也隨之發生了改變從純人工鑒黃,轉向教會機器人鑒黃。
日夜顛倒的鑒黃師
一間五、六平方的房間,是趙凱的工作室,擺著一台電腦。他今年34歲,作為一名鑒黃師,在這個房間,他每天要從5000張左右的圖片中,審核出涉黃內容,並將其分類。
房間的另一側是一張大床,堆放著不少玩具。他的另一個身份是父親,2歲的女兒愛和趙凱一起玩耍。
由於工作的內容充斥著色☆禁☆情內容,關門工作算是趙凱對女兒的一種特殊關愛。趙凱表示,等女兒在長大一些,我就要保證她在家時不工作。
我非常愛我的女兒,作為父親,我有責任和義務去保護她,每次審圖累了,一想到女兒長大後也會上網, 就有了動力,要為她營造一個乾淨的網路環境,趙凱表示。
每到夜晚,家人進入夢鄉的時候,趙凱借著微弱燈光,打開電腦,變身為一名職業鑒黃師。他表示,肯定不能當著家人和朋友的面做。
這份職業打破了趙凱原有的生活規律率,一開始斷定完所有圖片,算得上生無可戀了,三年時間,趙凱日復一日的敲擊滑鼠和鍵盤快速鍵,在他眼裡,已經不知道裡面是什麼內容了,只是按照標準執行。
由於患有先天性小兒腦癱,行走不便、語言交流有些困難,趙凱選擇待在家裡。2013年,他偶然獲悉殘聯和阿裡巴巴向殘障人士開放鑒黃師的這個崗位,因為只需在家工作,他抱著試一試的心態,加入鑒黃師團隊。和趙凱一樣參與鑒黃工作的殘障人士,在全國共有300多人,主要分佈在浙江、河南和湖南三省,已經累計審核模型圖片兩億五千多張。
憑藉著高準確率和兢兢業業的工作態度,趙凱晉升為組長,隊員每當遇到很多難以判斷的圖片,都交給趙凱處理判定和解答。
2013年,阿裡巴巴決定引入人工智慧鑒黃。趙凱和其他300位殘聯成員則是整個人工智慧鑒黃的重要環節。在日常工作中,趙凱是為大量的圖片審核分類,用他們的行話說叫打標,分成純色☆禁☆情、性☆禁☆感、低俗、正常和無法判斷五大類。趙凱明白給圖片打標,只是為了訓練機器演算法變得更加聰明,讓它逐漸擁有人的思維模式,而自己就是機器人的老師。
經過人工的訓練,和機器自我深度學習,阿裡安全部稱,99.9%的圖片可以由人工智慧機器鑒定。
趙凱也發現,隨著機器變得越來越聰明,他的日常工作量已經大幅度減少。他回憶道,2014年,當人工智慧還沒有完全運作起來的時候,在高峰時期,每天的任務量達到70000張。
鑒黃師的收入和外界傳言的不同,多是以公益性質,要依靠幾千元的津貼養活一家人,幾乎是不可能,趙凱說。現在,他學會了一些室內設計的常用軟體,白天做一些兼職,晚上繼續鑒定色☆禁☆情內容。趙凱表示,經過300位鑒黃師和人工智慧的共同努力,現在淘寶網的環境變得越來越好。
道高一丈
由於交易額爆炸式增長,色☆禁☆情內容曾一度成為阿裡巴巴安全部的心頭病,單純使用人力鑒定變得艱難。阿裡安全部小二李若冰(花名:博雷)表示,和社交工具以及網路社區等存在大量色☆禁☆情內容不同的是,消費者在淘寶是被動接觸色☆禁☆情內容。阿裡巴巴對此容忍度為零,一直在處罰,甚至關停涉黃商家和買家帳號。
即便有越來越聰明的機器鑒黃師,但還是會被不法商家鑽空子,兩者之間的博弈從來沒有間斷。
儘管行動不便,但趙凱仍堅持定時前往阿裡巴巴西溪園區和安全部小二溝通,今年,我已經來回園區3~4趟。
阿裡安全部的演算法專家薛暉(花名:奧創)見證了商家和鑒黃機器鬥智鬥勇的過程。他表示,不久前,平臺上出現一些二次元涉黃內容,由於機器對於二次元漫畫的鑒別能力不夠,商家就開始抓住這個死角傳播。
隨後,安全部發現了這個問題,便向趙凱和小組成員發佈了一項新任務,所需要打標的圖片大多是成人動漫。短時間內,通過大量的人工打標,教會機器學會看成人動漫。薛暉表示,目前機器已經有了比較完善的鑒別動漫內容的能力。
據瞭解,阿裡安全部的鑒黃人工智慧機器大致經歷了三個發展階段,從最初的基於膚色紋理等簡單特徵的技術,到基於局部特徵和BoW(Bag of Words)的圖像分類技術,再到目前基於人工智慧的深度學習技術。
一邊是機器不斷地反覆運算更新、擴大學習範圍,另一邊不斷湧現的新型傳播手段也在讓色☆禁☆情內容變得更難捕捉。
2016年,移動直播轟轟烈烈的成為行業風口,市場出現200多家的直播平臺。
同一年,阿裡旗下的兩大電商平臺淘寶和天貓,也相應推出了直播服務,定位於消費類直播,用戶可邊看邊買。阿裡安全部決定開啟對直播平臺的即時監控,對於人工智慧鑒黃而言,這並非一件易事。
前兩天,我們組裡有同學在分享深度學習技術的論文集時,發覺一般每隔1~2年新的技術就會出現,原來的主流技術過時了。 薛暉說。
他認為,在即時播出的畫面中,鑒定主播行為是否違規,在目前階段還是需要借助鑒黃師人工判定。他舉例道,例如女主播用性☆禁☆感的方式吃香蕉,閃露畫面,都是依靠人工鑒定是否違規。
今年雙11,為了應對淘系平臺上直播節目的井噴式增長,安全部增調了不少人手主攻直播內容審查。薛暉回憶道,每個人工鑒黃師要盯著一塊被分成若干個小塊的大螢幕,每一個社區塊上定格著一個主播畫面,每隔幾秒鐘,鑒黃系統就會為上千個主播重新截圖,就在短短幾秒鐘內,鑒黃師就要看完所有主播的行為。
有意思的是,這個階段直接鑒定直播畫面和動作儘管很困難,鑒黃機器卻能夠通過直播觀眾的互動留言區域的回饋預測主播的行為,若是遇上出格的留言,機器就會迅速以高亮的色彩邊框,提醒人工鑒黃師高度關注相關主播。
懂文字,會鑒黃是這個機器的最大特徵,一台普通伺服器可以一天不間斷的識別鑒定250萬~350萬張圖片。
今年5月,基於這套人工智慧系統,阿裡巴巴安全部推出了綠網。在淘系的平臺,以及阿裡生態下,綠網每天基於鑒黃業務的調用量有幾億次,而最終人工審核的比例大約在千分之幾。
李若冰表示,隨著準確率不斷地提高,這套鑒黃機器人,已經開始輸出給非阿裡生態的互聯網公司使用。