淘新聞

他深夜在阿裡小黑屋看黃圖

圖:阿裡巴巴西溪園區某小黑屋實景……

深夜23點的阿裡巴巴西溪園區,保安哥哥巡完樓後,燈已經熄了。

柳丁正打算回家,經過一間“小黑屋”的時候,忽然聽到裡面傳來可疑的笑聲。

什麼情況?柳丁壯著膽子推開門,一台電腦擺在桌子正中,螢幕不時滾動著“你懂的”的畫面。

一個小胖砸正坐在電腦前激動地操作著什麼,圍坐在一起的碼農們,時而竊笑,時而私語。

突然!電腦發出警報,一張圖片跳到桌面上,要求立刻進行審核。

柳丁還沒搞清楚狀況,小胖砸已經跳板凳上了,“又抓到一個”!

看柳丁已經方了,小胖砸有點捉急:“同學,憋誤會!這是我們的鑒黃機器人。”

阿裡用圖像識別做內容管理已經很久了,但鑒黃機器人,柳丁還是第一次聽說。

小胖砸說,其實,鑒黃機器人已經上崗一年多了,它一秒鐘能看數千張圖片,並以最快的反應速度挑出可疑的色☆禁☆情圖片,提交給人工審核。

阿裡業務安全產品技術的同學們,在小黑屋裡蹲了三個月,用愚公移山的精神,從網上扒拉來了億萬級的小黃圖,打上標籤,“喂”給深度神經網路。讓它在“某老師”們的言傳身教之下,深度學習,不斷反覆運算,舉一反三,抓出風險圖片。加上阿裡雲的彈性演算法助力,深度神經網路單次判斷的準確率已經超過了人眼。

這幫活(沒)潑(有)可(節)愛(操)的碼農還給它起了一個萌萌噠的名字——雅蠛蝶。

▲ 雅蠛蝶就藏在他們的電腦裡!這個團隊的同學不能露臉哦……身份保密!

直播它也管?

雅蠛蝶將在今年雙11大顯身手。10月21日開始,平均每天有幾千場直播在淘寶和天貓上進行。

“從現在到雙11,直播的數量還會不斷增加。一旦有涉黃或者色☆禁☆情直播在我們的平臺上被放出來,危害將是災難性的”,小二大衛是雙11保障專案的PM,他告訴柳丁,“會有數以億萬的買家觀看直播,必須保證平臺的潔淨度!”

每隔五秒,雅蠛蝶就截取一次該時間段所有直播的圖片,並同步進行分析,將可疑圖片提交給後臺人工審核員。

如果主播被判定著裝不得體,在播出後幾秒鐘內,立刻給予警告。一旦被判定為色☆禁☆情,直播將被立刻阻斷。

機器人的反應速度已經做到毫秒級,大家沒日沒夜地幹了半個月,反應時間縮短了很多,不到一眨眼的工夫,就能抓到“罪犯”!

“看黃圖這麼辛苦,你們還招人嗎”,柳丁終於沒憋住。

沒想到,大衛同學一臉的傷感。為了與時間賽跑,咱們動員了阿裡安全部的很多同學參與打標,大家是在完成本職工作之外友情贊助的,而且還不好給家裡人知道,做好事還不能名正言順。

圖:安全部辦公室一角,不能露臉的小二們……

尤其是其中有一些重口味圖片,內容會引發不適。有的同學打標後缺乏食欲不想吃飯,反應最嚴重的一位妹子還發生了嘔吐。

“那妹子豈不是工傷了”?柳丁又問。

大衛趕緊擺手,項目組的同學們每天做的最多的事情是寫代碼、跑程式、分析資料,只是有需要才會看黃圖。而且大家生龍活虎得很,幹起工作來是又猛又持久,因為大家看到了模型的進步、自己的成長,樂在其中呢。

大衛接著說,咱做雅蠛蝶,除了守護平臺的乾淨,也希望把人解放出來。比如,如果全靠人工審核,30個人不眠不休,一天只能看一千多張的圖片,但有了雅蠛蝶,每天千萬級的照片,只需要兩個工作人員就可以審核完。

“咱們就是007背後的Q博士,是提供智力和高科技的”!

圖:為雙11直播保架護航的小二們集體合影,這張圖小編PS得好辛苦哇……誰讓主管要求他們的身份一定要保密。