淘新聞

專訪百度大腦技術團隊 當"最強大腦"遇上人工智慧

OFweek機器人網訊:給你1張4歲小女孩的照片,再讓你從電腦螢幕上看20個女孩跳舞唱歌,每個女孩只出現3秒鐘。你能從中找出長大後畫著濃妝、戴著美瞳,甚至可能整容過的她嗎?
1月6日,江蘇衛視《最強大腦》就以“匆匆那年”為主題,上演了中國版的首次人機對決:31.02秒就可記憶一副無規則撲克牌的人類代表王峰,迎戰百度人工智慧機器人“小度”。雙方先比拼人臉識別——僅憑一張童年照認出十幾年後的少女,包括一對雙胞胎;第二局,則要從30張畢業照中,即約1500個花生米大小的頭像中,根據長大後的男生照片找出兒時的他。
同“Master”橫掃人類圍棋大師一樣,人工智慧再一次戰勝了人類。百度大腦如何分辨長大後的雙胞胎?它和Master哪個更厲害?它還擁有哪些神奇的功能?《經濟日報》記者就此採訪了百度大腦的技術團隊,得出迄今為止最靠譜的答案。

小度認出了長大後的雙胞胎之一,人類沒有
都說“女大十八變”,比賽中,選手王峰表示,自己主要看嘴角、耳朵的相似度。在他眼裡,長幼兩張人臉被分解成一個個相似的五官形狀,此中除了運用人類的記憶力、推理能力,還有人類的本能。
“千百萬年進化過程中,人腦進化出一個專門的區域負責人臉識別(簡稱FFA)。”百度首席科學家吳恩達被戲稱為小度的“爸爸”,他舉例說,“一個3歲的孩子看見媽媽時,不管媽媽是微笑、生氣,睜著眼、閉著眼,長頭髮、短頭髮,穿什麼衣服,孩子都可以輕易認出這是媽媽”。
但是,人腦為何一瞬間就能完成人臉識別,至今全世界的科學家也說不清背後的原理。因此,小度對人臉的識別不是模仿人腦,而是更多基於資料分析和深度學習。
在人工智慧“眼裡”,它看見的不是一個圖形,而是一些按數位1和0記錄的圖元點。因此,機器會把人臉分為很多個小方塊來識別。根據眼睛、眉毛、鼻子等器官的特徵及其相互之間的幾何位置關係,計算總結出這些點,最終構成了一張人臉。
如果要辨認這張人臉是誰,機器還要提取面部特徵進行特徵建模,與需要對比的人臉比較後,根據相似程度,對人臉的身份資訊進行判斷。一旦人的面貌發生任何變化,哪怕只是輕微仰頭,燈光變換,機器都需要重新計算一遍。
據百度深度學習實驗室主任林元慶介紹,“為做到儘量精確,在百度的技術中,我們會在人臉上取72個點,最後通過神經網路計算,得到128維特徵,每一維特徵是人臉上的某種特點,比如獅子鼻”。
至於如何從72個點的資訊裡總結出128種特徵,並將每種特徵與人臉的特點一一對應,這是由深度學習從海量資料裡自動學到的。換句話說,工程師並不知道這種特徵究竟是“獅子鼻”,還是別的某種甚至沒有詞彙形容的特徵。
電腦辨認人臉原本就非常困難,但在《最強大腦》的舞臺上,又增加了時間跨度。現場嘉賓、北京大學心理學系教授魏坤琳解釋說,成長中的人臉變化極大,一個人一輩子連身份證都要換好幾次。對於人類來說,可以依靠整體神態、氣質等無法言說的因素去主觀猜測,但機器不會猜,只能根據深度學習得來的規律計算。
據林元慶介紹,為了備戰,團隊2個月裡讓小度看了200萬個人的2億張照片,並輔以少量有時間跨度的照片。經過“訓練”,小度自己總結出了一種不為人所知的人臉隨年齡變化的規律。
在遇到蜜蜂少女隊的雙胞胎時,人類和人工智慧的差別就顯示出來了:姐妹花長大後外表幾乎一模一樣,連姐妹倆自己都分辨不出舊照片裡的人是誰,王峰用肉眼也無法辨別她們的五官特徵。但是,在人工智慧的計算方式下,雖然她們的面部骨骼極其相似,差別特別細微,總還是有一點區別。最終,小度計算出,其中一位跟老照片裡的小姑娘有72.98%的相似度,另一位有72.99%,差距僅為萬分之一。
百度大腦認臉和Master下棋,哪個更難?
很巧合,在百度大腦參加最強大腦比賽的幾乎同一時間,曾經橫掃國際象棋界的阿爾法狗改名Master,重出江湖,以60場連勝頂尖圍棋手的傲人成績,震驚了全世界。
這也讓不少人好奇:如果Master和百度大腦比賽,誰輸誰贏?