淘新聞

警匪片裡才能看到!穀歌研發超圖元技術

警匪、諜戰片裡常會出現這樣一個鏡頭。一組探員在監控視頻裡發現嫌疑人的身影,但抓拍鏡頭太模糊無法辨認,此時往往會有技術人員敲幾下鍵盤就能把那張模糊的照片清晰放大,從而看清楚被抓拍人的樣子。這技術現在被Google變成了真的。

上周,Google Brain在arxiv上發表論文談如何用圖元遞迴超解析度(Pixel Recursive Super Resolution)技術實現上述影視作品裡的場景,把一張 8x8 圖元的超低解析度照片變成相對清晰、可以辨認清楚人物的照片。這個過程具體分兩步進行。

第一步是通過“調節網路”(conditioning network)試圖為低解析度照片與其他高圖元照片解析度進行匹配,Google會將高圖元照片縮小到8x8解析度。

圖片來自:Google

第一列是8x8圖元照片;第二列是Google Brain合成的照片,第三列是參考對象。

接著Google通過“優先網路”(prior network),將高圖元照片中的細節合成添加到低圖元圖片中。比如識別人臉時,Google會加入毛髮和皮膚細節。原照片頂部被識別出有棕色圖元,優先網路會將其識別為眉毛,因此當原照片被最終清晰放大時,這塊區域會被棕色眉毛形狀色塊填滿。

Google Brain表示,它們的超解析度技術實際測試時,10%的人認為人像照片是真人拍攝而非電腦合成放大,Google覺得這一比例達到50%時意味著技術相對完美了。當對另一組臥室照片進行測試時,28% 的人以為那是真的。

圖片來自:Google

這是另一組 Google 提供的測試結果。“Ours”一列是 Google 合成的照片,“Ground Truth”一列是參考對象。

Google用的超解析度技術在1990年代就已經在影像處理領域開展研究。但本質上,這種技術不是將照片真實、清晰地放大,而是通過神經網路將它們以盡可能接近真實的對照片進行合成、放大。除此之外,類似可以把模糊照片變清楚的技術還有濾波器。