警匪片裡才能看到！穀歌研發超圖元技術

警匪、諜戰片裡常會出現這樣一個鏡頭。一組探員在監控視頻裡發現嫌疑人的身影，但抓拍鏡頭太模糊無法辨認，此時往往會有技術人員敲幾下鍵盤就能把那張模糊的照片清晰放大，從而看清楚被抓拍人的樣子。這技術現在被Google變成了真的。

上周，Google Brain在arxiv上發表論文談如何用圖元遞迴超解析度（Pixel Recursive Super Resolution）技術實現上述影視作品裡的場景，把一張 8x8 圖元的超低解析度照片變成相對清晰、可以辨認清楚人物的照片。這個過程具體分兩步進行。

第一步是通過“調節網路”（conditioning network）試圖為低解析度照片與其他高圖元照片解析度進行匹配，Google會將高圖元照片縮小到8x8解析度。

圖片來自：Google

第一列是8x8圖元照片；第二列是Google Brain合成的照片，第三列是參考對象。

接著Google通過“優先網路”（prior network），將高圖元照片中的細節合成添加到低圖元圖片中。比如識別人臉時，Google會加入毛髮和皮膚細節。原照片頂部被識別出有棕色圖元，優先網路會將其識別為眉毛，因此當原照片被最終清晰放大時，這塊區域會被棕色眉毛形狀色塊填滿。

Google Brain表示，它們的超解析度技術實際測試時，10%的人認為人像照片是真人拍攝而非電腦合成放大，Google覺得這一比例達到50%時意味著技術相對完美了。當對另一組臥室照片進行測試時，28% 的人以為那是真的。

圖片來自：Google

這是另一組 Google 提供的測試結果。“Ours”一列是 Google 合成的照片，“Ground Truth”一列是參考對象。

Google用的超解析度技術在1990年代就已經在影像處理領域開展研究。但本質上，這種技術不是將照片真實、清晰地放大，而是通過神經網路將它們以盡可能接近真實的對照片進行合成、放大。除此之外，類似可以把模糊照片變清楚的技術還有濾波器。