淘新聞

蘋果首份AI論文橫空出世,提出SimGAN訓練方法

當AI浪潮襲來,穀歌、Facebook、微軟等幾個山頭恨不得把自己都浸沒在潮水裡,可勁打滾兒的時候,蘋果這座孤島卻始終有一種不願被沾濕的姿態。

12月初,在灑滿陽光的西班牙NIPS大會上,蘋果AI研究團隊負責人Russ Salakhutdinov曾興奮地宣佈,蘋果將允許其AI研究人員對外發佈論文。那之後,眾人都在翹首以待,巴巴等著這個這個世界上市值最高的公司(截至12月23日市值6172.34億美元)的第一篇AI論文將以何種面目出現。

今天,這篇論文出來了。蘋果伸出了手指,試探了一下海水。

這篇題為《通過對抗訓練從模擬的和無監督的圖像中學習》(Learning from Simulated and Unsupervised Images through Adversarial Training)的論文於12月22日提交給了arXiv.org,一經發佈迅速點燃了媒體頭條。

蘋果這篇圖像識別領域的論文,提出了一個所謂“模擬+無監督學習”(simulated + unsupervised learning),使用了如今最炙手可熱的深度學習“對抗訓練”。

而有著“GANs之父”之稱的Ian Goodfellow在推特裡直接評論道:“蘋果第一份機器學習論文是關於GANs的。”

於是,GANs又借勢火了一把。

生成對抗網路(GANs)的經典過程

所謂的GANs模型,就是讓兩個網路相互競爭,玩一個“貓鼠遊戲”。

一個叫做生成器網路G( Generator Network),它不斷捕捉訓練庫裡真實圖片的概率分佈,將輸入的隨機向量轉變成新的樣本。一句話,G負責生成假圖片。

另一個叫做判別器網路D(Discriminator Network),它可以同時觀察真實和假造的資料,判斷這個圖片到底是不是真的。

G嘗試用自己的贗品來“矇騙”D,而D也不斷提高自己鑒別贗品的水準。這樣G的造假能力和D的鑒別能力都會越來越高超。

在機器學習領域,需要海量的資料來訓練模型,而海量資料本身的獲取都成問題。AI界常有這麼個說法:

“誰手握了數據,誰就佔據了人工智慧的制高點。”

南京大學周志華教授也曾經在演講中提到機器學習應用的限制因素:

機器學習雖然能力很強,但它並不是一個萬能的東西

。至少有兩件事,我們經常都要提醒自己,機器學習可能是做不了的。

第一種情況,如果我們的拿到的資料特徵資訊不夠充分,那麼機器學習可能就幫不上忙;第二種情況,如果資料樣本的資訊非常不充分,那麼這種情況也基本上解決不了問題。

所以,GANs最具革命性的地方在於,它的生成器G自己產出資料,而人只需要最初輸入一些隨機向量。無怪乎,Yann LeCun曾評價說:

對抗訓練是切片麵包以來最酷的事情

(Adversarial training is the coolest thing since sliced bread)。”

蘋果的SimGAN訓練方法

但是蘋果這份論文裡提到的模型,與GANs還是有些微不同的。他們想要解決的問題就是:提升合成圖像的品質。他們對GANs稍加修改,提出了“SimGAN”訓練方法,其中的“Sim”指的就是單詞“模擬器”。論文摘要裡提到:

“我們的模擬+無監督學習方法,使用的對抗網路跟GANs很類似。但是,輸入值是合成圖像,而不是隨機向量。”

蘋果的SimGAN其實包括三部分:模擬器(Simulator)和精製器(Refiner),然後再加上一個判別器(Discriminator)。模擬器合成圖像,再用精製器優化,最後喂給判別器訓練。

有學術圈內人士對這篇論文的“含金量”表示懷疑,然而蘋果這份論文“試水”的意義其實遠大於論文本身的意義。Forbes評論道:

這篇AI論文,是蘋果標誌性的一步

對於AI業界來說,這表明蘋果要邁開步子、扛著大旗來攪動海水了。

這篇論文的第一作者是Ashish Shrivastava,其個人主頁上顯示為馬里蘭大學電腦視覺博士。

其它共同作者還有5人,分別是Tomas Pfister, Oncel Tuzel, Wenda Wang(華裔), Russ Webb 和Josh Susskind。但是蘋果的“秘密文化”並沒有一下子就敞開大口,這6名研究人員,除了Tomas Pfister之外,雷鋒網在Twitter上很難找到其它5人的蹤跡,而Tomas Pfister這位劍橋、牛津雙名校的高材生,至今發過的推文也只有5條而已。