淘新聞

OpenAI發佈“宇宙”平臺,用1000+訓練環境賦予AI“類人智力”

當人工智慧領域大牛在西班牙NIPS會議酒店吃早餐的時候,Open AI 宣佈開源了其新平臺“宇宙”(Universe)。這家由伊隆·馬斯克資助的非贏利性AI開源組織,在週一的上午搞了個大新聞,相信NIPS的餐桌上一定熱鬧非凡。當然,Open AI後續也在NIPS的會場展示了自己的成果。

Open AI 聯合創始人Greg Brockman 在Twitter上說道,“這個AI 訓練架構,是我們從Open AI建立之初就在計畫著的”。可見Open AI對這個平臺的重視。

那麼這個敢以“宇宙”命名的 Universe是個什麼東西呢?

掌握人類的“普通智力”

OpenAI官網的介紹是:Universe軟體平臺,通過全世界的遊戲、網頁和其它應用,來測量和訓練AI的普通智力。

在Universe上,AI智慧體像人一樣使用電腦:觀看視頻,並操作鍵盤和滑鼠(只不過是虛擬的)。總而言之:人類可以在網路上做的事情,Universe都可以讓AI智慧體經歷一遍,目的就是訓練智慧體掌握類似於人類的“普通智力”。

如今的AI技術,已經使電腦能看、能聽和翻譯,還能產生圖像、聲音和文本,AlphaGo甚至擊敗了李世石。

但是

如今的AI技術仍然逃脫不了“窄AI”的範疇

,也就是說,它可以在某一個特定領域達到超強表現,但是一旦超過這個領域,就無法工作。AlphaGo能在圍棋上輕鬆贏過任何人,但是沒法去玩其他的棋類遊戲。

而Universe平臺,就是為了打破“窄AI”的樊籬而誕生的。其核心架構由 Greg Brockman, Catherine Olsson和Alex Ray三人一起建構。

OpenAI創始人Ilya Sutskever在接受《連線》採訪時說道:“

一個AI智慧體就是應該能夠解決你扔給它的任何問題。

”這聽起來有點過於大膽了,甚至有點“天方夜譚”。但Sutskever將Universe與ImageNet作類比,他認為ImageNet説明電腦能夠像人一樣地“看見”,如今穀歌和Facebook的眾多app已經可以做到這一點了,而Universe要做的,就是將人工智慧朝向每一個維度擴展。

1000+訓練環境

早在今年4月,OpenAI 發佈了一個名為Gym的工具包,用來開發和比較增強學習演算法,包括了眾多訓練環境(Environments)。如今在Universe上,任何一個程式都可以轉變成一個Gym環境。

今天發佈的Universe,可以在1000多個環境裡運行,包括Flash 遊戲、流覽器任務等。Universe 搞定了 Valve 和 Microsoft這樣的遊戲巨頭,獲得了遊戲授權。

(Universe平臺的部分合作方)

其實在遊戲裡訓練智慧體不是新鮮事兒,因為遊戲的內容是可控的,有清晰的獎懲機制,所以智慧體在其中可以穩定地學習什麼可以做,什麼不可以做。比如加拿大阿爾伯塔大學提供了經典遊戲Atari的學習環境,微軟則基於Minecraft遊戲打造了Malmo系統。

可以說,從訓練智慧體這一點來看,視頻遊戲已經給真實世界帶來了積極的影響。

不過相比而言,Universe不僅可以在眾多遊戲環境裡,還能在流覽器任務等任何網路環境裡運行,其覆蓋面超過了以往任何同類系統。

意義:省錢

DeepMind之前建立了一個可以在Atari遊戲裡訓練的智慧體,並使用相似的技術來對穀歌全球資料中心網路進行精細化訓練,以此來節省每年數百萬美金的成本支出。

Craig Quiter目前是Otto公司的工程師,這家自動駕駛卡車公司今年夏天被Uber收購。 在任職Otto之前,Quiter曾參與過Universe的開發工作,由於此前對該平臺早已熟悉,他對 Universe“省錢”的功能興致勃勃,正在打造一個可以玩“俠盜獵車手V”遊戲的智能體。

目前Otto的自動駕駛系統可以在相對平穩的環境下運行,但是在未來幾年,該公司希望可以隨時對路上遭遇的惡劣狀況做出反應,而“俠盜獵車手V”裡此起彼伏的驚險車況,對於Otto的自動駕駛系統是個很好的訓練素材。

Sutskever表示,在長期看來,Universe平臺以後甚至可以用於“遷移學習”:智慧體把一個場景中學到的東西應用到另一個場景。他表示目前已經在著手建立一些智慧體,將一個賽車遊戲裡學到的東西,應用在新的遊戲裡。