OpenAI發佈“宇宙”平臺，用1000+訓練環境賦予AI“類人智力”

當人工智慧領域大牛在西班牙NIPS會議酒店吃早餐的時候，Open AI 宣佈開源了其新平臺“宇宙”（Universe）。這家由伊隆·馬斯克資助的非贏利性AI開源組織，在週一的上午搞了個大新聞，相信NIPS的餐桌上一定熱鬧非凡。當然，Open AI後續也在NIPS的會場展示了自己的成果。

Open AI 聯合創始人Greg Brockman 在Twitter上說道，“這個AI 訓練架構，是我們從Open AI建立之初就在計畫著的”。可見Open AI對這個平臺的重視。

那麼這個敢以“宇宙”命名的 Universe是個什麼東西呢？

掌握人類的“普通智力”

OpenAI官網的介紹是：Universe軟體平臺，通過全世界的遊戲、網頁和其它應用，來測量和訓練AI的普通智力。

在Universe上，AI智慧體像人一樣使用電腦：觀看視頻，並操作鍵盤和滑鼠（只不過是虛擬的）。總而言之：人類可以在網路上做的事情，Universe都可以讓AI智慧體經歷一遍，目的就是訓練智慧體掌握類似於人類的“普通智力”。

如今的AI技術，已經使電腦能看、能聽和翻譯，還能產生圖像、聲音和文本，AlphaGo甚至擊敗了李世石。

但是

如今的AI技術仍然逃脫不了“窄AI”的範疇

，也就是說，它可以在某一個特定領域達到超強表現，但是一旦超過這個領域，就無法工作。AlphaGo能在圍棋上輕鬆贏過任何人，但是沒法去玩其他的棋類遊戲。

而Universe平臺，就是為了打破“窄AI”的樊籬而誕生的。其核心架構由 Greg Brockman, Catherine Olsson和Alex Ray三人一起建構。

OpenAI創始人Ilya Sutskever在接受《連線》採訪時說道：“

一個AI智慧體就是應該能夠解決你扔給它的任何問題。

”這聽起來有點過於大膽了，甚至有點“天方夜譚”。但Sutskever將Universe與ImageNet作類比，他認為ImageNet説明電腦能夠像人一樣地“看見”，如今穀歌和Facebook的眾多app已經可以做到這一點了，而Universe要做的，就是將人工智慧朝向每一個維度擴展。

1000+訓練環境

早在今年4月，OpenAI 發佈了一個名為Gym的工具包，用來開發和比較增強學習演算法，包括了眾多訓練環境（Environments）。如今在Universe上，任何一個程式都可以轉變成一個Gym環境。

今天發佈的Universe，可以在1000多個環境裡運行，包括Flash 遊戲、流覽器任務等。Universe 搞定了 Valve 和 Microsoft這樣的遊戲巨頭，獲得了遊戲授權。

（Universe平臺的部分合作方）

其實在遊戲裡訓練智慧體不是新鮮事兒，因為遊戲的內容是可控的，有清晰的獎懲機制，所以智慧體在其中可以穩定地學習什麼可以做，什麼不可以做。比如加拿大阿爾伯塔大學提供了經典遊戲Atari的學習環境，微軟則基於Minecraft遊戲打造了Malmo系統。

可以說，從訓練智慧體這一點來看，視頻遊戲已經給真實世界帶來了積極的影響。

不過相比而言，Universe不僅可以在眾多遊戲環境裡，還能在流覽器任務等任何網路環境裡運行，其覆蓋面超過了以往任何同類系統。

意義：省錢

DeepMind之前建立了一個可以在Atari遊戲裡訓練的智慧體，並使用相似的技術來對穀歌全球資料中心網路進行精細化訓練，以此來節省每年數百萬美金的成本支出。

Craig Quiter目前是Otto公司的工程師，這家自動駕駛卡車公司今年夏天被Uber收購。在任職Otto之前，Quiter曾參與過Universe的開發工作，由於此前對該平臺早已熟悉，他對 Universe“省錢”的功能興致勃勃，正在打造一個可以玩“俠盜獵車手V”遊戲的智能體。

目前Otto的自動駕駛系統可以在相對平穩的環境下運行，但是在未來幾年，該公司希望可以隨時對路上遭遇的惡劣狀況做出反應，而“俠盜獵車手V”裡此起彼伏的驚險車況，對於Otto的自動駕駛系統是個很好的訓練素材。

Sutskever表示，在長期看來，Universe平臺以後甚至可以用於“遷移學習”：智慧體把一個場景中學到的東西應用到另一個場景。他表示目前已經在著手建立一些智慧體，將一個賽車遊戲裡學到的東西，應用在新的遊戲裡。