淘新聞

阿裡發佈多智慧體協作研究成果 將引發機器智慧革命

4月5日,在新智元舉辦的通用智慧研討會上,阿裡巴巴研究人員與來自倫敦大學、清華大學、中科院、北師大的眾多專家就《基於雙向BiCNet網路的多智慧體協作在星際爭霸中的應用》這項研究成果,結合類腦計算、認知心理學、強化學習等熱點技術進行了深入研討。據悉,阿裡巴巴認知計算實驗室和倫敦大學學院發佈的這篇文章此前曾受到國際學術界和行業研究者的廣泛關注,包括牛津大學、清華大學、韓國科學技術院等多家國內外頂級院校和科研機構來函交流。行業專家表示,阿裡在研究星際爭霸遊戲過程中取得的成果將推動行業將機器學習研究的目標從單體能力提升擴展至團體能力的提升,進而增強機器之間的協作能力,引發AI(Artificial Intelligence)向MI(Machine Intelligence)轉變,為實現通用智慧探索新的方法。

圖為通用智慧研討會現場

阿裡認知計算實驗室負責人袁泉介紹,學界和工業界在對單個AI智慧體研究方面已取得了不俗進展,包括下圍棋的AlphaGo、打德州撲克的Libratus以及用於醫療診斷的Watson。但是,智慧的提升一方面來自個體,另一方面群體交流、協作也是提升智慧水準的重要手段;尤其針對人類不擅長的複雜問題,多AI智慧體協作、共同決策可能是個有效途徑,在電商、遊戲、醫療健康等領域都有廣泛應用前景。

圖為阿裡認知計算實驗室負責人袁泉講解技術原理

阿裡與倫敦大學學院合作的星際AI專案正是為研究這一課題而設置,袁泉表示,“星際爭霸這一遊戲蘊含了人工智慧的六大基礎問題,涉及感知識別、推理、規劃、不確定因素下的決策等各個層面,歡迎學術界和工業界一起來進行研究。今年初阿裡在GitHub上開源的Gym-StarCraft工具包也為共同研究提供了一個便利的環境。”

據介紹,該專案基於深度雙向協作網路BiCNet,首次提出了多個智慧體在意圖層面學習進行學習和溝通的觀點,並對強化學習中Actor-Critic演算法框架進行了創新拓展,引入了分組技術。在沒有使用人類示範和標注資料的情況下,BiCNet也能像人類一樣通過學習具備智慧協同作戰的能力。例如,多個槍兵在面對強敵之時學會邊退邊打,槍兵之間彼此互相掩護,實現敵進我退、敵退我打的陣型變化、陸空兵種協同等高級任務,是第一次在星際中展示可觀測到的協作智慧。

倫敦大學汪軍教授談到“我們的工作剛剛開始,人工多智慧體的研究就像打開一個潘朵拉盒子,將會對機器學習甚至是其他學科比如宏觀經濟學,社會學,生物的進化論的研究發生不可逆轉的影響。同時對系統層面的人工智慧應用場景,例如金融、電商、媒體、教育等等產生不同的影響”。

中國科學院計算技術研究所研究員、博士生導師史忠植對星際中的協作智慧予以高度肯定,“阿裡巴巴和汪軍老師這邊結合,以星際爭霸為背景, 演示智慧體集體智慧,協作完成複雜任務。2017年把人工智慧又推向更高的智慧高度,有很重要的影響。”中國腦計畫統稿人、認知與心理學研究專家范明提到,協作智慧是一種高級的人工智慧體現,阿裡的工作很具有前瞻性,並邀請阿裡巴巴加入中國腦計畫。

中國科學院自動化研究所研究員、博士生導師余山表示,“一個領域的發展,如果僅僅是學術興趣推動,可能比較慢。從IT的發展歷史看得出來,如果一個領域自身的發展能夠結合到整個社會大規模的商業性需求,發展速度會有數量級的提升。這是阿裡能夠做的事情,能夠為類腦的演算法、體系結構的設計找到真正的商業應用點,這個非常重要。”

研討會上,北京師範大學認知神經科學與學習國家重點實驗室教授、麥戈文腦科學研究所研究員吳思,清華大學醫學院生物醫學工程系、清華類腦研究中心及麥戈文腦研究中心研究員、博士生導師宋森分享的在腦神經科學中的研究成果,對類腦演算法的設計,起到了重要的啟發。袁泉介紹說,該項目接下來會對智慧體協作的若干關鍵問題進行深入研究,包括協作模型的通用性、協作效率的優化、協作通訊機制等,進而探索和觀察不同環境下多智慧體之間的“語言”及溝通的能力;同時協助業務技術團隊在阿裡巴巴進行應用。

不久之前召開的IT領袖峰會上,馬雲提出了與眾不同的關於人工智慧的見解,“人類有責任和擔當讓機器成為人的合夥人,成為人的合作夥伴,而不是讓機器來取代。”該專案如能順利探索發現智慧體之間的“語言”及基於“語言”展開協作的奧秘,將成為實現人與機器“合夥”的重要基礎;同時使得機器智慧之間因為協作溝通而實現跨越式發展。