二十一世紀的計算 | 微軟亞洲研究院洪小文54頁PPT講述人工智慧和人類智慧的 “共進化”

分類＼手機
時間＼2016-11-04

雷鋒網按：本文根據洪小文在“二十一世紀的計算”學術研討會所做的報告《Co-Evolution of Artificial Intelligence and Human Intelligence》編輯整理而來，在未改變原意的基礎上略有刪減。

近日，“二十一世紀的計算”學術研討會在韓國首爾舉行。它是微軟亞洲研究院自成立之初便開始舉辦的年度學術盛會。作為中國及亞太地區規模最大、最具影響力的電腦科學教育與研究盛會之一，迄今為止該大會已在中國、日本、韓國、新加坡等多個國家和地區成功舉辦了17屆，參會人數累計超過40000人。

今年的“二十一世紀的計算”大會以“Human and Machine Working as a Team”（人機協作）為主題。

洪小文博士，現任微軟全球資深副總裁，微軟亞太研發集團主席，兼微軟亞洲研究院院長，全面負責推動微軟在亞太地區的科研及產品開發戰略，以及與中國及亞太地區學術界的合作。洪小文博士師從圖靈獎獲得者拉吉·瑞迪（Raj Reddy），而拉吉·瑞迪則是人工智慧領域的奠基人和拓荒者約翰·麥卡錫（John McCarthy）的學生。洪小文博士從事人工智慧相關研究近30年，是國際公認的語音辨識專家。

昨天，洪小文博士在韓國進行了全英文演講，現場由劉鐵岩博士進行解讀。（劉鐵岩，微軟亞洲研究院首席研究員，美國卡內基梅隆大學（CMU）客座教授、英國諾丁漢大學榮譽教授、中國科技大學、中山大學、南開大學博士生導師。劉博士的研究興趣包括：人工智慧、機器學習、資訊檢索、資料採擷等。）

他今天和大家分享的是Co-Evolution of Artificial Intelligence and Human Intelligence(人工智慧和人類智慧的“共進化”)。在這次演講中，洪小文博士描述了諸如電腦視覺和資料採擷等人工智慧已經證明超過人類能力的領域的研究進展。他還將談論人類如何在創造力和判斷力方面做得更好。由於人工智慧是可以增強人類能力的工具，因此明確技術可行和不可行的內容與原則也十分重要，從而最終保證人工智慧能被恰當使用。

縱觀歷史，人類已經開發了幫助文明演變和成長的工具和技術。電腦及其擴展為人工智慧的發展提供了重要作用。首先，洪小文博士講到了人工智慧的3個不同的技術層面。

視覺識別

自然語言理解

資料分析

| 電腦視覺識別

先說電腦視覺識別，過去微軟亞洲研究院在電腦視覺領域有著世界領先的研究成果，在去年的ImageNet比賽和今年的COCO比賽中都有非常亮眼的表現。關於ImageNet，2014獲勝的系統錯誤率為6.7%，而2015微軟的系統的錯誤率已經低至3.57%，超過了人類的識別水準。

另外，當時微軟亞洲研究院的研究員們在當時的ImageNet挑戰賽中使用了一種前所未有，深度高達152層的殘差神經網路。

今年的COCO比賽，

尤其是COCO比賽的物體分割（Instance Segmentation）任務, 見下圖。

相比於圖像識別，圖像細分技術的難度遠超人們想像。這項挑戰主要考察在圖像中確定某些具體物件的技術。像之前傳統的全卷積網路雖然非常適合語義分割，它卻不適合圖像中的物體分割。

不過好在微軟研究院研發明了一種叫instance-aware fully convolutional network的演算法。

最終，以比第二名高11%的絕對優勢奪冠。

最近我們研究院的同事把電腦視覺上的前沿技術也拓展到了視頻分析之中。

在video captioning方面也取得了非常好的結果。

到此，洪小文博士分享了微軟認知服務目前提供的5大類21種API。

| 自然語音理解

下面講自然語音理解部分。微軟的工程師基於微軟認知服務開發了各種各樣的人工智慧應用，在自然語言處理方面，微軟小冰/Rinna是一個非常好的展示。小冰不僅重視問答，還關注和用戶的感情溝通。大家有空可以去試試~~

上圖從左至右分別是：How_old.net, twins or not.net, mymustache.net, 鬧鐘應用mimicker alarm 和caption robot。擁有了這些強大的人工智慧API，開發者都不需要擁有人工智慧或者機器學習背景，就可以開發出自己的有趣應用。

而且小冰還説明一些網站做客戶服務，不僅帶來了很好的客戶滿意度，還提升了銷售量。也說明我們的自然語言處理技術不僅可以應用在聊天上，對於企業級的應用也有很好的支持。

這樣，就可以真正把開發者的精力解放出來，而只用集中在自己天馬行空的創意應用上~此前，在第四代小冰發佈後，我們還與敦煌研究院進行合作，推出了敦煌小冰服務。借助自主知識學習技術（Doc Chat），小冰能夠在很短的時間內，迅速地從大量專業資料中學習相關領域的知識。

當然，除了小冰，我們在企業內部應用方面還有很多其他的新技術，比如自動會議助理EDI等。現在在微軟研究院內部，七、八成的會議都是通過這個人工智慧助理來訂的，它可以用自然語言對話作為對話模式，自動尋找最合適的會議室和時間段，解決各種潛在的衝突。

| 資料分析

洪小文博士接下來分享了微軟在資料分析和資料視覺化上的成果。

關於第三個層面的人工智慧，小文提到的是business intelligence，介紹了微軟亞洲研究院在大資料分析方面的最新成果。

Power BI是微軟推出的線上服務，通過powerbi.com能夠讓你用最直觀的方法對資料進行處理，例如查找和呈現資料、線上共用資料、團隊協同合作，等等。

BI即商業智慧（Business Intelligence, BI）。微軟亞洲研究院的軟體分析組（Software Analytics Group）和微軟總部的Power BI產品團隊在過去兩年內有著非常密切的合作。去年我們推出了Quick Insights幫你智慧地洞察大資料背後的秘密，今天我們和Power BI 共同推出了Infographic Designer, 幫你迅速將資料變為視覺化的圖片。

上圖是副院長

張益肇

博士在演示AnnaTalk技術，可以根據使用者輸入的自然語言查詢，對相關資料進行複雜的分析，生成圖表，提供洞察。

微軟亞洲研究院軟體分析組的研究工作可以分為

應用領域和基礎研究領域

。

從應用領域來說，軟體分析組以軟體為研究物件，主要採用資料驅動的方式解決三個方面的問題，

一是軟體系統的品質（Quality），如可靠性、性能、以及安全性等；

二是使用者體驗（Experience），如使用者介面、使用者使用方式、以及使用者黏度，等等；

最後是軟體發展效率（Productivity）。

為了解決這些應用領域中的問題，我們需要在一些基礎研究領域內有相應的技術支撐，包括大規模資料存儲與計算、各種資料分析演算法、以及資訊視覺化。Anna Talk也是軟體分析組的秘密黑科技~猜猜Anna是誰的名字。

人工智慧和人類智慧的共進化

介紹完了微軟亞洲研究院在三個層面上的人工智慧研究成果以後，洪小文博士開始探討人工智慧更深層次的問題，以及它和人類智慧的

共進化

。

我們現有的資源與之前可謂不同日而語——部署在雲端的海量計算資源已經像水和電一樣唾手可得了；互聯網所容納的資訊也遠遠超過了過去幾千年來人們所有的知識儲備；以深度學習等為代表的機器學習演算法的發展，也讓電腦能夠從這些龐大的資料中獲取知識。

洪小文博士指出，人類智慧的優越性在於從小樣本中、甚至0樣本中進行學習和推理。而以深度學習為代表的人工智慧技術則更適合從大資料中學習。

下面向大家提出了一個問題，人工智慧中的“智慧”究竟指什麼呢？洪小文博士將智慧分為四個階段。

第一級，功能（Capability）。功能是工具的價值點，對於人類最有意義，也一直推動著人類社會的進步。從石刀石斧、鼎鑊簋盂、塤箏鐘磬到今天的跑車、遊輪、客機，工具萬千，各有所用。

第二級，智能（Intelligence）。有趣的是，“智慧”的概念是跟著時代的發展而不斷改變的。記憶力是一種智慧嗎？倒退幾百年的話，顯然是。科舉、八股文所考察的首先是應試者對古老經典全域與細節的記憶。算術是一種智慧嗎？曾經是——《水滸傳》裡有位好漢叫神算子蔣敬，職司梁山錢糧支出納入，可說是梁山一百單八將裡少見的頭腦與肌肉兼具的人才。下棋是一種智慧嗎？當然是。雄踞國際象棋第一高手寶座時間最長的棋手加里-卡斯帕羅夫曾被譽為“全世界最聰明的人”——但在今天，說起記憶力、算數和弈棋（不包括圍棋），電腦比人類更在行，但大部分人可能不會認為這些有多高智慧多了不起。另外，IQ（Intelligence Quotient）測試是個有趣的話題——由於測試全程通常都會給出各種選項，機器在應對這種智慧商數的挑戰時其實是有很大的幾率得高分的，我猜測，未來十年內，將會出現IQ測試拿最高分的機器。

第三級，智力（Intellect）。智力比智慧更高一籌，“力”這個字裡包含了判斷力、創造力等資訊。對人類來說，每天我們面對的大多都不是選擇題，又或是有著無窮選項的選擇題。例如，我在微軟亞洲研究院的日常工作，大部分都不是非此即彼的選擇——一個研究團隊需要補充人手，我不能簡單地回答“可以”或“不可以”，而是要結合實際情況，包括預算、課題、團隊現狀、發展前景等多方面的因素，來判斷團隊是否真的急需補人、補多少人和什麼樣的人，或者是否可以通過與其他組的合併來內部解決。今天的AI，基本上沒有能力在缺乏資料的情況下，創造出如天外飛來一筆的新的選項。

第四級，智慧（Wisdom）。智慧往往是由豐富閱歷、深邃思考積澱而來的洞察——所以我們經常說某位長者智慧深廣、堪為導師。所有的智慧都不是用選項的形式來表述的，就像火種，它能在特定的時刻引燃人們思想的火花，照映前路。哪怕再過很久很久，機器也不大可能產生真正的智慧。

大家覺得現在我們說的“人工智慧”站在第幾層臺階上呢？

截至目前，全世界最“聰明”的機器也只是站在了第二級臺階上

——AI這個概念的大部分含義其實是“功能”，還有一定的“智慧”。“智慧”與“智力”只差一個字，但對機器而言卻好像是鴻溝天塹，極難攀越——至於讓機器具備“智慧”，劇作家和導演當然會繼續開發此類題材的科幻電影，但科學家們所得到的進展卻微乎其微。

洪小文博士認為，機器進化至今，已堪稱無人能匹敵的“最強左腦”，可是機器也有著明顯的極限和天花板，那便是它們從未發展出右腦能力——

至少截至目前，沒有任何跡象顯示，機器能以某種形式像人類右腦那樣進行創新和創造

。

洪小文博士認為人腦認知後通常會舉一反三，擁有無窮的創造力。圖像識別、語音辨識也是一樣。機器能分辨貓和狗，能根據使用者語音指令查詢天氣、訂購外賣，但這並不代表機器真真擁有智慧了。

總之，人類發明的電腦可以成為最好的左腦，而人類自身則繼續保有最好的右腦。機器沒可能也沒必要取代人類，

因此，HI+AI（人類智慧+人工智慧）、創新演算法+計算才是潛力無限的組合

，

才是人工智慧走向更強之路的最佳途徑。就是“共進化” Co-Evolution

。

接下來

，洪小文博士用一個視頻跟大家解釋了中文房間概念，中文房間（英語：Chinese room），是由約翰·希爾勒提出的一個思想實驗，藉以反駁強人工智慧的觀點。

根據強人工智慧的觀點，只要電腦擁有了適當的程式，理論上就可以說電腦擁有它的認知狀態並且可以像人一樣地進行理解活動

。

一個對漢語一竅不通，只說英語的人關在一間只有一個入口的封閉房間中。房間裡有一本用英文寫成的手冊，指示該如何處理收到的漢語訊息及如何以漢語相應地回復。房外的人不斷向房間內遞進用中文寫成的問題。房內的人便按照手冊的說明，查找到合適的指示，將相應的中文字元組合成對問題的解答，並將答案遞出房間。

約翰·希爾勒認為，儘管房裡的人可以以假亂真，讓房外的人以為他確確實實說漢語，他卻壓根不懂漢語。在上述過程中，房外人的角色相當於程式師，房中人相當於電腦，而手冊則相當於電腦程式：每當房外人給出一個輸入，房內的人便依照手冊給出一個答覆（輸出）。而正如房中人不可能通過手冊理解中文一樣，電腦也不可能通過程式來獲得理解力。既然電腦沒有理解能力，所謂“電腦於是便有智慧”更無從談起了。

（文中房間視頻位址 http://v.qq.com/x/page/x0340dupqyj.html）

那麼，大腦（Brain）、心靈（Mind）、意識（Consciousness）是一回事嗎？“我”這個詞來自于心靈對自身的一種定位和認同，心靈決定了“我”是什麼樣的人，為什麼和別人不一樣。而意識則像是時刻都在流動的具有工具性質的運算程式。

紐約州立大學的心理學家小戈登·蓋洛普（Gordon Gallup Jr.）主持的“鏡子測試”表明，猩猩、大象和海豚似乎能認出鏡中映射是自己，這說明，這些動物已聰明到具有自我意識，那它們也有心靈嗎？也有“我”的定義嗎？

可以說，現在的人工智慧還完全處於弱人工智慧的階段。洪小文指出，現在還有很多AI無法做到、但是對於人來說是再平常不過的事情，比如自我意識、創造力等等。

因此比較好的對待AI的態度應該是人和機器各取所長，相得益彰，實現共同發展。"Human + Machine = Superman": 讓電腦在大資料上運行人類發明的演算法！

我們正在走向“奇點”了嗎？小文博士認為我們現在的擔心還為時尚早。P=NP嗎？

需要快速思考來解決的問題就交給電腦吧，把人腦解放出來去解決那些需要深思熟慮的問題！