淘新聞

李彥宏、馬化騰、沈向洋三巨頭對話人工智慧的應用和未來 | 2017 IT領袖峰會

雷鋒網消息,4月2日,2017中國(深圳)IT領袖峰會正式開幕,騰訊董事會主席兼首席執行官馬化騰、百度創始人、董事長兼首席執行官李彥宏、微軟全球執行副總裁沈向洋圍繞“人工智慧”的主題進行了高端對話。

馬化騰由“絕藝”談到騰訊對於人工智慧的理解,他用了“恐怖”這個詞彙來描述對於AI強大的自我學習能力的感受。李彥宏談及了百度在非常早的時期佈局人工智慧的緣由,他還認為,人工智慧並不是互聯網的一部分,而是顛覆性的技術革命。沈向洋博士談到現階段微軟在人工智慧方面的主要方向,是互動式人工智慧。以下分別是馬化騰、李彥巨集、沈向洋對話實錄,雷鋒網編輯整理。

馬化騰:沒有場景支持的AI研究,是空中樓閣

問:騰訊為什麼重視人工智慧,為什麼做絕藝這個項目?

馬化騰

:其實李彥宏是人工智慧走得更前了,對騰訊來說我們還是落後一些,只是去年剛開始成立的部門。當然在我們所有BG內部結合它的業務形態,像我們微信裡面,超過上百億條消息,包括我們圖片、特別是做社交網路,裡面有人臉資料圖片絕對是天文數字,每天高達上十億張有人臉照片。這方面的技術研究在各個BG有相當長時間研究。包括後臺資料分析、廣告匹配都用了人工智慧技術,只是大家感受不到。因為他在後端。我們在前端也希望做出一些產品,剛好一年前Alpha Go它的paper出來,通過人機對戰讓全世界對人工智慧認知到了一個新的高☆禁☆潮。我們團隊本著練兵的心態也做了嘗試。

穀歌收購了deepmind團隊發表的論文,原來做電腦圍棋的團隊都紛紛採用深度學習方法來融入原有的似乎已經走進瓶頸的電腦圍棋軟體發展中,大家不約而同在這一年中起步。我們內部團隊有三個團隊也在做,只是分在不同部門。這個部門剛好是它能夠突破這個瓶頸,也動用了公司相當的大的後端的電腦資源,絕藝和Alpha Go最大的不同,是我們的絕藝AI的成長,全程得到了國家級圍棋世界冠軍的陪練,然後找出它為什麼不同。我們十幾位研發人員不懂圍棋的,一開始連黑先下還是白先下的規則都不懂,我們從電腦原理、工程實現以及結合中國包括很多的專家來去訓練。

我們覺得絕藝算是小小的成功吧,但是也不能過於欣喜,畢竟是站在前人肩膀上,因為你沒有發佈這個paper,我們也不可能做出來。但是也不能說這是毫無疑義的事情。這裡面給我們最大的思考,過去我們對AI很多是從一些規則、從簡單的訓練得出來的能夠改善我們計算處理的這樣一種能力,最終我們發現其實還有一個更恐怖、更深層的意義在於他能夠在電腦的後臺能夠用雲計算、大資料方式能夠高速的自學習,能夠自己跟自己對弈。所以AlphaGo出來後,它的下一代master,經歷了數十億盤自我對弈,已經超越過去所有人類交戰的盤數,然後它自己尋找規律,找到的已經遠遠超過人類過去在圍棋領域認知的範圍,是極大的擴展,這是給我們一個很大的啟示。

在很多的領域——圍棋以外的領域,不管是醫療(剛才講的病理的檢測),以後的金融,現實中的每個行業,如果能用電腦後臺做出一個模擬器,能夠讓它充分嘗試,就像開車一樣,你可能不用教自動駕駛怎麼開車,就模擬一個現實環境,給它一個規則,讓它駕駛,它去撞,有各種回饋,自然會琢磨出一套理論和經驗,這是給我們帶來巨大思考。在很多領域如果能做出模擬器,定義出很多參數,自己學習,他能找到規律可能遠超我們現在想像的。這是我們最大的啟示。

問:人工智慧要取得突破性進展,是模仿人的神經網路、人腦的效率,通過仿生人腦思維的方式突破,還是完全不一樣的方式?

馬化騰

:我們期待有本質性的飛躍,比如說發現飛機的空氣動力學、流體動力學和鳥不一樣的,車輪和人型馬一樣,仿生是某些垂直的領域,包括圍棋是選非常窄的領域,通過各種參數訓練。

郭為剛提到用AlphaGo下一盤棋消耗多少能源,垂直領域訓練消耗能源,但是實際用消耗不了多少。現在訓練出來的單機版本跟職業棋手差不多,訓練需要很長時間,最麻煩的是改一個參數,規則改一點、演算法改一點,全部重新來消耗很大,所以這屬於很窄的技能模擬。

未來下一步到通用的,再下一步是不是有更本質性的發現背後的原理,智慧其實可以超越現在碳基智慧,是不是有其他的元素可以形成更高級的生命和智慧呢?這是超越人類現在發現的知識,這是有可能的。

有人突發奇想說,現在認識的宇宙是高智慧生命用量子計算模擬出來的環節,一切都是模擬起來的,這是發揮大家腦洞大開的想像力吧。

問:有沒有可能把資料分享出來,讓這些創業公司來用?

馬化騰

:這個問題在內部我們也有激烈討論。首先看人工智慧我們關注那幾塊,第一個是場景。第二個是大數據。場景就是你想把這個技術應用在什麼場景下,你是不是有高頻的跟用戶接觸,這是一個落地的很重要的地方。所以我們看到很多研究院也好,包括我們內部研發團隊。如果沒有場景落地,沒有平臺支持,基本上就是空中樓閣,研究一半很難往下走。第二個是大資料,大資料也是從平臺、業務部門有大量實際運轉資料才能產生出來。但是這裡面很多大資料是垃圾資料,因為沒有標籤,每人做規劃定義,用多好的演算法也學不出來,學出來也是走火入魔,沒有用的。資料清洗、標籤化難度非常高,我們甚至要雇傭很多人用人手的辦法,先用人腦清洗乾淨,再讓AI學習。這裡面是一個混合結合的過程。第三,計算能力,也就是你有雲的資源,拿幾十萬核的計算能力,CPU、GPU,我們還是有這個能力的。而且在雲裡面本身就可以很好的調用,這是我們第三個優勢。第四個,一年前我們比較缺乏的就是人才。通過一年我們也招了挺多的人,我們在微軟、在西雅圖還設置了一個實驗室。因為很多微軟的人不願意離開西雅圖,所以我們就在旁邊設,沒有辦法,人才就是這樣。幾個方面結合起來才有辦法真正在某一個領域看到它的成效。

我們現在觀察到很多的AI所謂的大拿們,他們更關注怎麼落地,能不能把畢生研究成果能夠體現出來,所以在我們內部在吸引人才的時候,往往也會說你們微信、手機QQ裡面的平臺資料能不能給他們用,但是事實上大家都知道,BG、部門裡面的平臺他們也很希望近水樓臺先得月,資料就在我身邊流動,我為什麼不能招人先研究一把,為什麼給你呢。我們現在還處在內部怎麼把資料分享出來這個階段。當然這裡面還有一個用戶很關注的個人隱私,別把我的資料都賣了,到時候大家都知道,這裡面還有一個很複雜的資訊安全個人隱私脫敏,你是不知道無法根據資料倒推到哪一個人做了什麼事情,我們要把這些處理乾淨才能往下一步談。這裡面資料清理到什麼標籤,才能給其他部門、包括外部合作夥伴怎麼用。同時有很多資料來自合作夥伴,業界其他公司,他們也遇到這樣的問題那者一堆裸資料不怎麼用,這樣業界還要有一個標準,互惠互利交換,這是一個大方向,還有很長的路要走。

李彥宏:人工智慧不是互聯網的一部分,它是顛覆性的

問:當年百度為什麼那麼早做人工智慧佈局?

李彥宏

:我其實也思考過這個問題。從百度的基因來說,我們從一開始成立到現在最主要是做搜索。搜索本質上是機器試圖理解人想要的東西。我們一開始用各種各樣電腦方法試圖理解人的意圖。我在想一個問題,深度學習在圖像檢索裡頭的效果不錯,是一個偶然還是它代表一種趨勢?分析完之後,覺得它是代表一種趨勢的,它不僅僅對於圖像搜索有用,它對很多其他電腦科學要解決的問題都是非常有用的。原因就是,隨著互聯網這麼多年發展,資料越來越多,越來越豐富,計算資源越來越便宜,越來越強大。人工智慧有60年歷史,前50年,為什麼大家不看好,為什麼大家覺得人工智慧沒有用?我在美國讀書的時候,我就很喜歡人工智慧這門課,但是學完之後,教授告訴我說其實沒用,人工智慧沒有一個真正有商業價值的應用,你將來靠這個是找不著工作的。

到現在最近幾年,原來認為沒用東西變成有用,是因為市場環境變了,條件變了,原來認為不可能的事情現在變成可能了。分析了環境因素之後,覺得人工智慧是代表未來的。所以我們在2013年1月份對外宣佈成立深度學習研究院,這個可能是全球工業界第一個用深度學習來命名的這麼一個研究院。而且等於我自己食言了,我2013年以前不斷跟外界說我們是一個商業公司,我們不應該成立研究院,不應該搞純的研究機構,這些機構要想轉化成產品,進入市場被市場所認可的話,應該跟那些產品部門、跟那些業務部門緊緊結合在一起,而不是單獨成立一個研究院,但是深度學習這一波起來之後,我覺得是完全不一樣的東西,他需要在理論上、在演算法上,在很多方面有長遠的佈局和突破,所以從那個時候開始大規模投入去吸引人才,去推進演算法,其實不光是演算法,在剛才朱民講的時候也講到各種各樣晶片結構層、CPU到GPU等等,都要審視演算法的需求。所以現在看起來人工智慧比2013年我們決定進入的時候一個更要大的產業。前一陣我對外講了,互聯網其實現在只是一道開胃菜,真正的主菜是人工智慧,所以人工智慧不是互聯網的一部分,不是互聯網第三個階段,它是堪比工業革命一個新的技術革命。

問:百度深度學習有一個開放的平臺,你們不覺得這樣開放以後會培養出競爭對手?

李彥宏

:我覺得人工智慧是一個非常大的產業,而且是會持續很長時間。像我們現在的判斷未來20-50年都會是一個快速發展的人工智慧時期。在這種時代大潮下,顯然不是一個公司能夠把所有的事情都做下來的。相反,對於一些小機構沒有這麼多計算資源和長遠研發能力,但他們可能會對垂直領域的瞭解更加深刻,我們為他們提供一些這樣的平臺,讓他們去做,這會推動整個人工智慧技術的發展。而且我們也能夠在平臺上看到大家在幹什麼事情,哪些方向發展的會更快,哪些領域更適用於現在已經解決的技術。所以我們把平臺開放出來,對大家都有益。

我剛才講人工智慧永遠不可能超過人類的能力,但是當他逐步逼近人類能力的時候,其實已經是可以一個一個行業去顛覆掉。比如說人臉識別這種應用,我們今天如果你去機場的話,要過好幾道安檢,又要把身份證拿出來,比對一下,其實人臉識別這個問題解決後,將來到機場就應該大搖大擺就過去了,他那個攝像頭可以識別,不需要一道一道檢查的。我們在家裡自己開一個Party,不可能每個人進來先把身份證看一看。但是人多了,幾千人、幾萬人,甚至更多人的情況就要用現在比較笨的辦法一個人一個人對他的身份,但是現在這個問題基本上解決了。比如百度大廈,我們那個閘機就是刷臉可以進,到哪兒直接過就可以了。這還是人臉識別一個東西。語音的識別、自然語言的理解等等,都是可以。未來人和物的交流方式,人和工具交流方式,不是人學習工具怎麼使用。人和動物的區別就是人發明了工具,但是人發明了工具之後,是發明人寫一個用戶手冊告訴你這個東西怎麼用,電視怎麼用、冰箱怎麼用,這些東西,電腦手機怎麼用,我們要學習用鍵盤,小時候都要學打字。但是未來應該是機器、工具學習人的意圖,以後人再也不需要學習工具怎麼用了,我要這個工具幹什麼,他就能夠明白,這就是我希望用人工智慧方法解決理解人的自然語言,以後人和機的對話、人和物的對話就變成一種自然語言的對話,這是未來幾十年可能代表人工智慧發展最大的方向。

沈向洋:每一個商業應用都會被人工智慧顛覆掉

問:人工智慧有哪些非常具有潛力的商業應用?

沈向洋

:我自己從研究生開始到現在,從事人工智慧的研究也有20多年的實踐。看到現在人工智慧如火如荼,我很激動,因為當時90年代中期我們畢業的時候連像樣的工作都找不到。

我覺得人工智慧經歷了多少個冬天之後,發展到現在這個樣子,主要還是因為三個方面的原因。第一,是因為大量資料的出現,第二,是強大的運算能力,摩爾定律到現在,大家覺得應該會死掉,但是並沒有,持續有更多新的計算方法出現。第三,是深度學習技術的突破,以前很多不能解決的問題,現在可以解掉。

從人工智慧基本和研究方向來講,還是兩個不同非常不一樣的階段。一個是人類感知這件事情上,我們講人工智慧,原來對人工智慧的定義就是跟人類智慧相比較。人類的智慧體現在哪?主要是兩方面,一個是感知方面、一個是認知方面。感知方面,剛才我提到這幾個原因,所以在接下來5-10年進展會非常快。具體表現在電腦語音和電腦視覺發展,我覺得AI會超過人。很多人會同意我這個說法。第二方面問題大家今天還沒有搞的很清楚的地方是人工智慧的認知方面,包括自然語言,包括知識的獲取、包括你對一般的情況下這種解決的方法這樣的思考,包括情感,這些東西今天我們還都是不知道。所以我是覺得現在是非常好的時代。激動之餘的話,我覺得我們作為科研人員還是要有一個平常心,因為很多科研進展還需要一些時間。

從微軟公司來講,我們的研判是,短期之內有非常非常大的一些商機。那具體到哪些行業有商機呢?如果這個行業已經有相當量的資料,並且這個行業的從業人員對現狀並不滿意,那麼這就是人工智慧有商機的地方。從銷售、人事、客戶支援等方面,每一個商業應用都會被顛覆。

我們公司內部一共有7000多個工程師和科學家,但是我們還在繼續招人。

我覺得微軟在中國最近幾年推出的最了不起人工智慧產品,就是微軟小冰,這個產品面對的是比較年輕的人群,大概18到20多歲的一個用戶群,因為這個年齡段的人更願意花時間跟聊天機器人對話。所以我們跟QQ的合作,也主要是為了面對這樣一個用戶群。我們在推小冰這樣一個產品的過程當中,學到了很多的東西,所以我們現在主推的研究和產品方向,就是對話式人工智慧。

問:如果大家願意開放資料合作,微軟是不是感興趣這個事情?

沈向洋

:作為大公司來講,特別是成功大公司來講,我們對社會有一個責任,對行業有一個責任。當我們行業做的很成功,第一件事情就是開研究院。現在Pony也開研究院,唯一做的不對的就是開到微軟門口去了(笑)。我也想分享一下在微軟的工作經驗,你說叫這些公司把資料拿出來,讓初創公司或者其他公司去用,我覺得不見得很現實、不見得很容易。但是我想鼓勵大家,很多的資料如果我們願意花時間、花精力做一點處理,然後讓研究人員去用,完全是可以做到的。我們微軟出了兩個資料集,一個是電腦視覺標準方面的集,這樣可以做資料分割、物體分割。最近做了另外一個資料集是在自然語言,希望有一批新的做問題問答。這樣推動研究領域,大家在標準集下,不斷把標準集資料越做越多。我們做的方法是用搜尋引擎資料,非常小心處理過,包括很多隱私的問題等等。拿出一些資料讓大家做研究是非常實際的,完全可以做到。

更多雷鋒網文章:

馬雲最新演講談AI:AlphaGo贏了人類?So TM What? | IT領袖峰會