雷鋒網 AI 科技評論按:2017年6月21日至22日,騰訊·雲+未來峰會在深圳舉行。騰訊董事會主席兼首席執行官馬化騰會帶來演講,多位優秀的學界、產業界人才也會發表自己的見解。雷鋒網編輯赴一線報導,並將持續帶來最新消息。
21日上午,人工智慧領域的世界級泰斗邁克爾·歐文·喬丹(Michael I.Jordan)進行了主題為“機器學習:創新視角,直面挑戰”的演講,與大家分享他對人工智慧的未來與挑戰的見解。以下為演講全文,雷鋒網 AI 科技評論根據速記,結合現場內容聽譯整理。
邁克爾·喬丹:
大家早上好!很榮幸受邀來到這裡。我是一名人工智慧和統計學方面的研究者,今天我非常高興來到這裡,好像大家都非常地瞭解我,我也非常高興能夠和騰訊這樣頂尖的公司合作,能夠分享我們對於未來的發展趨勢的預見。
我們要非常清晰地瞭解,哪些技術是會出現的,哪些是不可能存在的,而哪些是我們現在所存在的問題,以及未來我們會看到什麼樣的技術的發展。這就是我今天這個演講的主要內容,就是標題所說的“
創新視角,直面挑戰
”。
首先我們簡單回顧一下到底人工智慧是如何發展成現在這樣的。
“人工智慧”這個說法是上世紀60年代第一次出現的。那時候我們說要造一個機器人,讓它可以和人一樣思考,跟人一起互動,加入到人的世界當中來。那個時候大部分人工智慧的電影向大家展示的是機器人最終進入到人的世界中,那時候很多的研究也都是關於視覺系統、語音系統,寄希望於這些技術就能夠讓機器人越來越像一個人。
但是在80年代、90年代以來出現了另外一個趨勢,這個趨勢對我們來說也是非常重要的,我們叫做“IA”(Intelligence Augmentation),也就是智慧增強技術。搜尋引擎就是這種技術的體現,我們可以靠搜尋引擎中獲得關於這個世界的各種知識而不用背在腦子裡,比如中國最長的河流是什麼,法國首都是什麼,只要在搜尋引擎中打字就可以獲得答案。所以人類的智慧得到了增強。還有語言方面的技術,電腦可以通過自然語言處理做語言轉換,我說的是英語,但是說其它語言的人也能用自己的語言聽到我的表達。我們可以看到這些技術目前正在發展,而機器説明我們有了更好的存儲能力,更好的溝通、交流的能力。
還有一個部分是 “II”(Intelligent Infrastructure),也就是智慧基礎設施,這對我們來說是最重要的。現在我們的交通和金融行業,在我們身邊的每一個行業、每一個模組,現在都出現了智慧化的趨勢,我們也發現世界更瞭解我們了,能夠根據我們的需求提供服務。所以在我們前方是有一個系統的,如果你要說雲的話,這個系統就是雲,這個雲變得更加智慧。我們溝通的物件不是機器人,而是這個雲的架構和雲的基礎設施在和我們溝通。
現在有一個問題是,之前我們大部分的研發都是智慧型機器人、掌握自然語言方面的,但是這些技術和IA以及II所需要的技術迥然不同。所以,現在我們在建立基礎智慧設施的的時候就會遇到很多新問題,在騰訊也是如此。
比如,我們要對相關的大型的設施做出相應的決定,比如說我們要做一個金融系統、交通系統,或者向人類提供醫療決策的時候,一個單獨的機器人如果要僅僅根據周圍的資訊做決策是很不好的,有時候機器瞭解的資訊是不夠的,一個機器做出的決策往往是不對的,它沒辦法意識到我們周圍環境的變化。如果說單個機器人犯錯了以後還可以自我學習更正,但是如果這種事情大規模地發生,那就是危險的。
以及,我們應該如何分享競爭性的資料呢?我們可以看到模型訓練技術的發展,可以用資料説明業務的發展。但是這些資料都是停留在各個公司內部的,他們怕別人也有了這樣的資料以後就會有競爭優勢,但是這並不是最好的做法。如果能把資訊進行分享,比如說詐騙資訊,每個公司都能看到危險的一小部分,然後我們一起不斷地把問題進行整合,就可以讓問題進行更好的解決,同時大家也不會失去競爭力,每個人都可以從中獲益。但目前從技術和思維的角度來說還沒有辦法完全解決
然後有這個雲和終端設備互動的問題,到底我們的知識在哪裡?知識是在每個地方不同重複的,在每個地方會出現不重疊性,以及在發展中不同的問題會得到不同的答案。所以我們如何在資料之間取得協調,既包括在雲端,也包括在終端上時得到相應的解答,這是很難做到的。
我們在公平、品質和多樣性之間如何取捨,我們現在還沒什麼辦法能夠同時達成這三者。我們現有的系統只能滿足一種某一種取向,有多種取向的情況就無能為力。
還有一個問題是安全問題。假如大批量的系統受到攻擊,如果我們不進行處理,它們就無法正常工作,這是比較大的問題,這是我們要重視的。這些都不是小問題,都是大問題,這就是我對智慧的一個想法。
下面回到我們的機器人、智慧發展,包括從人工智慧的角度來看,我們看看哪些是可能的,哪些是不可能的
。
我們看到機器視覺,在過去幾年,我們已經可以通過攝像頭對場景中的物體進行識別,但是它還是沒有辦法能夠像我們清晰的瞭解到所有的情況,就像我在這裡站在臺上,大家在台下,或者瞭解到所有人的注意力在哪裡,讓人工智慧系統完全理解語義很難,我們現在還不知道要怎麼才能做到。我們現在可以把語音轉化成文字,文字也可以轉換成語音,在各種語言上都可以實現,但是我們的機器人還沒辦法幫我們瞭解聽覺、視覺之後的真正的意義。
還有一點就是自然語言的處理,我們可以看到到目前為止,自然語言的處理得結果還沒有達到我們需要的發展,我們現在有大量的語言的翻譯,但是大部分的語言和語句因為沒有辦法得到有效的語義的闡述,沒辦法讓我們的受眾瞭解到這個語義的意思,有時候我們問問題僅僅能瞭解部分的答案,而不能瞭解全部的答案。
對機器人來說也是如此,我們看到世界上有很多工業可程式設計的機器人,他們也在和我們溝通,但是它們沒辦法瞭解到我們的環境、處境以及我們的情緒。如果我們都覺得機器智慧以後將會無處不在的話,其實這是不太可能的。
對於我們來說,在過去幾年的發展,特別是在機器人的發展上,我們的機器人還只是一個雛形,之後可能會出現一些有效的對話,特別是像這樣一個自我導識的機器也會出現,但是智慧方面它目前還是比較有限的。我相信在未來,短期內不會出現太多的像人這樣的靈活性和可變化性。也許機器可以瞭解一些事實,它們看上去非常有知識,但是它們沒法真正得到人這樣一種高級智慧,甚至像小孩一樣的高級智慧,它沒有辦法瞭解抽象思維,沒有辦法進行抽象的處理,機器人還不能實現這方面的能力。這些機器人就像小孩一樣,他們知道一些非常棒的現實,他們知道每條河流、每個國家,但是它們仍然沒有很高的智慧進行人的抗衡,所以在這方面,我們還是很難看到“超越人類的人工智慧”出現,這個技術可能要很多年的發展才能夠出現。我相信我們真正要關注的不僅僅只是這樣一種技術的發展,畢竟我覺得我們這代人身上還看不到這種高水準的人工智慧的出現。
但是除此之外,雖然人工智慧還沒有辦法進行抽象、識別語義,但是電腦的計算能力不是要比人的大腦高出很多嗎?機器人以及人工智慧可以説明我們大批次的處理資料,能夠通過資料瞭解未來一些事件的走向,同時能夠保證我們的資料結果不斷地提高,可以發現一些人類發現不了的事情。但是它們沒辦法像人類同一樣地理解這些洞見,當面對各種資訊的時候也無法分辨哪些是真的。所以這個機器人並沒有辦法實現像人一樣的能力,假設讓一個機器人做公司的CEO,那它沒有辦法引領這個公司的發展,在我們這代人身上,在機器上還沒能力做出這樣的決定。
我們到底應該關注什麼,應該擔心什麼呢?
如果我們擔心這種高度類人化的人工智慧的發現,我們應該關注,我們所謂的人工智慧看上去很智慧,但是它並非如此。比如說在醫療行業中,我們讓機器做很多的醫學診斷,這是不太可能的,有很多人會因為這種不暢的診斷,可能會劑量出現問題,特別是結果間有衝突的情況下,如果出現任何問題,這個機器沒有辦法做出有效的診斷,我們的病人都有可能去世。
與此同時,我們要關注機器人可能會造成大量的工作的流失,以及許多人因為丟了工作沒有辦法得到收入。在過去我們可以看到工業的發展,在七八十年代都是如此,但是在過去50年中,人們在不斷地調整,現在我們可以看到未來10到20年,人們沒有機會更多的調整,機器人會取代更多的人,獲得更多的工作。
同時它還可以説明現有的智慧設備的發展,在世界上也有很多人會惡意使用人工智慧的系統。如果出現人工智慧系統的誤用,我相信也會有問題。機器人本身是沒有任何惡意要傷害人類的,只是使用這些及其人的人本身含有惡意。
在這裡我特別要和大家談到
近期機器學習方面一些比較大的挑戰
,我相信這些挑戰都是我們大家已經意識到的,但是現在還沒有解決,如果我們能夠確保未來要建立起一個人工智慧的系統,我們必須要解決這些問題,否則沒有辦法保證未來人工智慧的發展。
首先是我們必須要設計一個系統,這個系統可以帶來有意義的經過校準以後的資訊,能夠應對一些不確定性,比如說在醫療行業,還有在策略規劃的角度,如果你是公司的CEO,你必須要清楚地瞭解到,一種做法和另外一種做法之間的差別,你不可能只有一個做法。與此同時,我們還要保證我們的系統能夠真正地解釋它們自己所做出的決策,如果機器做出了一個決定,我們必須要讓機器向我們闡釋為什麼做這樣的決定,是否還有其它的潛在方法。還有我們要找到問題發生的原因。
另外我們要找到一個系統,這個系統可以實現長期目標的追溯,同時可以主動的收集在實現目標相關的資料。
還有一點是即時,我們可以看到很多的資料和機器需要花幾天、幾個小時來學習這些資料,但是到目前為止,我們的機器學習方面還沒有辦法能夠達到真正的即時操作。
還有在意外情況下怎麼辦,還有在外部事件上的連接,包括資料和其他的要求,需要和政府的合作,和法律部門、和社會科學家的合作。
以上這些就是我們正在努力解決的技術挑戰,雖然不一定都能完全解決,但它們需要我們的關注。我們做AI,或者做電腦視覺,並不是為了贏下來一些對人類的比賽就好,我們需要像工程師一樣解決一些問題。
還有一些大規模的挑戰,這對我們來講是更難的。
比如說在語義方面,現在世界中有什麼、未來在世界中會發生什麼,需要有能夠理解這個世界的概念。我們在機器學習上,我們講的更多的是表面的東西,我們需要瞭解真正的世界上需要什麼。我們需要能夠理解上下文的機器人。現在的機器人瞭解我們的一些情況,但是它們不清楚我們的過去,也沒辦法深刻地理解我們。一段時間過去以後我們就會覺得厭倦,我們不想要這樣的互動或者交互。
然後有雲端和終端的互動問題,這也是挑戰非常大的。如果把資料放到雲上,你需要關注成本、載入速度的問題。同時你還要考慮現實的情況,有時候雲和終端的距離太遠,雲和終端獲取到的資訊有區別,就有可能會做出錯誤的決定,所以我們現在需要有更好的方案。
當然還有不確定性,這也是人類的一個非常重要的特點,圍棋比賽其實並不是一個很好的例子,因為你知道棋盤上的東西,但是人的生活有很多不確定性,比如說我不知道今天會發生什麼事情,我不知道將來會發生什麼,這就是所謂人的一生,這和圍棋是不一樣的。這樣的問題需要從更深層次才可能改善。
最後總結一下。我很高興來到這裡和大家講人工智慧,我也期待著看大家在AI方面會做什麼,看看其它企業會做什麼。我們需要一起合作,我覺得這相當於3000年以前,兩個人一起來建立合作,大家去建大橋、建房子。大家都很興奮,大家一同帶來了新的發展,同時也會面臨一些災難,大樓可能會倒閉等等,因為他們當時沒有什麼科學。然後我們一起創建了土建工程,與全世界分享這些知識。這些知識指導著我們實踐,我們由此建立了自洽的體系,那麼全世界不同的地方都會用共通的方式去建造,因為已經證明了這是可信任的,它不會再垮塌。
但是人工智慧的發展還沒有達到這一步,現在還沒有建立這樣完善的體系。這需要付出幾十年的努力,所以我們需要一起合作,共同認真思考怎麼解決這些挑戰。
(完)
更多人工智慧方面動態,請繼續關注雷鋒網 AI 科技評論。