李德毅：沒有交互認知，自動駕駛或是個陷阱

編者按：2016 年 11 月 23 日，科大訊飛舉行了年度發佈會。在會上，中國工程院院士、歐亞科學院院士、中國人工智慧學會理事長李德毅作了主題為「交互認知」的演講。雷鋒網進行了編輯和整理（有刪減）：

電腦界對計算認知瞭解的太多，但對交互認知瞭解的還不夠。

今天我想講一講交互認知。為什麼要研究交互認知？我們還是從圖靈測試談起。圖靈測試本質上就是一個交互測試。

自閉症是交互認知障礙的一種典型疾病，自閉症就是在交互上遇到了很多困難。如果現在我們把人換成一個聊天機器人，把這台機器換成一個自閉症患者。我想問：測試者還能區分誰是人誰是機器人嗎？這就是圖靈測試的瑕疵。

我們看看這樣一個對話：你今天吃的是什麼？

同樣的問題，機器人回答的不一樣。一開始它很有禮貌回答：蛋炒飯。後來它就開始解釋。如果你還一再的問它：你今天吃的是什麼？它就說：「你丫有病啊！」

這體現了聊天人的性格，修養和幽默。這就叫做不確定性的交互，我們需要的不是一個「問題-回答」系統，需要一個活生生的聊天機器人。因此我們看到聊天總是在特定的語境和語義下發生的。

在過去的半個世紀的自然語言理解當中，我們對此是不是關注了太多的語法和語構、或是語境和語用、或者是語言交互中的不確定性？

我們要研究交互，交互認知的外在表現：如何聽說、如何看、如何感覺。聽說是語言交互，看是圖像交互，聽是體覺交互。腦認知的內涵應該是三個：記憶認知、計算認知和交互認知，而不是一個。

我們認為研究交互和記憶是有道理的。

語言可理解為對交互認知的語義標注，圖像可理解為對交互認知的情感標注，體覺可稱之為肢體語言。

交互認知的度量可用情商和智商表示。

有一個著名的亞伯特定律告訴我們，語義的作用只占 7%，語言的作用占 38%，面部表情和記憶的作用要占到 55%。能不能把這些情感通過語音表現出來？為什麼不做這樣的情感研究？語音語調是情感的流露，是言外之意。

因此，我們強調做一個好的機器人，首先要有交互能力。

交互認知的不確定性包括：交互觸發的瞬間性、對話模式的隨意性、交互內容的未知性。這就要求我們把不確定性人工智慧研究好。不確定性人工智慧要在看似瞬間性隨意性和未知性中，發現交互認知的基本規律性，又能體現不確定性的魅力。

與聽覺，觸覺等相比，視覺主導著我們的情感知覺，並影響我們的思維方式。因此，生物視覺圖像交互的情感表達，成為交互認知的核心。

圖靈測試有一個漏洞。如果被測試的一方支支吾吾保持沉默或主動插話介入，就可能顛覆測試者的主導地位，也很難區分到底對方是人還是機器人，再次暴露出圖靈測試的瑕疵。圖靈測試原本是測試對方是否具有人的智慧。如果圖靈測試的漏洞被多次利用，圖靈測試就轉化為比拼測試雙方誰更睿智的問題，不在乎雙方是生物人還是機器人。

因為這個漏洞，我們開始研究交互認知，研究如何突破圖靈測試的漏洞。

對話是最直接最便捷的交互，是幾乎所有服務機器人的必備，可否把對話機器人作為研究交互認知的突破口？

聊天是淺層次，短時長的對話，也是最通用的對話，聊天也許是在講廢話，但可帶來親和感，在社交生活中不可或缺，不會聊天的對話機器人太乏味。所以，交互認知可從研發「互聯網+對話機器人」開始。

從對話的語境和語用入手；

優先考慮情感交互；

強調純淨感，交互感和構想感；

關注交互認知環境中的選擇性注意；

研究不確定性☆禁☆交互認知中的客觀性，普遍性和積極意義，尋找不確定性中的基本確定性。

對話是所有服務機器人繞不過去的坎。對話機器人自身是活生生的認知主體，不是一個刻板的「問題——回答」系統。充滿不確定性和變通，有情感和語言交互能力。我們需要聊天的機器人。利用雲模型的不確定性研發對話機器人。

對話機器人的形式化約束有：

特定的對話背景；

對話雙方是有個性的機器人；

用動畫體現情感交互語音交互和文字交互，話題情感性格等不確定性。

隨著對話的深入，不確定性會大幅度降低。所以我們提出不要老是關注語義和語構，我們現在要關注應用和語境。在這種情況下，我們要研發對話引擎。

基於檢索搜尋引擎生成可選到答句集；

借用機器翻譯技術潤色答句，保持個性。

重視語境和語用

有社交的技巧背後是與特定的語用相關。舉個例子，一大早睡覺被吵醒，聽到樓下有人大喊：

「打死，打死，往死裡打！」

「反了，反了，反了你。」

怎麼去理解這個語義？到窗戶一看，原來是正在指揮倒車。所以我說要研究語用和語境，重視語境和語用。不要老是停留在語義和語構裡。說話人的身份、年齡、對話和時間與用語語調、用語習慣，都很重要。

對話一般是兩個人的，實際上，還要研究三人對話多人對話和複雜系統湧現中的交互認知。

2006 年，我們研究過掌聲之間的交互。人們有過這樣不常有的生活經歷：音樂廳音樂廳裡有一個精彩的節目結束後，觀眾會爆發出雷鳴般的掌聲在很短的時間內，這種嘈雜的掌聲會突然轉變成有節奏的掌聲，似乎有一股神秘的力量驅使觀眾一致的鼓掌，這是一個典型的複雜系統交互認知導致的自組織同步現象。

一個值得警示的現象：如果連淺層次短，時長的對話機器人的交互認知都做不好，如果機器人不具備最基本的語音交互，圖像交互和體感交互能力，中國的服務機器人產業就跳不出同質化，玩具化低端化的怪圈。高開低走，只能把服務機器人行業推入血腥的紅海。

交互認知的本質：協商和學習

協商包括：協商達成共識、協商達成一定程度的共識以及沒有共識，但知曉了對方的認知力與下一次交互。共識是交互認知的結果，是認知主體，任何一方單獨進行計算或推理，無法得出的新的認知，是計算認知記憶認知替代不了的。

學習包括：一方可從另一方獲得新的認知、學習是相互的。人類社交活動中的交互認知，以及人和自然自然人機器人之間的交互認知，大大擴展了三個人一群人，乃至整個人類的智慧。

案例一：

機器人來到一扇門前問，這門怎麼開？

作為物聯網的終端門答：我是一個滑動門。

案例二：智慧駕駛中的交互認知

智慧駕駛中的交互認知非常重要。

比如無人車上路，老百姓覺得它是幽靈，不敢乘坐，因為它沒有交互。駕駛員的環境和周邊車輛群體的交互認知。每一個司機都認為是最合理的，在客觀上就會造成一個交通擁堵。這就是交互認知的結果。

再比如，兩輛人駕車和多輛帶有自動駕駛模式的車混合行駛，由於自動駕駛模式缺少交互認知能力，受到人駕車干擾，預設的自動駕駛門檻立馬崩潰，幾乎全部轉為人工駕駛。所以我把它叫做：自動駕駛亦或是個陷阱。

怎麼辦？我們要讓智慧車成為可交互的輪式機器人：人輪式機器人是一個認知主體，有一個駕駛腦，同時我們還允許雙駕雙控。我們允許駕駛位上，可以有駕駛員或者可空缺。

與程式調試，試驗和維護人員、與乘客、與執勤交警有交互，如果這樣的車不能做到與人之間的交互，那怎麼能成一個產品？所以要讓智慧車成為可交互的輪式機器人。交互認知是非常重要的。

移動互聯網的終端已經從 PC 轉變為手機，進而轉變為機器人，在機器人聯網的時代，人工智慧是否應該更多地關注交互認知？研究人與人、人與機器人、機器人與機器人或者混合的認知主體之間的交互認知。

李德毅：沒有交互認知，自動駕駛或是個陷阱

戀愛中這樣穿，沒有玄幻卻有浪漫

廣東年俗大變化，沒有對比就沒有傷害！

陽光沙灘和美女，沒有這些神器怎麼行？

拯救危險“肌”，沒有隔離霜那叫拯救？

牛仔褲T恤小白，沒有任何理由不愛你

俏皮背帶褲，沒有不喜歡你的理由

南京最好吃的一條地鐵線，沒有之一！

深圳首家竹筒宴，店裡沒有菜碟、沒有湯鍋……

雖然撞車不怪Uber，但自動駕駛是時候給自己裝個交互介面了

李德毅：駕駛腦的使命是加速汽車向輪式機器人轉變

現代自動駕駛汽車體驗：沒有瑕疵轉彎正確永不超速

挫折沒有擊敗Uber 他們順便給自動駕駛卡車升了個級

李德毅：沒有交互認知，自動駕駛或是個陷阱

戀愛中這樣穿，沒有玄幻卻有浪漫

廣東年俗大變化，沒有對比就沒有傷害！

陽光沙灘和美女，沒有這些神器怎麼行？

拯救危險“肌”，沒有隔離霜那叫拯救？

牛仔褲T恤小白，沒有任何理由不愛你

俏皮背帶褲，沒有不喜歡你的理由

南京最好吃的一條地鐵線，沒有之一！

深圳首家竹筒宴，店裡沒有菜碟、沒有湯鍋……

雖然撞車不怪Uber，但自動駕駛是時候給自己裝個交互介面了

李德毅：駕駛腦的使命是加速汽車向輪式機器人轉變

現代自動駕駛汽車體驗：沒有瑕疵 轉彎正確 永不超速

挫折沒有擊敗Uber 他們順便給自動駕駛卡車升了個級

現代自動駕駛汽車體驗：沒有瑕疵轉彎正確永不超速