神秘公司欲造新型AI:虛擬實境加持
據國外媒體報導,一家名為Kindred AI的神秘加拿大創業公司在利用人工虛擬實境“嚮導”來教導機器人執行新任務。它的最終目標是創造一種新型的人工智慧技術。通過給機器人配對佩戴虛擬實境頭盔和手握運動追蹤控制器的人類“嚮導”,Kindred教導它們如何超快速地執行相對棘手的靈巧型任務。
該技術讓人們可以一瞥未來人類可以如何跟機器同步協作,展示如何通過利用人類的能力來強化自動化系統的功能。儘管業界普遍擔憂機器人和人工智慧將會搶走人類的工作崗位,但還有很多事情機器還是無法勝任。該公司上周向《麻省理工科技創業》(MIT Technology Review)展示了該項技術,稱計畫未來幾個月推出一款面向零售商的產品。它的長期雄心甚至更為宏大。Kindred希望,該項人類輔助學習將會催生一種全新的、更加強大的人工智慧技術。
Kindred由加拿大本拿比的量子計算公司D-Wave出身的幾位人員創立。它目前在測試一些常規的工業用機器手臂,這些機器手臂能夠快速而可靠地抓取和放置難以握持的物品,比如小件的衣服。有時候,它們需要請求人工團隊提供説明,該團隊會利用虛擬實境硬體來瞭解它們遇到的挑戰,然後臨時控制機器手臂。
“嚮導能夠看到機器人所看到的,聽到它所聽到的,感覺到它所感覺到的。當嚮導行動時,那些動作也會讓機器人動起來。”Kindred聯合創始人兼CEO、D-Wave聯合創始人喬第·羅斯(Geordie Rose)表示,“這讓我們能夠給機器人展示如何像人類那樣行動。人類在各種機器人控制上都不是最快速或者最擅長的,比如將物品放在特定的位置,但人類還是最擅長搞懂棘手或者意料之外的狀況。”
Kindred的系統使用數個機器學習演算法,會嘗試預測哪一種演算法會帶來最好的結果,比如最能幫助抓握物品。如果沒有一個演算法可帶來高成功率,但系統就會請求人工説明。最重要的是,這些演算法會學習人類控制員的動作。為了實現這一點,該公司採用一種強化學習技術。該技術涉及通過試驗和強化行為來實現特定的目標。
羅斯稱,該系統抓握小件衣服的速度達到人工單獨操作的兩倍,如機器人獨立操作,則難以完成任務。一個人員還可以同時操作幾個機器人。
羅斯補充道,Kindred在探索各種人工參與的系統,從只是讓人點擊圖片來給機器人展示抓握點的系統,到控制人形機器人的全身外骨骼。他說,嚮導通常是學習如何有效地控制遠端的機器人系統。
技術靈感來源
該技術的開發靈感來自於前D-Wave高級研究員、Kindred首席科學官蘇珊娜·吉爾德特(Suzanne Gildert)。該公司低調運營了幾年時間,但隨著吉爾德特提交的專利申請細節浮出水面,它引起了關注。該專利描述的是一個結合不同遙控操作和機器學習技術的機制。的確,Kindred對於其技術的願景似乎已經遠遠超過開發更擅長整理東西的機器人的範疇。
“我們的想法是,如果你能夠展開時間足夠長的研究,如果你有某種AI系統在後臺學習,那麼你或許可以嘗試很多不同的AI模型,看看哪些模型的訓練效果更好。”吉爾德特說道,“我的想法是,如果你能夠讓人類通過機器人來進行演示操作,那機器人沒有理由無法學習得像人類那樣。”
最引人注目的是,Kindred的專利甚至描述了讓這類系統由諸如猴子的動物控制的可能性。吉爾德特表示,這只是個想法,公司目前還沒有雇用猴子。然而,她透露,公司倒是有只機械貓,經過強化學習技術的訓練,它能夠在辦公室裡四處走動。
潛力與挑戰並存
Kindred還有個不同尋常之處:幾位創始人都是物理學家,而不是機器人學家或者電腦科學家。不過羅斯指出,這帶來了獨特且有價值的視角。“對於電腦科學家來說,類比和現實世界之間的界線有時候很模糊,”他說,“而我們則非常偏愛在真實機器人身上做我們在現實世界中會做的事情。”
Kindred的解決方案似乎有著巨大的潛力。加州大學伯克利分校研究機器學習和機器人的教授肯·戈德伯格(Ken Goldberg)表示,人類技能將會大大加速機器人的學習速度。正研究將類似技術應用于機器人手術的戈德伯格補充道,讓機器人學習人類是一個非常活躍的研究領域。“我認為它在機器人學領域是一大機會,”他說,“讓人類來示範有很大的益處。”
不過,通過人工遙控操作來學習的技術挑戰不可謂不小。麻省理工學院研究遙控操作人形機器人的副教授Sangbae Kim指出,將人的控制映射到機器動作上,是件極其複雜的事情。“第一個挑戰是,通過將剛性構件附加到人的皮膚上來追蹤人的動作。這非常困難,因為我們是內骨骼動物。”他說,“更大的挑戰在於,真正理解人在操作時的決策步驟的所有細節,要知道這些決策往往是下意識的決策。”
但Kindred的幾位創始人對此並不擔心。“我們的目標是解構認知過程。”羅斯說,“所有的生物體都遵循特定的行為和行動模式。我們正嘗試打造有跟人一樣的行動機理的機器。”