紮克伯格的智慧家居系統與智慧語音交互的商業化之路
OFweek智能家居網訊:2016年年底,Facebook CEO紮克伯格的AI管家“賈維斯”的出現,再次喚起了人們對人工智慧未來的遐想。紮克伯格的AI管家與《鋼鐵俠》電影中的智能管家同名,叫做“賈維斯“(Jarvis),由著名影星摩根?弗裡曼(Morgan Freeman)配音,能夠基本掌控全家上下。紮克伯格稱研發”賈維斯“比他預想中的要更加簡單,難點在於如何將不同的系統整合在一起。
據瞭解,“賈維斯”集多種智慧技術於一體,包括自然語言處理、語音辨識、面部識別、強化學習等技術,不僅能夠識別訪客,控制光源、房門、窗戶、音樂等的開關,還能調控溫度、讀懂主人的品味和生活習性、學習新詞彙、新概念,甚至還會逗樂紮克伯格的女兒。
不過在現實中的“賈維斯”也時不時會掉鏈子,比如經常聽不到召喚,有時執行錯誤命令,引得紮克伯格的太太大為惱火。
“賈維斯”取得的成果與遇到的尷尬,其實也反映了現在語音交互技術應用的現狀。但是畢竟語音交互是未來智慧交互場景的重要入口,如何讓語音技術應用場景更合理化?如何真正成為新一代主流對話模式?本站為您觀察當前智慧語音技術的困境與未來升級趨勢。
“賈維斯”再次喚起人們對智慧語音交互的期待
Facebook CEO紮克伯格在2016年年初立下個人目標,計畫打造人工智慧(AI)語音助手“賈維斯”(J.A.R.V.I.S.)。日前,紮克伯格在Facebook上傳視頻,展示了其精心打造的AI管家“賈維斯”。此視頻一出,再次喚起了人們對人工智慧未來的遐想和期望。
為了讓 AI管家具備學習與識別能力,紮克伯格為賈維斯採用多項人工智慧技術,包括自然語言處理(Natural Language Processing)、語音與臉部辨識、增強式學習(reinforcement learning),其系統程式則以 Python、PHP 及 Objective-C 等語言編寫。平常只要通過手機或電腦便能跟賈維斯“說話”,就可以進一步操控家電設備、安全系統,調節室內燈光與空調,播放音樂等。
語音交互商業化之路遇到的瓶頸是什麼?
紮克伯格視頻中能幹又貼心的“賈維斯”真實體驗似乎並不給力,曾有記者到紮克伯格家中真實體驗“賈維斯”,發現不僅連續多次呼叫“賈維斯”才有反應,而且還經常無法正確執行命令。事實上,紮克伯格“賈維斯”的尷尬,也反映著當前語音交互技術升級期的瓶頸所在。
語音交互是人機交互最主要的方式之一,包括了聲學處理、語音辨識、語義理解和語音合成等核心技術。目前的關鍵問題是:這些技術雖然獨立發展,但實際上無法割裂,同時在其他技術的配合下,才能形成一次語音交互的完整鏈條。從當前的技術水準來看,這四項技術已經達到了商業初級可用的階段,但是協同發展距離市場滿意還有一定時間的距離。
據瞭解,“賈維斯”集多種智慧技術於一體,包括自然語言處理、語音辨識、面部識別、強化學習等技術,不僅能夠識別訪客,控制光源、房門、窗戶、音樂等的開關,還能調控溫度、讀懂主人的品味和生活習性、學習新詞彙、新概念,甚至還會逗樂紮克伯格的女兒。
不過在現實中的“賈維斯”也時不時會掉鏈子,比如經常聽不到召喚,有時執行錯誤命令,引得紮克伯格的太太大為惱火。
“賈維斯”取得的成果與遇到的尷尬,其實也反映了現在語音交互技術應用的現狀。但是畢竟語音交互是未來智慧交互場景的重要入口,如何讓語音技術應用場景更合理化?如何真正成為新一代主流對話模式?本站為您觀察當前智慧語音技術的困境與未來升級趨勢。
“賈維斯”再次喚起人們對智慧語音交互的期待
Facebook CEO紮克伯格在2016年年初立下個人目標,計畫打造人工智慧(AI)語音助手“賈維斯”(J.A.R.V.I.S.)。日前,紮克伯格在Facebook上傳視頻,展示了其精心打造的AI管家“賈維斯”。此視頻一出,再次喚起了人們對人工智慧未來的遐想和期望。
為了讓 AI管家具備學習與識別能力,紮克伯格為賈維斯採用多項人工智慧技術,包括自然語言處理(Natural Language Processing)、語音與臉部辨識、增強式學習(reinforcement learning),其系統程式則以 Python、PHP 及 Objective-C 等語言編寫。平常只要通過手機或電腦便能跟賈維斯“說話”,就可以進一步操控家電設備、安全系統,調節室內燈光與空調,播放音樂等。
語音交互商業化之路遇到的瓶頸是什麼?
紮克伯格視頻中能幹又貼心的“賈維斯”真實體驗似乎並不給力,曾有記者到紮克伯格家中真實體驗“賈維斯”,發現不僅連續多次呼叫“賈維斯”才有反應,而且還經常無法正確執行命令。事實上,紮克伯格“賈維斯”的尷尬,也反映著當前語音交互技術升級期的瓶頸所在。
語音交互是人機交互最主要的方式之一,包括了聲學處理、語音辨識、語義理解和語音合成等核心技術。目前的關鍵問題是:這些技術雖然獨立發展,但實際上無法割裂,同時在其他技術的配合下,才能形成一次語音交互的完整鏈條。從當前的技術水準來看,這四項技術已經達到了商業初級可用的階段,但是協同發展距離市場滿意還有一定時間的距離。