淘新聞

雲知聲IoT事業部總裁謝冠超:智能音箱是個偽命題

1999 年 3 月,微軟以“智慧家庭”為由,推出了“維納斯計畫”。

當時微軟的算盤是這麼打的:把簡化版的 Windows CE 植入機上盒和 VCD 機,讓那些買不起電腦的人感受下互聯網。那時中國才 200 多萬線民,電視機3.2 億台左右。

和很多人一樣,那是謝冠超第一次聽說“智慧家庭”這個概念,當時他人還在聯想。據他回憶,包括聯想在內的大多數國產廠商都參與了“維納斯計畫”,微軟自身推廣力度也頗大,為“維納斯”燒了數十億美金。

理論上眾人拾柴火焰高,但“維納斯計畫”最終卻以失敗收場,直到個人電腦普及的今天,“智慧家庭”依然是鏡中月水中花,概念多於實質。

進步還是有的,謝冠超說,當初夢想著要解決的“連接”問題已經攻克了,可以通過手機等方式進行交互,現在主要解決的是設備本身的智慧問題,包括決策、協調、溝通。

Amazon Echo 便是解決“設備連接”的典型,同類產品在中國也並不鮮見,智慧音箱作為智慧家居入口的說法也一度甚囂塵上,但當雷鋒網記者提出這個觀點的時候,雲知聲 IoT 事業部總裁謝冠超似乎並不認為這樣講是合適的。

“入口我覺得會很多元。現在其實主流的入口還是手機,通過APP的方式在做。”他說。在謝冠超看來,雲知聲希望解決每一個設備的智慧性,“解決家庭領域多個設備智慧性,而不僅僅局限在唯一的入口。可能空調是你的入口,不一定要依賴於手機。”

但是雲知聲與Amazon Echo在部分理念上是一致的,比如——只解決一個交互控制是薄弱的,一定要實現控制+服務才相對完善,當然這之後還可能有其他新東西。“Echo 的成功證明了提供 service 的重要性。”謝冠超強調。

除了部分理念的認同,國內智慧語音廠商絕大部分不可避免地對標 Amazon Echo,雲知聲當然也繞不過。只不過相對於單純對標 Echo 音箱,雲知聲對標的是 Amazon Alexa 系統。 

相比較於其他專注在智慧音箱的廠商,雲知聲主攻智慧家居語音交互整體方案。今年3月,以物聯網人工智慧服務為主業的雲知聲,宣佈推出面向智慧家居的 AI 解決方案 AIOS@Home,瞄準 Alexa 意圖明顯。

該方案主要利用自身語音計算、麥克風陣列方案以及定位技術優勢,從而實現家居控制、互動娛樂和個人助理功能等人機高度交叉互動的效果。 

即便如此,謝冠超對 Echo 音箱與Amazon Alexa也不是完全認可,在他看來,echo也是從最初的僅僅“好玩”、到後來逐步與Amazon服務打通連接,才被消費者認可為“好用”的。同時謝冠超也談到智慧家居的入口問題、Amazon Echo尚未入華的原因等。

本文是雷鋒閘道于“智慧音箱系列”的第五篇報導。

對話實錄: 

雷鋒網:您從1999年首次接觸智慧家居到如今,您對生態入口級產品有哪些看法?

謝冠超:我認為入口一定會很多元。雖然目前主流入口還是手機,通過APP建立聯繫。但雲知聲希望能夠解決每一個設備的智慧性,不要有唯一的入口。空調、冰箱、電視等等,都可以是。

雷鋒網:那您對Echo音箱作為智能家居生態入口怎麼看?

謝冠超:首先這是一次有意義的探索,我們一直認為只解決一個交互控制是很薄弱的,最後一定是控制+服務才是相對完善的。Amazon Echo就證實了你必須要有提供service的能力,這個設備才會被大家認可。它先得好玩,其次還得好用。Echo在前期也賣得不好,之後是由於Amazon跟多家協力廠商開展服務、以及Amazon本身全產業鏈的服務鏈條,才實現了Echo的火爆。

所以,進一步講,我認為智慧音箱形態本身即是偽命題。

智慧音箱首先是音箱,最重要的是音質。肯花1000元左右買一個音響的人,通常我認為他不會隨隨便便買幾十、一兩百的音響,他們可能直接搜索JBL等特定品牌。那如果你想買給消費能力一般的小孩兒,成本所決定的價格可能又超過了他們的承受範圍——所以你的目標受眾到底是誰?

雷鋒網:那Amazone Echo作為智慧音箱成功的原因是什麼?

謝冠超:Echo本身基於Amazon電商平臺,既連接服務、本身又做硬體,時間上也做了好多年了。比如百度DuerOS也是剛剛開始做——這是產業時間的問題。

在產業環境上,國內包括傳統家電企業、新興互聯網企業、以及BAT巨頭,各自都有各自的需求,比如小米米+,如果一個微波爐不是小米產的、要怎麼融進來?比如百度DuerOS,如果用戶就是喜歡阿裡的一款產品,不同協定如何融入進來?這是國內產業環境的複雜性。試水封閉系統成功的誘惑是巨大的。

雷鋒網:Amazon Echo一直沒有進入中國的原因是什麼?

謝冠超:我認可Echo在所謂家居智慧化領域是很有標誌性的事件,但它完全自我copy一份就能適應國內產業環境嗎?不一定。

美國在智慧家居產業上實際比較簡單粗暴,在對家電的控制方面,Echo並沒有嘗試與家電廠商做溝通——開通WiFi,通過WiFi控制IoT開關。這是不是最好的方式?不一定。

在我看來,Amazon Echo沒有進入中國很簡單——第一,它不支持中文。做中文語音語義識別和英文識別完全是兩套東西,是需要時間的。第二,Amazon在美國對接自己的服務與生態,進入中國之後,肯定要與包括BAT在內的諸多平臺協商對接服務的問題,這就涉及到商業秘密的問題,Amazon願不願意提供一個入口去對接BAT的服務呢?

雷鋒網:那在echo進入中國之前,誰更有可能在這個視窗期佔據行業龍頭?

謝冠超:我個人不認為哪一類型的企業能夠佔領這個市場,因為這裡面是很綜合性的問題。大規模的服務肯定掌握在BAT手中,這是重要參與方之一;家電廠商,線上線下服務的聚攏者,是一方;做硬體設備的人,又是一方。因此綜合來講,只有對用戶產生精准畫像,這些參與方所提供的服務才有意義。 

雷鋒網:如果您認為智慧音箱是偽命題、硬體形態不重要,那可以認為語音交互是目前智慧家居的核心嗎?

謝冠超:語音技術肯定不是最核心的。從人工智慧對話模式來講,最重要的——一是語音,一是圖像,一是手勢。手勢是與圖像類似的技術,所以可以暫時算作一個。語音和圖像相對來講,側重的是效率的提升。但效率的影響是有限的。在後臺通過深度學習、大資料技術,在產品形態上獲得更深遠的發展,這才是核心。同樣的計算,我們從語音開始,後面大資料,深度學習,人工智慧。所以語音只是一個工具。