在亞馬遜和Google相繼推出智慧音箱Amazon Echo和Google Home後,為了不在競爭中落後太多,據Quartz報導,蘋果或將在今年夏天的開發者大會 (WWDC)上推出智慧音箱Siri Hub。根據KGI證券分析師Ming-Chi Kuo的內部文件,蘋果這款智慧家居設備的價格估計會超過179美元的亞馬遜Echo,性能或將接近Iphone 6/6s。
去年5月,就有外媒報導說蘋果計畫發佈智慧家居設備。隨後,彭博社報導稱,該設備已在2016年9月份進入測試階段。根據Ming-Chi Kuo此次的報告,蘋果的這款設備將能夠通過Siri語音控制門鎖、燈光和窗簾等。報告還透露,測試的原型機中有人臉識別感測器和內置攝像頭等。
如今,智慧語音已經成了科技巨頭們的必爭之地,除了蘋果、微軟、穀歌和亞馬遜四強爭霸,還有很多科技創業公司也將語音交互看作是撬動物聯網的重要入口,前赴後繼地殺了進來,這一領域的競爭有越來越激烈的趨勢。
發力遠場語音的硬體落地
雖然沒有像Amazon和Google那樣開發出智慧音箱,但蘋果語音助手Siri已經在多方面有所應用,比如蘋果的Mac、iPad、iPhone等硬體設備中,早就置入了Siri語音。今年3月,蘋果還推出了一款可以控制智慧家居產品的APP。在iPhone上安裝這款iOS應用後,使用者可以通過語音助手管理各類智慧家居,還可以在iPad和Apple Watch上同步使用。
不過,在觸屏交互能很好滿足用戶需求的手機上,Siri的功能似乎並沒有被充分地開發。為了Siri語音的進一步智慧化,蘋果需要找到觸屏交互不能很好解決的場景。拿AirPods舉例,通過和Siri相結合,AirPods極大地增加了Siri的使用情境,比如所有用戶無法方便地掏出手機的場景。在使用時,只要輕點兩下AirPods,即可啟動iPhone上的Siri。
就仿佛有一個私人助理在電話的另一頭,你可以和它對話:“明天會下雨嗎?”“幫我定一個六點的鬧鐘。”“我想知道騰訊現在的股價。”而智慧音箱也是同樣的邏輯。拿Amazon舉例,在已有的音箱基礎上加上其遠場識別的麥克風陣列等語音技術,可以讓語音助手Alexa落地在智慧音箱這個硬體產品上。
在《被嚴重低估的蘋果AirPods和語音產品如何落地?》一文中,中科院聲學研究所博士、中科院前聲學所副研究員(副教授)的陳孝良認為,人工智慧要真正實現,必須要落地到實際場景和產品中。語音交互的落地,必須要解決真實場景下的語音辨識。
目前語音產品的落地場景主要有兩種,一是近場語音,包括手機語音交互,嘴巴貼近麥克風交互等,識別率可達到90%以上;而遠場語音辨識,包括3-5米、車載環境下、智慧家居環境等的識別率還不到50%。識別率是關乎語音產品體驗的關鍵問題。比如在遠場識別中,機器識別使用者語音需要考慮說話者與機器的距離、處理雜訊、混響、回聲等干擾,僅僅依靠軟體很難解決問題。
對蘋果來說,此前主要是發力近場語音領域,要想進一步擴展語音交互,遠場語音的硬體落地可以說是必經之路。
競爭白熱化的智慧語音市場
在智慧音箱市場,但Amazon Echo和Google Home之間的競爭已經相當激烈。
上個月,為了解決家中某個角落連不到網路的窘境,Google Assistant在新版本中內置了網格WiFi網路。為了應對,Amazon也沒有閑著,很快也推出了兩項新服務:Device Address API和Metrics Dashboard。前者可以説明開發者定位使用者的位置資訊,包括街道位址、城市、州、郵編等。後者可以説明開發者追蹤使用者資訊,比如使用者訪問情況、話語、意圖等。
作為第一個吃到螃蟹的亞馬遜Echo,其去年的銷售資料證明了智慧音箱這一產品商業化的可能性。亞馬遜公佈的資料顯示,Alexa與協力廠商硬體廠商合作的服務種類已經超過了1萬多種,廣泛應用于汽車、智慧手機、家電、機器人、智慧音箱等領域。截至2016年年底,亞馬遜Echo智慧音箱銷量超過600萬台,在2017年預計可以超過1000萬台。
Amazon Alexa的應用場景,資料來自VoiceLabs發佈的《2017語音報告》
除了亞馬遜外,穀歌也在不斷拓展自己的語音產品市場,除了應用於音箱,朝著操控各種家居設備的方向努力,在音箱中加入Wi-Fi路由器等功能以提高競爭力外,谷歌助手也已廣泛應用於手機、智慧手錶等其他硬體中。不過,和擅長賣貨的蘋果和亞馬遜相比,穀歌的賣貨能力確實略差一籌,不過穀歌想出了要在語音助手中內置廣告的方式進行盈利。
除了谷歌和亞馬遜外,微軟旗下的Cortana和小冰等智慧語音助手,主要應用場景是自家的Windows phone和Windows 10作業系統。從其應用場景的規模來看,尚且還無法與其他三家匹敵。
除了這些巨頭外,還有很多科技公司也在語音助手領域中不斷發力。比如三星 S8也被報導稱會搭載語音助手Bixby以及支援8個國家的語言;有消息稱華為組建了百人工程團隊在研發語音助手功能;百度和騰訊也將智慧語音作為重要切入口,比如騰訊剛剛推出了語音助手“騰訊叮噹”。而科大訊飛的語音技術也已經取得一定的成功。另外,一些初創公司也在積極的佈局自己的垂直類語音產品。
語音助手之所以火熱,是因為其使用空間的想像力很大。比如可以應用於汽車、醫療、BFSI、電信、教育和零售等多個領域。VoiceLabs發佈的《2017語音報告》預測,2015和2016年的智慧語音設備銷量為650萬台,2017年這一資料可能達到2450萬台。Global Market Insights資料顯示,未來七年全球語音市場的年增長為34.9%,預計到2024年市場規模達到110億美元。
對於語音助手來說,聲音識別的場景化應用依然會是隨後需要克服的重要問題。拿智慧音箱舉例,如果其產品要進行全球化推廣,語音助手需要適應全球化的語音辨識。比如在地方方言混雜的中國市場,中文的喚醒和識別會是個很大的挑戰,需要很長時間的資料積累和優化,這些都是不得不克服的挑戰。
作者: 蘇一
(發佈/韋康)