不玩VR了，電視廠商紮堆玩智慧語音

隨著VR/AR這股熱潮逐漸冷卻之後，2017年電視圈子又火了另外一個東西——智慧語音技術，還有一種說法叫做人工智慧，說的樸素一點就是電視上的語音交互。雖然不是什麼新鮮的概念，可是最近所有電視廠商的每一場春季發佈會，幾乎都在著重的強調自家電視的智慧語音技術，似巧合，又非巧合。智慧語音技術為何在這個時間點在智慧電視上井噴？值得我們為此探討一番。

智慧語音的風口真來了？

投資界流行這樣一句話：投資要投“第三眼美女”，第一眼、第二眼美女交往的門檻和成本都比較高，而只有第三眼美女是屬於大眾的，對應到產品上，就是任何技術產品都要到第三代才能被大眾廣泛接受，才能長時間的存在下去。

人工智慧技術從50年代的控制論與早期神經網路，走到如今的AlphaGo、Master，現在正好在經歷技術發展的第三個階段。50年代末是一波高☆禁☆潮很多死掉了，到70年代的時候國家自然科學基金會都不支持了。80-90年代又活躍了一次，但許多認知科學家強烈反對當時很火的一個人工智慧概念“物理符號系統假設”，認為身體是推理的必要條件，加上科研經費的削減，又死了。今天正好是第三波，理論上機遇比較大。

第三代技術應該足夠下方到消費領域，接下來我們看看各電視廠商智慧語音技術具體的應用情況如何。

TCL：發佈會上TCL著重演示了人工智慧助手“小T”，具備感知、認知、服務、學習的三大特性。而“小T”是TCL集團與騰訊、阿裡在人工智慧及雲服務上進行資料打通，實現資源分享的結晶。

長虹：推出以電視機為中心的人工智慧平臺AI Center。據悉長虹除了與IBM、科大訊飛等達成合作，也與杜比、騰訊、華帝，以及清華大學、西安交大、微軟、中科院等結成“人工智慧產業聯盟”。

微鯨：微鯨科技推出了微鯨智慧語音電視2.0高端產品醉薄A系列，並宣佈微鯨全線產品也將進入2.0時代。其與科大訊飛與美國麻省理工媒體實驗室、微軟等，分別在語音遙控、多媒體交互領域、人臉識別等方面達成了合作。

樂視：從樂視一代超級電視開始就搭載有語音功能，超級電視語音技術經歷從合作到自主研發的過程，樂視的超級語音技術，不僅包括語音辨識和語義分析，其自主研發的語音合成TTS技術已全面上線。

幾乎每一個廠商都在強調對語音認知已從功能層面上升到人工智慧。而且背後還有巨大的合作團隊，與知名的語音技術和人工智慧平臺密切合作和研發。這種全軍出擊的局面，很難否定智慧語音在電視行業的發展盛況。但盛況並不意味著技術和商業的足夠成熟。

語音辨識究竟有多難？

為什麼智慧語音技術發展了這麼長時間，還是做不到對語音和語意的精准識別呢？我們有必要先瞭解一下語音辨識是怎麼做到的。

聲音實際上是一種波紋，就像自然中的光譜一樣。如果要對聲音進行分析，就要先把聲音的這種波紋切分成很很多小片段，就好比一個視頻由很多幀畫面構成，畫面又由很多個圖元點構成一樣，語音也可以切分成很多幀。所以語音辨識的大概流程可以歸納為以下幾點：

採集：聲波資訊分段採集

編碼：把每一單位長度的語音變成多維向量（內容資訊）

訓練：從資料中學習對語音的判斷，而不是用人工的規則。用資料庫和建立模型讓語音系統自我學習（如果遇到方言，需要建立獨立的一套系統）

解碼：用訓練好的模型組合起來就可以通過判斷新的語音向量，來識別語音了。

回饋：將分析結果通過設備播放出來。

看似很簡單的一個過程，其實每一個環節都有很多難點，有很多不可控的因素存在。一方面是複雜條件下，識別率顯著下降，比如地方方言、背景雜音，還有說話語速的差異，都是不具規律性的；另一方面是語音的訓練和測試用資料的並非完全匹配，如果用人民廣播電臺的語音來訓練資料庫，那實際操作中哪有這麼多廣播員呢？

這些都還只是皮毛，最重要的是人工智慧對於語意的理解才是巨大的困難。就算作為人類，在沒有前後文的情況下，突然扔給你一段話，你也不見得能理解它的意思。而人工智慧就更是一臉懵逼了，不同的麥克風、噪音、口音以及談話內容下，人工智慧作出的反應可能都截然不同，本質上它還不具備意識，對人類的語言缺乏足夠的認知。

語音交互在電視上的實際操作過程中，還會遇到這樣一個窘境：反應速度問題。試想一下如果對電視提出一個問題，哪怕回答的結果是準確的，但是等待時間卻長達兩三秒的話，你還有欲望繼續對它說話嗎？

綜上所述，無論是語音辨識演算法的亟待革命、語音工程上或缺的奇跡，或者是硬體性能上的各種限制，智慧語音發展到今天遠遠還談不上輕車熟路。只不過正好它遇上了這個時代，能夠忽略它的不成熟，容忍它的成長過程。因為它已經發展的足夠快了。

除了足夠智慧，還需要什麼？

如今的智慧語音並非完美，但是在電視這個平臺上，真的需要需要那麼智慧嗎？

電視的用途主要是什麼？搜索-點播-播控，無非就這是三點，深度整合一下線上和離線時的語音辨識工具包，並及時更新，就能夠基本滿足用戶對此的需求。

但是如果把電視當做的人工智慧控制中心，那電視就將會高頻率的用起來。那對智慧語音的要求就要高很多了。但是有一點作為智慧電視的本質屬性，是永遠不會改變的。那就是給使用者提供足夠多的內容和服務。

如果電視沒有足夠多的模組和功能，沒有足夠多的內容和服務，使用者使用語言的動機就會缺失。如果沒能打通所有家電智慧平臺，沒有統一控制協議，那使用者使用智慧語音就會處處受限。

真正要讓使用者把智慧語音功能使用起來，優秀的語音辨識技術，僅僅是其中很小的一部分，在家庭場景下的解決使用者實際問題的服務，才是根本。像很多廠商在電視上加入的人臉識別、兒童教育，配合智慧語音，才能發揮語音技術在這一場景下的價值。

總結：人工智慧只有在不斷交互的情形下，它才有使用的意義和進步的空間。所以在智慧交互不斷更迭的物聯網時代，智慧語音技術來得恰是時機。很多人把它看做是下一波風口，也並非無稽之談。只不過，一切科技的價值都是圍繞人性服務而產生，如何用智慧語音連接所有家庭環境下人性的需求，才是技術研發的同時，品牌製造商們迫切需要思考的問題。

不玩VR了，電視廠商紮堆玩智慧語音

如果懶得減肥就玩VR吧歪果仁胖子減掉45斤了！

蘋果電腦終於可以玩VR了！但別高興得太早

索尼電視率先支援智慧語音助手

微軟也賣VR了，本月正式出貨！

暴風走下神壇：電視VR受挫

小米電視4A系列發佈：“會聽話”的人工智慧語音、HDR10

CES變成畫展了？三星發佈文藝爆表的“壁畫”電視

電視都有24核處理器+8G快閃記憶體了，電腦該如何是好

樂視放棄收購美電視廠商Vizio，稱“監管原因”

開學期來了，電視劇也要跟起來！

樂視年度大戲跨界發佈CDLA手機、電視、汽車、VR

智慧生活微鯨智慧語音電視帶來新體驗

不玩VR了，電視廠商紮堆玩智慧語音

如果懶得減肥就玩VR吧 歪果仁胖子減掉45斤了！

蘋果電腦終於可以玩VR了！但別高興得太早

索尼電視率先支援智慧語音助手

微軟也賣VR了，本月正式出貨！

暴風走下神壇：電視VR受挫

小米電視4A系列發佈：“會聽話”的人工智慧語音、HDR10

CES變成畫展了？三星發佈文藝爆表的“壁畫”電視

電視都有24核處理器+8G快閃記憶體了，電腦該如何是好

樂視放棄收購美電視廠商Vizio，稱“監管原因”

開學期來了，電視劇也要跟起來！

樂視年度大戲跨界發佈CDLA手機、電視、汽車、VR

智慧生活 微鯨智慧語音電視帶來新體驗

如果懶得減肥就玩VR吧歪果仁胖子減掉45斤了！

智慧生活微鯨智慧語音電視帶來新體驗