淘新聞

在聲學技術這件事上,小米MIX 怎麼就黑科技了?丨硬創公開課

編者按:備貨少,聲量足,小米MIX 秒光是一件意料之中的事情。雖說在這個“PPT手機”氾濫的時代,沒搶到一台概念機不足為談,但得不到的永遠在騷動,祛魅比盲目點贊也更靠譜。

本期硬創公開課,「唯物」邀請了聲學博士陳孝良從他的專業角度對這款手機進行解讀,內容方面深入淺出,相信無論是消費者還是從業者,均能從中獲益。以下為演講實錄,由「唯物」整理。

小米MIX 的設計和工藝公認是非常困難的,超大的屏占比抓住了很多眼球,大家也為小米的這次創新鼓掌。但是同時,由於不拘一格的設計,以及眾多新技術的應用,特別是一些技術並未得到規模化驗證,導致了良品率極低。

小米為何如此冒險?這次我從小米MIX 應用的兩項聲學新技術分析一下。

小米MIX 其驚豔的外觀令人印象深刻,屏占比達到了史無前例的 91.3%,視覺上為“三面無邊框”(僅保留底部邊框)。其中,取消頂部邊框是一個非常大膽的嘗試,因為頂部邊框至少會有 3 個器件:前置攝像頭、距離感測器和聽筒。另外很多手機還會多放一個麥克風以便嘈雜環境的時候降低雜訊,以及普遍還放置光線感測器。

事實上,對於當前的智慧手機,改動任何一個感測器位置都是很大的設計嘗試。

但是小米為了取消頂部邊框,不得不做一些冒險的技術嘗試。攝像頭和光線感測器位置不是非常敏感,放到下部邊框也可以,當然,攝像頭放在底部,自拍稍微麻煩,但距離感測器和聽筒主要是通話輔助,更換位置就本末倒置了。

那麼,什麼是聽筒?

學術上一般叫受話器(Receiver),媒體經常說成“聽筒”,實際上可以理解為小型喇叭,有時候也叫著微型揚聲器。

普通受話器和揚聲器的工作原理類似,都是利用電感的電磁作用,即在一個放于永久磁場中的線圈中以聲音的電信號,使線圈中產生相互作用力,依靠這個作用力來帶動受話器的膜片振動發聲。

另外還有一種靜電式受話器,通過在兩個靠得很近的導電薄膜之間加上電信號,使這兩個導電薄膜由於電場力的作用而發生振動,來推動周圍的空氣振動,從而發出聲音。這種受話器目前在手機中使用越來越多。現在市面上已經有靜電揚聲器出售了。

先討論一個問題:既然有了“喇叭",為何還要“聽筒“?

可能很多人還沒有留意,手機從功能機時代的標準配置就包含了一個受話器,一個揚聲器,到現在也沒有多大變化,為什麼會這樣?

技術還是要滿足需求,這需要探索手機的兩項主要功能:通話和娛樂。受話器和揚聲器的主要區別也恰巧符合這兩種功能的技術要求。

通話是手機的基本功能,特別是手機,需要滿足兩個基本需求:聽得清、私密好,這正是受話器的基本特點。受話器的尺寸一般都在 2 cm 以內,其功率基本都在 0.5 W 左右,很少超過1W(更大的也有一種用途)。受話器頻率回應主要在中高頻的人聲頻段,幾乎不會低於 500HZ,相對來說衰減會比較快。

這些限制導致受話器的聲音傳播衰減很快,所以不靠近聽筒很難聽到聲音,從而保證了通話過程的私密性。

當然了,受話器也有很大的缺點,免提或者聽音樂就無能無力了,這時候就需要切換到大功率的揚聲器,通常稱為喇叭,喇叭由於功率增大其音量也很大,而且喇叭的音質也增色不少。國內很多山寨機就主打“大功率喇叭”。

看來這兩項功能確實不可替代,聽筒和喇叭至少在當前手機設計中還是無法繞過的。

另外免提時候手機切換到喇叭工作模式,這個時候音量就會很大,周邊的人都可以聽到手機通話的聲音,但同時卻帶來了一個副作用,就是若兩方同時說話的時候,這個時候手機裡面的麥克風也把喇叭播放的聲音錄了回去,然後再傳輸重播到了遠端,遠端的人聽起來就好像回聲一樣,嚴重影響了通話品質。

所以手機裡面自然又需要增加一項功能,回聲抵消。

這個功能不僅免提時候啟用,而且網路語音對話的時候也需要啟用。回聲抵消是雙工通話的關鍵性技術。目前來看,技術來源主要是手機晶片廠商的集成和專業廠商的演算法授權,比如聲智科技甚至提供了面向低端攝像頭的回聲抵消和語音增強技術方案,讓小小的攝像頭具備了通話甚至語音辨識的能力。

那麼,聽筒能不能放到手機下邊框?

聽筒的技術特性要求聽筒必須物理上貼近耳朵,這嚴重限制了 ID 設計的自由度。但是也是沒有辦法的事情,因為通話還是個非常私密的事情,特別是在較為安靜的場景,誰也不希望周邊的人聽到雙方交談的內容

Apple 在 iPhone 7 上據說就是使用底部的揚聲器與頂部的受話器搭配,通過演算法調校出來身歷聲音效的體驗。考慮到手機內部緊湊的設計,確實也很難安放第二個揚聲器。

小米MIX 的答案是:懸臂壓電陶瓷導聲技術。

這並不新鮮,因為夏普 2011 年的功能機就採用了這種技術,包括夏普的智慧機也部分採用,但是體驗都不是太好。這種方式和受話器的發聲原理是一樣的,都是通過電信號轉換成機械振動來產生聲音,兩者之間的區別僅僅是振動材料的不同而已。

為了大家理解壓電陶瓷發聲,我們舉幾個簡單的例子:

第一個例子就是網上眾多的共振音箱,通過壓電陶瓷的振動可以帶動玻璃甚至桌面振動產生聲音。

第二個例子就是超聲加濕器,其核心器件就是一個壓電陶瓷片,這種 1~3MHz 的壓電陶瓷片可以振動激發出水霧,當然這個頻率的聲音我們是無法聽到的(人耳最高聽到20KHz,而且隨著年齡增加持續下降)。

順便說一句,超聲加濕器的這種方式是不安全的,容易擴散細菌造成呼吸道疾病。

壓電陶瓷的這種功能主要是得益於壓電陶瓷的壓電效應,這種特性是著名的居裡夫婦 1880 年發現的。壓電效應通俗來說,就是某種材料沿一定方向受到外力的作用而變形時,內部產生的極化現象。

壓電效應有正效應和逆效應。簡單來說,正效應可以產生電,逆效應可以利用電產生形變。利用逆效應給壓電材料施加電壓它就會變形,若施加可控制的交流電就可以產生我們需要的形變,這種形變就可以產生振動從而發出聲音。

實際上很多材料具有壓電效應,只不過壓電陶瓷相對來說比較便宜和穩定。

從上面來看,這項技術其實蠻普通的,通過激勵壓電陶瓷產生聲音,進而再帶動手機陶瓷框架振動發聲傳到耳朵,關鍵點是要控制好音質,因為這種方式的音質取決於跟隨振動的材質。可以花個幾十塊錢試試共振音箱,貼在桌子、玻璃或者鋼板上試聽下效果。

那麼,這種技術的效果到底好不好?會不會是未來的主流技術呢?

答案應該是清晰的,這種壓電陶瓷的效果還是不能讓人滿意的,特別是作用到手機上用來替換聽筒,至少有三個方面的缺陷:

第一個就是音質問題,這種方式產生的聲音比傳統的受話器要差不少,降低通話體驗顯然是小米MIX 無奈之舉;

第二個就是私密性不好,因為整個陶瓷機身都在振動發聲,這在很多場景都會讓聲音輻射出去,這是蠻尷尬的一件事情,如同半開了免提效果一般;

第三個就是握感不好,打電話的時候握著的手機總是在振動,這真讓處☆禁☆女座的人簡直無法忍受了。還有,國內總喜歡給手機帶個護套啥的,這些都會影響手機通話品質。

至於量產倒是其次,畢竟是概念機。雖然壓電陶瓷的量產確實是個大問題,現在很難的技術就是壓電陶瓷的切割,陶瓷易碎導致成本很貴,同時也側面說明小米MIX 是一款需要精心呵護的手機,不能輕易給摔了,鬱悶的是還不能給帶個厚厚的外殼。

壓電陶瓷的事情我們先討論在這,下面再看看超聲距離傳感這項技術。

小米取消紅外傳感也是不得已,沒有了手機上框讓很多傳感無處藏身,取消紅外距離傳感估計是多家手機廠商的共同想法。

事實上由於光學距離感應器需要在手機的正面開一個矩形黑塊或兩個大孔,手機設計人員早就想去除這個小孔。

但這些小孔又非常重要,主要用於檢測用戶何時正在打電話,從而禁用觸控式螢幕,如果沒有距離感應功能,用戶的面頰就經常觸控式螢幕幕容易產生意外操作,比如很多時候貼緊面部經常意外掛掉電話,或者開啟了其他可怕的功能。

既然沒有了上邊框,紅外無法使用,小米也花了很大心思,採用了超聲距離感應的方法。

超聲波測距原理與雷達原理是一樣的。首先超聲波發射器向某一方向發射超聲波,在發射時刻的同時開始計時,超聲波在空氣中傳播,途中碰到障礙物就立即返回來,超聲波接收器收到反射波就立即停止計時。超聲波在空氣中的傳播速度為 340 m/s,根據計時器記錄的時間 t,就可以計算出發射點距障礙物的距離(s),即:s=340t/2

順便說一下,當前手機中的 mems 麥克風普遍具有了接收超聲波段的能力,有的麥克風可以聽到 80KHz。

同時,由於手機揚聲器尺寸也很小,發射超聲波段的聲音難度也不大,也就為超聲測距形成了天然的條件。手機中現在已經擁有了多個麥克風和喇叭,未來甚至還可以做超聲手勢識別。

當前幾種主流手勢識別技術我們列舉和對比如下:

但是呢,這項技術還不是非常成熟,小米也算是首次嘗試。

小米的這種技術可成為軟體解決方案,應該是Elliptic Labs這家公司提供的。事實上,單憑超聲測距這項技術來說,沒有多大技術難度,也不會有太大的專利壁壘。

最後再來總結一下,上面的這兩項技術未來會成為主流嗎?

分開來看,壓電陶瓷導聲這種技術應該不會,畢竟缺陷太多,對用戶來說也沒有不得不選的理由。

超聲測距這項技術應該會有部分手機需要,但是這要依賴於我們手機器件的進步,特別是麥克風和受話器的更新,不能簡單說成軟體方案。

當然,我們也可以暢想:全屏、柔性屏將來需要怎樣的聲學技術呢?

手機中聲學無非就做兩件事情,發聲和收聲,這兩種器件都在進步,有些原理方面進展也很大,特別是材料方面的進展,比如揚聲器就有指向揚聲器、靜電揚聲器等等出現。而麥克風現在基本都是 mems,其頻段越來越寬,具有了拓展更多應用的能力。

麥克風和揚聲器都在向著數位化發展,估計3年內可能會出現較大增長,這會讓手機的設計更加簡單。舉個例子,柔性屏應該怎麼配喇叭和麥克風?現在實驗室已經研究出了薄膜揚聲器和薄膜麥克風,相信也會很快應用到一些概念手機上面。(完)

---嘉賓簡介---

陳孝良,博士,聲智科技創始人,曾任中科院聲學所副研究員和資訊化辦公室主任,中科院上海高等研究院客座,北京市公安局首屆網路應急專家,主要從事聲學信號處理和 GPU 深度學習演算法研究工作。

2002 年從北京航空航太大學畢業後進入金山軟體股份有限公司工作,2003 年進入中科院聲學所,師從著名聲學家田靜和李曉東學習。主要參與海軍某重大專案(已獲得國防重大獎項)及 863、中科院戰略先導項目等。期間負責的核心演算法長期服役于海軍某重大型號。

2016 年 4 月中旬離職中科院,帶領聲學陣列和深度學習兩個團隊在峰瑞資本的支持下成立聲智科技,主要致力於解決真實場景下的語音交互問題,實現“聽你所言、知你所想”的願景。目前聲智科技的語音交互技術已經應用於包括 360、小米、百度和東方網力等產品系列以及數十家音箱和汽車相關企業。