為保競爭優勢 Siri 是如何學習一門新語言的
在智慧語音助理領域的競爭中,Siri 握有一項優勢,那便是本土化。據悉,Siri 支持 36 個國家的 24 種語言。相比之下,谷歌的智慧語音助理只掌握 5 種語言,而亞馬遜的 Alexa 就只會英語和德語。
在即將到來的 iOS 10.3 中,據稱還將增加對上海話的支持。在接受路透社採訪時,蘋果語音團隊的負責人 Alex Acero 透露了 Siri 是怎樣學會一門新語言的。
在開始引入一門新語言之前,蘋果會讓熟悉該語言的人進行各種段落和單詞閱讀,過程中會夾雜著許多口音或方言。這些生成語音將由另一部分人進行記錄和轉錄,以確保用詞的規範性和語音辨識的準確性。隨後用於訓練的原始語音將被輸入機器演算法訓練模型。
蘋果會構建一個語言模型試圖對單詞序列進行預測。在正式升級 Siri 之前,蘋果將在 iOS 和 macOS 上推出新語言的聽寫功能,以便於公司收集並匿名化採用部分蘋果使用者的錄音來作為語音樣本。
在這些語音中,難免會出現背景雜音,而這些樣本同樣需經由人工進行轉錄,再將語音樣本與轉錄文字相互比對著進行訓練,據 Alex Acero 稱,這樣可使識別錯誤率降低至少一半。
收集足夠的資料後,蘋果便會讓一人或多人進行語音錄製,Siri 便多學會了一門語言,此後每兩周蘋果都將對其資料庫進行更新。