Siri發抖？亞馬遜Alexa學會說話

分類＼手機
時間＼2017-05-02

自從智慧音箱Echo大受歡迎之後，Amazon上月底又推出了一項擴大AI生態體系的舉措，那就是Amazon Lex平臺的正式發佈。該平臺以虛擬助理Alexa底層的自動語音辨識與自然語言理解技術為基礎，旨在利用一系列工具為聊天機器人開發者的工作提供便利，同時利用開發者的訓練資料進一步完善Alexa，以及促進Lex在語音計算平臺的統治力。而為了進一步提高其智慧語音服務的吸引力，近日這家電子商務巨頭又宣佈已經讓Alexa get到了新技能：一套新的說話技能，開發者通過利用標準的語音合成標記語言，就能夠調節Alexa的說話模式，讓它產生低聲耳語、停頓深呼吸一下以示強調、調整語速、語調等。一個更加個性化和情緒化的虛擬助理無疑是更加聰明的，也會讓人更加願意去互動。不過目前這項功能僅針對美國和英國開放。

新技能需要通過語音合成標記語言（Speech Synthesis Markup Language，SSML）來運用。這次SSML總共新增了5個標籤：whispered（說悄悄話）、expletive（用嗶嗶聲遮罩）、Sub（替換說法）、emphasis（強調）以及Prosody（控制語音、語調、語速，但是會有範圍控制）。比方說下面就是一個說悄悄話的SSML例子：

用戶名是Boxi Yang，密碼是… 等一下，你湊近一點…

密碼是悄悄話。

這樣說“密碼是悄悄話”時Alexa就會壓低聲音。

當然，此前Alexa已經添加了不少個性。比方說她會自問自答，講講笑話，回答“我愛你”等，甚至如果你要求的話她還可以唱歌給你聽。但是之前Alexa的說話時仍然擺脫不了那種千篇一律，而且一旦句子太長就會露出機器發音的痕跡。

而這5個新標籤就可以增加Alexa說話的個性化。為了演示這些說話技巧實際的應用效果，Amazon創建了一個運用了新標籤的謎語遊戲範本，開發者自己也可以對其進行修改來嘗試新的說話技巧。

此外，Amazon還為英國和德國地區引入了“speechcons”功能。這項功能可以讓Alexa利用特殊的單詞和短句以更豐富（更加口語化）的方式來進行互動。

當然，Alexa的繁榮仍然有賴於開發者社區的活躍。這幫人需要的不僅僅是樂子，更重要的是銀子。除了有趣以外，如何幫助他們找到真正有用的商業模式是Amazon搭建語音帝國需要解決的課題。

作者： boxi

（發佈/韋康）