Siri發抖?亞馬遜Alexa學會說話
自從智慧音箱Echo大受歡迎之後,Amazon上月底又推出了一項擴大AI生態體系的舉措,那就是Amazon Lex平臺的正式發佈。該平臺以虛擬助理Alexa底層的自動語音辨識與自然語言理解技術為基礎,旨在利用一系列工具為聊天機器人開發者的工作提供便利,同時利用開發者的訓練資料進一步完善Alexa,以及促進Lex在語音計算平臺的統治力。而為了進一步提高其智慧語音服務的吸引力,近日這家電子商務巨頭又宣佈已經讓Alexa get到了新技能:一套新的說話技能,開發者通過利用標準的語音合成標記語言,就能夠調節Alexa的說話模式,讓它產生低聲耳語、停頓深呼吸一下以示強調、調整語速、語調等。一個更加個性化和情緒化的虛擬助理無疑是更加聰明的,也會讓人更加願意去互動。不過目前這項功能僅針對美國和英國開放。
新技能需要通過語音合成標記語言(Speech Synthesis Markup Language,SSML)來運用。這次SSML總共新增了5個標籤:whispered(說悄悄話)、expletive(用嗶嗶聲遮罩)、Sub(替換說法)、emphasis(強調)以及Prosody(控制語音、語調、語速,但是會有範圍控制)。比方說下面就是一個說悄悄話的SSML例子:
用戶名是Boxi Yang,密碼是… 等一下,你湊近一點…
密碼是悄悄話。
這樣說“密碼是悄悄話”時Alexa就會壓低聲音。
當然,此前Alexa已經添加了不少個性。比方說她會自問自答,講講笑話,回答“我愛你”等,甚至如果你要求的話她還可以唱歌給你聽。但是之前Alexa的說話時仍然擺脫不了那種千篇一律,而且一旦句子太長就會露出機器發音的痕跡。
而這5個新標籤就可以增加Alexa說話的個性化。為了演示這些說話技巧實際的應用效果,Amazon創建了一個運用了新標籤的謎語遊戲範本,開發者自己也可以對其進行修改來嘗試新的說話技巧。
此外,Amazon還為英國和德國地區引入了“speechcons”功能。這項功能可以讓Alexa利用特殊的單詞和短句以更豐富(更加口語化)的方式來進行互動。
當然,Alexa的繁榮仍然有賴於開發者社區的活躍。這幫人需要的不僅僅是樂子,更重要的是銀子。除了有趣以外,如何幫助他們找到真正有用的商業模式是Amazon搭建語音帝國需要解決的課題。
作者: boxi
(發佈/韋康)