IBM宣佈語音辨識系統單詞錯誤率取得5.5%的突破

科技界花了數年時間來創建可與人類相當的語音辨識軟體。近日，IBM 宣佈，公司已經開發出單詞錯誤率為 5.5% 的系統，較去年的 6.9% 單詞錯誤率又有了進一步提高。

微軟曾在去年 10 月聲稱所研發的語音辨識系統單詞錯誤率達到了 5.9%，已經十分接近人類的聽力水準。但 IBM 認為這還遠遠不夠。IBM 首席研究科學家 George Saon，本周在一篇博客文章中寫道：“即便今日已經取得了 5.5% 單詞錯誤率的突破，但公司認為，語音辨識系統要與人類水準旗鼓相當，需要達到的水準應該是 5.1%，目前還沒有哪家公司能做到。”

為取得 5.5% 這一數字的突破，IBM 將一套名為長短期記憶（Long Short-Term Memory）的人工神經網路與擁有三個強大聲學模型的 WaveNet 語言模型相結合，並啟用了 20 多年來一直被用於檢驗語音辨識系統的“SWITCHBOARD”語料庫。

在 IBM 一份聲明中，哥倫比亞大學電腦科學系的 Julia Hirschberg 教授稱，語音辨識系統要與人類打成平手仍需努力，因為人類的語言是極其複雜的，而每個人對語言的理解能力也有所差異，這進一步增加了定義“與人類相當”水準標準的難度。

IBM宣佈語音辨識系統單詞錯誤率取得5.5%的突破

黑科技！MIT新晶片將語音辨識功耗降99%

MIT黑科技：全新晶片將語音辨識功耗降低99%

IBM語音辨識技術超越人類！

語音辨識技術超越人類：錯誤率低的驚人

博世CES2017展未來概念車：搭載先進語音辨識技術

IBM宣佈將投資兩億美元用於互聯網安全

思必馳雷雄國：語音辨識將是萬億級物聯網設備的標配 | 萬物互聯創新大會

谷歌最牛語音辨識上線：粵語也能直轉文字

穀歌雲端語音辨識上線：普通話直轉文字

穀歌雲端語音辨識服務上線

語音辨識看似神通廣大但它真的聽得懂方言麼？

谷歌團隊提出全新線上序列到序列模型，可應用於雜訊語音辨識

IBM宣佈語音辨識系統單詞錯誤率取得5.5%的突破

黑科技！MIT新晶片將語音辨識功耗降99%

MIT黑科技：全新晶片將語音辨識功耗降低99%

IBM語音辨識技術超越人類！

語音辨識技術超越人類：錯誤率低的驚人

博世CES2017展未來概念車：搭載先進語音辨識技術

IBM宣佈將投資兩億美元用於互聯網安全

思必馳雷雄國：語音辨識將是萬億級物聯網設備的標配 | 萬物互聯創新大會

谷歌最牛語音辨識上線：粵語也能直轉文字

穀歌雲端語音辨識上線：普通話直轉文字

穀歌雲端語音辨識服務上線

語音辨識看似神通廣大 但它真的聽得懂方言麼？

谷歌團隊提出全新線上序列到序列模型，可應用於雜訊語音辨識

語音辨識看似神通廣大但它真的聽得懂方言麼？