一窺穀歌神經機器翻譯模型真面貌，其底層框架開源！

去年，穀歌發佈了 Google Neural Machine Translation (GNMT)，即穀歌神經機器翻譯，一個 sequence-to-sequence (“seq2seq”) 的模型。現在，它已經用於谷歌翻譯的產品系統。

雖然消費者感受到的提升並不十分明顯，穀歌宣稱，GNMT 對翻譯品質帶來了巨大飛躍。

但穀歌想做的顯然不止於此。其在官方博客表示：“由於外部研究人員無法獲取訓練這些模型的框架，GNMT 的影響力受到了束縛。”

如何把該技術的影響力最大化？答案只有一個——開源。

因而，

谷歌於昨晚發佈了 tf-seq2seq —— 基於 TensorFlow 的 seq2seq 框架。谷歌表示，它使開發者試驗 seq2seq 模型變得更方便，更容易達到一流的效果。

另外，tf-seq2seq 的代碼庫很乾淨並且模組化，保留了全部的測試覆蓋，並把所有功能寫入檔。

該框架支援標準 seq2seq 模型的多種配置，比如編碼器/解碼器的深度、注意力機制（attention mechanism）、RNN 單元類型以及 beam size。這樣的多功能性，能幫助研究人員找到最優的超參數，也使它超過了其他框架。詳情請參考穀歌論文《

Massive Exploration of Neural Machine Translation Architectures

》。

上圖所示，是一個從中文到英文的 seq2seq 翻譯模型。每一個時間步驟，編碼器接收一個漢字以及它的上一個狀態（黑色箭頭），然後生成輸出向量（藍色箭頭）。下一步，解碼器一個詞一個詞地生成英語翻譯。在每一個時間步驟，解碼器接收上一個字詞、上一個狀態、所有編碼器的加權輸出和，以生成下一個英語詞彙。雷鋒網提醒，在穀歌的執行中，他們使用 wordpieces 來處理生僻字詞。

據雷鋒網瞭解，除了機器翻譯，tf-seq2seq 還能被應用到其他 sequence-to-sequence 任務上；即任何給定輸入順序、需要學習輸出順序的任務。這包括 machine summarization、圖像抓取、語音辨識、對話建模。穀歌自承，在設計該框架時可以說是十分地仔細，才能維持這個層次的廣適性，並提供人性化的教程、預處理資料以及其他的機器翻譯功能。

穀歌在博客表示：

“我們希望，你會用 tf-seq2seq 來加速（或起步）你的深度學習研究。我們歡迎你對 GitHub 資源庫的貢獻。有一系列公開的問題需要你的説明！”

GitHub 地址：

https://github.com/google/seq2seq

GitHub 資源庫：

https://google.github.io/seq2seq/nmt/

via

googleblog

，雷鋒網編譯

一窺穀歌神經機器翻譯模型真面貌，其底層框架開源！

穀歌機器翻譯借AI再顯神通再加三種語言

你的機器學習模型為什麼會出錯？奉上四大原因解析及五條改進措施

谷歌的神經翻譯系統並不意味著機器翻譯到頭了，還有大把創新可做 | MIFS 2016

解密谷歌神經網路翻譯，訊飛超腦帶來新進展｜唯物週刊

深度：回顧Google神經網路機器翻譯上線歷程

穀歌神秘設備“Bisto”正在測試：很可能是個耳機

AI機器人也有性別歧視？其實都怪人類

F8 2017 | 技術負責人為你解析 Facebook 神經機器翻譯

穀歌機器翻譯取得顛覆性突破到底幾分真假？

網易有道上線神經網路翻譯，品質提升超過去十年總和

穀歌神秘Fuchsia系統UI介面曝光

穀歌研發能處理多域多工的機器學習模型——MultiModel

一窺穀歌神經機器翻譯模型真面貌，其底層框架開源！

穀歌機器翻譯借AI再顯神通 再加三種語言

你的機器學習模型為什麼會出錯？奉上四大原因解析及五條改進措施

谷歌的神經翻譯系統並不意味著機器翻譯到頭了，還有大把創新可做 | MIFS 2016

解密谷歌神經網路翻譯，訊飛超腦帶來新進展｜唯物週刊

深度：回顧Google神經網路機器翻譯上線歷程

穀歌神秘設備“Bisto”正在測試：很可能是個耳機

AI機器人也有性別歧視？其實都怪人類

F8 2017 | 技術負責人為你解析 Facebook 神經機器翻譯

穀歌機器翻譯取得顛覆性突破 到底幾分真假？

網易有道上線神經網路翻譯，品質提升超過去十年總和

穀歌神秘Fuchsia系統UI介面曝光

穀歌研發能處理多域多工的機器學習模型——MultiModel

穀歌機器翻譯借AI再顯神通再加三種語言

穀歌機器翻譯取得顛覆性突破到底幾分真假？