我们从2011年坚守至今,只想做存粹的技术论坛。  由于网站在外面,点击附件后要很长世间才弹出下载,请耐心等待,勿重复点击不要用Edge和IE浏览器下载,否则提示不安全下载不了

 找回密码
 立即注册
搜索
查看: 653|回复: 1

[最新新闻] Google Translate中翻英首次運用神經機器翻譯技術

[复制链接]

该用户从未签到

2391

主题

1013

回帖

399

积分

三级逆天

朝十萬金幣目標邁進!!!

积分
399

社区居民忠实会员社区劳模原创达人终身成就奖特殊贡献奖原创先锋奖金点子奖

QQ
发表于 2016-9-29 21:50:13 | 显示全部楼层 |阅读模式
以中文語句翻譯為英文為例,Google神經機器翻譯(GNMT)技術會將中文句子編碼為一組向量,每個向量都表示句子讀到目前的意義。在讀完整個中文句子才開始翻譯的解碼過程,每讀一次逐步產生一個英文字,直到產出完整句子。


sample.jpg

Google已經將人工智慧用於語音辨識和圖像辨識上,周三再宣佈將在網頁與行動版Google Translate使用最新神經機器翻譯(Google neural machine translation, GNMT)系統,並用於中文翻英文的工作。
Google Brain團隊研究員Quoc Le及Mike Schuster指出,Google Translate自10年前推出以來,使用的是以字詞為基礎的機器翻譯方式,數年前,Google開始運用遞歸神經網路(Recurrent Neural Networks,RNN)來學習在不同語言翻譯中,輸入與翻譯輸出句子的比對。相較於傳統字詞為基礎的機器方式是將句子切成字和詞再獨立翻譯,但運用神經網路的翻譯則是將整個輸入句視為一個單元。一開始兩者的翻譯精準度並沒有相差太多,但經過改進,神經網路翻譯開始超越舊式技術。
以一個中文語句翻譯成英文為例,新系統將一個中文句編碼為一組向量(vectors),每個向量都表示句子讀到目前的意義。在讀完整個中文句子才開始翻譯的解碼過程,每讀一次逐步產生一個英文字,直到產出完整句子。而在產出英文字時,系統會注意特定字詞在中文句中的權重。
以中文新聞的翻譯為例(下圖),可看出傳統以字詞為基礎的機器翻譯技術(PBMT)、Google神經機器翻譯(GNMT)及人工翻譯的差異。


螢幕快照 2016-09-28 下午3_38_13 (1).jpg

目前GNMT還是會犯許多人類不會犯的錯,像是漏字或特定與罕見字詞翻錯,以及翻譯未考量前後文,但是已經有長足進步,例如以維基百科及數家新聞網站上抓取的句子進行的數種主要語言的翻譯測試中,已經讓錯誤率較原有翻譯降低55-85%。
而在配合Google早先公佈的機器學習工具組TensorFlow及Tensor處理單元(TPU)下,Google決定將GNMT用於Google Translate網頁及Web版所有中翻英的工作。目前,Google Translate App一天大約可完成1800萬次翻譯。Google表示,未來幾個月還會將新系統用於其他語言的翻譯上。
Google積極運用人工智慧技術於多項服務,包括Inbox by Gmail及近日公佈的Google Allo 助理等。
回复

使用道具 举报

该用户从未签到

632

主题

6399

回帖

209

积分

三级逆天

-

积分
209

忠实会员社区居民社区劳模原创达人最爱沙发终身成就奖特殊贡献奖原创先锋奖优秀斑竹奖金点子奖

QQ
发表于 2016-9-30 12:28:56 | 显示全部楼层
-
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

论坛开启做任务可以
额外奖励金币快速赚
积分升级了


Copyright ©2011-2024 NTpcb.com All Right Reserved.  Powered by Discuz! (NTpcb)

本站信息均由会员发表,不代表NTpcb立场,如侵犯了您的权利请发帖投诉

平平安安
TOP
快速回复 返回顶部 返回列表