技术:谷歌翻译高勤:神经互联网对于多语言机器翻译具普适性
本篇文章2187字,读完约5分钟
新浪科技报7月11日上午宣布,中国互联网大会在北京国家会议中心开幕三天。 谷歌翻译开发科学家的高薪详细阐述了谷歌翻译最近一年的最新进展,第一是利用机器学习消除语言障碍。
高勤说,谷歌的翻译现在以100多种语言相互运用,复盖了全世界99%的读者,每天提供10亿次以上的翻译,相当于约100万本书的复印件总量。 每月活动用户超过10亿人,其中95%来自美国以外的地区。 从技术上讲,Google利用机器学习,为没有数据服务的旅行者带来了有用的新翻译体验,包括使用手机照相机的即时翻译、使用手机麦克风和扬声器的即时会话翻译、离线翻译支持等。
在翻译质量方面,谷歌基于神经网络机器翻译技术提高了翻译的流畅性和准确性。 高勤认为神经网络对以前传来的技术是革命性的变化,可以得到连续的全球决策新闻。
“以前流传下来的翻译技术是基于短语的统计机器翻译是一个谜题过程,通过短语对的排列和组合,试图找到更好的翻译选项,但整个决定过程是离散的,支持这个决定的新闻 神经网络的机器学习恰恰相反,在所有的翻译过程中都可以利用云语言和目标语言的所有新闻,整个决策过程是连续的、全球的。
是。训练
桃子
第二大
只是只是只是只是只是只是只是只是只是只是只是只是只是只是只是只是只是只是只是只是只是只是只是只是而已只是只是只是只是只是而已g,,世界。
还是111,,,每月,从美国,1000011111111111111111111111111111111111111111111111111111100000111111111111111111111
稍微有点
但是在这里是手动的
但是
稍微有点儿句子句子句子句子稍微统计稍微有点儿稍微有点儿短语稍微有点儿不太好。不太好,不太好,不太好,不太好,不太好,不太好,不太好,不太好,不太好。
神经网络机器翻译是以前流传下来的技术的一大特征,而like这个英语单词被翻译成中文的“相似”“相同”这个短语。 这两个词根的距离非常长,对以前传下来的机器翻译技术来说,这种关系非常难处理,英语多,复杂的程序结构带来很多排序和省略。 如果不能利用整个云语言句子的全球新闻,我们就不会不连续和尴尬。 神经网络机器翻译在这两方面都有很大的进步,这几个已经在各种研究中得到了证实。 但是,从一个实验室的研究结果到服务10亿产品还有很长的路要走。
我们在制定项目计划时预计完成这个发布需要三年时间。 实际发布时间超过预期,年9月,我们的项目基于tensorflow,年2月获得了第一个产品规模模型,年11月共计有16种语言为在线神经网络机器翻译带来了初始规模。 上个月超过50%的流量在神经网络上翻译。 在计划初期设定比较保守的目标吧? 神经网络具有强大的表现力,但需要很大的计算量,要获得第一个产品化模型,迅速的一个模型需要2~3周,一次训练需要100张以上的gpu,翻译需要20次以上的句子。 这种情况使这种产品非常难以在线。 这时谷歌用机器学习了硬件和软件的全面布局,为弹药库提供了足够的弹药。 当我们致力于提高数据和吞吐量时,谷歌张量解决器诞生了。 高度优化的代码使数亿客户能够提供快速的翻译服务。
面对200个模型的训练和维护对我们来说依然是非常重要的任务。 因此,我们把目光转向了多语言模型。 多语言模型是指在同一神经网络上学习多种语言的相互翻译。 例如,可以把英语、西班牙语、韩语放在同一种翻译模式中进行翻译。 我们发现实现多语言模型的机器翻译方法非常简单,只要把我们想翻译的目标语言代码以特殊的符号形式传递给神经网络,神经网络就能解决多种语言的翻译。 例如,要翻译成日语,只需在原来的语言前加入2ja+的简单符号。 这样解决的多语言简单的符号往往比单语言的情况提高性能。
零数据翻译,这个模型采用了英语到日语,英语到韩语,日语到英语,韩语到英语的训练数据,但是没有日语和韩语之间的翻译数据。 从日语到韩语和从韩语到日语的翻译是零数据的任务。 多语言模式非常好地解决了从日语到韩语、从韩语到日语的解决,无需向英语转播就能实现两者的英语以外的语言的翻译,为将来统一构建统一的翻译模式提供了可能性。
我们在多语言模型、神经网络内部多维空间投影多语言且意义相近的句子向量表达,发现意义相近的句子投影在邻接地区,这表明神经网络内部对多种语言的表达具有一定的普遍性 你的意思是找到代表多种语言的普通话了吗? 我现在还不清楚,我觉得需要进一步讨论。
总结来说,利用tpu、张量解决器、谷歌在机器翻译中的多年积累,我们在短时间内成功推出了神经网络机器翻译模型,同时该模型取得了巨大的成功。 谷歌翻译在各个市场的招聘量大幅度提高。 而且,这种模式的发表在业界和研究界掀起了机器翻译研究的热潮。 据统计,去年一年发表了200篇关于神经网络机器翻译的论文,但这并不意味着神经网络机器翻译非常成熟,实际上经过过去一年的研究,我们正在进行神经网络机器翻译 下一步将致力于改善数字、日期、名称、企业品牌和不常见短语翻译,并进一步研究新的模型结构和培训方法。 最近谷歌的大脑发表了基于观察力模型的新模型结构。 我们认为神经网络的机器翻译刚出现前线,往往没有达到性能的极限。 这是因为将来我们会继续投入。 我希望神经网络的机器翻译可以无障碍地为建立语言间的交流环境做出贡献。
非常感谢!
标题:技术:谷歌翻译高勤:神经互联网对于多语言机器翻译具普适性
地址:http://www.greenichiban.com/hlw/4031.html
免责声明:国际科技时报是中国具有影响力的科技媒体,以全球视角,第一时间呈现最新科技资讯。所著的内容转载自互联网,本站不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,国际科技时报的作者:何鸿宝将予以删除。
上一篇:技术:国内首例互联网音乐侵权案