【科技】Facebook新技术有望帮人类克服语言鸿沟
本篇文章1439字,读完约4分钟
句子/光谱
创世记11章说,人类计划建造一座通天高塔,但上帝让人类说不同的语言,他们不能合作,计划最终失败了。
在现实中,不同的语言成为各自所属文化的因子,构筑了多样的美。 但是语言依然如隔阂,妨碍了人类的交流。
最近,facebook使用人工智能大幅改造了翻译系统。
他们的工程师在网站上发现翻译蒂穆尔文和答案的按钮每天点击数十亿次,翻译动作有数千个方向(例如中文对译,从英语到中文是一个方向,相反是另一个方向)。
这样大量的翻译事业,facebook迄今为止做得不好。 他们过去采用的统计机器系统不能翻译俚语,不能识别错字和缩写,不能理解上下文,很难正确翻译蒂穆尔文的意图。 因此,工程师们利用有观察力的长短记忆( long short-termmemorywithattention,lstm )深度学习技术,设计了人工智能翻译系统。
现在,新的神经机器翻译系统取代了传统的机器翻译系统,并部署在facebook网站、instagram和其他产品中。 改造效果显着:根据业界公认的bleu标准,facebook新翻译系统的各语言对译得分比旧系统提高了11%。
人类信息表达大多是通过语言进行的。 参加者不使用统一语言时,信息表达必须通过翻译。 这是因为这个翻译系统的精度对信息表现的成果有很大的影响。 但遗憾的是,大部分互联网和手机的翻译网站和软件,背后的技术来自机器翻译。
一般来说,机器翻译系统对常见单词、短语、句法简单的句子的翻译有效。 一句话主谓宾,比如我吃饭,系统翻译成i eat rice,这就没问题了。
但是,在中日对译,或者下图的土耳其语和英语对译中,原文的语言和翻译后的语言在句法上有很大差异,机器翻译会陷入僵局。 下图是折回结果。
翻译的英语语法上没有错,但意思还很难理解。 这是因为机器翻译把句子分割成一个区域,结果放出一个区域的翻译,没有优化目标语言的语序、语法、表现习性。
人工智能如何能更准确、更人性化地翻译呢?
维基解释说,lstm是时间递归的神经互联网,适合解决和预测时间序列上的间隔和延迟相对长的重要事情。 翻译正好是这种类型的员工,因为长句话,后半部分可能呼应前半部分的逻辑,机器翻译系统不记得之前说过。
lstm可以记住整个句子的副本,回溯句子上下文,理解逻辑,提供更准确流利、真实的翻译结果。 请参见下图。
观察力( attention )也是深度学习中感兴趣的机制,类似于人类注意事物时的眼神焦点。 锅里有菜,不是锅和锅柄,而是自动分配越来越多的观察力给菜。
观察力有助于关注idk (i dont know )、tmrw (tomorrow )、网络用语等缩写和短语的可能性高的标准英语词典中没有的词语。 神经机器在句子中发现这样的词时,首先不要直接翻译,而是分配一定的计算能力,去其他词典和训练数据集寻找这个词的释义,最后翻译。
不仅如此,研发团队利用神经网络剪枝(保存重要权重)和压缩编码算法,大幅降低神经翻译系统词汇表的大小,减少了计算量,但没有降低翻译精度。
桃子
略略略略略略略略略略略略略略微略微微软mmrrstttttttttttttt发布通过翻译嘻嘻
今年也是
好的I
还差得远还差得远还差得远呢。
净是
就这样,就这样,就这样,就这样,就这样,就这样,就这样,就这样,就这样,就这样,就这样,就这样,就这样,就这样。
有点儿
手
年轻只是只是只是只是只是只是只是只是只是只是只是只是只是只是只是而已
只是。
标题:【科技】Facebook新技术有望帮人类克服语言鸿沟
地址:http://www.greenichiban.com/news/12680.html
免责声明:国际科技时报是中国具有影响力的科技媒体,以全球视角,第一时间呈现最新科技资讯。所著的内容转载自互联网,本站不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,国际科技时报的作者:何鸿宝将予以删除。