Google翻译内核升级 称误差再降超55%

作者: 佚名 2020-05-09 10:03:00

近期,Google 翻译悄然升级了其翻译内核。据 Google 官方提供的数据显示,Google 翻译搭载的 Google 的神经机器翻译(GNMT:Google Neural Machine Translation)系统使用了当前最先进的训练技术,因而提升了机器翻译水平,将翻译误差再度降低了 55%-85%。

Google 展示的翻译模型质量

十多年前,Google 发布了 Google 翻译,早年基于短语的统计机器翻译,会将输入句子分解成词和短语,然后对它们进行独立翻译。这种翻译方式的劣势非常明显:句子中原本完整的信息被碎片化,无法连贯地进行表达。而这种现象在英中互译的情况下显得尤其明显。

而 Google 神经机器翻译则将输入的句子作为一个整体翻译。

以中英翻译为例,Google 神经机器翻译首先将这句中文的词编码成一个向量列表,其中每个向量都表示了到目前为止所有被读取到的词的含义(编码器“Encoder”)。读取完整个句子,解码器就开始工作——一次生成英语句子的一个词(解码器“Decoder”)。

上图展示了 Google 神经机器翻译的中英翻译原理

为了在每一步都生成翻译正确的词,解码器重点注意了与生成英语词最相关编码的中文向量的权重分布。

在被首次提出时,神经机器翻译系统在中等规模的数据集上就与基于短语的翻译系统水平相当。

现在,Google 方面表示,通过让神经机器翻译战胜在非常大型的数据集上工作的许多挑战,打造了在速度和准确度上都更好翻译的系统。

目前,Google 神经机器翻译系统已投入到了中文-英语的翻译中。现在,移动版和网页版的 Google 翻译的中英翻译已完全使用神经机器翻译——每天大约 1800 万条翻译。

有经过大型数据集考验的 Google 神经机器翻译系统加持,最新的 Google 翻译效果究竟如何呢?

我们做了一个简单的比较测试。当然,还是在中英翻译场景下。

测试场景:PC 端 Google 翻译网页版

随机选择了一则英文消息,原文如下:

Since COVID-19 began, we’ve heard from our retail and brand manufacturing partners that they’re hungry for more insights on how consumer interests are changing, given fluctuations in consumer demand. We see these changes reflected in how people are searching on Google. Last month, there were spikes in search interest for household supplies and jigsaw puzzles as people spent more time at home. This month we’ve seen surging interest for sewing machines and baking materials in the U.S., and tetherball sets and chalk in the United Kingdom and Australia.

Businesses are using a variety of resources to understand changing consumer interests—including Google Trends, social listening, surveys, and their own data—in order to help make decisions on the fly. But if they don’t know what to look for, there isn’t an easy way to understand which product categories are gaining in popularity, and might pose an OPPOrtunity.

That’s why we’re launching a rising retail categories tool on Think with Google. It Surfaces fast-growing, product-related categories in Google Search, the locations where they’re growing, and the queries associated with them. This is the first time we’ve provided this type of insight on the product categories that people are searching for.

旧版 Google 翻译给出的英译中结果:

升级后 Google 翻译给出的英译中新结果,红色标记字部分为与旧翻译结果的不同地方。新版翻译具体如下:

对比两段翻译结果,可以看出区别还挺大的。整体而言,新版翻译结果中标红文字的表述明显更符合汉语的语法和表述习惯。

另外,最后一段的翻译结果优化则更为明显,对 Google 产品名称“Think with Google”进行了准确识别,避免了乱翻译的尴尬。

确实更智能啦!

 
 
Google 翻译 技术
上一篇:人工智能在过程工业绿色制造中的机遇与挑战 下一篇:人工智能将在2020年改变IT行业
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

没有了传感器,工业机器人还能工作吗?

当前,人口红利下降、人力成本上升、人才结构矛盾等问题正在成为困扰制造业企业发展的难题。为解决用工问题,一些制造业企业开始发力智能制造,建设智慧工厂,通过引入工业机器人来解决用工短缺和成本上升问题。

佚名 ·  1天前
详解人工智能十大经典应用领域及其技术原理

本文通过案例分门别类地深入探讨人工智能的实际应用。案例甚多,此处所列举的仅是九牛一毛。本该按行业或业务对这些案例进行分类,但相反我选择按在行业或业务中最可能应用的顺序来分类。

华章科技 ·  1天前
机器学习的中流砥柱:用于模型构建的基础架构工具有哪些?

人工智能(AI)和机器学习(ML)已然“渗透”到了各行各业,企业们期待通过机器学习基础架构平台,以推动人工智能在业务中的利用。

读芯术 ·  2天前
了解有关符号人工智能,象征性AI的好处和局限性

如今,人工智能主要是关于人工神经网络和深度学习。但这并非总是如此。实际上,在过去的十年中,该领域大部分都由象征性人工智能主导,也被称为“经典AI”,“基于规则的AI”和“老式的AI”。

AI国际站 ·  2天前
IoT和AI如何让企业在疫情期间重启业务

疫情期间,我们该如何利用物联网和人工智能技术帮助企业重新开始营业,提供安全和相关的服务,同时也确保员工安全。

Dimitrios Spiliopoulos ·  3天前
复工复产“新基建”提速 人工智能能做什么

疫情中,智能产品在用户群体中赢得了更多信任,人工智能给各行业的“赋能”作用开始显现,人工智能应用在提升国家治理能力方面的作用也越来越明显。

邱晨辉 ·  3天前
2020年商业中十大AI趋势 人工智能技术正以惊人的速度增长

人工智能是2010年代的技术,随着时间的流逝,越来越多的AI技术正在出现。人工智能是所有技术人员的新魅力-但即使在第二个十年,它也没有结束。毫无疑问,2019年是人工智能之年;然而,2020年已许诺了更多的AI奇迹。以下是2020年人工智能业务十大趋势。

AI国际站 ·  3天前
机器学习:有监督和无监督之间有什么区别

机器学习是人工智能的一个子集,它通过示例和经验教会计算机执行任务,是研究和开发的热门领域。我们每天使用的许多应用程序都使用机器学习算法,包括AI助手,Web搜索和机器翻译。

AI国际站 ·  4天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载