谷歌推“同声传译”系统Translatotron:语音翻译无需文本转换

作者: 佚名 2019-05-16 13:42:38

 谷歌AI官方博客***博文中向我们介绍了一项实验性质的新系统--Translatotron,它能够直接将语音翻译成为语音,中间不再需要任何文本。在博文中写道:“Translatotron是***能够直接将一种语言的语音翻译成为另一种语言语音的端到端模型。”

谷歌表示当前的翻译系统分为三个步骤:自动语音识别,将语音转换为文本;机器翻译,将文本转换为另一种语言;***是文本转语音(TTS)合成,也就是将翻译好的文本生成语音。在这三个步骤衍生出了Google Translate等服务,不过这家科技巨头希望通过一个模型就实现语音的翻译,而不再需要借助文本这个中间步骤。

Google AI软件工程师Ye Jia和Ron Weiss表示:“该系统名为Translatotron,这个系统避免了将任务分成不同的阶段。”谷歌表示这意味着更快的翻译速度和更少的转译错误。该系统使用频谱图作为输入并生成频谱图,同样依赖于神经声码器和扬声器编码器,这意味着系统在翻译后保留说话者的声音特征。

谷歌 Android 开发者
上一篇:史上人脸识别禁令出台,警察用来抓罪犯也不行 下一篇:2019如何玩转人工智能,全球AI大牛给你答案
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

机器学习公平性研究,走在正确的道路上吗?

随着人工智能的发展,机器学习的技术越来越多地被应用在社会的各个领域,来帮助人们进行决策,其潜在的影响力已经变得越来越大,特别是在具有重要影响力的领域,例如刑事判决、福利评估、资源分配等。

丛末 ·  2020-02-07 15:14:23
容量是GPT-2的1.7倍!谷歌打造神经对话模型Meena

谷歌的研究人员认为:开放域对话研究除了是一个引人入胜的研究课题之外,这种对话机制还可以产生许多有趣的应用程序,例如进一步人性化的计算机交互、改进外语练习以及制作可关联的交互式电影和游戏角色。

AI前线小组 译 ·  2020-01-30 14:50:16
AI 不再高大上 更贴近生活

进入到 2020 年,AI 在行业中的发展已经超脱了单纯技术创新和突破的范畴,而是走向产品和产业融合,并由此体现出商业回报价值。由此,AI 的商业化落地,越来越成为衡量一家科技巨头在技术战略、产品规划、生态构建等方面综合实力的关键指标。

I/O ·  2020-01-16 16:18:49
谷歌、苹果、英特尔们的“医疗数据隐私保卫战”:三种AI技术你最倾向哪一个?

回顾人工智能技术的发展历史,我们可以看到,隐私问题并没有被当成一把悬在头上的“达摩克利斯之剑”。但是机器学习的一个分支——保护隐私的机器学习——试图探索可能防止个人识别数据泄露的方法。而联邦学习、微分隐私和同态加密被认为是最有前景的三种技术。

李雨晨 ·  2020-01-02 14:23:25
谷歌15个人工智能开源免费项目!开发者:懂了 精选

今天说的是来自科技“大厂”Google发布的一些涉及到机器学习、深度学习、神经网络等优质的人工智能开源项目,精心挑选了一部分推荐给大家学习。下面就来看一看。

钛灵Tiorb ·  2019-11-22 23:52:15
谷歌升级可在浏览器内运行的免编程AI训练工具

谷歌刚刚升级了机器教学(Teachable Machine)人工智能训练工具。作为一项可在浏览器内运行的功能,其源于该公司在 2017 年推出的一项网络实验,旨在方便人们理解机器学习的一些基本原理。

佚名 ·  2019-11-08 13:30:22
谷歌把打败99%程序员的AutoML集成到Kaggle平台!

谷歌宣布,将用于训练机器学习算法的Cloud AutoML服务集成到数据科学平台Kaggle中。

佚名 ·  2019-11-06 10:49:29
谷歌发布大规模对话语料库,涉及17个领域含1.8万个注释

在不需要额外数据和再训练的情况下,谷歌Assistant等人工智能助手如何更好地支持新服务?

图灵联邦 ·  2019-10-30 08:55:33
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载