谷歌推“同声传译”系统Translatotron:语音翻译无需文本转换

作者: 佚名 2019-05-16 13:42:38

 谷歌AI官方博客***博文中向我们介绍了一项实验性质的新系统--Translatotron,它能够直接将语音翻译成为语音,中间不再需要任何文本。在博文中写道:“Translatotron是***能够直接将一种语言的语音翻译成为另一种语言语音的端到端模型。”

谷歌表示当前的翻译系统分为三个步骤:自动语音识别,将语音转换为文本;机器翻译,将文本转换为另一种语言;***是文本转语音(TTS)合成,也就是将翻译好的文本生成语音。在这三个步骤衍生出了Google Translate等服务,不过这家科技巨头希望通过一个模型就实现语音的翻译,而不再需要借助文本这个中间步骤。

Google AI软件工程师Ye Jia和Ron Weiss表示:“该系统名为Translatotron,这个系统避免了将任务分成不同的阶段。”谷歌表示这意味着更快的翻译速度和更少的转译错误。该系统使用频谱图作为输入并生成频谱图,同样依赖于神经声码器和扬声器编码器,这意味着系统在翻译后保留说话者的声音特征。

谷歌 Android 开发者
上一篇:史上人脸识别禁令出台,警察用来抓罪犯也不行 下一篇:2019如何玩转人工智能,全球AI大牛给你答案
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

谷歌大脑最新操作玩“复古”:不用卷积注意力,图像分类接近SOTA

这个架构名为MLP-Mixer,采用两种不同类型的MLP层,可以看做是一个特殊的CNN,使用 1×1卷积进行通道混合(按位操作),同时全感受野和参数共享的的单通道深度卷积进行字符混合(跨位操作)。

佚名 ·  2021-05-06 15:55:01
谷歌人工智能实验室DeepMind将在加拿大招募研究人员

2014年被谷歌收购的位于伦敦的人工智能实验室DeepMind将其寻找世界上最好的人工智能研究人员的工作扩展到了加拿大多伦多。

Yu ·  2021-05-06 08:48:30
谷歌实现2种新的强化学习算法,“比肩”DQN,泛化性能更佳

来自Google Research的研究人员,证明可以使用图表示 (graph representation)和AutoML的优化技术,来学习新的、可解析和可推广的RL算法!

丰色 ·  2021-04-29 14:53:14
谷歌解雇伦理学家后三个月,AI伦理研究会议暂停谷歌赞助

ACM公平、责任与透明度大会(FAccT)的会议赞助商联合主席兼Boise State University助理教授Michael Ekstrand于今天证实,该会议已决定中止与Google的赞助关系。

大数据文摘 ·  2021-03-10 23:29:22
机器人会梦见电子羊吗:谷歌 AI 员工离职事件,能看出哪些 AI 伦理问题

对于一个充满黑箱和未知的技术,AI 值得人们探讨的问题还有很多。谷歌是第一家爆发激烈讨论的公司,但它绝不会是最后一家。

脸脸 ·  2021-03-08 07:02:11
AutoML大提速,谷歌开源自动化寻找最优ML模型新平台

为了帮助研究者自动、高效地开发最佳机器学习模型,谷歌开源了一个不针对特定领域的 AutoML 平台。

机器之心 ·  2021-02-21 14:08:15
Jeff Dean万字长文:2020谷歌10大领域AI技术发展

Jeff Dean 发了一篇几万字长文,回顾了这一年来谷歌在各个领域的成就与突破,并展望了 2021 年的工作目标。

新智元 ·  2021-01-18 10:52:55
谷歌大脑提出简化稀疏架构,预训练速度可达T5的7倍

刚刚,Google Brain 高级研究科学家 Barret Zoph 发帖表示,他们设计了一个名叫「Switch Transformer」的简化稀疏架构,可以将语言模型的参数量扩展至 1.6 万亿(GPT-3 是 1750 亿)。

机器之心 ·  2021-01-13 15:16:45
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载