谷歌推“同声传译”系统Translatotron:语音翻译无需文本转换

作者: 佚名 2019-05-16 13:42:38

 谷歌AI官方博客最新博文中向我们介绍了一项实验性质的新系统--Translatotron,它能够直接将语音翻译成为语音,中间不再需要任何文本。在博文中写道:“Translatotron是首个能够直接将一种语言的语音翻译成为另一种语言语音的端到端模型。”

谷歌表示当前的翻译系统分为三个步骤:自动语音识别,将语音转换为文本;机器翻译,将文本转换为另一种语言;最后是文本转语音(TTS)合成,也就是将翻译好的文本生成语音。在这三个步骤衍生出了Google Translate等服务,不过这家科技巨头希望通过一个模型就实现语音的翻译,而不再需要借助文本这个中间步骤。

Google AI软件工程师Ye Jia和Ron Weiss表示:“该系统名为Translatotron,这个系统避免了将任务分成不同的阶段。”谷歌表示这意味着更快的翻译速度和更少的转译错误。该系统使用频谱图作为输入并生成频谱图,同样依赖于神经声码器和扬声器编码器,这意味着系统在翻译后保留说话者的声音特征。

谷歌 Android 开发者
上一篇:史上人脸识别禁令出台,警察用来抓罪犯也不行 下一篇:2019如何玩转人工智能,全球AI大牛给你答案
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

谷歌发布含7种语言的全新数据集:有效提升BERT等多语言模型任务精度高达3倍!

近日,谷歌发布了包含 7 种语言释义对的全新数据集,即:PAWS 与 PAWS-X。BERT 通过该数据集的训练,在释义对问题上的精度实现了约为 3 倍的提升。

杨鲤萍 ·  2019-10-10 09:00:00
无人驾驶元老被起诉,窃取谷歌1.4万份机密文件给Uber

据《纽约时报》报道,联邦检察官指控Anthony Levandowski犯有33项盗窃和企图盗窃商业机密罪。如果他被判有罪,将面临最高10年的监禁和高额罚款。

佚名 ·  2019-08-29 11:33:33
谷歌开源基于ML的手部跟踪算法:手机端实时检测,多个手势同时捕捉

就在不久前,Google 人工智能实验室宣布,他们在「实时手部跟踪」方面取得了新的进展,并将这项新技术运用在了 MediaPipe 中,这也是 AI 计算机视觉任务的一大突破。

杨鲤萍 ·  2019-08-22 10:48:56
谷歌开源「AI手势识别」算法:凭一帧图像识别21个3D点位

谷歌公司的科学家们研究出一种新的计算机视觉方法,用于实现手部感知。该方案能够在实机实验中仅凭一帧图像识别出一只手(或者多只手)上的21个3D点位。只要在手机上就能进行实时追踪,并且还能同时追踪多只手,可识别遮挡。

佚名 ·  2019-08-21 20:08:34
震撼!谷歌自动重建了果蝇完整大脑:40万亿像素图像首度公开!

昨天,谷歌与霍华德 • 休斯医学研究所 (HHMI) 和剑桥大学合作,发布了一项深入研究果蝇大脑的重磅成果 —— 自动重建整个果蝇的大脑。他们使用数千个谷歌云 TPU,重建的完整果蝇大脑高达 40 万亿像素。有了完整的大脑图像,科学家距离了解大脑如何工作更近了一步。

新智元 ·  2019-08-07 13:04:22
印尼垃圾分类:人工智能派上用场

自7月份上海开始推行“史上最严垃圾分类措施”以来,垃圾分类成了很多人日常生活的“必修课”。一个月过去,利用新技术、新模式推进垃圾分类的探索不断涌现。

刘园园 ·  2019-08-05 15:03:46
谷歌高级研究员Nature发文:避开机器学习三大「坑」

本文将介绍谷歌 Accelerated Science 团队在使用机器学习分析时所面临并解决了的三个问题,以说明展示这种做法。

机器之心 ·  2019-08-01 08:15:06
微软10亿美元砸入OpenAI:明为AGI,暗争谷歌,被指云计算换投资

AI巨头争霸赛,今日微软又迈出重要一步:10亿美元,投向知名AI研究机构OpenAI,同时双方达成一项多年合作协议——OpenAI接下来会在微软Azure云平台开发AI技术。

乾明 安妮 一璞 栗子 ·  2019-07-23 10:35:47
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载