再显AI威力!百度地图20分钟定制个人语音包

百度地图在“‘音’为有你,更有‘AI’”发布会上正式发布“语音定制功能”,内部代号“百雀灵”。

佚名 ·  2019-09-19 16:36:09
5 款不错的开源语音识别/语音文字转换系统

语音文字转换(speech-to-text)(STT)系统就像它名字所蕴含的意思那样,是一种将说出的单词转换为文本文件以供后续用途的方式。

LCTT ·  2019-06-24 09:30:00
谷歌推“同声传译”系统Translatotron:语音翻译无需文本转换

谷歌AI官方博客最新博文中向我们介绍了一项实验性质的新系统--Translatotron,它能够直接将语音翻译成为语音,中间不再需要任何文本。

佚名 ·  2019-05-16 13:42:38
1400 小时数据,Common Voice 成最大开源人类语音数据集

Mozilla 近日发布了其开源语音识别数据集项目 Common Voice 的最新版本,并宣布其已成为当前全球最大的人类语音数据集。

h4cd ·  2019-03-05 10:07:33
国内首款真正意义的AI输入法上线 面向未来革新输入方式

百度输入法AI探索版正式亮相,这是一款默认输入方式为全语音输入,并调动表情、肢体等进行全感官输入的全新输入产品。同时,百度宣布语音技术取得一项对全球学术界和工业界都具备重大意义的技术突破。

佚名 ·  2019-01-16 18:47:53
谷歌ReCaptcha系统被破解,机器语音验证准确率高达85%

美国马里兰大学的四位研究员开源了一个名为UnCaptcha的工具,能够破解谷歌的验证码系统ReCaptcha,其进行语音验证的准确率高达85%。

灵火K ·  2019-01-03 09:04:04
物灵科技推出“Luka Hero”和“Luka Baby”两款智能绘本机器人,并获得A轮融资

昨日,物灵科技在北京举办了新品发布会,发布了两款新品,分别是具备多感官交互能力的“Luka Hero”,以及面向更广泛大众市场的“Luka Baby”。同时物灵科技CEO顾嘉唯宣布已经获得1.5亿元Pre-A轮融资。

summer ·  2018-07-06 18:36:25
基于线性网络的语音合成说话人自适应

一种基于低秩分解(low-rank plus diagonal,LRPD)的模型压缩算法被应用于线性网络。实验发现,当数据量较少的时候,通过LRPD来移除一些冗余的参数,从而能够使得系统合成的声音更加稳定。

阿里巴巴授权发布 ·  2018-04-23 16:27:27
基于深层前馈序列记忆神经网络的大词汇量连续语音识别

本论文,我们在之前FSMN的相关工作的基础上进一步提出了一种改进的FSMN结构,称之为深层的前馈序列记忆神经网络(Deep-FSMN, DFSMN)。我们通过在FSMN相邻的记忆模块之间添加跳转连接(skip connections),保证网络高层梯度可以很好的传递给低层,从而使得训练很深的网络不会面临梯度消失的问题。

阿里巴巴授权发布 ·  2018-03-16 13:27:55
CNN 在语音识别中的应用

CNN也比较容易实现大规模并行化运算。虽然在CNN卷积运算中涉及到很多小矩阵操作,运算很慢。不过对CNN的加速运算相对比较成熟,如Chellapilla等人提出一种技术可以把所有这些小矩阵转换成一个大矩阵的乘积。一些通用框架如Tensorflow,caffe等也提供CNN的并行化加速,为CNN在语音识别中的尝试提供了可能。

侯艺馨 ·  2017-10-27 16:19:23
语音识别结合应用场景 唱响未来新篇章

近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术走进了工业、家电、通信、汽车电子、消费电子产品等各个领域。语音识别作为人工智能发展最早、且率先商业化的技术,近几年来随着深度学习技术的突破,识别准确率大幅提升,带动了一波产业热潮。

佚名 ·  2017-04-28 13:00:42
语音识别数据库成为了人工智能的核心

语音识别数据库、语音合成 数据库是人工智能的关键技术,让机器能听会说、能像人一样的学习、理解和思考,成为人类生活和工作的得力的帮手、亲密的伴侣,一直是人类的梦想。

与羊相遇的日子 ·  2017-03-20 16:42:00
  • 首页
  • 1
  • 末页
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载