阿里达摩院公布自研语音识别模型DFSMN并宣布开源

作者: 佚名 2018-06-07 16:00:28

阿里达摩院公布自研语音识别模型 DFSMN 并宣布开源

近日,阿里巴巴达摩院机器智能实验室推出了新一代语音识别模型 DFSMN,将全球语音识别准确率纪录提高至 96.04%(这一数据测试基于世界最大的免费语音识别数据库 LibriSpeech)。

达摩院机器智能实验室的语音识别团队主导了这个模型的研发,并宣布向全世界企业与个人开源。对比目前业界使用最为广泛的 LSTM 模型,DFSMN 模型训练速度更快、识别准确率更高。采用全新 DFSMN 模型的智能音响或智能家居设备,相比前代技术深度学习训练速度提到了 3 倍,语音识别速度提高了 2 倍。

阿里达摩院公布自研语音识别模型 DFSMN 并宣布开源

图:阿里在 GitHub 平台上开源了自主研发的 DFSMN 语音识别模型

在近期举行的云栖大会武汉峰会上,装有 DFSMN 语音识别模型的“AI 收银员”在与真人店员的 PK 中,在嘈杂环境下准确识别了用户的语音点单,在短短 49 秒内点了 34 杯咖啡。此外,装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。

著名语音识别专家,西北工业大学教授谢磊表示:“阿里此次开源的 DFSMN 模型,在语音识别准确率上的稳定提升是突破性的。是近年来深度学习在语音识别领域最具代表性的成果之一。对全球学术界和 AI 技术应用都有巨大影响。”有业内人士称,DFSMN 有望成为继传统的 LSTM 模型后,成为全球语音识别领域最主要的声学识别模型之一。

阿里巴巴 语音识别 开源
上一篇:人工智能与大数据的区别 下一篇:全国高校人工智能学院盘点来啦!今年的高考志愿考虑一下?
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

将sklearn训练速度提升100多倍,美国「返利网」开源sk-dist框架

在本文中,Ibotta(美国版「返利网」)机器学习和数据科学经理 Evan Harris 介绍了他们的开源项目 sk-dist。

机器之心 ·  2019-09-26 14:16:21
DeepMind一次性开源3个新框架!深度强化学习应用落地即将迎来春天?

深度强化学习(Deep Reinforcement Learning,DRL)一直是近年来人工智能的一些重大突破的核心。然而,尽管 DRL 有了很大的进步,但由于缺乏工具和库,DRL 方法在主流解决方案中仍然难以应用。

杨鲤萍 ·  2019-09-20 09:38:18
PyTorch版《动手学深度学习》开源了,最美DL书遇上超赞DL框架

李沐等人的开源中文书《动手学深度学习》现在有 PyTorch 版实现了。不论是原书中的示例代码,还是实战项目,原来的 MXNet 都可以无缝转化到 PyTorch 代码。

ShusenTang ·  2019-09-17 10:23:45
五行代码用图提升模型表现,TensorFlow开源NSL神经结构学习框架

今日,谷歌 TensorFlow 宣布推出神经结构学习(NSL)开源框架,它使用神经图学习方法来训练带有图和结构化数据的神经网络。

一鸣、李亚洲 ·  2019-09-04 15:07:15
滴滴开源 AoE:一种快速集成 AI 的终端运行环境 SDK

滴滴开源了一个终端侧 AI 集成运行时环境(IRE)—— AoE(AI on Edge)。AoE 以 “稳定性、易用性、安全性” 为设计原则,可以帮助开发者将不同框架的深度学习算法轻松部署到终端高效执行。

佚名 ·  2019-09-02 10:47:54
谷歌开源基于ML的手部跟踪算法:手机端实时检测,多个手势同时捕捉

就在不久前,Google 人工智能实验室宣布,他们在「实时手部跟踪」方面取得了新的进展,并将这项新技术运用在了 MediaPipe 中,这也是 AI 计算机视觉任务的一大突破。

杨鲤萍 ·  2019-08-22 10:48:56
语音识别大牛因奇葩学生事件被JHU开除,怒拒脸书,转投中国

据悉,Povey教授此前因为与霍普金斯校内的抗议学生发生冲突,因而被霍普金斯校方解雇。该事件引起了美国各界的关注,诸如华盛顿邮报等大型媒体均有跟进报道。

知社学术圈 ·  2019-08-21 14:35:27
滴滴开源AI项目登上GitHub热榜,人机对话模型可从论文到产品部署

没想到,滴滴开源的自然语言理解(人机对话)模型训练平台,就这样登上了GitHub热榜。

乾明 ·  2019-08-08 16:37:31
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载