您好,语音识别了解一下!

作者: 关崇 2018-06-05 17:40:36

【51CTO.com原创稿件】语音识别也被称为自动语音识别,其目标是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。简单来讲,即是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术,因此,常有人将其比作“机器的听觉系统”。

作为一门交叉学科,语音识别技术所涉及的领域十分广泛,其中包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

近二十年来,随着大数据、深度学习等技术的发展,以及计算能力的不断提升,语音识别技术也取得了显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。今天,我们就来聊一聊,日常生活中所接触到的语音识别~

实时翻译 语音翻译机

小时候,经常会在偶像剧中看到这样的设定:富家千金(公子)、周游各国、精通8国语言、崇拜者无数。。。。

现在想来,虽然部分设定过于中二and玛丽苏,但精通多国语言这项神技能,却着实让小编羡慕的不要不要的~毕竟,小编是那种一听到“How are you? ”就只会下意识回答“Fine,thank you,and you?”的人啊。。。。

而对小编这种缺乏缺语言天赋的人来说,语音翻译机可谓是消除不同文字和语言间隔阂的“神器”了。近几年,AI的应用和普及,让语音翻译机开始进入新的领域,性能、效率和效果都有了显著提升:支持整句式完整翻译,几十个语种双向翻译,多机对讲……试想下,几个语言不通的人围在一起,仅靠语音翻译机进行交流的场景,也是很神奇的了。

除语音翻译外,有的翻译机还带有图片翻译功能,让你不但能听懂、说懂还能看懂。

当然,对于商业谈判、技术交流这种专业要求较高的场景,语音翻译机的整体性能还有待提升,不过仅就日常出行、旅游中所遇到的简单交流而言,还是可以应对自如的。这下妈妈再也不用担心我去周游各国了

听歌识曲 音乐识别APP

相信很多人都曾遇到过这样的情况:在大街小巷邂逅一段熟悉的旋律,无奈又听不清歌词。遗憾也许这辈子就这样失之交臂了。。。。

记得小编刚上大学的时候,还曾和室友畅想过,如果有一天我们对着机器哼上两句旋律,机器就能自动识别,告诉我们歌名就好了。没想到,短短几年时间,这个梦想就已经实现了。

目前,很多软件都支持听歌识曲功能,其基本原理就是通过手机的麦克风采样,采集音乐的音源也就是样本,利用网络将采集到的音源的波段数据发送至公司的服务器内,经过快速的数据分析识别,将得到的音乐相关信息,如曲名、主唱、专辑名等数据,传回你的手机并在软件内显示出来。

现在,我们再也不必为错过一段心仪的旋律而遗憾了。

确认过声音,是我要找的歌,嗯!

人机对话 智能音箱

如果你看到有人独自在房间里还能一副和他人相谈甚欢的模样,不必惊慌,他没有精分,他可能只是在和他的智能音箱沟通感情~

近年来,随着智能家居逐渐普及,其性能也从最初单项的听取、识别、执行命令,升级为可以和人类进行日常的互动对话。其中,智能音箱可谓是所有智能家居中C位出道的当红代表了。

在你忙于工作时,智能音响可以帮你点外卖、查快递、充话费;你无聊了,它还能陪你做游戏,给你唱情歌;你半夜失眠它还能陪你聊天侃大山,陪你从诗词歌赋谈到人生哲学……24小时随叫随到,不会因为打游戏而忽略你,不会以为要和姐妹逛街而遗忘你,这么看来,另一半什么的,感觉完全不需要了呢~

除了上述这些,我们身边还有很多应用语音识别的场景,你有想到哪些呢?

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

人工智能 语音识别
上一篇:人工智能崛起引发担忧,我们应该如何应对? 下一篇:人工智能利用单眼强度图像进行面部深度图估计的对抗架构深度学习
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

11个主流AI聊天机器人平台,你绝不能错过 精选

人工智能聊天机器人掀起了一场用户体验革命。只要用户需要,机器人就能提供有用的信息。一些企业应用AI聊天机器人为客户提供积极有益的帮助,企业也因此得到了长足的发展。

读芯术 ·  1天前
5G自动驾驶什么样?韩国测试得出这样的结果

自动驾驶与5G的产业发展备受关注,而两者结合会有什么样的效果,韩国企业近日进行了一番探索。韩媒报道称,10月10日,LG U+自动驾驶汽车在首尔麻谷LG科学园一带的普通公路上进行了测试。

佚名 ·  1天前
全球十大AI训练芯片大盘点

AI芯片哪家强?现在,有直接的对比与参考了。英国一名资深芯片工程师James W. Hanlon,盘点了当前十大AI训练芯片。

乾明 ·  1天前
模型仅1MB,更轻量的人脸检测模型开源,效果不弱于主流算法

AI模型越来越小,需要的算力也也来越弱,但精度依旧有保障。最新代表,是一个刚在GitHub上开源的中文项目:一款超轻量级通用人脸检测模型。

乾明 ·  1天前
人工智能遇冷,自动驾驶受阻?

2016到2019,人工智能经历了梦幻般的三年,但人工智能的历史规律告诉我们:高潮过后可能会引来新的一波沉寂,人工智能助推下的自动驾驶也会受到波及。

佚名 ·  1天前
非监督学习最强攻略

本次主要讲解的内容是机器学习里的非监督学习经典原理与算法,非监督,也就是没有target(标签)的算法模型。

SAMshare ·  1天前
PyTorch终于能用上谷歌云TPU,推理性能提升4倍,该如何薅羊毛?

Facebook在PyTorch开发者大会上正式推出了PyTorch 1.3,并宣布了对谷歌云TPU的全面支持,而且还可以在Colab中调用云TPU。

晓查 ·  1天前
500亿参数,支持103种语言:谷歌推出「全球文字翻译」模型

由于缺乏平行数据,小语种的翻译一直是一大难题。来自谷歌的研究者提出了一种能够翻译 103 种语言的大规模多语言神经机器翻译模型,在数据丰富和匮乏的语种翻译中都实现了显著的性能提升。

机器之心 ·  3天前
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载