科学家研发出“读心术”,直接将脑电波翻译成文本,错误率低至3%

作者: 张路 2020-04-02 10:16:59

本文转自雷锋网,如需转载请至雷锋网官网申请授权。

美国加州大学旧金山分校的科学家,已经训练出一种算法,可以直接将受试者的脑电波实时翻译成句子,错误率仅为 3% 。

这项研究发表在《自然神经科学》(Nature Neuroscience)杂志上,他们招募了 4 位志愿者,这些志愿者被要求多次朗读 30-50 个固定句子,而电极记录下他们的大脑活动。[1]

科学家研发出“读心术”,直接将脑电波翻译成文本,错误率低至 3%

【 雷锋网注:人类对大脑所知甚少。图片来源:Pixabay  所有者:Gerd Altmann 】

这些数据随后被输入到机器学习算法,它将每个句子的大脑活动数据转换成一串数字和字符串。

系统从这些大脑活动数据再推导出声音,并和实际记录的音频进行比较。数字和字符串则被再次输入到系统,转换成一个单词序列。

起初,系统会吐出毫无意义的句子。但是当系统将每个单词序列与实际朗读的句子进行比较时,它得到了改进,学会了数字字符串与单词的关系,以及哪些单词是有上下文关系的。

算法不断的训练,直到从说话时的大脑活动中产生书面文本,类似机器翻译。

新系统的准确性远远高于以前的方法。虽然准确性因人而异,但对于其中一位志愿者来说,平均每个句子只有 3% 需要纠正,高于速记员 5% 的单词错误率。

当然,目前这个系统还是有很大局限,算法还只能处理少量的句子。系统也不能用于严重残疾失去语言能力的患者,因为它依赖于记录大声说出句子的人的大脑活动。

然而,每个志愿者只用了不到 40 分钟来训练,在有限的小数据集情况下,达到了迄今为止最大的精确度。

脑机接口

从人类大脑信号到外部设备之间建立连接通路并不是新鲜事,脑机接口的研究已持续了 30 年。

科学家研发出“读心术”,直接将脑电波翻译成文本,错误率低至 3%

【 雷锋网注:脑机接口近30年来一直是研究热点。图片来源:Pixabay  所有者:aytuguluturk 】

在过去的十年,我们已经能够解码语音信号,但是局限于孤立音素或者单音节词,在一段 100 个单词的连续语音的情况下,解码正确的单词少于 40% 。

科学家们此次找到的是一个更直接的方法,就是采取机器翻译类似的算法。机器翻译就是将文本从一种语言到另一种语言的算法翻译,只不过这次输入的文本变成了脑电波信号。此次发表的论文《使用编码器-解码器框架:大脑皮层活动到文本的机器翻译》,正是详细描述了这一过程。

在系统对一个志愿者进行训练之后,再对另外一个志愿者训练时,解码结果得到了改善,这表明该技术可以在人和人之间进行迁移。

在 GitHub 上,放置了论文对应的代码。

ecog2txt 模块,用于从神经数据中将语音解码为文本。它用 Python 代码实现了跨主题的迁移学习的高级功能。[2]

科学家研发出“读心术”,直接将脑电波翻译成文本,错误率低至 3%

【雷锋网注:ecog2txt是论文对应的开源实现模块】

而训练本身则是通过另一个 machine_learning 软件包,它在 TensorFlow 里实现了一个序列到序列的网络。[3]

这些软件包的作者,也是论文的联合作者之一约瑟夫·马金(Joseph Makin)博士,他目前是加州大学旧金山分校整合神经科学中心的研究科学家。他的专业是电机工程和计算机科学,专门研究控制理论,包括脑机接口的算法开发。[4]

科学家研发出“读心术”,直接将脑电波翻译成文本,错误率低至 3%

【雷锋网注:上图为张爱德博士】

论文的另外一个联合作者是张爱德(Edward Chang)博士,他是医学博士和神经外科医生,擅长为患有癫痫病,脑瘤,三叉神经痛,面肌痉挛和运动障碍的成年人提供治疗。他目前是加州大学旧金山分校威尔神经科学研究所的神经外科教授,还领导了一个神经工程与假肢中心,以恢复瘫痪和言语障碍等神经疾病患者的功能。[5]

网友评论

科学家们曾经认为将大脑信号转换为可理解的语音可能需要数十年,而现在这个间隔可以用几年来衡量。在 reddit 的科学板块,该消息引发了 3 万多次点赞和上千条评论。[6]

网友 derlumpenhund 评论说,这并不表示思想阅读机发明出来了。它主要依赖于解码口舌运动时对应的大脑皮层活动,需要收集给定主题的数据,并且提前进行训练,并不会直接解码你的思想活动。话虽这么说,这一进展也很了不起。

网友 boointhehouse 则说,如果这项技术早点用于斯蒂芬·霍金,在他的一生中还能完成更多的工作。

机器学习 人工智能 计算机
上一篇:5G风头正盛 人工智能要被“冷落”了? 下一篇:学不动了?麻省理工 CS 和 EE 网课开放了
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

AI安全对抗中,只用一招轻松骗过五种神经网络

图像识别作为人工智能最成熟的应用领域,已经大规模落地并服务于人们的日常生活。但在大规模商业化的同时,也面临更多方面的威胁。

张鑫 ·  1天前
盘点人工智能十大经典应用领域、图解技术原理

本文通过案例分门别类地深入探讨人工智能的实际应用。案例甚多,此处所列举的仅是九牛一毛。本该按行业或业务对这些案例进行分类,但相反我选择按在行业或业务中最可能应用的顺序来分类。

Alex Castrounis ·  1天前
机器学习正在帮助Invisalign的患者呈现完美的微笑

Align Technology的移动应用程序可以帮助Invisalign佩戴者按时完成任务,而机器学习和其他功能则有助于吸引潜在消费者试用这款牙齿矫正设备。

Clint Boulton ·  1天前
详解人工智能十大经典应用领域及其技术原理

本文通过案例分门别类地深入探讨人工智能的实际应用。案例甚多,此处所列举的仅是九牛一毛。本该按行业或业务对这些案例进行分类,但相反我选择按在行业或业务中最可能应用的顺序来分类。

华章科技 ·  1天前
目标驱动系统模式,能否成为实现人工通用智能(AGI)的关键?

组织开发AI方案时采取的一大核心模式,正是目标驱动型系统模式。与其他AI模式一样,这种形式的AI能够解决一系列原本需要人类认知能力才能处理的常见问题。

佚名 ·  1天前
机器学习的中流砥柱:用于模型构建的基础架构工具有哪些?

人工智能(AI)和机器学习(ML)已然“渗透”到了各行各业,企业们期待通过机器学习基础架构平台,以推动人工智能在业务中的利用。

读芯术 ·  2天前
后疫情时代的八大关键技术发展趋势

建立必要的基础架构以支持数字化世界并保持比较新的技术,这对于任何企业或国家在后疫情时代的世界中保持竞争力都至关重要。

Ahmed Banafa ·  2天前
从AI测温到安防机器人 智能安防会是新的“守门神”吗?

说起安防系统,很多人的脑海中会先冒出“监控摄像头”,“电子门禁”等字眼,而随着人工智能的加速发展,传统的安防系统短板也在逐渐暴露,越来越多的新功能开始被需要:人脸识别、车辆检测、夜间识别等等,而我们小时候幻想过的机器人站岗的场景,也正在逐渐变成现实……

王嘉陆 ·  2天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载