超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

作者: 佚名 2021-05-13 17:57:31

英国科学家现在找到了一种方法,可以让智能手机和笔记本等日常物品具备类似蝙蝠的环境感知能力,像超胆侠一样厉害。

格拉斯哥大学的计算机科学家和物理学家在《物理评论快报》杂志上发表的一篇论文中概述了这项研究,它可以应用于安全和医疗保健领域。

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

这项技术的核心是一种复杂的机器学习算法,它利用反射回声来生成图像,类似于蝠使用回声定位进行导航和狩猎的方式。

研究人员提出的算法能够测量扬声器发出的声音片段或小天线发出的无线电波脉冲在室内空间内发射并返回到传感器所需的时间。

通过巧妙地分析结果,该算法可以推断出一个房间的形状、大小和布局,以及挑选出存在的物体或人。

结果以视频形式显示,将回声数据转化为三维视觉。

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

这一研究成果与蝙蝠的回声定位之间的一个关键区别是,蝙蝠有两只耳朵来帮助它们导航,而该算法被调整为与从单点收集的数据一起工作,如麦克风或无线电天线。

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

研究人员表示,「该技术可用于通过潜在的任何配备有麦克风和扬声器或无线电天线的设备来生成图像。」

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

Turpin博士表示,动物的回声定位是一种了不起的能力,科学已经成功地以多种不同的方式重新创造了从反射回声中生成三维图像的能力,如RADAR和LiDAR。

这项研究与其他系统的不同之处在于:

首先,它只需要来自单一输入的数据、麦克风或天线就能创建三维图像。

其次,算法可以将任何具有这两件装备中的任何一件的设备变成回声定位设备。

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

这意味着这种三维成像的成本可以大大降低,开辟许多新的应用。

比如,通过接收入侵者反射的信号,可以在没有摄像机的情况下保证建筑物的安全。

同样的方法也可以用来追踪养老院中虚弱病人的行动。

甚至可以将系统用于跟踪医疗机构中病人胸部的起伏,提醒工作人员注意他们的呼吸变化。

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

该论文概述了研究人员如何使用笔记本电脑的扬声器和麦克风来产生和接收千赫兹范围内的声波。

他们还使用天线对千兆赫兹范围内的无线电频率声音进行了同样的处理。

在每次试验中,研究人员都收集了一个人在房间里走动时对声波的反射的数据。

同时,他们还使用一个特殊的相机记录了房间的数据,该相机使用一个被称为飞行时间的过程来测量房间的尺寸并提供一个低分辨率的图像。

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

通过结合来自麦克风的回声数据和来自飞行时间相机的图像数据,研究小组在数百次的重复中训练了他们的机器学习算法,将回声中的特定延迟与图像联系起来。

最终,该算法已经学会了仅从回声数据中生成它自己的高度准确的房间及其内容的图像,使它具有感知周围环境的蝙蝠式能力。

这项研究建立在英国这一研究团队以前的工作基础上,训练了一种神经网络算法,通过使用单像素检测器测量闪光的反射来建立三维图像。

Turpin博士补充道,「我们现在已经能够利用光和声音证明这种算法机器学习技术的有效性,这非常令人激动。很明显,这里有很多以新方式感知世界的潜力,我们渴望继续探索未来生成更多高分辨率图像的可能性。」

AI 数据 人工智能
上一篇:意念打字登Nature封面!每分钟写90个字符,准确率超99% 下一篇:过半作者是华人!Google Research图像表征模型ALIGN霸榜ImageNet
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

面部识别的利与弊:是福还是祸?

虽然现代技术使面部识别更加精确和安全,但与面部识别隐私问题和监控有关的担忧也在增加。因此,让我们在这篇文章中探讨一下这该技术的利与弊。

Naveen Joshi ·  2021-06-01 16:36:22
人工智能和5G如何结合以实现物联网收入最大化

网络系统通过信令和使用软件以及分析来检测和分类设备非常棘手,并且对有限且日益紧张的网络资源提出了巨大的需求。然而,解决这些问题有一个主要解决方案:采用人工智能、自动化和5G技术。

Jordi Castellvi ·  2021-06-01 13:49:15
MIT团队最新研究,仅靠LiDAR和2D地图实现端到端自动驾驶

最近, MIT 计算机科学与人工智能实验室(CSAIL)团队成功展示了一种基于机器学习的自动驾驶系统,该端到端框架仅使用 LiDAR获取的原始 3D 点云数据和类似于手机上的低分辨率 GPS 地图就能进行自主导航,并且大大提升了鲁棒性。

文龙 ·  2021-06-01 12:47:51
自然语言处理(NLP)的历史及其发展方向

自然语言处理的历史是一个充满曲折的故事。它从徒劳的研究开始,经过多年卓有成效的工作,最后结束于一个我们仍在试图找出该领域极限的时代。今天,让我们来一起探索这一AI科学分支的发展。

佚名 ·  2021-06-01 12:46:26
是福还是祸?人脸识别技术的利与弊

面部识别并不是一项全新的技术,但人工智能和机器学习不断使面部识别变得更好。苹果通过引入具有 3D 扫描功能的面部生物识别系统和 iPhone 的 Face ID,提高了面部识别的标准。

Naveen Joshi ·  2021-06-01 11:11:01
人工智能能否使机器具有流体智力?

麻省理工学院和奥地利研究人员为灵活的人工智能创造了“液体”机器学习。

千家网 ·  2021-06-01 10:38:55
高真实感、全局一致、外观精细,面向模糊目标的NeRF方案出炉

自 NeRF 被提出后,有多项研究对其加以改进。在本篇论文中,上海科技大学的研究者提出了首个将显式不透明监督和卷积机制结合到神经辐射场框架中以实现高质量外观的方案。

Haimin Luo等 ·  2021-06-01 09:57:39
大脑模拟NLP,高德纳奖得主:神经元集合演算用于句子解析

一个简单的大脑模型为人工智能研究提供了新的方向。世界顶尖计算机科学理论学家、哥德尔奖和高德纳奖获得者、哥伦比亚大学计算机科学教授 Christos Papadimitriou 关于「大脑中单词表征」的演讲。

Ben Dickson ·  2021-06-01 09:39:24
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载