微软年度研究大盘点:ML突破将到来,人机交互更真实,惜别沈向洋

作者: 十三 2019-12-26 09:52:47

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

研究是为了实现一个长期目标,通常是渐进式的发展过程。

随着岁末钟声的临近,微软研究院回顾了这一年来在人工智能领域中的工作。

微软年度研究大盘点:ML突破将到来,人机交互更真实,惜别沈向洋

微软研究院表示:

2019年,是科技面临严峻挑战的一年。

总体来说,研究大盘点包括以下几个方面:

· 让AI和机器学习系统更容易被访问;
· 促进了”以人为本“的创新研究;
· 创建适合所有人的人机交互;
· 安全、存储、系统以及应用方面的突破;
· 为研究社区提供开源工具和数据;
· 为研究团体提供奖学金

此外,沈向洋博士于前不久宣布离职微软。

微软年度研究大盘点:ML突破将到来,人机交互更真实,惜别沈向洋

微软研究院在此次复盘中也与沈向洋博士道了声”再见“

提高AI和机器学习的可访问性

机器学习很显然对人们的生活产生了一定影响。

那么微软的研究人员在这一年中做了些什么呢?

提高机器学习系统的能力,进一步发展这一科学的新模式

他们使用了一些特殊方法让这些系统能够更容易被访问。

在深度学习方面,微软研究院合作研究经理高剑峰博士的团队,提出了MT-DNN模型

这是一个学习通用语言嵌入的模型,结合了多任务学习的优势和BERT的语言模型预训练,帮助系统快速发展自然语言处理所必需的语义理解。

MT-DNN地址:
https://www.microsoft.com/en-us/research/blog/towards-universal-language-embeddings/

微软研究院Xu Tan的团队则开发了MASS。

这是一种预训练方法,在序列到序列的语言生成方面优于现有模型。

MASS地址:
https://www.microsoft.com/en-us/research/blog/introducing-mass-a-pre-training-method-that-outperforms-bert-and-gpt-in-sequence-to-sequence-language-generation-tasks/

而在未来几年里,将会出现机器学习的突破

能够超越目前将使用马尔科夫决策过程作为基础的方法,尤其是强化学习,会变得更加适用于现实场景。

项目地址:
https://www.microsoft.com/en-us/research/blog/reinforcement-learning-for-the-real-world-with-dr-john-langford-and-rafah-hosn/

许多机器学习应用程序受益于庞大的数据集,然而也有很多应用是没有足够的数据来证明其方法是有效的。

进入机器教学(machine teaching)领域,领域专家可以用很少的数据建立定制的人工智能模型。

项目地址:
https://www.microsoft.com/en-us/research/blog/machine-teaching-luis-and-the-democratization-of-custom-ai-with-dr-riham-mansour/

另外一个让AI较为民主化的项目是研究院与Justin Harris合作的区块链框架上的分散与协作人工智能

它可以让用户在以太网上训练和维护模型和数据集。

此外,微软研究院首席研究员Debadeepta Dey在今年的NeurIPS上提出了Petridish项目。

微软年度研究大盘点:ML突破将到来,人机交互更真实,惜别沈向洋
△超过300名微软研究人员参与了NeurIPS 2019

这是一种高效的前向神经结构搜索算法,它可以帮助识别给定机器学习任务的神经结构。

项目地址:
https://www.microsoft.com/en-us/research/blog/project-petridish-efficient-forward-neural-architecture-search/

促进负责、包容、以人为本的创新

2019年ACM FAT *大会在亚特兰大举行。

微软年度研究大盘点:ML突破将到来,人机交互更真实,惜别沈向洋

微软研究院在会议上发表了四篇论文,分别涵盖了职业分类中的性别偏见、数据驱动决策在加强不公正方面的作用、算法决策系统的战略操纵,以及在没有资金的情况下公平分配项目。

这些工作来自微软的 FATE 研究小组,该小组研究人工智能、机器学习、数据科学、大规模实验和自动化的复杂社会影响。

在五月份的CHI大会上,研究员Saleema Amershi与其合作者提出了一套人机交互设计的指导方案,汇集了20多年的研究、建议和最佳实践,围绕着与人工智能系统的有效交互。

把这些工作结合在一起,将有助于设计师管理用户的期望,调节自治的程度,解决模糊性,并向用户提供系统如何从用户的行为中学习意识。

项目地址:
https://www.microsoft.com/en-us/research/blog/guidelines-for-human-ai-interaction-design/

此外,开源模拟器 AirSim今年举办了无人机的NeurIPS比赛。

在无人驾驶飞机挑战赛中,参赛者与微软研究院的一名对手在同一跑道上进行竞争,他们的策略和机动水平通常是同类竞赛所没有的。

项目地址:
https://www.microsoft.com/en-us/research/blog/game-of-drones-at-neurips-2019-simulation-based-drone-racing-competition-built-on-airsim/

创建适合所有人的人机交互

在ACM CHI关于计算系统中的人为因素的会议上,微软研究人员展示了一些论文和演示,探索如何为有认知或感觉障碍的用户提供可访问性。

这些研究包括:浏览器的“阅读模式”是否真的对患有阅读障碍的人有帮助,以及帮助低视力的人(包括亮度敏感度和低视力)更容易接触到VR的工具。

还展示了微软的Soundscape,这是一个使用3D音频提示来增强态势感知和辅助导航的项目。

项目地址:
https://www.microsoft.com/en-us/research/product/soundscape/features/

此外,还有一些使虚拟环境更加真实、可触摸和可导航的项目。

微软年度研究大盘点:ML突破将到来,人机交互更真实,惜别沈向洋
△微软Dreamwalker VR

Dreamwalker是一个虚拟现实项目,可以通过虚拟现实增强真实世界的行走体验。虚拟环境可以实时检测用户周围的环境,并生成一个虚拟世界,说明他们的路径和任何障碍。

项目地址:
https://www.microsoft.com/en-us/research/publication/dreamwalker-substituting-real-world-walking-experiences-with-a-virtual-reality/

安全、存储、系统和应用方面的突破

同态加密技术的发展和采用在2019年取得了持续的进展。同态加密技术可以在加密数据上进行计算,有助于保护隐私。

微软年度研究大盘点:ML突破将到来,人机交互更真实,惜别沈向洋

Microsoft SEAL已经成为世界上最流行的同态加密库之一,在学术界和工业界都得到了广泛的采用。

项目地址:
https://github.com/Microsoft/SEAL

今年4月,随着EverCrypt的发布,Project Everest又向前迈进了一步,建立了一个安全认证的HTTPS生态系统。

其中,EverCrypt是第一个完全认证的密码提供商,满足了TLS协议的安全需求。Project Everest是微软、Inria和卡内基梅隆大学的合作项目。

项目地址:
https://www.microsoft.com/en-us/research/blog/evercrypt-cryptographic-provider-offers-developers-greater-security-assurances/

到2023年,预计将有超过100 ZB的数据存储在云里。

为了满足这一需求,Project Silicon正在开发第一个从媒体设计到云计算使用的存储技术。

项目地址:
https://www.microsoft.com/en-us/research/project/project-silica/

今年,这个团队与华纳兄弟公司(Warner Bros.)合作进行了一项概念验证,把1978年的电影《超人》(Superman)装在一块几乎坚不可摧的玻璃上,大小和杯垫差不多。

项目地址:
https://www.microsoft.com/en-us/research/blog/optics-for-the-cloud-storage-in-the-zettabyte-era-with-dr-ant-rowstron-and-mark-russinovich/

微软年度研究大盘点:ML突破将到来,人机交互更真实,惜别沈向洋

与此同时,今年4月,微软和华盛顿大学的研究人员实现了一个“Hello, World!”,他们展示了首个以人工合成的DNA存储和检索数据的全自动系统。

项目地址:
https://news.microsoft.com/innovation-stories/hello-data-dna-storage/?utm_source=elevate&utm_campaign=1385

剑桥大学的研究人员 Andy Gordon 和 Simon Peyton Jones 通过探索编程语言研究如何改进电子表格这一世界上最常见的商业应用,展示了基础研究的实际影响。

在下面的项目中,他们详细介绍了他们与Microsoft Excel团队的合作是如何改进产品的,比如单元格可以包含与外部数据源链接的一级记录,以及可以计算“溢出”到相邻单元格的数组值的公式。

项目地址:
https://www.microsoft.com/en-us/research/blog/influencing-mainstream-software-applying-programming-language-research-ideas-to-transform-spreadsheets/

在 ACM 网络搜索和数据挖掘国际会议上,微软的研究人员展示了一项关于极端分类的新研究。

极端分类是一个研究领域,有望显著提高算法的速度和质量。这项工作可以带来更多相关的推荐和搜索结果。

在下面这篇二月份的博文中,印度微软研究院的 Manik Varma 对极端分类进行了深入探讨。

项目地址:
https://www.microsoft.com/en-us/research/blog/everything-you-always-wanted-to-know-about-extreme-classification-but-were-afraid-to-ask/

由于计算机视觉技术的进步,尤其是视频目标检测和分类技术的进步,视频分析已经变得更加精确。

然而,快速而实用的实时视频分析却相对滞后。

去年12月,微软研究人员 Ganesh Ananthanarayanan 和 Yuanchao Shu 主持了一个关于 Project Rocket 的网络研讨会,这是一个可扩展的软件栈,利用边缘和云来满足视频分析应用的需求。

项目地址:
https://www.microsoft.com/en-us/research/project/live-video-analytics/

为研究社区提供开源工具和数据

在这一年中,微软的研究人员为了学术界的利益,做了一些开源项目,包括以下内容:

SandDance:是 Azure Data Studio、 Visual Studio Code 和 Power BI 中的数据可视化工具。
地址:https://cloudblogs.microsoft.com/opensource/2019/10/10/microsoft-open-sources-sanddance-visual-data-exploration-tool/

TensorWatch:是一个人工智能调试和可视化工具。
地址:https://www.microsoft.com/en-us/research/blog/microsoft-makes-ai-debugging-and-visualization-tool-tensorwatch-open-source/

PhoneticMatching:是 Maluuba 自然语言理解平台的一个组成部分。
地址:https://www.microsoft.com/en-us/research/blog/a-phonetic-matching-made-in%cb%88h%c9%9bv%c9%99n/

SpaceFusion:是一个学习范例,它将不同的深度学习模型汇集到一起,用于人工智能对话。
地址:https://www.microsoft.com/en-us/research/blog/spacefusion-structuring-the-unstructured-latent-space-for-conversational-ai/

Icecaps:一个会话建模工具包。
地址:https://www.microsoft.com/en-us/research/blog/microsoft-icecaps-an-open-source-toolkit-for-conversation-modeling/

Icebreaker:一个深层次的生成模型,最小化训练一个机器学习模型所需的数据量和成本。
地址:https://www.microsoft.com/en-us/research/blog/icebreaker-new-model-with-novel-element-wise-information-acquisition-method-reduces-cost-and-data-needed-to-train-machine-learning-models/

基于去年发布的Microsoft Research Open Data(一个基于Azure的数据共享库),公司开发了一套数据使用协议,并在GitHub上发布,可将其应用于多个公共数据集。

支持和尊重研究团体

今年,微软研究院推出了Ada Lovelace奖学金,用来支持计算机相关领域攻读博士学位的人才。

微软年度研究大盘点:ML突破将到来,人机交互更真实,惜别沈向洋

有关他们的研究可以访问下面的链接:
https://www.microsoft.com/en-us/research/academic-program/ada-lovelace-fellowship/#!fellows

10名博士生还获得了为期两年的奖学金(作为博士奖学金项目的一部分),用来支持他们在光子学、系统和网络以及人工智能方面的研究。

此外,微软研究院将奖学金授予了五位从事高影响力突破性研究的教师。

有关他们的研究可以访问下面的链接:
https://www.microsoft.com/en-us/research/blog/investing-in-leading-minds-microsoft-research-faculty-fellowship/

微软研究院的研究人员在本年度获得了许多奖项和荣誉,完整名单如下:
https://www.microsoft.com/en-us/research/awards/

最后,要和沈向洋博士说一声再见。

沈向洋博士已经在微软就职23年,将于明年2月份离职。

微软 机器学习 开源
上一篇:6个你应该知道的机器学习的革命性的教训 下一篇:贝壳找房推动图谱技术落地,促进地产服务生态链正循环
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

对象存储适合人工智能和机器学习的三个原因

如今,各种类型的企业都致力于采用人工智能和机器学习项目,但要发挥其真正的潜力,则需要克服重大的技术障碍。虽然计算基础设施通常是重点,但存储设施也同样重要。

Gary Ogasawara ·  21h前
机器学习:有监督和无监督之间有什么区别

机器学习是人工智能的一个子集,它通过示例和经验教会计算机执行任务,是研究和开发的热门领域。我们每天使用的许多应用程序都使用机器学习算法,包括AI助手,Web搜索和机器翻译。

AI国际站 ·  22h前
机器学习的七原罪

机器学习是一种伟大的工具,正在改变着我们的世界。 在许多伟大的应用中,机器(尤其是深度学习)已被证明优于传统方法。 从用于图像分类的Alex-Net到用于图像分割的U-Net,我们看到了计算机视觉和医学图像处理领域的巨大成功。 不过,我看到机器学习方法每天都在失败。 在许多这样的情况下,人们迷上了机器学习的七大罪过之一。

闻数起舞 ·  1天前
为ML模型注入灵魂:基于MVP的超简单部署方案

开发一个出色的机器学习模型是一件棘手的事,但即使开发完成也不意味着工作的结束。在部署之前,它仍然毫无用处,他人可以轻易访问。

读芯术 ·  1天前
可再生能源与机器学习“双重加持”,谷歌成功实现风力预测

从传统角度看,电力电场的发电能力普遍较弱,因为我们至今很难预测无形无相的风,会在新一天中表现出怎样的活动趋势。

佚名 ·  1天前
微软用 AI 取代人工编辑,解雇多名新闻工作者

微软将解雇 Microsoft News 和 MSN 团队中的数十名新闻工作者和编辑人员。大部分受影响的员工属于 Microsoft SANE(搜索、广告、新闻、Edge 浏览器)部门。

佚名 ·  1天前
明确解释:机器学习与统计建模有何不同

这篇文章提出了一个非常重要的区别,我们应该将其理解为数据科学领域的活跃部分。 上面的维恩图最初是由SAS Institute发布的,但是它们的图显示统计和机器学习之间没有重叠,据我所知,这是一个疏忽。

闻数起舞 ·  1天前
不用任何数学方法,如何计算圆面积

借鉴统计学习和机器学习的核心原理,我们可以使用蒙特卡罗模拟和多项式/二次回归来创建基于计算的方法,以找到圆的面积公式。

机器之心 ·  2天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载