机器学习与HPC碰撞出的火花 有点不一样

作者: 佚名 2017-11-20 09:08:13

传统意义上,高性能计算(HPC)依赖于数值分析来求解物理方程,以此模拟小到亚原子,大到银河系的系统行为。而最近,科学家们开始尝试一种完全不同的方法。事实证明,机器学习(ML)模型比现有的数字运算仿真更高效、更准确。一旦深度神经网络(DNN)使用来自传统分析和直接观察的几乎***的数据集得到训练,它就可以预测或估计模拟的结果——而不需要实际运行。早期的结果表明,通过将ML与传统的仿真相结合,这些“综合模型”可以提高准确性,加快求解速度,并显着降低成本。如果这一办法被广泛采用,将进一步推动以NVIDIA为代表的加速器供应商的业务的发展。

机器学习和HPC的交集

机器学习模型可以用来解决极其复杂的问题。就此而言,它会使用比传统方法少得多的资源。基于两个原因,ML可以更有效率。首先,数值分析通常需要昂贵的64位浮点计算,而经过训练的神经网络通常只需要8位整数计算。训练一个DNN无疑具有很高的计算要求,需要许多GPU和数万亿次的计算。但是,一旦训练好了,DNN就可以用简单的整数进行运算。其次,整个方法通过找到现有数据中的模式规律来起作用,而不是计算数值方程。因此,早期的研究表明ML通常消耗的资源要少得多,可以解决传统模拟所无法掌控的问题。

HPC机器学习的好处

虽然ML在HPC领域是一个相对较新的特性,但是科学家已经在研究中应用了综合建模并且得到了一些引人注目的结果。早期阶段的研究案例较少,以下是一些典型的研究项目,在SC17超算大会上备受关注:

1.LIGO信号处理(NCSA) - 快5000倍

2.预测分子能量学(UFL / UNC) - 快300,000倍

3.分析引力Lensing(SLAC斯坦福) - 从数周到10毫秒

4.产生玻色爱因斯坦凝聚(UNSW):快14倍

5.持久融合(Princeton):将中断预测从85%提高到90%

6.跟踪中微子(Fermilab):检测率提高33%

7.Protein Ligand Scoring(匹兹堡大学):将姿势预测精度从52%提高到70%

将ML应用于HPC问题有三种方法。首先,它可以用来调制连续迭代之间的仿真或实验 - 将收敛加速到一个稳定可靠的模型。在劳伦斯利弗莫尔国家实验室研究聚变能力的研究人员已经使用ML来检查仿真运行期间的发散,自动调整参数以保持仿真正常进行。他们已经报告使用这种技术的速度显着增加。

另一种方法是增强现有的模拟,以提高准确性和降低延迟。在这里,模拟提供了神经网络的出发点和训练数据,以改进数值模型的输出。这种方法的一个显着的例子是高分辨率光线追踪。这种传统的计算密集型方法创建了一个“真实”的图像,然后用它来训练一个DNN以产生额外的高质量图像,而资源却少得多。

与传统的光线跟踪相比,机器学习可以生成高质量的图像,计算资源要少得多。

***,也许HPC中机器学习最有影响力的应用是用基于ML的近似值代替数值模拟模型。这种方法有可能改变HPC。然而,这种方法需要科学家采用一种办法,最终可能会使他们花费了数十年开发的代码变得过时。当然,实践中的结果可能也是让人惊叹的。佛罗里达大学和北卡罗来纳大学的科学家已经看到了其在药物研究中的好处,他们能够将计算时间从几分钟缩短到几微秒,减少了6个数量级。这可能会对筛选新候选药物所需的时间产生巨大影响,使用传统的CPU,这个筛选过程可能需要5年。

结论

这种新的方法仍处于起步阶段,也存在一些争议。 不过机器学习研究人员已经证明,它们可以减少多个数量级的计算资源和能源消耗,同时提高准确性和降低延迟。考虑到各国政府和行业的资金投入,以及现有的极其高效的GPU硬件,预计未来几年这一趋势将会大幅加速。

HPC 机器学习 DNN
上一篇:人工智能将成为数据中心管理的覆性的技术 下一篇:AI时代的云端智能计算
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

开发板能这么用?美国学者用Jetson Nano支持假肢,控制每一根手指

在一篇新论文中,来自明尼苏达大学等机构的研究者提出了一种基于嵌入式深度学习控制的神经假肢实现。

佚名 ·  2天前
机器学习如何影响系统设计:Learned Index Structures浅析

本文简要介绍了Learned Index Structures的实现和优缺点,希望可以给大家带来一些系统设计的启发和思路。

作者Victor ·  2天前
吴恩达的二八定律:80%的数据+20%的模型=更好的机器学习

一个机器学习团队80%的工作应该放在数据准备上,确保数据质量是最重要的工作,每个人都知道应该如此做,但没人在乎。

新智元 ·  2天前
机器学习在铁路缺陷检测中的实际应用

本文介绍了在铁轨的超声波检测过程中有效使用机器学习技术自动检测缺陷的经验,并提出了一种使用数学建模为神经网络创建训练数据集的有效方法,为实际缺陷图的识别提供了更高精度的指标。文中训练神经网络运算的原型实例,其实际缺陷图的预测精度高达92%。

李睿 ·  2天前
人工智能进军“古玩鉴定”,人类职业再遭冲击?

近两年,人工智能的风头虽然偶被5G、自动驾驶等所盖过,但其发展和热度并未因此受到影响。

林中易木 ·  3天前
机器学习概述

机器学习(Machine Learning)这个术语常常掩盖了它的计算机科学性质,因为它的名字可能暗示机器正在像人类一样学习,甚至做得更好。尽管我们希望有一天机器能够像人类一样思考和学习,但如今机器学习并不能超越执行预定义过程的计算机程序。

追求源于热爱i ·  3天前
为什么机器学习胜过人工智能?

人工智能、数据科学和机器学习都属于同一个领域。问题是,在这种情况下,它们中的哪一个能达到正确的目的。

Cassie ·  3天前
启动机器学习/深度学习项目的八种方法

从探索性的数据分析到自动机器学习(AutoML),组织需要使用这些技术来推动其数据科学项目发展,并建立更好的模型。

李睿 ·  3天前
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载