TensorFlow为新旧Mac特供新版本,速度最高提升7倍

作者: 佚名 2020-11-19 15:02:56

 苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周,谷歌就把专为 Mac 优化的 TensorFlow 版本做好了,训练速度最高提升到原来的 7 倍。

对于开发者、工程师、科研工作者来说,Mac 一直是非常受欢迎的平台,也有人用 Mac 训练神经网络,但训练速度一直是一个令人头疼的问题。

上周,苹果发布了搭载 Arm 架构 M1 芯片的三款新 Mac,于是就有人想问:用它们训练神经网络能快一点吗?

今天,主流机器学习框架 TensorFlow 发文表示:我们专门做了一版为 Mac 用户优化的 TensorFlow 2.4 框架,M1 版 Mac 和英特尔版 Mac 都能用。这一举动有望大幅降低模型训练和部署的门槛。

TensorFlow为新旧Mac特供新版本,速度最高提升7倍

此前,在 Mac 上,TensorFlow 仅支持将 CPU 用于训练,但新的 tensorflow_macos 分支利用苹果的 ML Compute,能让 GPU 也被利用起来。苹果在博客中介绍说:「我们使用了更高级别的优化方法,比如熔合层,选择合适的设备类型,将图作为原语编译、执行并由 CPU 上的 BNNS 和 GPU 上的 Metal Performance Shader 加速。」

ML Compute 是苹果公司今年推出的新框架,可用于在 Mac 上进行 TensorFlow 模型的训练。现在,无论新的 M1 版 Mac 还是旧的英特尔版 Mac,其 CPU 和 GPU 都能用来加快训练速度。

M1 芯片包含新的 8 核 CPU 和最多 8 核的 GPU,并针对 Mac 的机器学习训练任务进行了优化。下面两张图表分别展示了针对 Mac 优化后的 TensorFlow 2.4 在不同模型训练中的性能提升:

TensorFlow为新旧Mac特供新版本,速度最高提升7倍

上图展示了使用 ML Compute 分别在搭载 M1 和英特尔芯片的 13 英寸 MacBook Pro 上进行机器学习训练的情况。柱形的高度代表单批次的训练时长。可以看出,优化后的 Mac 版 TensorFlow 2.4 的训练速度得到了明显提升。在换成 M1 版的新 MacBook Pro 之后,提升就更为明显了,训练速度最高提升了 7 倍。

TensorFlow为新旧Mac特供新版本,速度最高提升7倍

同样使用 ML Compute,在搭载英特尔芯片的 2019 Mac Pro 上进行常见模型的训练,性能提升也相当明显。

TensorFlow 官方表示,用户不需要对现有的 TensorFlow 脚本做任何更改,就可以使用 ML Compute 作为 TensorFlow 和 TensorFlow 插件的后端。

Mac 版 TensorFlow 2.4 的详细入门指南可以参见:https://github.com/apple/tensorflow_macos

M1 版 Mac 对机器学习用户的影响

苹果曾在发布会上介绍说,M1 芯片将苹果的神经网络引擎引入了 Mac,实现了 15 倍的机器学习任务加速。该神经网络引擎有 16 个核心,每秒运算速度可达 11 万亿次。除此之外,配置了 ML 加速器的 CPU 和强大 GPU(称霸集显,媲美部分独显)也使得整个 M1 芯片的机器学习能力得到巨大提升。

TensorFlow为新旧Mac特供新版本,速度最高提升7倍

图源:https://medium.com/disruptive-nerd/how-is-the-apple-m1-going-to-affect-machine-learning-2d9da1beef86

性能的提升毋庸置疑,但软件兼容也是一个很大的问题。在 M1 版 Mac 发布之后,不少开发者都在问:我的 VS Code/Docker/Juypter Notebook…… 还能在新 Mac 上用吗?

VSCode:最快月底就能做出来

在苹果发布会之后不久,微软 VS Code 团队就发文表示,「VS Code 将支持 ARM 版 Mac,11 月底可能推出首个预览版。」

Mac/ARM64 试验版地址 https://code.visualstudio.com/insiders/#osx

TensorFlow为新旧Mac特供新版本,速度最高提升7倍

此外,微软还宣布将发布一款新的通用版 Mac Office 2019,支持新版苹果处理器。

Docker:在安排,但还没准备好

在 11 月 16 日的一篇博客中,Docker 的开发者表示,他们还没有准备好让 Docker 在 M1 版 Mac 上运行,在这之前还需要做很多准备。

Docker 表示,「我们 Docker 的目标是在新的 Mac 上提供与今天在 Docker Desktop for Mac 上同样出色的体验,并使这种过渡尽可能地无缝。」「为我们的客户打造合适的体验意味着在我们推送一个版本之前,要把不少事情做好。虽然苹果已经发布了 Rosetta 2 转译器,以帮助将应用程序转移到新的 M1 芯片上,但这并不能让我们与 Docker Desktop 一路同行。」

TensorFlow为新旧Mac特供新版本,速度最高提升7倍

至于 Juypter Notebook 等软件,目前还没有官方消息放出。不过,随着苹果不断将生态打通,正在有越来越多的软件开发商表示将开发适配 M1 版 Mac 的新产品。

TensorFlow 数据 机器学习
上一篇:我们是否正在进入第四代人工智能? 下一篇:无人机黑飞再现新花样,治理为何如此难?
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

处处是“垃圾”:人工智能太缺高质量数据了!

某种程度上讲,人工智能已经超越了我们过去最大胆的想象;但再看实际中,Siri甚至无法告诉用户今天天气如何。

读芯术 ·  14h前
重磅!AI解决生物学50年大挑战,破解蛋白质分子折叠问题

11 月 30 日,一条重磅消息引发了科技界所有人的关注:谷歌旗下人工智能技术公司 DeepMind 提出的深度学习算法「Alphafold」破解了出现五十年之久的蛋白质分子折叠问题。

机器之心 ·  17h前
机器学习和AI如何影响餐饮业

最近,COVID-19大流行以及它如何与食品企业的制造或破产联系在一起,成为人们关注的焦点。在讨论食品工业时,可能最后想到的事情之一是现代技术,尤其是人工智能和机器学习。

Cassie ·  17h前
5分钟介绍各种类型的人工智能技术

人工智能是一个广泛的术语,涵盖了许多技术,所有这些技术使计算机能够显示类似于我们人类的某种程度的智能。

deephub ·  17h前
精明的企业可以借鉴认知AI在医疗保健领域的成功应用

认知技术正在被用来解决世界上比较大的挑战。本文介绍了企业是如何让认知人工智能发挥作用的。

Rutesh Shah ·  18h前
2020年AI状况调查:25%的公司因采用AI收入显著增长

近期,麦肯锡发布了有关AI状况的全球调查报告,这是该报告连续第三年发布。

包永刚 ·  18h前
六项任务、多种数据类型,谷歌、DeepMind提出高效Transformer评估基准

Transformer 在多个模态(语言、图像、蛋白质序列)中获得了 SOTA 结果,但它存在一个缺点:自注意力机制的平方级复杂度限制了其在长序列领域中的应用。

机器之心 ·  2天前
第四范式NeurIPS 2020:知识图谱嵌入的自动化

前不久,来自第四范式的资深研究员姚权铭博士和大家分享了其参与并被 NeurIPS 2020 接收的论文《Interstellar: Searching Recurrent Architecture for Knowledge Graph Embedding》。

机器之心 ·  2天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载