Torch7 开源 PyTorch:Python 优先深度学习框架

作者: 佚名 2017-03-01 09:05:27

PyTorch 是一个 Python 软件包,其提供了两种高层面的功能:

使用强大的 GPU 加速的 Tensor 计算(类似 numpy)

构建于基于 tape 的 autograd 系统的深度神经网络

如有需要,你也可以复用你最喜欢的 Python 软件包(如 numpy、scipy 和 Cython)来扩展 PyTorch。目前这个版本是早期的 Beta 版,我们很快就会加入更多的功能。

PyTorch 介绍

在粒度层面(granular level)上,PyTorch 库包含了以下组件:

使用 PyTorch 的原因通常有二:

作为 numpy 的替代,以便使用强大的 GPU;

将其作为一个能提供***的灵活性和速度的深度学习研究平台。

进一步阐述如下:

一个支持 GPU 的 Tensor 库

如果你使用 numpy,那么你就使用过 Tensor(即 ndarray)。

PyTorch 提供了支持 CPU 和 GPU 的 Tensor,可以极大地加速计算。

我们提供了各种各样的用于加速的张量例程(tensor routine),可以满足你的各种科学计算需求,比如 slicing、索引、数学运算、线性代数、reduction。而且它们非常快!

动态神经网络:基于 tape 的 autograd

PyTorch 有一种独特的神经网络构建方法:使用和重放 tape recorder。TensorFlow、Theano、Caffe 和 CNTK 等大部分框架对世界的视角都是静态的,让人们必须先构建一个神经网络,然后一次又一次地使用同样的结构;如果要想改变该网络的行为,就必须完全从头开始。

但使用 PyTorch,通过一种我们称之为「Reverse-mode auto-differentiation(反向模式自动微分)」的技术,你可以零延迟或零成本地任意改变你的网络的行为。我们灵感来自关于这一主题的许多研究论文以及当前和过去的研究成果,比如 autograd、autograd、Chainer 等。

autograd:https://github.com/twitter/torch-autograd

autograd:https://github.com/HIPS/autograd

Chainer:https://chainer.org/

尽管这项技术并非 PyTorch 独有,但它仍然是到目前为止最快的实现。你能为你的疯狂研究获得***的速度和***的灵活性。

Python 优先

PyTorch 不是简单地在整体 C++框架上绑定 Python。它深入构建在 Python 之上。你可以像使用 numpy / scipy / scikit-learn 那样轻松地使用 PyTorch。你可以用你喜欢的库和包(如 Cython 和 Numba)在 Python 中编写新的神经网络层。我们的目标是尽量让你不用重新发明轮子。

命令式体验

PyTorch 的设计思路是线性、直观且易于使用。当你需要执行一行代码时,它会忠实执行。PyTorch 没有异步的世界观。当你打开调试器,或接收到错误代码和 stack trace 时,你会发现理解这些信息是非常轻松的。Stack-trace 点将会直接指向代码定义的确切位置。我们不希望你在 debug 时会因为错误的指向或异步和不透明的引擎而浪费时间。

快速精益

PyTorch 具有轻巧的框架。我们集成了各种加速库,如 Intel MKL、英伟达的 CuDNN 和 NCCL 来优化速度。在其核心,它的 CPU 和 GPU Tensor 与神经网络后端(TH、THC、THNN、THCUNN)被编写成了独立的库,带有 C99 API。

这种配置是成熟的,我们已经使用了多年。

因此,PyTorch 非常高效——无论你需要运行何种尺寸的神经网络。

在 PyTorch 中,内存的使用效率相比 Torch 或其它方式都更加高效。我们为 GPU 编写了自定义内存分配器,以保证深度学习模型在运行时有***的内存效率,这意味着在相同硬件的情况下,你可以训练比以前更为复杂的深度学习模型。

轻松拓展

编写新的神经网络模块,或与 PyTorch 的 Tensor API 相接的设计都是很直接的,不太抽象。

你可以使用 Torch API 或你喜欢的基于 numpy 的库(比如 Scipy)来通过 Python 写新的神经网络层。

如果你想用 C++ 写网络层,我们提供了基于 cffi(https://cffi.readthedocs.io/en/latest/)的扩展 API,其非常有效且有较少的样板文件。

不需要写任何 wrapper code。这里有一个示例:https://github.com/pytorch/extension-ffi

安装

二进制

Anaconda

conda install pytorch torchvision -c soumith

来自源

Anaconda 环境的说明

如果你想要用 CUDA 支持编译、安装:

NVIDIA CUDA 7.5 或之上的版本

NVIDIA CuDNN v5.x

安装可选依赖包

  1. export CMAKE_PREFIX_PATH=[anaconda root directory]  
  2. conda install numpy mkl setuptools cmake gcc cffi 
  3. conda install -c soumith magma-cuda75 # or magma-cuda80 if CUDA 8.0 

安装 PyTorch

  1. export MACOSX_DEPLOYMENT_TARGET=10.9 # if OSX  
  2. pip install -r requirements.txt 
  3. python setup.py install 

开始使用

从以下三点开始学习使用 PyTorch:

教程:开始了解并使用 PyTorch 的教程(https://github.com/pytorch/tutorials)。

案例:跨所有领域的轻松理解 PyTorch 代码(https://github.com/pytorch/examples)。

API 参考:https://pytorch.org/docs/

交流

论坛:讨论实现、研究等(https://discuss.pytorch.org)

GitHub 问题反馈:bug 通知、特征要求、安装问题、RFC、想法等。

Slack:通常聊天、在线讨论、合作等(https://pytorch.slack.com/)。

邮件订阅没有骚扰信件、单向邮件推送 PyTorch 的重要通知。订阅:https://eepurl.com/cbG0rv。

发布和贡献

PyTorch 的发布周期(主版本)为 90 天。目前的版本是 v0.1.6 Beta,我们期望在发布前尽量减少 bug。如果你发现了错误,欢迎向我们提交:

https://github.com/pytorch/pytorch/issues

如果你愿意为 PyTorch 提供新功能、实用函数或核心扩展,请先开一个 issue 与大家讨论一下。请注意:在未经讨论的情况下提交的 PR 可能会导致退回,因为我们可能会采取不同的解决方式。

在下一个版本中,我们计划推出三大新功能:

分布式 PyTorch

(这里已经有一个尝试性的实现了:https://github.com/apaszke/pytorch-dist)

反反向(Backward of Backward):在反向传播的过程中进行过程优化。一些过去和最近的研究如 Double Backprop 和 Unrolled GANs 会需要这种特性。

用于 autograd 的 Lazy Execution Engine:这将允许我们可以通过引入缓存和 JIT 编译器来优化 autograd 代码。

开发团队

PyTorch 是一个社区驱动的项目,由经验丰富的工程师和研究者开发。

目前,PyTorch 由 Adam Paszke、Sam Gross 与 Soumith Chintala 牵头开发。其他主要贡献者包括 Sergey Zagoruyko、Adam Lerer、Francisco Massa、Andreas Kopf、James Bradbury、Zeming Lin、田渊栋,Guillaume Lample、Marat Dukhan、Natalia Gimelshein 等人。

PyTorch Python 框架
上一篇:从PyTorch到Mxnet ,对比7大Python深度学习框架 下一篇:反面观点:我们不该急于投身AI的五个理由
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

为什么用Go编写机器学习的基础架构,而不是Python?

虽然Python是使用广泛的语言,并用于每个主要的机器学习框架中。然而,你能想象?在Cortex(将机器学习模型部署为API的开放源代码平台之一)代码库中,87.5%的代码都是使用GO编写。

读芯术 ·  2020-02-14 13:13:04
Golang还是Python?哪种语言更适合AI?

Google所开发的Golang正在成为机器学习和AI的主流编程语言,全球已有数百万用户。那么很多IT技术人员肯定会有这样的疑问,前些年火起来的Python在科学计算及AI领域也有广泛应用,那么这两者今后谁才是AI的菜呢?

橘子键盘手 ·  2020-02-07 12:55:29
从事数据科学工作需要掌握哪些技能?

本文通过国外KDnuggets论坛上Simplilearn的统计结果和国内某知名招聘网站的招聘要求信息进行分析,详细介绍在数据科学的工作中,需要掌握哪一些技能以及工具,以及当下数据科学工作中,哪些技能和工具是从业人员的学习首选。

CDA数据分析师 ·  2020-01-09 17:28:39
Python实现识别图片中的所有人脸并显示出来

本文介绍一下使用Python3实现识别图片中的所有人脸并显示出来,让我们一起来看一下。

佚名 ·  2019-12-31 15:20:43
酷极了!5分钟用Python理解人工智能优化算法

梯度下降是神经网络中流行的优化算法之一。一般来说,我们想要找到最小化误差函数的权重和偏差。梯度下降算法迭代地更新参数,以使整体网络的误差最小化。

python小白社区 ·  2019-11-27 09:47:49
教你怎样用Python进行语音识别

这里讲一下如何在不联网的情况下,依然可以通过python来将语音文件转换成文字。这里用到的包为sphinx,sphinx是由美国卡内基梅隆大学开发的大词汇量、非特定人、连续英语语音识别系统。

CDA数据分析师 ·  2019-11-20 12:30:21
给 AI 讲故事,如何教它脑补画面?

视觉想象力是人与生俱来的, AI 能否拥有类似的能力呢?比如:给出一段故事情节,如何让机器展开它的想象力,“脑补”出画面呢?看看阿里AI Labs 感知实验室的同学们如何解决这个问题。

源方 ·  2019-11-19 10:56:16
2019深度学习框架决战:PyTorch横扫AI顶会,再夺NeurIPS 2019!

近日,Reddit的一则热帖引发机器学习社区大量讨论:NeurIPS 2019使用的机器学习框架:PyTorch 68-> 166,TensorFlow 91-> 74。

肖琴 ·  2019-11-19 09:58:16
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载