新的PyTorch图神经网络库,快了14倍:LeCun盛赞,GitHub 2000星

作者: 方栗子 2019-03-15 11:34:19

 

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

“CNN已老,GNN当立!”

当科学家们发现,图神经网络 (GNN) 能搞定传统CNN处理不了的非欧数据,从前深度学习解不开的许多问题都找到了钥匙。

如今,有个图网络PyTorch库,已在GitHub摘下2000多星,还被CNN的爸爸Yann LeCun翻了牌:

它叫PyTorch Geometric,简称PyG,聚集了26项图网络研究的代码实现。

这个库还很,比起前辈DGL图网络库,PyG***可以达到它的15倍速度。

应有尽有的库

要跑结构不规则的数据,就用PyG吧。不管是图形 (Graphs),点云 (Point Clouds) 还是流形(Manifolds) 。

△ 右边是不规则的,非欧空间

这是一个丰盛的库:许多模型的PyTorch实现,各种有用的转换 (Transforms) ,以及大量常见的benchmark数据集,应有尽有。

说到实现,包括Kipf等人的图卷积网络 (GCN) 和Bengio实验室的图注意力网络 (GAT) 在内,2017-2019年各大顶会的 (至少) 26项图网络研究,这里都能找到快速实现。

到底能多快?PyG的两位作者用英伟达GTX 1080Ti做了实验。

对手DGL,也是图网络库:

在四个数据集里,PyG全部比DGL跑得快。最悬殊的一场比赛,是在Cora数据集上运行GAT模型:跑200个epoch,对手耗时33.4秒,PyG只要2.2秒,相当于对方速度的15倍。

每个算法的实现,都支持了CPU计算和GPU计算。

食用方法

库的作者,是两位德国少年,来自多特蒙德工业大学。

△ 其中一位

他们说,有了PyG,做起图网络就像一阵微风。

你看,实现一个边缘卷积层 (Edge Convolution Layer) 只要这样而已:

  1.  1import torch 
  2.  2from torch.nn import Sequential as Seq, Linear as Lin, ReLU 
  3.  3from torch_geometric.nn import MessagePassing 
  4.  4 
  5.  5class EdgeConv(MessagePassing): 
  6.  6 def __init__(self, F_in, F_out): 
  7.  7 super(EdgeConv, self).__init__() 
  8.  8 self.mlp = Seq(Lin(2 * F_in, F_out), ReLU(), Lin(F_out, F_out)) 
  9.  9 
  10. 10 def forward(self, x, edge_index): 
  11. 11 # x has shape [N, F_in] 
  12. 12 # edge_index has shape [2, E] 
  13. 13 return self.propagate(aggr='max', edge_index=edge_index, x=x) # shape [N, F_out] 
  14. 14 
  15. 15 def message(self, x_i, x_j): 
  16. 16 # x_i has shape [E, F_in] 
  17. 17 # x_j has shape [E, F_in] 
  18. 18 edge_features = torch.cat([x_i, x_j - x_i], dim=1# shape [E, 2 * F_in] 
  19. 19 return self.mlp(edge_features) # shape [E, F_out] 

安装之前确认一下,至少要有PyTorch 1.0.0;再确认一下cuda/bin在$PATH里,cuda/include在$CPATH里:

  1. 1$ python -c "import torch; print(torch.__version__)" 
  2. 2>>> 1.0.0 
  3. 3 
  4. 4$ echo $PATH 
  5. 5>>> /usr/local/cuda/bin:... 
  6. 6 
  7. 7$ echo $CPATH 
  8. 8>>> /usr/local/cuda/include:... 

然后,就开始各种pip install吧。

PyG项目传送门:

https://github.com/rusty1s/pytorch_geometric

PyG主页传送门:

https://rusty1s.github.io/pytorch_geometric/build/html/index.html

PyG论文传送门:

https://arxiv.org/pdf/1903.02428.pdf

神经网络 数据 图形
上一篇:2019年机器人领域值得关注五大趋势 下一篇:人工智能大会这么多,我们不一样
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

强化学习能否在2020年取得突破?

强化学习对于实现我们的人工智能 / 机器学习技术的目标来说至关重要,但现在我们还有一些障碍需要克服。

Bill Vorhies ·  4天前
30 亿图库,一张照片就能查个人信息!人脸识别再爆隐私争议

这个时代,你的个人信息在手机里的比家里更多。想象一下,那么多生活细节都能放进口袋里,这让隐私问题变得比以往更重要。

Rachel ·  2020-01-21 21:20:00
JetBrains 发布基于 IntelliJ 的 IDE 2020 年功能路线图

上个月 JetBrains 发布了 IntelliJ 平台 2020 年路线图,现在作为 2020 年规划中的另一部分,JetBrains 又发布了基于 IntelliJ 的 IDE 2020 年的功能路线图。

佚名 ·  2020-01-21 08:00:22
数据太少怎么办?试试自监督学习,CV训练新利器

数据少,又没有预训练模型,怎么破?给你个秘密武器——自监督学习。

十三 ·  2020-01-20 14:25:19
搞AI的,怎么才能不失业?

 这一年,科大讯飞、比特大陆、旷视科技等人工智能公司相继传出裁员消息,曾经红极一时的 AI 独角兽,不再是万能的金饭碗。

燃财经工作室 ·  2020-01-18 20:23:35
用 PyTorch 单挑全世界,特斯拉是如何实现自动驾驶的?

特斯拉的工程师们正致力于开发一种发展自动驾驶技术的方法,这种方法能够真正适应数据的扩展,而不用因为数据规模扩展而增加工程师的人力,这意味着要将数十亿英里驾驶过程中出现的计算机视觉错误样本都积累起来。

Trent Eady ·  2020-01-18 16:33:26
性能提升最高120倍!滴滴实习生提出自动结构化减枝压缩算法框架

在相同准确率下,实际参数量的压缩,相对之前方法最大可以提高超120倍。

乾明 ·  2020-01-18 16:09:31
期末高数有救了!AI帮你解方程

近日,Facebook AI宣布建立了第一个使用符号推理解决高级数学方程式的AI系统,准确率碾压Mathematica和Matla。期末高数有救了!

佚名 ·  2020-01-17 08:45:07
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载