20名Python人工智能和机器学习开源项目

作者: 佚名 2018-02-28 11:39:04

 本文用Python更新了顶级的AI和机器学习项目。Tensorflow已经成为了贡献者的三位数增长的第一位。 Scikit-learn下降到第二位,但仍有非常大的贡献者群体。

进入机器学习和人工智能并非易事。考虑到今天可用的大量资源,许多有抱负的专业人员和爱好者发现难以在该领域建立正确的路径。这个领域正在不断发展,我们必须跟上飞速发展的步伐。

经过信息的更新、检查,本文用Python更新了顶级的AI和机器学习项目。Tensorflow已经成为了贡献者的三位数增长的第一位。 Scikit-learn下降到第二位,但仍有非常大的贡献者群体。

与2016年相比,贡献者人数增长最快的项目是:

1.TensorFlow增长169%,从493个增加到1324个贡献者

2.Deap,增长86%,从21到39个贡献者

3.Chainer,增长83%,从84到154个贡献者

4.Gensim,增长81%,从145到262个贡献者

5.Neon,增长66%,从47到78个贡献者

6.Nilearn提高了50%,从46个到69个贡献者

2018年的更新:

1.Keras,629名贡献者

2.PyTorch,399名贡献者

顶级的20名Python人工智能和机器学习开源项目,你熟悉哪个?

Github上的前20名Python人工智能和机器学习项目

大小与贡献者的数量成正比,颜色代表贡献者数量的变化,红色更高,蓝色更低。雪花形状适用于深度学习项目,否则适用于其他项目。

我们看到像TensorFlow、Theano和Caffe这样的深度学习项目是最受欢迎的项目之一。

顶级的20名Python人工智能和机器学习开源项目,你熟悉哪个?

下面的列表是根据Github上贡献者的数量以降序给出的项目。贡献者人数的变化是相对于2016年发布的前20名Python机器学习的开源项目。

1.TensorFlow最初是由谷歌机器智能研究机构的Google Brain Team的研究人员和工程师开发的。该系统的设计是为了便于机器学习的研究,并使其快速、容易地从研究原型过渡到生产系统。

贡献者:1324(168%),Github 网址:https://github.com/tensorflow/tensorflow

2.Scikit-learn是用于数据挖掘和数据分析的简单而高效的工具,可供所有人访问,并且可在各种环境中重用,基于NumPy、SciPy和matplotlib、开源、商业可用,BSD许可证。

贡献者:1019(39%上),Github网址: https://github.com/scikit-learn/scikit-learn

3.Keras是一种高级神经网络API,用Python编写,能够在TensorFlow、CNTK或Theano上运行。

贡献者:629(新),Github网址: https://github.com/keras-team/keras

4.Python中的PyTorch,张量和动态神经网络以及强劲的GPU加速。

贡献者:399(新),Github网址:https://github.com/pytorch/pytorch

5.Theano允许你高效地定义、优化和评估涉及多维数组的数学表达式。

贡献者:327(24%上),Github网址: https://github.com/Theano/Theano

6.Gensim是一个免费的Python库,它具有可扩展的统计语义,分析用于语义结构的纯文本文档,检索语义相似的文档。

贡献者:262(81%上升),Github网址: https://github.com/RaRe-Technologies/gensim

7.Caffe是一个深思熟虑的表达,速度和模块化的深度学习框架。它由伯克利视觉和学习中心(BVLC)和社区贡献者开发。

贡献者:260(提高21%),Github网址: https://github.com/RaRe-Technologies/gensim

8.Chainer是一个基于Python的深度学习模型的独立开源框架。 Chainer提供灵活、直观和高性能的手段来实施全面的深度学习模型,其中包括最新的模型,如递归神经网络和变分自动编码器。

贡献者:154(上升84%),Github网址: https://github.com/chainer/chainer

9.Statsmodels是一个Python模块,允许用户探索数据,估计统计模型并执行统计测试。描述统计、统计测、绘图功能和结果统计的广泛列表适用于不同类型的数据和每个估算器。

贡献者:144(上升33%),Github网址: https://github.com/statsmodels/statsmodels/

10.Shogun是机器学习工具箱,它提供了广泛的统一和高效的机器学习(ML)方法。该工具箱无缝地允许组合多个数据表示、算法类和通用工具。

贡献者:139(上升32%),Github网址: https://github.com/shogun-toolbox/shogun

11.Pylearn2是一个机器学习库。其大部分功能都建立在Theano之上。这意味着你可以使用数学表达式编写Pylearn2插件(新模型,算法等),Theano将为你优化和稳定这些表达式,并将它们编译为你选择的后端(CPU或GPU)。

贡献者:119(3.5%上),Github网址: https://github.com/lisa-lab/pylearn2

12.NuPIC是一个开源项目,它基于称为分层时间存储器(HTM)的新大脑皮层理论。部分HTM理论已经在应用中实施、测试和使用,HTM理论的其他部分仍在开发中。

贡献者:85(提高12%),Github网址: https://github.com/numenta/nupic

13.Neon是Nervana基于Python的深度学习库。它提供易用性,同时提供最高的性能。

贡献者:78(66%上),Github网址: https://github.com/NervanaSystems/neon

14.Nilearn是一个Python模块,用于在NeuroImaging数据上进行快速简单的统计学习。它利用scikit-learn Python工具箱进行多变量统计,并提供预测建模、分类、解码或连接分析等应用。

贡献者:69(上升50%),Github网址: https://github.com/nilearn/nilearn/branches

15.Orange3是开源机器学习和数据可视化新手,同时也是专家。使用大型工具箱交互式数据分析工作流程。

贡献者:53(上升33%),Github网址: https://github.com/biolab/orange3

16.Pymc是一个python模块,实现贝叶斯统计模型和拟合算法,包括马尔可夫链蒙特卡罗。其灵活性和可扩展性使其适用于大量问题。

贡献者:39(上升5.4%),Github网址: https://github.com/pymc-devs/pymc

顶级的20名Python人工智能和机器学习开源项目,你熟悉哪个?

17.Deap是用于快速原型设计和测试思想的新型演化计算框架。它试图使算法明确、数据结构透明。它与多处理和SCOOP等并行机制完美协调。

贡献者:39(86%上),Github网址: https://github.com/deap/deap

18.Annoy(近似最近邻居Oh Yeah)是一个C ++库,它使用Python绑定来搜索接近给定查询点的空间点。它还创建映射到内存的大型只读基于文件的数据结构,以便许多进程可以共享相同的数据。

贡献者:35(46%上),Github网址: https://github.com/spotify/annoy

19.PyBrain是Python的模块化机器学习库。其目标是为机器学习任务提供灵活、易于使用但仍然强大的算法,以及各种预定义环境来测试和比较的算法。

贡献者:32(3%上),Github网址: https://github.com/pybrain/pybrain

20.Fuel是一个数据管道框架,它为你的机器学习模型提供他们需要的数据。计划由Blocks和Pylearn2神经网络库使用。

贡献者:32(10%上),Github网址:https://github.com/mila-udem/fuel

(贡献者在2018年2月录得。)

Python 人工智能 机器学习
上一篇:AI改变世界,电商业务场景中的人脸识别怎么玩? 下一篇:突发,刘强东扔出核弹!快递员将加速消失!
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

AI行业寒潮下,智能物流机器人产业迎来“风口”

“人工智能,前景很好,但‘钱’景不好 ” 、“2018年,人工智能的进展就是没有进展”、“2019年的AI行业已如石墨烯一样,尽显疲态”……一篇《投资人逃离人工智能》文章又给人工智能行业泼了一身冷水。人工智能融资难、“寒冬论”再一次戳痛每个人工智能从业者的心,激起大众的焦虑情绪。

AI报道 ·  18h前
人工智能应用在智慧社区五大场景

物联网、云计算、大数据、人工智能正逐步从概念走向应用。越来越多的传统产业也开始探索和创新,积极拥抱互联网和新技术。未来,人工智能技术可能会颠覆社区管理。

有熊 ·  19h前
基于PyTorch的CV模型框架,北大学生出品TorchCV

在机器学习带来的所有颠覆性技术中,计算机视觉领域吸引了业内人士和学术界最大的关注。

张倩、泽南 ·  20h前
高位截瘫患者重新行走:靠意念指挥外骨骼,法国脑机接口新突破

依靠介入头部的 2 个传感器,法国里昂的一名瘫痪男子 Thibault 实现了操控外骨骼装备来助力行走。

孙滔 ·  1天前
2008 年预测 2020 年生活方式:基本都实现了

美国皮尤研究中心曾在 2008 年预测 2020 年的生活方式,目前来看,该研究的预测基本已经实现。而对于未来 10 年,也就是 2030 年左右人们的生活,在 2017 年底的世界经济论坛上,800 多名信息和通讯技术领域的技术高管和专家给出了如下预测。

佚名 ·  1天前
机器学习的正则化是什么意思?

正则化的好处是当特征很多时,每一个特征都会对预测y贡献一份合适的力量;所以说,使用正则化的目的就是为了防止过拟合。

佚名 ·  1天前
为什么我的CV模型不好用?没想到原因竟如此简单……

机器学习专家 Adam Geitgey 近日发布了一篇文章探讨了这一简单却又让很多人头痛的问题,并分享了他为解决这一问题编写的自动图像旋转程序。

机器之心 ·  1天前
中文自动转SQL,准确率高达92%,这位Kaggle大师刷新世界纪录

首届中文NL2SQL挑战赛上,又一项超越国外水平的NLP研究成果诞生了。在NL2SQL这项任务上,比赛中的最佳成绩达到了92.19%的准确率,超过英文NL2SQL数据集WikiSQL目前完全匹配精度86.0%,执行匹配精度91.8%的最高成绩。

郭一璞 ·  1天前
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载