我们对比了GitHub上8800个开源机器学习项目,并选出了其中的Top30

作者: 叶一 Shan LIU Aileen 译 2018-01-30 15:20:30

编译:叶一、Shan LIU、Aileen

2017年是机器学习应用全面开花的一年,惊为天人的想法和项目层出不穷。我们对比了过去一年中近8800个开源机器学习项目,并挑选了其中较好的30个(Top 0.3%)列举于此。

这是一份***竞争性的列表,它精挑细选了发表于2017年1月-12月份的机器学习库、数据集和应用类的优质项目。我们通过流行度、参与度和时近性来对其质量进行评级。有一项数据可以让你对表单质量有一个直观印象:这些项目的GitHub平均stars数是3558。

开源项目对于数据科学家而言是很有意义的。你可以通过阅读源代码,在前人的基础上构建更加强大的项目。你可以尽情尝试一下这些可能在去年与你失之交臂的机器学习项目。

No.1 - FastText:快速文本表示/分类库

GitHub stars数: 11786个

来源:Facebook研究

链接:https://github.com/facebookresearch/fastText

FastText:快速文本表示/分类库

以及[Muse:基于FastText的多语言无监督/监督词嵌入(GitHub stars数:695个)https://github.com/facebookresearch/MUSE]

No.2- Deep-photo-styletransfer:康奈尔大学 Fujun Luan 论文《Deep Photo Style Transfer》的代码与数据

GitHub stars数:9747个

链接:https://github.com/luanfujun/deep-photo-styletransfer

Deep-photo-styletransfer

No.3 - face recognition:世界上最简单的适用于Pyhthon的面部识别api以及命令行

GitHub stars数:8672个

来源:Adam Geitgey

链接:https://github.com/ageitgey/face_recognition

face recognition

No.4 - Magenta:机器智能音乐与艺术生成器

GitHub stars数:8113

链接:https://github.com/tensorflow/magenta

 Magenta

No.5 - Sonnet:基于 TensorFlow 的神经网络库

GitHub stars数:5731个

来源:DeepMind 成员 Malcolm Reynolds

链接:https://github.com/deepmind/sonnet

No.6 - deeplearn.js:网页端硬件加速机器学习库

GitHub stars数:5462个

来源:Google Brain 团队 Nikhil Thorat

链接:https://github.com/PAIR-code/deeplearnjs

No.7 - Fast Style Transfer:TensorFlow 快速风格转换

GitHub stars数:4843个

来源:MIT的Logan Engstrom

链接:https://github.com/lengstrom/fast-style-transfer

Fast Style Transfer

No.8 - Pysc2:星际争霸II 学习环境

GitHub stars数:3683个

来源:DeepMind Timo Ewalds 等人

链接:https://github.com/deepmind/pysc2

Pysc2

No.9 - AirSim:微软AI和研究院出品的基于虚幻引擎的开源自动驾驶模拟器

GitHub stars数:3681个

来源:微软的Shital Shah

链接:https://github.com/Microsoft/AirSim

AirSim

No.10 - Facets:机器学习数据集可视化工具

GitHub stars数:3371个

来源:Google Brain

链接:https://github.com/PAIR-code/facets

 Facets

No.11 - Style2Paints:AI漫画线稿上色工具

GitHub stars数: 3310个

链接:https://github.com/lllyasviel/style2paints

Style2Paints

No.12 - Tensor2Tensor:用于广义序列-序列模型的工具库

GitHub stars数目: 3087个

来源:Google Brain 的Ryan Sepassi

链接:https://github.com/tensorflow/tensor2tensor

Tensor2Tensor

No.13- 基于 PyTorch 的图像对图像转换工具 (如horse2zebra, edges2cats,等)

GitHub stars数:2847个

来源:UC Berkeley 朱俊彦博士

链接:https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix

基于 PyTorch 的图像对图像转换工具

No.14 - Faiss:用密集向量高效相似性检索与聚类的工具库

GitHub stars数:2629个

来源:Facebook

链接:https://github.com/facebookresearch/faiss

Faiss

No.15 Fashion-mnist:一个类似于 MNIST 的时尚产品数据集

GitHub stars数:2780个

来源:Zalando Tech 的 Han Xiao

链接:https://github.com/zalandoresearch/fashion-mnist

Fashion-mnist

No.16 - ParlAI:适用于在各类公开的对话数据集上训练与评估AI模型的一个框架

GitHub stars数: 2578个

来源:Facebook Research的 Alexander Miller

链接:https://github.com/facebookresearch/ParlAI

ParlAI

No.17 Fairseq:序列到序列工具包

GitHub stars数: 2571个

来源:FAIR

链接:https://github.com/facebookresearch/fairseq

No.18 Pyro:使用 Python 和 PyTorch 进行深度通用概率编程

GitHub stars数: 2387个

来源:Uber AI Labs

链接:https://github.com/uber/pyro

 Pyro

No.19 iGAN:基于 GAN 的交互图像生成器

GitHub stars数: 2369个

链接:https://github.com/junyanz/iGAN

 iGAN

No.20 Deep-image-prior:使用神经网络进行图像恢复,然而无需学习过程

GitHub stars数: 2188个

来源:Skoltech 的 Dmitry Ulyanov博士

链接:https://github.com/DmitryUlyanov/deep-image-prior

 Deep-image-prior

No.21 Face_classification:基于 Keras CNN 模型与 OpenCV 的实时面部检测和表情/性别分类,训练与 fer2013/imdb 数据集

GitHub stars数: 1967个

链接:https://github.com/oarriaga/face_classification

Face_classification

No.22 Speech to Text WaveNet:使用 DeepMind 的 WaveNet 和 TensorFlow 构成的端到端句级英语语音识别

GitHub stars数: 1961个

来源: Kakao Brain 的 Namju Kim

链接:https://github.com/buriburisuri/speech-to-text-wavenet

Speech to Text WaveNet

No.23 StarGAN:用于多领域图像-图像转换的统一生成对抗网络

GitHub stars数: 1954个

来源:韩国大学的Yunjey Choi

链接:https://github.com/yunjey/StarGAN

StarGAN

No.24 MI-agents:Unity 机器学习智能体

GitHub stars数: 1658个

来源:深度学习 Unity3D 的Arthur Juliani

链接:https://github.com/Unity-Technologies/ml-agents

MI-agents

No.25 Deep Video Analytics:分布式可视化搜索和可视化数据分析平台

GitHub stars数: 1494个

来源:康奈尔大学的Akshay Bhat

No.26 OpenNMT:Torch 上的开源神经机器翻译

GitHub stars数:1490个

链接:https://github.com/OpenNMT/OpenNMT

OpenNMT

No.27 Pix2PixHD:使用条件 GAN 合成和处理 2048×1024 分辨率的图像

GitHub stars数:1283个

来源:英伟达 AI 科学家 Ming-Yu Liu

链接:https://github.com/NVIDIA/pix2pixHD

Pix2PixHD

No.28 Horovod:分布式 TensorFlow 训练框架

GitHub stars数:1188 个

来源:Uber 工程团队

链接:https://github.com/uber/horovod

 Horovod

No.29 AI-Blocks:强大而直观的 WYSIWYG 界面,可让任何人创建机器学习模型

GitHub stars数:899 个

链接:https://github.com/MrNothing/AI-Blocks

AI-Blocks

No.30 Voice Conversion with Non-Parallel Data:基于 TensorFlow 的深度神经网络语音转换(语音风格转换)

GitHub stars数:845个

来源:Kakao Brain人工智能研究团队的Dabi Ahn

链接:https://github.com/andabi/deep-voice-conversion

Voice Conversion with Non-Parallel Data

来源:

https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7

【本文是51CTO专栏机构大数据文摘的原创译文,微信公众号“大数据文摘( id: BigDataDigest)”】

     大数据文摘二维码

戳这里,看该作者更多好文

GitHub 开源 机器学习
上一篇:基于face_recognition实现人脸识别 下一篇:李开复预言AI泡沫年底要破,LeCun:确实如此
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

轻松构建 PyTorch 生成对抗网络(GAN)

生成对抗网络(GAN)是一种生成式机器学习模型,它被广泛应用于广告、游戏、娱乐、媒体、制药等行业,可以用来创造虚构的人物、场景,模拟人脸老化,图像风格变换,以及产生化学分子式等等。

佚名 ·  1天前
新AI让教师能够快速开发智能辅导系统

通过使用一种采用人工智能的新方法,教师可以通过演示解决某个主题中的问题的几种方法来教计算机……

佚名 ·  1天前
终结重复工作!教你30分钟创建自己的深度学习机器

建立一个深度学习环境是一件很重要的事情。本文讲述使用深度学习 CommunityAMI、TMUX和 Tunneling在EC2为Jupyter Notebooks创建一个新的深度学习服务器。

读芯术 ·  2天前
化身阿凡达,国外小哥开源 AI 实时变脸工具 Avatarify

疫情期间,很多人都在用 Zoom 和 Skype 等软件进行视频会议。国外一位开发小哥觉得这样开会太无聊,于是基于 first-order-model 开发了一个能够把别人的照片套在自己脸上的“变脸”软件 Avatarify,并将其开源。

OSC神秘老司机 ·  2天前
如何用机器学习模型,为十几亿数据预测性别

基于用户画像进行广告投放,是优化投放效果、实现精准营销的基础;而人口属性中的性别、年龄等标签,又是用户画像中的基础信息。那该如何尽量准确的为数据打上这些标签?

TalkingData ·  2天前
教你轻松选择合适的机器学习算法!

机器学习方面没有免费午餐。因此,确定使用哪种算法取决于许多因素:面临的问题类型和预期的输出类型等。本文介绍了为数据集探究合适的机器学习方法时要考虑的几个因素。

布加迪 ·  2天前
画图太丑拿不出手?有人做了套机器学习专用画图模板,还有暗黑模式

论文、博客写好了,里面的图可怎么画?对于很多研究人员和开发者来说,内容的「可视化」是一个大问题。如果从头开始画,配色、空间布局都很伤脑筋,而且画丑了也拿不出手,要是有模板可以套就好了。

张倩、魔王 ·  2天前
机器学习:物联网成功的诀窍?

通过机器学习,物联网可以完美地运行。全球各地的组织正在竞相利用物联网的能力,但是,其中许多组织都被我们讨论过的一个或多个障碍所困扰。不过,不管您遇到什么问题,都可以通过结合了机器学习技术的方法来解决。

iothome ·  3天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载