自学3天的阿法元完爆阿法狗,GitHub2017年度报告见证人工智能有多火!

作者: 佚名 2017-10-20 09:42:51

Nature 今天上线的这篇重磅论文,详细介绍了谷歌 DeepMind 团队最新的研究成果。人工智能的一项重要目标,是在没有任何先验知识的前提下,通过完全的自学,在极具挑战的领域,达到超人的境地。

2017 人工智能到底有多火

01人工智能从 0 到 1, 无师自通完爆阿法狗 100-0

去年,有个小孩读遍人世所有的棋谱,辛勤打谱,苦思冥想,棋艺精进,4-1 打败世界冠军李世石,从此人间无敌手。他的名字叫阿法狗。

今年,他的弟弟只靠一副棋盘和黑白两子,没看过一个棋谱,也没有一个人指点,从零开始,自娱自乐,自己参悟,100-0 打败哥哥阿法狗。他的名字叫阿法元。

阿尔法元的最大亮点,在于无需任何人类指导,通过全新的强化学习方式自己成为自己的老师,在围棋这一最具挑战性的领域达到超过人类的精通程度。

自学 3 天,就打败了旧版 AlphaGo

人类其实把阿法狗教坏了! 新一代的阿法元(AlphaGo Zero),完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己一个人强化学习(reinforcement learning)和参悟,棋艺增长远超阿法狗,百战百胜,以 100-0 击溃阿法狗。

达到这样一个水准,阿法元只需要在 4 个 TPU 上,花三天时间,自己左右互搏 490 万棋局。而它的哥哥阿法狗,需要在 48 个 TPU 上,花几个月的时间,学习三千万棋局,才打败人类。

AlphaGo Zero 与此前版本有明显差别:

AlphaGo-Zero 的训练时间轴

  • AlphaGo Zero 仅用棋盘上的黑白子作为输入,而前代则包括了小部分人工设计的特征输入。
  • AlphaGo Zero 仅用了单一的神经网络。在此前的版本中,AlphaGo 用到了“策略网络”来选择下一步棋的走法,以及使用“价值网络”来预测每一步棋后的赢家。而在新的版本中,这两个神经网络合二为一,从而让它能得到更高效的训练和评估。
  • AlphaGo Zero 并不使用快速、随机的走子方法。在此前的版本中,AlphaGo 用的是快速走子方法,来预测哪个玩家会从当前的局面中赢得比赛。相反,新版本它依靠高质量的神经网络来评估下棋的局势。

人工智能的一项重要目标,是在没有任何先验知识的前提下,通过完全的自学,在极具挑战的领域,达到超人的境地。零基础之上,进而自我训练,实现超越。

通过数百万次自我对弈,AlphaGo Zero 从零开始掌握了围棋,在短短几天内就积累起了人类几千年才有的知识。但它也发现了新的知识,发展出打破常规的策略和新招,与 AlphaGo 在对战李世石和柯洁时创造的那些交相辉映,却又更胜一筹。

这些创造性的时刻给了我们信心:人工智能会成为人类智慧的增强器,帮助我们解决人类正在面临的一些严峻挑战 。

尽管才刚刚发展起来,AlphaGo Zero 已经走出了通向上述目标的关键一步。对于希望利用人工智能推动人类社会进步为使命的 DeepMind 来说,围棋并不是 AlphaGo 的终极奥义,他们的目标始终是要利用 AlphaGo 打造通用的、探索宇宙的终极工具。

AlphaGo Zero 的提升,让人们看到了利用人工智能技术改变人类命运的突破性机会。人工智能未来的发展,码农或将大批失业,程序员将成为"驯兽师"。

02人工智能系统完爆程序员实现真正自主编程

让 AI 自动编程是人工智能领域长久以来的梦想之一。不久前,来自彭博和英特尔实验室的两位研究人员,号称实现了首个能够自动生成完整软件程序的 AI 系统“AI Programmer”。

这个“AI 程序员”利用遗传算法和图灵完备语言,开发的程序理论上能够完成任何类型的任务,AI 自动编程的时代,大幕已开。

这个首个能够自动生成完整软件程序的机器学习(ML)系统,全程只需最低限度的人类参与。以遗传算法(GA)为核心,加上紧密约束的编程语言,将其 ML 搜索空间的开销降到最低。

AI Programmer 的软件架构

从图中可见,由人类驱动的部分非常少,只需要在开始输入指令,最后接收适用于某项任务的函数即可,剩下部分全部由机器完成。

AI Programmer 的新颖部分源于:

  • 独特的系统设计,包括用于效率和安全性的嵌入式手工解释器(hand-crafted interpreter)。
  • 对遗传算法的增强,纳入了指令基因(instruction-gene)随机化绑定,以及编程语言特定的基因组构建及消除技术。

目前这个方面的成果还非常有限,比如让 AI 自动补完编程语言,或者执行简单的加法程序。

研究人员表示,他们用这个系统证明了长久以来的假设,那就是功能完备的程序确实能够被自动生成。

具体到这项工作,AI Programmer 利用机器学习中的遗传算法,模拟复杂的指令。虽然现在 AI Programmer 生成的程序,复杂程度与人类新手程序员编写的结果相当。但研究人员认为,AI Programmer 编写的程序完全可以超越传统范畴,不受人类时间和智慧的局限。

AI 编写的程序只是在测试复杂度和计算资源之间找到了最适合的点。换句话说,可能性无限。

研究人员还表示,我们需要重新思考,设计新的、面向机器的编程语言,因为当前的编程语言是面向人类的,不适用于基于 ML 的编程。“在考虑ML驱动程序生成的未来时,我们需要放弃和重新考虑典型程序语言创建的方法。”

研究人员表示,只有这样做,我们才能开始设想一个由 AI 系统驱动,以人类创造力和设计为指导的计算机软件开发的新未来。

GitHub 2017 年度报告见证人工智能有多火

GitHub Universe 是 GitHub 的年度盛会,今年 10 月10-12 日,GitHub Universe 大会在旧金山召开。同时,GitHub 也在其官网发布了 2017 年年度数据报告 —— GitHub Octoverse 报告。

报告显示,2017 年 GitHub 社区共汇集了 2400 万开发人员,150 万个组织和企业,6700 万个存储库,其中有 2500 万个公共存储库,用户遍布世界 200 多个国家,“全球最大的同性交友网站”实至名归啊!

GitHub 每年都会在年度盛会中推出数据报告,其中列出了一些年度的数据,包括其网站中最受欢迎的编程语言、开源项目等。今年的数据更是让人眼前一亮,Python 这匹编程语言中的黑马,势不可挡!

01.终结语言之争,GitHub 得分最高的语言

编程语言之间的战争是一场持久战,程序员们虽然对于这样的内容有些审美疲劳了,但是每次看到还是疯狂的为自己的应用打 Call。而 GitHub 作为一个丰富的资源库,其中包含有337种独特的编程语言开发的开源项目。

那么,在 GitHub 中哪种语言可以封王呢?JavaScript,你想到了吗?JavaScript 这一年在 GitHub 中共获得 230 万 pull request,比第二名 Python 多了两倍还不止。

Python 今年的请求比去年增加了 40%,成功挤掉 Java 上升为第二位。Typescript 也是今年的黑马语言,它在 GitHub 上的 pull request 比去年多了四倍。

2017 GitHub 上最受欢迎的前 15 门语言

排名前十五的语言(按先后顺序):

  • JavaScript
  • Python
  • Java
  • Ruby
  • PHP
  • C++
  • CSS
  • C#
  • Go
  • C
  • TypeScript
  • Shell
  • Swift
  • Scala
  • Objective-C

从 2017 GitHub 上最受欢迎的前 15 门语言可以看出:JavaScript 稳居第一, 遥遥领先于第二名 Python,这可能和 GitHub 上关于 Web 前端的项目、开发者的数量庞大有一定关系。

值得注意的是:Python 已代替 Java 从去年的第三突进了第二,相比去年它新增了 40% 的 PR 数。

近几年 Python 的增长势头一直非常迅猛,Python 虽然是脚本语言,但容易学,同时,Python 有非常多优秀的深度学习库可用,现在大部分深度学习框架都支持 Python。所以,Python 作为 AI 时代头牌语言的位置基本确立。

再来看看 Java,Java 则被挤到第三位,不过 Java 9 刚发布不久,而且它的模块化特性深受开发者喜爱,霸主地位还是很难撼动的。

同时,我们注意到 Objective-C 排行下降,从中可以看出移动开发的热度在减退。今年提交的 PR 甚至比去年还少不少,而 OC 是 iOS 开发的最主要语言,再联想到 Java 排名的下降,可以看出,移动开发的火热度在下降,而且今年可能是首次下降。

究其本质原因是,智能手机已经越来越普及,当你身边的爷爷奶奶都拥有一部智能手机的时候,那只能说明,智能手机的市场份额已基本到头了。

再加上现在流量基本被一些头部的大厂占领,移动时代的流量获取越来越难,移动创业也就越来越难,自然移动开发的市场需求没法再持续增长了。

不过,移动开发市场没那么火热是事实,但并不意味着移动开发找不到工作,现在稳定发展的公司移动开发岗位是不可或缺的,缺的是真正有能力的人才。

所以,如果你已经在从事移动开发,不必过多焦虑,专注提升自身技术才是王道,而如果你是想学习编程转行的,那么现如今不建议再从 0 学习移动开发了。

02.2017年谁是最赞的开源者?谁是最棒的开源项目?

GitHub 自 2007 年成立,如今已经十年了,如今已经是全球影响力最大、最权威的开源社区了,每年都有大量的企业和个人将自己的项目开源到这里进行交流学习。

那么今年哪些项目最具价值?哪些项目获得了程序员的广泛讨论?哪些项目又收集到了最全的资料呢?

被 fork 最多的前十个项目

TensorFlow 当选第一,TensorFlow 是谷歌的第二代机器学习系统,这也反映了越来越多的人对人工智能感兴趣,并且正在学习准备投入到机器学习当中。

也侧面说明了,现如今,很多开发者还是积极拥抱未来的,因为开源社区,让我们的心态更加开放,也让我们接受、了解、学习新事物的成本低了太多。经历了被称为“人工智能元年”的 2016 年,人工智能在 2017 年也迎来了更大的发展。

贡献者最多的前十个项目

review 最多的前十个项目

discuss 最多的前十个项目

上面四个排行榜,TensorFlow 在其中三个都留下了自己的名字,再一次证明人工智能火热的同时,也从侧面反映了越来越多的开发者对未来人工智能的发展充满信心。

03.2017 年,GitHub 的参与人群出现了新变化

与 2016 年相比,2017 年 GitHub 有了更多的参与者。这些贡献者中接近半数是学生,28% 是专业人士,22% 是编程爱好者。在经验方面,只有 10% 的程序员是有经验的,其中有 45% 的程序员是完全新手。

GitHub 参与人群变化

毫无疑问,开发人员永远都是 GitHub 的核心。2017 年 4 月,GitHub 扩展了其开发者计划,其中 GitHub 的开发人员以及付费用户的开发人员都包括在内。这个计划也使得 GitHub 上的开发人员大涨。

03.2017年 machine-learning 是最被广泛使用的标签

2017 年 GitHub 增加了一个新功能"主题-存储库标签",支持用户通过技术、行业等等搜索项目,那么经过一年的运营,哪些标签成为了 2017 年的主旋律标签呢?

毫无疑问,游戏是 2017 年的大热门,从全民王者荣耀就可见一斑,但"游戏"并不是天下无敌的,至少机器学习就可以和它平分秋色。

被使用最广的标签

以下为标签详情:

● machine-learning:https://github.com/topics/machine-learning

● game:https://github.com/topics/game

● iOS:https://github.com/topics/ios

● API:https://github.com/topics/api

● blog:https://github.com/topics/blog

● website:https://github.com/topics/website

● deep-learning:https://github.com/topics/deep-learning

● library:https://github.com/topics/library

● arduino:https://github.com/topics/arduino

● plugin:https://github.com/topics/plugin

● database:https://github.com/topics/database

● bot:https://github.com/topics/bot

整体数据概述:

  • 2400 万用户
  • 150 万组织
  • 6700 万 Repostitories
  • 130 万学生开发者
  • 用户横跨 200 个国家
  • 四分之一的 GitHub 企业账户来自美国以外的国家
  • 自 2016 年 9 月,公开发表 10 亿 Commit
  • 自 2016 年 9 月,2530 万活跃项目
  • 自 2016 年 9 月,1250 万活跃 Issue
  • 自 2016 年 9 月,新增 670 万开发者
  • 自 2016 年 9 月,新增 45.1 万个组织入驻 GitHub
  • 自 2016 年 9 月,120 万人提交了他们的第一个 Pull Request
  • 自 2016 年 9 月,410 万人创建了他们的第一个 Repo
  • 自 2016 年 9 月,130 万新 Pull Request ,包括 Linus Torvald 的第一个 GitHub Pull Request:https://github.com/Subsurface-divelog/subsurface/pull/155
  • 合并了 100,000,000 次 Pull Request
  • 关闭了 68,800,000 个 Issue
  • 62.4 万 Pull Request 被 review
  • 140 万人在他人的 Issue 下讨论
  • Emoji 表情在 GitHub 上被用得很多
  • 19.1 万人 star 或 fork 了项目但没有提交代码
  • 不包括框架和语言,下面的标签被使用得最多
  • machine-learning
  • game
  • iOS
  • API
  • blog
  • website
  • deep-learning
  • library
  • arduino
  • plugin
  • database
  • bot

最后点有趣的,emoji 表情排行榜,妥妥的排行第一,看来程序员很喜欢相互点赞的呢。

随着社区的不断发展,开源项目的不断增长,GitHub 的报告对于我们对未来的技术趋势判断有很大的参考意义。

互联网行业最怕的是固步自封,不与时俱进,做技术的一样,我们要时刻更新自己,不人云亦云,但是要拥抱变化,只有这样,我们才能在时代的潮流中立于不败。

最后,感谢 GitHub,感谢开源精神,让我们做技术的可以与全世界接轨,更改变了我们学习新事物的方式。感兴趣的不妨点击“阅读原文”查看完整报告。

阿法元 阿法狗 GitHub
上一篇:想做AI,怎么选开发工具?这份上手指南送给你 下一篇:不可不知!如何利用机器学习来打击AI下的网络犯罪
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

大盘点:8月Github上7个值得关注的数据科学项目

本文带你来看看GitHub上创建于2019年8月的7个数据科学项目。笔者所选项目的范围十分广泛,涉及从机器学习到强化学习的诸多领域。

读芯术 ·  1天前
怎么解决Linux LVM I/O报错

本文将会分享近期发布的七大GitHub机器学习项目。这些项目广泛覆盖了机器学习的各个领域,包括自然语言处理(NLP)、计算机视觉、大数据等。

读芯术 ·  2019-09-15 17:57:03
GitHub上Star最高的5个机器学习项目,最后一个可惜了!

机器学习正在高速发展当中,想要找到实用、先进的机器学习项目,首选就是GitHub,GitHub的Stars是评判一个项目受欢迎程度的标准之一。

·  2019-08-06 13:29:48
GitHub万星的中文机器学习资源:路线图、视频、学习建议全在这

再也不用在学机器学习之前先恶补英语了,这儿有一套超热门的优质中文资源可以选择。这套名叫AI Learning的GitHub资源,汇集了30多名贡献者的集体智慧,把学习机器学习的路线图、视频、电子书、学习建议等中文资料全部都整理好了。

铜灵 ·  2019-04-22 09:52:34
GitHub超过3000赞的「机器学习路线图」,教你升级打怪全攻略

对想要学习机器学习的人来说,信息太多也是一种困扰,开放的课程、书籍、框架、开源代码那么多,每套资料都有自己的好处,有人说这个课程好,有人说那个框架最好用。

郭一璞 ·  2019-03-26 10:21:12
微软沈向洋谈GitHub、数据信仰和计算未来

 1 月 20 日,微软全球执行副总裁沈向洋在 2019 极客公园创新大会上,解读了微软在 AI、计算、数据方面的工作和思考。

王金旺 ·  2019-01-21 09:41:37
不同的领域、框架,这是一份超全的深度学习模型GitHub集合

近日有开发者发布了一个模型聚合平台,我们可以分领域在上面搜索到当前最为流行的开源模型。作者根据 GitHub 项目收藏量、项目所属领域、实现框架等特点对这些模型分类,因此我们能快速定位合适的模型。

思源 晓坤 ·  2018-06-14 15:34:59
16个GitHub收藏和贡献率最高的深度学习框架

在本文中文摘菌将为大家详细介绍16种GitHub中最受欢迎的深度学习开源平台和开源库,除此之外,还有些比较不错的平台和框架虽然没有进入榜单。

文摘菌 ·  2018-05-10 07:45:26
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载