斯坦福全球AI报告:人才需求两年暴增35倍,中国机器人部署量涨500%

作者: 关注前沿科技 2018-12-14 11:48:24

刚刚,斯坦福全球AI报告正式发布。

从去年开始,斯坦福大学主导、来自MIT、OpenAI、哈佛、麦肯锡等机构的多位专家教授,组建了一个小组,每年发布AI index年度报告,全面追踪人工智能的发展现状和趋势。

“我们用硬数据说话。”报告的负责人、斯坦福大学教授、前任谷歌首席科学家Yoav Shoham谈到这份最新的报告时表示。

今年的报告,从学术、工业、开源、政府等方面详细介绍了人工智能发展的现状,并且记录了计算机视觉、自然语言理解等领域的技术进展。

 

报告要点:

一、美国AI综合实力最强

美国的AI论文发布数量虽然不是第一,但美国学者论文被引用的次数却是全球第一,比全球平均水平高出83%。

2018年美国AI创业公司的数量,比2015年增长2.1倍。而从2013年到2017年,美国AI初创企业获得的融资额增长了4.5倍。均高于平均水平一倍以上。

二、中国AI追赶速度惊人

清华2017年学AI和机器学习的学生数量,是2010年16倍。

70%的AAAI论文来自美国或中国,两国获接收的论文数量相近,但中国提交的论文总量比美国多30%。

基于经同行评议论文数据库Scopus的数据,2018年发布AI论文最多的地区是欧洲(28%)、中国(25%)和美国(17%)。

与2000相比,2016年中国AI学者论文被引用的次数,提高了44%。

中国一年的机器人部署安装量,从2012到现在增长了500%。ROS.org来自中国的访问量,2017年比2012年增加了18倍。

三、全球AI发展提速但仍不均衡

2017年,全球ML人才需求已经是2015年的35倍。

整体来说,自2016年以来,美国、加拿大、英国政府在国会/议会会议中对人工智能和机器学习的提及激增。

80%的AI教授是男性,统计数据来自UC伯克利、斯坦福、UIUC、CMU、UC London、牛津和苏黎世联邦理工学院。

美国AI工作岗位的应聘者中71%为男性。

 

看过这份报告之后,人工智能大牛吴恩达总结了两点:1、AI正在快速发展,不管是学术界还是工业界都是如此。2、AI的发展仍不均衡,在多样性、包容性方面仍需努力。

以下是这份报告的主要内容:

AI论文情况分析

发表总量增长迅猛

 

从1996年到2017年,CS领域的年发表论文增长了约五倍 (6x) ,AI领域的年发表论文增长了约七倍 (8x) 。对比一下,所有学科的年发表论文总量增长了不到两倍 (<3x) 。

划重点,AI论文的年发表量,比CS论文增长要快。

各地区AI论文发表情况

 

2017年,Scopus上面的AI论文,有83%来自美国以外的地方。具体数据是,28%来自欧洲,25%来自中国,17%来自美国。

从2007年到2017年,中国的年发表AI论文数增长了150%。

细分领域论文发表情况

 

2017年发表的AI论文中,有56%来自机器学习与概率推理这一研究方向。

对比一下,2010年发表的AI论文,只有28%来自这个方向。

另外,图表里显示的大部分研究方向,在2014-2017年间,复合年均增长率 (CAGR) 比2010-2014年要高。

比如,神经网络这一方向的论文发表数量,2014-2017年之间,复合年均增长率达到37% (如图中红色曲线) ,最为突出。

做个对比,在2010-2014年之间,神经网络论文发表数,复合年均增长率仅有3%。

arXiv论文

 

自2010年以来,arXiv论文总体呈现迅速增长,从2010年发布的1,073篇,到2017年发布的13,325篇,增长超过11倍 (12x) 。许多细分领域也呈现增长。

这表示,论文作者们倾向于把自己的研究成果传播出去,不论是经过同行评审还是在AI会议上发表的论文。这也体现了,AI这个领域竞争激烈的特质。

在细分领域中,计算机视觉 (CV) 是自2014年起增长最快的一个 (上图蓝色曲线) ,从1,099篇增长到2017年的4,895篇,涨幅近400%。

AI论文引用量

 

FWCI是领域权重引用影响系数,可以用来衡量论文的影响力。

报告重新定义了一种“改装版” (Re-based) 的FWCI,不按地区,而按世界平均值,来计算影响力。

在这个标准之下,虽然欧洲发表的AI论文数高于中国和美国,不过论文影响力曲线比较平缓;相比之下,中国发表的论文影响力增长剧烈:与2000年相比,2016年平均每位中国AI论文作者的引用率增长了44%。

不过在这方面,美国依然全球领先,美国AI论文作者的平均引用率,比世界平均值高出83%。

AAAI论文

 

AAAI 2018,提交论文,中美占70%,中选论文,中美占67%。

中国的论文提交数高出美国约1/3,但二者中选论文数相差无几,中国入选265篇,美国入选268篇。

高校AI课程注册情况

 

AI和ML进军高校的速度提升了不少。

报告显示,截止到2017年底,AI课程注册人数是2012年的3.4倍,ML课程注册人数是2012年的5倍。

其中,UC伯克利的ML课程的注册人数增长最快,是2012年的6.8倍,但此数值较2016年增长速度有明显下降。

 

报告进一步统计了非美国地区院校AI+ML课程注册人数的变化。结果显示,清华是非美国院校外增长率最高的高校,几乎是第二名多伦多大学的2倍。

纵向对比来看,清华2017年AI+ML课程注册人数是2010年的16倍。

学术会议热度

 

在大型会议中,NeurIPS (曾用名NIPS) 、CVPR和ICML,是参与人数最多的三大AI会议。自2012年以来,论参与人数的增长率,这三者也领先于其他会议。

NeurIPS和ICML参与人数增长最快:将2018年与2012年相比,NeuRIPS增长3.8倍 (4.8x) ,ICML增长5.8倍 (6.8x) 。

上面讨论的是大型会议,但小型会议的参与人数同样有明显的增长,甚至可以比大型会议的增长更加明显。

这里最突出的是,ICLR 2018的参会人数达到了2012年的20倍。

原因很可能是近年来,AI领域越来越关注深度学习和强化学习了。

AI创业投资情况

 

从2015年1月到2018年1月,人工智能创业公司的数量增长到了原来的2.1倍,而所有活跃的创业公司增长到了原来的1.3倍。

大多数情况下,创业公司的增长都保持相对稳定,而人工智能创业公司呈指数级增长。

 

在风投资金方面,从2013年到2017年,人工智能领域的风投资金增长到了原来的4.5倍,而所有的风投资金只增长到了原来的2.08倍。这些数据都是年度数据,不是逐年累积的。

图表中有两个高峰期,1997-2000年风投资金的激增,对应的是网络泡沫时期。2014-2015年出现了一个较小的增长,因为当时正处于一个相对较大的经济增长时期。

人才需求

 

报告显示,近几年,社会需要的AI相关人才大幅度增加,目前对有ML技能的人才需求最大,其次是深度学习。

 

可以看出,ML人才需求也是这两年增长速度最快的。

报告统计,2017年,全球ML人才需求是2015年的35倍,从2016年到2017年的增幅尤为明显。全球对AI人才的需求在2016年骤增。

专利

2014年,大约30%的人工智能专利发明人来自美国,其次是韩国和日本,各拥有16%。

 

在韩国和中国台湾地区,专利的增长速度较快。2014年人工智能专利的数量几乎是2004年的5倍。

财报电话会议中提及AI和ML的次数

2015年,科技公司在财报电话会议中提及AI和ML的次数开始有所增加。

2016年,其他行业提及AI次数才开始增长。

相比之下,科技行业的公司提及AI和ML的次数远比其他行业多。

在财报电话会议中,除了科技行业之外,提及AI次数最多的公司,基本上分布在消费、金融和医疗保健行业。

机器人安装量

2012年到2017年,中国机器人年安装量增长了500%,其他地区,比如韩国和欧洲,分别增长了105%和122%。

在安装量较小的地区中,中国台湾比较突出,在2012-2017年增长最快。

开源框架GitHub标星数

各框架的标星数反映着他们在开发者群体中的流行程度。不过,因为开发者们日常不会“取关”GitHub项目,所以这些星星都是多年来积攒下的。

我们可以明显发现,TensorFlow的受欢迎程度在开发者中遥遥领先、稳步增长。

排除了第一热门,第二名和第三名分别是scikit-learn和BVLC/caffe。

TensorFlow官方力推的keras排到了第四,但近一年来几无增长势头。

另外两大热门PyTorch和MXNet分别排到了第七和第六,尤其是PyTorch,作为一个年轻的框架,自2017年初发布以来至今,GitHub标星数至少增长了4倍。获取新用户的势头很猛,不知道其中有多少被TensorFlow逼疯的人类。

各类任务最新成绩

这个部分分为CV和NLP两块,分别列举了各主流任务从发展之初到现在的成绩进步情况。

ImageNet图像识别准确率

2017年是ImageNet比赛的最后一届,2018年这项比赛就不再进行了。不过,验证集依然有人在用。

图中,蓝色的线条为ImageNet挑战赛历年的成绩变化,由于每年比赛所用的数据不同,旁边多了一条黄色线条,是以ImageNet 2012验证集为评价标准绘制的。

可以看出,到2015年,机器在图像分类任务上的能力已经明显超越了人眼,而即使比赛不再继续,学术研究者依然在认真推进该任务的表现。

这也侧面说明,如果一项工作有了明确的评价标准和固定的挑战内容,研究者们围绕此竞争,更容易让技术在该领域取得突破。

ImageNet训练速度

这张图是训练ImageNet图像分类神经网络所需时间的历年变化(当然,是买得起足够计算资源的人和机构所用的时长)。

从2017年6月的1小时,到2018年11月的4分钟,ImageNet图像分类神经网络的训练速度提升了16倍,除了硬件方面的贡献,算法上的提升也不容小觑。

图像分割COCO

ImageNet挑战赛“退休”之后,CV领域的朋友们就把重点放在了微软的COCO,挑战语义分割和实例分割。

四年来,COCO数据集上图像分割挑战的精确度已经提升了0.2,2018年的成绩比2015提升了72%。不过,目前还没有超过0.5,这一项还有充足的进步空间。

另外值得一提的是,COCO比赛近年来占据冠军位置的多是来自中国的公司,包括旷视、商汤等计算机视觉独角兽日常包揽数个项目的冠军。

语法分析(Parsing)

在确定句子结构这种语法分析的任务上,2003年到2018年的15年间,AI的表现(F1 Score得分)提升了将近10%。

机器翻译

在机器翻译任务上,报告拿英语-德语互相翻译举例,评估了AI模型在经典机器翻译评估算法BLEU标准中的表现。

报告显示,2018年英语转德语的BLEU评分是2008年的3.5倍,德语转英语成绩是2008年的2.5倍。

机器问答:AI2 Reasoning Challenge(ARC)

在问答领域,AI表现进步更明显,可以按月计数了。

报告统计了2018年从四月到11月间,AI在ARC推理挑战赛上成绩的变化:简单组得分从63%提升到69%,挑战组得分从27%提升到42%。

这些,都仅是半年间的进步。

机器问答:GLUE

同样用于机器问答的GLUE基准(General Language Understanding Evaluation)推出至今只有7个月的时间,但目前的表现已经比半年前提升了90%。

GLUE的推出者、纽约大学助理教授Sam Bowman说,虽然围绕GLUE的大型社区还没有出现,不过已经有了像谷歌BERT这样的代表性技术用了GLUE基准,面世一个月内已经被引用8次。在EMNLP会议中,GLUE时常被讨论,可能会成为语言理解领域中的一个基准线。

政府提及

  
 
 

整体来说,自2016年以来,美国、加拿大、英国政府在国会/议会会议中提及人工智能和机器学习的次数激增。

2016年之前,机器学习很少被提及,与人工智能相比,机器学习在总提及量中只占很小的一部分。

报告下载

目前,这份2018年度报告已经开放下载了,可以登录官网获取:

https://aiindex.org/

在量子位公众号(QbitAI)对话界面回复“94页报告”,也可直接下载PDF版报告一份~

AI 人工智能 机器人
上一篇:新零售风口之下,大数据及人工智能有哪些应用? 下一篇:人工智能的快速发展 推动零售行业迎来了第五次变革
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

500亿参数,支持103种语言:谷歌推出「全球文字翻译」模型

由于缺乏平行数据,小语种的翻译一直是一大难题。来自谷歌的研究者提出了一种能够翻译 103 种语言的大规模多语言神经机器翻译模型,在数据丰富和匮乏的语种翻译中都实现了显著的性能提升。

机器之心 ·  2天前
对于人工智能的恐惧及其5个解决方法

实施人工智能技术的IT领导人可能会感到一些恐惧,这有着充分的理由。人工智能在拥有数十年发展和应用历史的同时却有着奇怪的定位,但对于许多人来说,人工智能仍然是一种未来主义的感觉。

Kevin Casey ·  2天前
机器学习免费跑分神器:集成各大数据集,连接GitHub就能用

搞机器学习的小伙伴们,免不了要在各种数据集上,给AI模型跑分。现在,Papers with Code (那个以论文搜代码的神器) 团队,推出了自动跑分服务,名叫sotabench,以跑遍所有开源模型为己任。

栗子 鱼羊 ·  2天前
用AI实现动画角色的姿势迁移,Adobe等提出新型「木偶动画」

近日,Adobe 和康奈尔大学的研究人员提出一种基于学习的动画制作方法——基于卡通角色的少量图像样本就可生成新动画。

机器之心 ·  2天前
AI核心难点之一:情感分析的常见类型与挑战

情感分析或情感人工智能,在商业应用中通常被称为意见挖掘,是自然语言处理(NLP)的一个非常流行的应用。文本处理是该技术最大的分支,但并不是唯一的分支。情绪AI有三种类型及其组合。

Veronika Vartanova ·  2天前
AI新贵登上胡润百富榜:“CV四小龙”三家创始人上榜

AI造福人类,也造富了一些创业者。最近公布的2019胡润百富榜就是窥探老板们身价的好机会。

郭一璞 ·  2天前
大数据为什么不够聪明?机器要如何走向强人工智能

大数据为什么不够聪明?比概率语言更强大的思考工具是什么?科幻电影中的强人工智能到底怎样实现?如何让智能机器像人一样思考?搞清楚因果关系才能拨云见日。

明日情报 ·  2天前
2019 AIIA开发者大会新闻发布会在京召开

10月10日,2019 AIIA人工智能开发者大会新闻发布会在北京成功召开。据悉,2019 AIIA人工智能开发者大会暨第四届中国(杭州)人工智能产业发展论坛将于11月1日-2日在杭州召开。

佚名 ·  3天前
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载