对于机器学习,到底该选择哪种编程语言

作者: 佚名 2017-11-14 06:10:15

开发者到底应该学习哪种编程语言才能获得机器学习或数据科学这类工作呢?这是一个非常重要的问题。我们在许多论坛上都有讨论过。现在,我可以提供我自己的答案并解释原因,但我们先看一些数据。毕竟,这是机器学习者和数据科学家应该做的事情:看数据,而不是看观点。

让我们看一些数据。我将在Indeed.com上使用趋势搜索。它可以根据时间搜寻实际工作机会中特定的条款。这表明了雇主们正在寻找拥有该技能的人才。然而,请注意,这并不是一项有效使用技能的民意调查。这种指标更能体现技能的受欢迎程度。

话不多说,上数据。我搜索了与“机器学习”和“数据科学”一起使用的技能,搜索选项包括编程语言Java、C、C+++和JavaScript。然后还包括了Python和R,因为我们知道它在机器学习和数据科学方面很受欢迎,当然还有Scala,考虑到它与Spark的关系,再加上Julia,一些开发中认为这是“the next big thing”。运行这个查询,我们得到的数据如下:

运行这个查询“the next big thing”。

当我们关注机器学习时,我们得到了类似的数据:

当我们关注机器学习时,我们得到了类似的数据

我们能从这些数据中得到什么启示呢?

首先,我们看到并不是一招通吃。在这种情况下,各种机器学习编程语言都很受欢迎。

其次,所有这些编程语言都在急剧增长,反映出在过去几年里,企业对机器学习和数据科学的关注和需求正在急速增加。

第三,Python很明显的***,其次是Java,然后是R,再然后是C++。Python对Java的领先优势正在增加,而Java在R上的领先地位正在下降。必须承认,我很惊讶地看到Java名列第二;我本来是以为是R语言。

第四,Scala的增长令人印象深刻。它在三年前几乎是不存在的,现在和这些成熟的编程语言几乎在同一个层面。当我们切换到Indeed.com上的数据的相对视图时,这更容易发现。

第五,Julia的受欢迎程度虽然不明显,但肯定有上升的趋势。Julia将成为一种流行机器学习和数据科学编程语言吗?未来会告诉你。

如果我们忽略Scala和Julia,以便能够聚焦其他编程语言的增长,那么我们毫无疑问可以确认:Python和R的增长速度要快于通用语言。

考虑到增长率的差异,R的受欢迎程度可能很快就会超过Java。

当我们专注于深度学习这个问题时,数据是完全不同的:

这时,Python仍然是***,但C++现在是第二,然后是Java,而C在第四,R只在第5。这里显然强调了高性能计算语言。Java正在快速发展。它可以很快达到第二名,就像一般的机器学习一样。R不会很快接近顶部。令我惊讶的是Lua的缺席,尽管它在一个主要的深度学习框架(orch)中使用,而Julia不存在。

到这时,到底哪种语言才是***的编程语言呢?答案应该很清楚了。当涉及到机器学习和数据科学工作时,Python、Java和R是***的技能。如果你想专注于深度学习,而不是一般的机器学习,那么,在某种程度上来说C++、C也是值得考虑的。然而,请记住,这只是看待问题的一种方式。如果你想找一份工作,或者你只是想在业余时间学习机器学习和数据科学,你可能会得到不同的答案。

我的个人答案呢?除了有许多***机器学习框架的支持之外,Python对我来说很适合,因为我有计算机科学的背景。对于开发新的算法,我也会感到很舒服,因为我的大部分职业生涯都是用这种语言编程的。但这就是我,有不同背景的人可能会觉得用另一种语言更好。一个拥有有限编程技能的统计学家肯定会更喜欢R。一个强大的Java开发人员可以使用他最喜欢的语言,因为有大量的Java API的开放源代码。对于这些图表上的任何一种语言,都可以有类似的例子。

因此,我的建议是,在花大量时间学习一门语言之前,根据自己的情况来决定选择哪种编程语言,切记千万不可跟风。

机器学习 编程语言 数据科学
上一篇:AI时代的云端智能计算 下一篇:深度学习高手该怎样炼成?这位阿里天池大赛冠军为你规划了一份专业成长路径
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

数据机器学习在故障检测中的应用

本文将简要介绍几种在故障诊断领域广泛应用的机器学习技术及其各自的应用方向,并对每种技术的优缺点进行简单分析。包括:贝叶斯网络(BN),人工神经网络(ANN),支持向量机(SVM)和隐马尔可夫模型(HMM)技术。

交能网 ·  1天前
人工智能如何改造旅游业

旅游业正在慢慢地将人工智能融入到行业当中,并为游客提供个性化定制体验。在人工智能的帮助下,旅游业的业务流程和客户服务都发生了改变。

佚名 ·  1天前
治愈大脑,人机共生,马斯克为“脑机接口”辩护

随着今年年初特斯拉中国工厂正式开始交付特斯拉 model3 型号电动汽车,特斯拉的股值不断飙升,与此同时特斯拉和马斯克也在新闻媒体上赚足了眼球。

学术君 ·  2天前
如何在Kaggle上打比赛,带你进行一次完整流程体验

Kaggle是一个磨练您的机器学习和数据科学技能的好地方,您可以将自己与他人进行比较,并学习新的技术。在这篇文章中,我们利用一个典型的例子,来给大家演示如何参加Kaggle竞赛。

机器学习与数据分析 ·  3天前
一文读懂即将引爆的TinyML:在边缘侧实现超低功耗机器学习

人工智能AI正在加快速度从“云端”走向“边缘”,进入到越来越小的物联网设备中。在终端和边缘侧的微处理器上,实现的机器学习过程,被称为微型机器学习,即TinyML。

物女王 ·  3天前
谷歌发布TyDi QA语料库,涵盖11种不同类型语言

为了鼓励对多语言问答技术的研究,谷歌发布了 TyDi QA,这是一个涵盖了 11 种不同类型语言的问答语料库。

Jonathan Clark ·  4天前
机器学习所需的工程量未来会大大减少 精选

未来,构建 ML 产品将更加有趣,并且这些系统会工作得更好。随着 ML 自动化工具的不断改进,数据科学家和 ML 工程师将把更多的时间花在构建优秀的模型上,而花在与生产级 ML 系统相关的繁琐但必要的任务上的时间会更少。

David LiCause ·  4天前
意料之外 情理之中:解读Gartner 2020年数据科学和机器学习平台魔力象限

最近Gartner发布了数据科学和机器学习(DSML)平台魔力象限报告。数据科学、机器学习和人工智能的市场格局极为分散,竞争激烈且难以理解。Gartner尝试根据明确定义的标准对厂商进行了排名。

佚名 ·  2020-02-21 17:23:21
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载