为什么用Go编写机器学习的基础架构,而不是Python?

作者: 读芯术 2020-02-14 13:13:04

Python是机器学习项目中流行的语言,这点是毋庸置疑的。

虽然像R语言、C++和Julia这样的程序语言有其特有的使用群体与用例,使它们经久不衰,但Python仍是使用广泛的语言,并用于每个主要的机器学习框架中。

然而,你能想象?在Cortex(将机器学习模型部署为API的开放源代码平台之一)代码库中,87.5%的代码都是使用GO编写。

为什么用Go编写机器学习的基础架构,而不是Python?

图源: Cortex GitHub

Python引以为豪的机器学习算法只是生产环境机器学习系统的一个组成部分。如要实际大规模运行生产环境中的机器学习API,您的基础结构需要实现以下功能:

  • 自动缩放,确保流量波动不会破坏API
  • 实行API管理,以处理API同步部署
  • 滚动更新,确保更新模型不会中断用户服务

Cortex旨在自动实现所有上述基础架构,以及其他一些问题,例如日志记录和成本优化。

出于以下考虑,Go是构建满足上述需求软件的理想之选:

1. Go生态系统非常适合基础设施项目

来源:zcool

开源的好处之一就是您可以从自己欣赏的项目中不断学习。例如,Cortex存在于Kubernetes(本身用Go编写)生态系统中。很幸运,我们能够在该生态系统中参考许多出色的开源项目,其中包括:

  • kubectl: Kubernetes CLI
  • minikube: 一种在本地运行Kubernetes的工具
  • helm: Kubernetes软件包管理工具
  • kops: 管理生产Kubernetes的工具
  • eksctl: 亚马逊EKS的官方CLI

以上所有工具不仅仅是Kubernetes项目,并且都是用Go语言编写。无论是查看CockroachDB还是Hashicorp的基础设施项目(包括Vault, Nomad, Terraform, Consul和 Packer),您将发现它们均是使用Go语言编写。

Go在基础架构领域的流行还有另一个影响,那就是大多数对基础架构感兴趣的工程师都熟悉Go语言。所以,很容易通过GO吸引这些工程师。实际上,Cortex Labs最优秀的工程师之一就是通过在AngelList上搜索Go职位找到我们的。他找到了我们,我们感到非常幸运。

2. 并发对于机器学习的基础架构至关重要

用户可以将许多不同的模型部署为不同的API,并把所有模型都在同一个Cortex集群中以便管理。而Cortex Operator也需要通过一些API来管理这些不同的部署。举例:

  • Cortex调用Kubernetes API在集群上部署模型。
  • Cortex调用各种AWS API(包括EC2 Auto Scaling,S3,CloudWatch等)来管理AWS上的部署。

用户不会直接与这些API进行交互。相反,Cortex以编程方式调用这些API来提供群集,启动部署和监视API。

以一种高效、可靠的方式交叉调用API是一项重大挑战。采用并发的方式使用API是最高效的方法,但也引发了问题,因为现在我们不得不担心竞态条件之类的事情。

Go提供了一个解决该问题的简便方案:Goroutines。

Goroutines是Go以并发方式执行代码的普通函数。我们可以另写一篇长文深入探讨Goroutines背后的工作方式,但是概括而言,Goroutines是Go运行时自动管理的轻量级线程。多个Goroutine可以放置在一个OS线程上,如果Goroutine阻塞了OS线程,则Go运行时会自动将其余Goroutine移到新的OS线程上。

Goroutines还提供了一个称为“channel”的功能,此功能允许用户在Goroutines之间传递消息,帮助用户调度请求并预防竞态条件。

当然,用户也可使用asyncio等最新工具在Python中实现这些功能,但Go在设计时就考虑到了这些情况,使用GO可以减轻我们的工作和生活负担。

3. 使用Go语言编程是一种享受

为什么用Go编写机器学习的基础架构,而不是Python?

来源:Pexels

我们使用Go构建Cortex的最后一个理由就是:Go语言真的非常好。

相对于Python,Go的入门有点痛苦。但是,Go的包容性能为大型项目带来舒适感。我们仍然在严格测试软件,但静态输入和编译(Go初学者的两大难题)充当了我们的护栏栏,有助于我们编写(相对而言)没有错误的代码。

您可能会说其他语言也会提供特定的优势,但总的来说,Go最大限度地满足了我们的技术和美学需求。

4. 使用Go构建跨平台的CLI更容易

Cortex CLI是一个跨平台工具,允许用户直接从命令行部署模型并管理API。以下动图显示了运行中的CLI:

为什么用Go编写机器学习的基础架构,而不是Python?

图源: Cortex GitHub

最初,我们使用Python编写CLI,但事实证明,跨平台分发CLI太困难了。而Go可以编译二进制文件(无需依赖管理),为我们提供了跨平台分发CLI的便捷易行方案,而无需进行额外的工程工作。

Go编译的二进制代码与解释型语言相比,具有显而易见的性能优势。根据计算机基准测试结果,GO的速度远胜Python。

许多其他的基础设施CLI工具也是用GO编写,这可能并非偶然。

Python适用于机器学习,而Go适用于基础架构

我们也很喜欢Python,它在Cortex中占有一席之地,特别是在处理推理方面。

Cortex服务于TensorFlow,PyTorch,scikit-learn和其他Python模型,这意味着与模型的接口,推理之前和之后的处理均在Python中完成。但是,即使Python代码经过打包部署到了Docker容器中,这些容器是由用Go编写的代码精心编排的。

为什么用Go编写机器学习的基础架构,而不是Python?

来源:Pexels

如果您有兴趣成为一名机器学习工程师,那么必须熟悉掌握Python。但是,如果您对使用机器学习的基础结构感兴趣,认真考虑一下Go语言,一定会收获满满~

Go 机器学习 Python
上一篇:人工智能和区块链如何在2020年彻底改变移动应用产业? 下一篇:支付宝人脸识别被“破解”,我们的钱不安全了么?
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

快来!建立你的第一个Python聊天机器人项目

利用Python,我们可以实现很多目标,比如说建立一个你专属的聊天机器人程序。聊天机器人程序不光满足个人需求,它对商业组织和客户都非常有帮助。大多数人喜欢直接通过聊天室交谈,而不是打电话给服务中心。

读芯术 ·  1天前
治愈大脑,人机共生,马斯克为“脑机接口”辩护

随着今年年初特斯拉中国工厂正式开始交付特斯拉 model3 型号电动汽车,特斯拉的股值不断飙升,与此同时特斯拉和马斯克也在新闻媒体上赚足了眼球。

学术君 ·  1天前
如何在Kaggle上打比赛,带你进行一次完整流程体验

Kaggle是一个磨练您的机器学习和数据科学技能的好地方,您可以将自己与他人进行比较,并学习新的技术。在这篇文章中,我们利用一个典型的例子,来给大家演示如何参加Kaggle竞赛。

机器学习与数据分析 ·  2天前
一文读懂即将引爆的TinyML:在边缘侧实现超低功耗机器学习

人工智能AI正在加快速度从“云端”走向“边缘”,进入到越来越小的物联网设备中。在终端和边缘侧的微处理器上,实现的机器学习过程,被称为微型机器学习,即TinyML。

物女王 ·  2天前
谷歌发布TyDi QA语料库,涵盖11种不同类型语言

为了鼓励对多语言问答技术的研究,谷歌发布了 TyDi QA,这是一个涵盖了 11 种不同类型语言的问答语料库。

Jonathan Clark ·  3天前
机器学习所需的工程量未来会大大减少 精选

未来,构建 ML 产品将更加有趣,并且这些系统会工作得更好。随着 ML 自动化工具的不断改进,数据科学家和 ML 工程师将把更多的时间花在构建优秀的模型上,而花在与生产级 ML 系统相关的繁琐但必要的任务上的时间会更少。

David LiCause ·  3天前
意料之外 情理之中:解读Gartner 2020年数据科学和机器学习平台魔力象限

最近Gartner发布了数据科学和机器学习(DSML)平台魔力象限报告。数据科学、机器学习和人工智能的市场格局极为分散,竞争激烈且难以理解。Gartner尝试根据明确定义的标准对厂商进行了排名。

佚名 ·  2020-02-21 17:23:21
DeepMind发布神经网络、强化学习库,网友:推动JAX发展

JAX由谷歌提出,是TensorFlow的简化库。结合了针对线性代数的编译器XLA,和自动区分本地 Python 和 Numpy 代码的库Autograd,在高性能的机器学习研究中使用。

十三 ·  2020-02-21 15:33:44
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载