Amazon SageMaker简介

作者: 佚名 2018-08-22 12:35:01

Amazon SageMaker 是一个完全托管的平台,可以帮助开发人员和数据科学家快速轻松地构建、训练和部署任何规模的机器学习模型。Amazon SageMaker 消除了通常会阻碍开发人员使用机器学习的所有障碍。

Amazon SageMaker简介

大多数开发人员通常觉得机器学习要比它本身难得多,因为构建和训练模型,然后将其部署到生产中的流程过于复杂,并且速度太慢。首先,您需要收集和准备训练数据,以发现数据集中哪些是重要元素。然后,您需要选择要使用的算法和框架。确定方法后,您需要通过训练教模型如何进行预测,这需要大量的计算。接下来,您需要调整模型,以交付可能的最佳预测,这通常需要繁琐的手动工作。开发出经过完全训练的模型后,您需要将该模型与您的应用程序集成,并在可扩展的基础设施上部署此应用程序。这一切操作都需要大量的专业知识,需要访问大量的计算和存储,并需要大量的时间对流程的各个方面进行试验和优化。如此看来,大多数开发人员觉得这一切都无法实现也并不奇怪。

Amazon SageMaker 消除了阻碍开发人员成功完成每个步骤的复杂性。Amazon SageMaker 包含一些可同时或单独用以构建、训练和部署机器学习模型的模块。

工作原理

构建

Amazon SageMaker 提供了快速连接到您的训练数据所需的所有内容,从而轻松构建 ML 模型并为训练做好准备,并且还可以轻松为您的应用程序选择和优化最佳算法和框架。Amazon SageMaker 包含托管的 Jupyter 笔记本,您可以轻松浏览和可视化在 Amazon S3 中存储的训练数据。您可以直接连接到 S3 中的数据,或者使用 AWS Glue 将数据从 Amazon RDS、Amazon DynamoDB 和 Amazon Redshift 移动到 S3 以在笔记本中进行分析。

为了帮助您选择算法,Amazon SageMaker 包含最常用的机器学习算法,这些算法已预装好并经过优化,与在任何其他地方运行些算法相比,最多可以将性能提高 10 倍。此外,Amazon SageMaker 还经过预配置,能在 Docker 容器中运行 TensorFlow、Apache MXNet 和 Chainer。您还可以将这些开源容器下载到本地环境中,然后在使用 Amazon SageMaker 在生产环境中训练或托管模型前,使用 Amazon SageMaker Python 开发工具包以本地模式测试脚本。您也可以选择使用自己的框架。

训练

只需单击一下,您就可以在 Amazon SageMaker 控制台中开始训练您的模型。Amazon SageMaker 为您管理所有底层基础架构,并且可以轻松以 PB 级扩展以训练模型。为了使训练过程更快更轻松,Amazon SageMaker 可以自动调整您的模型以达到最高的精度。

部署

当模型经过训练和调整后,Amazon SageMaker 可以轻松在生产环境中进行部署,以便您可以开始针对实时或批量数据生成预测(该过程称为推理)。Amazon SageMaker 在跨多个可用区的 Amazon SageMaker ML 实例的自动扩展集群上部署您的模型,以实现高性能和高可用性。Amazon SageMaker 还包含内置的 A/B 测试功能,以帮助您测试模型并试验不同的版本以获得最佳效果。

Amazon SageMaker 承担了机器学习的繁重工作,因此,您可以快速轻松地构建、训练和部署机器学习模型。

优势

使用机器学习快速部署到生产中

Amazon SageMaker 可显著缩短训练、调整和部署机器学习模型所需的时间。 Amazon SageMaker 可管理和自动使用所有复杂的训练和调整技术,因此您可以将模型快速部署到生产中。

选择任意框架或算法

Amazon SageMaker 支持所有机器算法和框架,因此您可以使用自己已经熟悉的技术。Apache MXNet、TensorFlow 和 Chainer 已预先安装,并且 Amazon SageMaker 可提供大量内置的高性能机器学习算法。如果您想使用其他框架或算法进行训练,可以在 Docker 容器中应用您自己的框架或算法。

一键式训练和部署

使用 Amazon SageMaker,您只需在控制台中单击一下或通过一个简单的 API 调用,即可开始训练模型。训练完成并且您已做好准备部署模型后,只需在 Amazon SageMaker 控制台中单击一下,即可启动该模型。

轻松与您的现有工作流程集成

Amazon SageMaker 采用三个模块设计,这些模块可同时使用或单独作为您可能已准备好的任何现有 ML 工作流程的一部分使用。

轻松访问经过训练的模型

Amazon SageMaker 提供了可从任意应用程序调用的 HTTPS 终端节点,可轻松地将机器学习模型集成到您的应用程序中。

针对速度进行了优化

Amazon SageMaker 预先配置了最新版本的 TensorFlow、Apache MXNet 和 Chainer,以及带有 NVIDIA GPU 的 CUDA9 库,可提供最高性能。借助运行 NVIDIA Volta V100 GPU 的 Amazon SageMaker P3 实例,Amazon SageMaker 让您能够以无与伦比的速度训练深度学习模型。

Amazon SageMaker 机器学习
上一篇:Amazon Rekognition简介 下一篇:Amazon Transcribe简介
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

高位截瘫患者重新行走:靠意念指挥外骨骼,法国脑机接口新突破

依靠介入头部的 2 个传感器,法国里昂的一名瘫痪男子 Thibault 实现了操控外骨骼装备来助力行走。

孙滔 ·  21h前
2008 年预测 2020 年生活方式:基本都实现了

美国皮尤研究中心曾在 2008 年预测 2020 年的生活方式,目前来看,该研究的预测基本已经实现。而对于未来 10 年,也就是 2030 年左右人们的生活,在 2017 年底的世界经济论坛上,800 多名信息和通讯技术领域的技术高管和专家给出了如下预测。

佚名 ·  21h前
机器学习的正则化是什么意思?

正则化的好处是当特征很多时,每一个特征都会对预测y贡献一份合适的力量;所以说,使用正则化的目的就是为了防止过拟合。

佚名 ·  21h前
为什么我的CV模型不好用?没想到原因竟如此简单……

机器学习专家 Adam Geitgey 近日发布了一篇文章探讨了这一简单却又让很多人头痛的问题,并分享了他为解决这一问题编写的自动图像旋转程序。

机器之心 ·  22h前
机器学习与预测分析的区别在何处? 精选

如今,认知学习的应用比以往更为普遍。通常意义上讲,认知学习与认知计算就是涉及AI技术与信号处理的操作过程或技术平台。

读芯术 ·  1天前
大盘点:8月Github上7个值得关注的数据科学项目

本文带你来看看GitHub上创建于2019年8月的7个数据科学项目。笔者所选项目的范围十分广泛,涉及从机器学习到强化学习的诸多领域。

读芯术 ·  1天前
非监督学习最强攻略

本次主要讲解的内容是机器学习里的非监督学习经典原理与算法,非监督,也就是没有target(标签)的算法模型。

SAMshare ·  1天前
PyTorch终于能用上谷歌云TPU,推理性能提升4倍,该如何薅羊毛?

Facebook在PyTorch开发者大会上正式推出了PyTorch 1.3,并宣布了对谷歌云TPU的全面支持,而且还可以在Colab中调用云TPU。

晓查 ·  1天前
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载