二十年一轮回 AI将数据中心架构再次拖向分裂?

作者: 张?? 2019-02-25 12:37:21

自从Alpha GO战胜人类围棋选手以来,AI就成为了整个商业社会中热度最高的一个名词。在AI的背后是对传统商业模式的巨大颠覆和对社会生产力的空前解放。虽然AI很可能在未来淘汰掉一部分重复性劳动很高的工作岗位,但因此所释放出的劳动力将在未来把人类的创造力推向新的高峰。

但除了已经沦为陈词滥调的AI光明未来,在实际的应用中,AI技术却仍旧处于萌芽状态。在目前的阶段,人工智能——Artificial Intelligence仍旧处于相当初级的阶段,还只能根据海量数据所构建出的模型来完成应用中的推理与判断,离真正的自主型人工智能或根据有限信息来自主拓展模型并作出判断的强人工智能还有很大的差距。

不过由于目前AI开发与应用的主要模式已经确认,对应的研究手段也就变得明确起来。在现有的技术方向下,企业需要利用神经网络技术并使用机器学习、深度学习算法来构建模型,在根据模型来开发对应的软硬件解决方案。而无论是训练AI模型还是利用AI模型来进行推理判断,强大的运算能力都是必不可少的。

AI两端的不同景象

在模型训练方面,由于输入的数据类型和使用的DL/ML框架不同,硬件不仅需要有强大的并行计算和浮点能力,更要具备强大的灵活性。但这两种需求都不是传统x86服务器所擅长的,因此就需要与x86异构的协处理器来完成对应的模型训练任务。在这一领域,最大的赢家无疑就是NVIDIA。面对这一市场的巨大需求和丰厚利润,NVIDIA不仅推出了针对不同性能和应用环境的多款GPU产品,更推出了对应的一体机甚至是为大规模GPU互联提供更高带宽的NVLink总线。此外,针对云数据中心的虚拟化环境和相关训练程序的开发,NVIDIA也有专门的GRID虚拟化技术及提高并行运算效率的CUDA语言。

以庞大的产品研发投入,NVIDIA几乎占领了AI中的模型训练市场。不过在利用成品模型进行实际问题的推理判断领域,NVIDIA却还没有获得相应的统治地位。

利用AI模型(程序)进行实际问题的推理和判断仍旧需要对应的硬件系统拥有强大的运算能力。但与模型训练的复杂场景不同,由于需要运行的程序和处理的数据类型的相对固定,硬件系统并不需要很高的灵活性。相反,在实际的AI应用场景中,用户往往对硬件的采购成本、能效和部署效率有着更高的要求。

于是,专门对应某种算法的AI芯片被越来越多的制造了出来。最近在资本圈和市场上引起广泛关注的华为海思、寒武纪、地平线、比特大陆等公司都是这一领域的新贵。在产品形态上,他们大多采用ASIC方式将AI应用固化在芯片中,从而获得更低的成本和更高的性能及能效。当然,传统科技企业也没有在这一领域缺席,包括Google的TPU、Intel的Arria 10系列(FPGA芯片)和Xilinx的Versal芯片(FPGA)等也纷纷进入AI推理判断领域。

与AI模型训练领域中NVIDIA的一家独大不同,推理判断领域却呈现出了百家争鸣、群雄逐鹿的景象。

云数据中心的AI隐忧

随着云理念和云优势被越来越多的企业认可,云计算市场也经历着一轮又一轮的高速增长。而将AI能力通过云计算的形式交付给企业和用户也成为了AI技术迅速发展并取得广泛应用的前提条件。于是,对于云数据中心来说各类计算卡和AI芯片就成为了扩容建设的重中之重。

但随着云计算市场和应用集中趋势的愈发明显,很快,大型云数据中心就会发现,越来越多的GPU、ASIC、FPGA会开始堆满数据中心,他们分别运行着不同的程序、发挥着不同的作用、并且有着不同的管理方式。而这对于数据中心来说则是一种巨大的挑战。

二十年前,当时的CPU性能远没有现在的强大,而面对庞大的数据存储和管理压力,大多数企业都开始研发运行效率更高的ASIC芯片,并使之成为存储系统的核心功能实现单元。期初,这一思路取得了很好的效果,满足的用户的需求。但随着时间得推移,越来越多不同厂牌、不同管理框架、不同功能的ASIC也让存储网络的管理和运营成本直线飙升;最终受苦的仍旧是企业。直到现在,软件定义存储技术才开始慢慢扭转这一局面,将企业从存储系统结构的深渊中慢慢拉出来。

而现在,数据中心虽然已经实现了大面积的运化,但CPU+GPU+FPGA+ASIC的复杂计算架构却仍旧有可能将企业拖入AI基础设施的深渊,让数据中心重新面临二十年前的窘境。显然,这一切在目前仍未引起足够的重视。

诚然,AI的崛起能够让企业在数字化时代的竞争中获得巨大的优势,并有望彻底改变人们生活和企业运行的效率和方式,但这种粗放型的发展思路却仍旧值得数据中心管理者们的重视。

指望在复杂多变的AI市场建立统一的管理和运行框架在目前这个时间节点是不现实的;寄希望于初出茅庐的AI芯片独角兽们从整个数据中心未来管理和运营的角度来设计产品也不太可能。但从市场的规律来看,在没有新的颠覆性技术出现之前,谁能够解决好这一问题谁才有可能成为AI硬件市场未来真正的赢家。

基于这一点,最有希望成为赢家的仍旧是Intel和Google这样庞大企业。他们既有设计数据中心架构的能力与经验,也有引领行业发展的资本和实力。而隶属于华为的海思则也有可能凭借华为丰富的设备制造和系统构建背景获得未来市场的一杯羹。但对于地平线、比特大陆、寒武纪这样最近几年才崭露头角的新型企业来说,数据中心仍旧是一个庞大且无法掌控的存在,其未来最好的归宿或许仍旧是被收购。

当然,由于具备更相对更高的灵活性,FPGA和GPU方案仍旧可以很方便的与各种数据中心管理架构兼容,这对于近来股价持续下跌的NVIDIA来说或许是一个好消息。

AI 数据中心 架构
上一篇:2019年科技发展预测:云、大数据、AI、物联网和区块链 下一篇:数据清洗&预处理入门完整指南
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

AI核心难点之一:情感分析的常见类型与挑战

情感分析或情感人工智能,在商业应用中通常被称为意见挖掘,是自然语言处理(NLP)的一个非常流行的应用。文本处理是该技术最大的分支,但并不是唯一的分支。情绪AI有三种类型及其组合。

Veronika Vartanova ·  2天前
机器学习帮你预测电池寿命:精确了解电池还能充几次

电池寿命的确定,是移动硬件发展的重要一环,但是由于电池电化学反应的不确定性以及不同的使用环境和习惯,电池寿命变成了一门玄学。不过柏林的三位小伙伴,利用Tensorflow,在原有的预测体系基础上。更近一步,完成了电池的全寿命预测。

靓科技解读 ·  3天前
专家认为对“人工智能+教育”应持审慎态度

随着人工智能不断发展,人脸识别技术被越来越多地应用于校园中。据了解,一所知名大学2019级新生“刷脸”就能瞬间完成报到程序,系统是这所学校的学生研发的,学生对着摄像头,人脸识别系统就开始进行比对,眨眼间就能完成扫描,整个报到注册手续几乎不到一秒钟。

新华网客户端 ·  3天前
人脸识别有风险,美国全面禁止,可为什么中国却全面推广?

对于大多数人而言,最先接触的就是指纹识别,对指纹识别的了解程度也相对比较深一些,然而随着科技的不断发展,人脸识别也越来越普及,所谓的人脸识别就是基于人的脸部特征信息进行身份识别的一种生物识别技术,用摄像头或摄像机采集含有人脸的图像或视频,并自动在图像中检测和跟踪人脸,对其进行一系列的相关技术,最后进行辨别完成自己想要完成的项目。

测评前线说 ·  4天前
AI的时代,你的职业还在吗?

目前人工智能(Artificial Intelligence,简称AI)的技术到底发展到啥情况了?如果未来AI在我们社会上全面应用之后,会对咱们的生活会带来多大的帮助?

奎哥 ·  4天前
人工智能改善教育的32种方式

在人工智能赋能教育的实践探索上,国外已经有了许多工具和应用,总结起来,可以分为改进教学和改进管理两个大的方面,共32个细分领域。改进教学是人工智能对教与学实践的促进,改进管理则是对校园管理等后勤行政方面的效用提升。

就要买买买 ·  4天前
谁在为“AI+教育”试错买单?

在教育行业,似乎AI作为一个辅助工具出现更为合适,企业在资本浪潮簇拥着前进的时候,更应该想清楚是教育的本质,以及商业模式是否行得通,否则等资本的泡沫褪去,留下的也不过是满地鸡毛。

大鱼 ·  2019-10-09 16:49:57
人工智能图像放大器,完全免费!一键告别渣像素

你可以在互联网上找到一些解决方案,以快速进行拍摄后期制作。该AI图像放大器采用人工智能和机器学习技术放大任何图像。它可以保持图像质量而不会像素化。

科技有点牛 ·  2019-10-09 14:47:26
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载