基于AI的存储正在帮助企业从数据中获取更多信息

作者: Karen D. Schwartz 2020-10-22 10:09:38

如果你能够把存储想象成一辆自动驾驶汽车,而不是一个需要亲自动手的、劳动密集型的必需品呢?如果是像自动驾驶汽车一样,你的存储基础架构也能够预测你需要什么,并在道路上进行路障导航呢?

根据你对新技术的容错性和你公司的文化,你可能已经利用了从应用程序的行为中学习、识别应用程序和配置中的异常并使用这些信息来预测和预防问题的技术了。

为这些核心技术赋能的正是人工智能。事实上,人工智能正在经历一个特殊的时刻,根据专家的说法,这种情况不太可能很快改变。麦肯锡最近的一项调查发现,近一半的公司目前在某些方面使用了人工智能,但绝大多数公司仍然预计,它们在人工智能领域的投资将在未来几年继续增加。

在满足当今的存储需求方面,人工智能也正在迅速变得至关重要。它能够使如此多的数据如此快速、智能地得到分析,并有助于避免瓶颈、可用性问题和安全问题。基于人工智能的存储将允许IT员工在灭火上花费更少的时间,并提高基础架构的可用性和生产效率。

HPE Storage的产品营销总监王大伟表示,该公司的目标是创建一个自动的、人工智能驱动的基础设施,几乎可以在瞬间提供洞察力。

“我们希望达到这样一个境界,即洞察力可以推动即时可见的变革,”他说。“有一种观点认为应该有端到端的人工智能管道,从本地的边缘一直延伸到云。”

从不同的角度看待问题

人工智能改变了存储的任务,这意味着企业也应该以不同的方式看待存储和数据,IBM存储营销总监Doug O'Flaherty说。

“你必须停止把存储看作是数据库或特定用例所需要的东西,而是要考虑如何以不同的方式来访问来自不同部门的数据,”他说。“如果你能让数据科学家或组织中其他跨部门职责的人访问这些数据,你就能进入到下一层次的数据分析,这将是真正改变存储的一个关键任务。”

除了从更广泛的角度来考虑外,重要的是要采用一种更加以应用程序为中心的方法来进行存储,而不是传统的以数据为中心的方法。

“在大数据人工智能世界的1.0版本中,公司认为他们必须是由数据来驱动的。因此,他们专注于将所有数据存储在存储库中以及该组中的所有人工智能人员,“Splice Machine首席执行官Monte Zweben解释说,该公司专注于分布式NoSQL数据库技术。

结果,他说,这些数据湖往往很快就变成了“数据沼泽”,这主要是因为负责业务流程的人没有考虑到这些业务流程中所使用的数据和应用程序。

通过关注应用程序而不是数据,你将能够更好地将存储及其功能与业务匹配起来。例如,处理大量索赔(业务流程)的保险公司将与负责索赔系统的索赔专家和应用程序开发人员一起来确定一个应用程序。通过把它们放在一起,他们可以更好地决定如何使用这些数据来创建一个智能索赔处理系统。

“这是为了让应用程序能够更智能地处理数据,而不是试图收集世界上的所有数据,然后把它们提供给那些可能对索赔感兴趣的人,”他说。“这是一个简单的想法,但它可以对企业如何实施人工智能产生深远的影响。”

建立一个成功的基于AI的存储基础设施也意味着解决了人工智能存储管道中的三个不同的阶段:数据摄入(从不同的环境中摄入和规范化数据,这样你就可以将其看作为一个整体),培训(使用机器学习研究数据来理解它真正的内容)和推理(提供见解的阶段)。

要满足这些要求,存储基础设施必须能够支持非常高的容量、长期的数据保留和高性能处理。换句话说,大规模的人工智能也需要大规模的能力、保留率和性能。

Storage Switzerland的首席分析师George Crump表示,支持高存储容量的能力是至关重要的。组织很少删除用于训练人工智能工作负载的数据点,因为获取这些数据的初始成本很高,他说。此外,这些数据集也不遵循典型的数据访问模型,即随着年龄的增长,使用的机会将会减少。“人工智能工作负载需要重新处理旧训练数据的几率几乎为100%,因此整个数据集需要时刻保持易于获取,”他补充道。

长期的保留也同样重要,特别是当存储容量不断增加时。

“我们的意思是,机器将根据输入的数据来做出决策。这意味着数据不能被删除。它将持续增长,”O'Flaherty说。“你拥有的数据越多,应用人工智能的准确性和效率也就越高。”

除了简单地存储更多的数据之外,你还必须存储更多类型的数据。其中包括有关数据(元数据)的数据,许多人认为,这些数据正在成为最有价值的商品之一,尤其是在数据治理方面。

第三个要求是高性能处理。

“训练人工智能应用程序是一个迭代的过程,(而且)提高精确度也会是一个反复训练的过程,调整人工智能算法,然后再次训练,”Crump说。“迭代的速度越快,开发人员制作的模型就越精确,这也就增加了存储基础设施的压力。”

在大多数人工智能工作负载中,关键是要确保这些环境中的标准图形处理单元(GPU)保持尽可能的繁忙,Crump说。取决于人工智能的工作负载,一个有许多节点、混合了闪存和硬盘的扩展存储系统是有意义的,Crump说。“人工智能的工作负载往往是非常并行的,而一个并行的、向外扩展的存储集群即使在硬盘驱动器上也可能会遇到挑战,”他说。

充分利用人工智能

对于刚起步的公司来说,通过从系统中提取数据并将人工智能方法应用于选定的数据集来寻找相关性,可以简单地扩充现有的数据。不过,最终你会想要深入一点。一旦将关键的应用程序和系统绑定在一起,要想获得人工智能的真正好处,就可能需要部署新的基础设施和新的处理数据方法。

你选择的基于人工智能的存储系统应该具有快速管理元数据的智能,并能够在正确的存储类型上存储正确的数据类型。Crump说,如果你选择在本地运行基础设施,你就可以从全闪存存储系统开始,但最终将其迁移到闪存和硬盘的混合环境也是有意义的。通常,环境还将包括软件定义的存储,它可以自动在环境之间移动数据。

有些组织则更喜欢把所有东西都保留在本地--尤其是那些有敏感的工作负载和遵从性/数据治理问题的组织--而其他组织则可以从基于云的人工智能/存储环境中获益。

“这其中有很大一部分是发生在云计算领域,因为云计算需要共享计算能力和数据,”HPE公司Nimble Storage的产品管理高级总监Rochna Dhand表示。“你从任何人工智能模型中得到结果的质量都会取决于训练这些模型的可用数据的多样性和数量,所以使用一个从云端收集全球数据的系统是很有意义的。”

同时,Dhand也说,HPE正在研究如何将HPE Insight在云端提供的相同类型的全球数据分析应用到用户的内部环境当中。她说,这样做的目的是为了把在云计算中获得的经验整理成代码,并将其作为防火墙后面的本地更新应用。

Dhand相信,随着时间的推移,技术会不断发展,基础设施管理也最终将会完全自动化。“你将能够预测并预防比现在更多的问题,而且你将对这些预测和预防更有信心,”她说。“你将不仅能够预测问题并确定解决问题的方法,还能够进一步的确定正确的解决方案并采取行动。”

AI 存储 数据
上一篇:人工智能伦理:首席信息官应问的五个问题 下一篇:Facebook正在开发一种使用VR键盘的输入方法
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

就算戴上口罩,AI也知道你在说啥

现在,检测面部肌肉变化的AI来了,只要你动了嘴,哪怕没出声,它也能知道你在说什么。

萧箫 ·  17h前
AI生成肖像画,精细到毛发!北大校友最新研究收割2.8k星标

这款AI工具叫U∧2-Net(U Square Net),最近火到不行!不仅登上了GitHub热榜,收割了2.8k星标,还被顶会ICPR 2020 选中。

贝爽 ·  18h前
5G和AI:现在和未来的互补技术

围绕人工智能和5G以及它们的变革潜力,科技界有很多热议。这两种技术的有趣之处在于,它们普遍适用于许多行业,并可能改变其中许多技术的运作方式。

佚名 ·  21h前
放飞无人机并非想飞就能飞

自古以来,人们就梦想着能像鸟儿一样翱翔蓝天,无论是童年的纸飞机,还是如今的无人机,放飞的都是人们对天空的热爱。但是无人机放飞并非想飞就飞。这不,第三届进博会期间,上海公安机关便查处了一起多次违规施放无人机、扰乱公共秩序的案件,这也是上海首次出现因违规施放无人机被依法行政拘留的案例。

中国民航网 ·  21h前
人工智能虚拟更衣室 零售商新的主流营销利器

COVID-19改变了世界各地人们日常行为的方式,在实体零售中,没有比这更敏锐的感觉了。几十年来,零售商一直在尝试各种客户参与策略,以吸引人们,让他们浏览样本并留心。但是大流行使几乎所有这些人都感到冒险和不愉快。试穿衣服,珠宝,化妆品和其他可穿戴产品的愿望使人身安全胜出。

AI国际站 ·  1天前
专利申请超全球!新崛起的中国人工智能,还有哪些你不知道的事

根据报告中的公开数据:美国和中国的互联网发展遥遥领先其他国家,且我国在人工智能专利申请数量方面首次超过美国,位居世界第一。

京东数科 ·  1天前
麦肯锡《2020年人工智能状况》报告:企业收入增长,AI真的出了力

那些早期采用人工智能技术,希望以此创造收入的企业如今已经取得了成果。

佚名 ·  1天前
AI改进建筑施工安全的十种方式

AI与机器学习技术通过实时分析24/7全天候视频流快速建立新的预测洞见以及威胁情境智能,由此减少建筑施工事故、盗窃、故障破坏以及其他危险操作行为。

佚名 ·  1天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载