人工智能如何拯救企业数据目录?

作者: Andy Hayler 2020-01-14 17:25:58

“数据目录”这一概念其实并不新鲜,早在大型机时代,企业就开始通过数据目录跟踪、管理其数据资产。数据目录保存的是与数据有关的数据,或称之为元数据。一个企业的数据目录需要记录遍及整个公司的所有数据库和文件,并为其添加描述,例如,如果有可能的话,对文件与文件之间的关系进行记录。

数据目录允许业务用户快速找到他们所需的信息源——无论是资产数据、公司的地理位置,还是产品和供应商的信息。但是,数据目录只有在保持最新的情况下才能保证有效——而在一个快速变化的行业中,这可能很难做到。

人工智能如何拯救企业数据目录?

元数据和数据目录

理解元数据的一个简单方法是用电影来类比。电影存储在广播公司的电影库中,但是您需要保存的不仅仅是电影的标题。重要的是要知道这部电影的时长是多少、里面有哪些演员、谁是导演、谁是编剧、以及关于剧本的信息,所有这些都是关于电影的元数据。

想必大家对数据目录、数据字典和业务术语表等概念也已经大概了解了。业务术语表针对的是业务用户,而数据词典针对的是更懂技术的受众,两者之间存在着细微的差别。不过这三个概念都明显与元数据有关——而且它们都面临着类似的挑战。

企业数据目录的挑战

早期的数据目录主要关注技术数据,比如数据库中有多少字段、字段是基于数字还是基于字符、字段有多长以及它是否有一个有效值范围。后来,该定义被扩展为包括关于业务数据类型的信息,甚至包括该数据的定义,例如什么是“客户”、“产品”或“资产”。

其中有一个关键问题在于,企业数据目录可能会过时。通常情况下,热心的员工会输入关于各种系统和数据库内容的信息,但是却没有什么动力来时刻保证这些信息都是最新的。当新系统部署完成、整个公司被收购且它们的系统被添加到企业投资组合中,或者进行重组时,那些费力输入的描述性元数据会变得过时,以至于不再受信任,然后就不用了。

虽然许多公司花了很多精力来实现有效的目录,但是随着业务的快速变化,很少有公司会持续努力保持企业数据目录完全同步。因此,尽管今年来有几家软件供应商提供了数据目录、数据字典和业务术语表等产品服务,但并未得到真正意义上的广泛普及。

AI和企业数据目录

在数据量和数据种类不断增加的时代,让企业数据目录保持最新,已经变得越来越困难。但是,人工智能等技术的应用,获取可以对此状况有所改变。

机器学习应用程序可以筛选企业数据目录和文件系统,自动收集元数据标记,整个过程类似于谷歌在互联网上搜索网站并进行编目和索引的方式。将此技术应用于数据目录,可以帮助企业实现自动填充和更新——不需要人工干预。这可以解决阻碍企业数据目录的关键问题:需要人工做许多繁复的工作。可以预见,人工智能很可能将帮助数据目录市场蓬勃发展。

人工智能 机器学习 数据目录
上一篇:报告:2022年中国人工智能产业规模逼近300亿美元 下一篇:人工智能还是人工智障?那些想不到的大型算法翻车现场
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

MIT提出Liquid机器学习系统,可像液体一样适应动态变化

麻省理工学院(MIT)的研究者开发出了一种新型的神经网络,其不仅能在训练阶段学习,而且还能持续不断地适应。

机器之心 ·  2021-02-21 15:47:47
规划智慧城市时,别忘了无障碍通行

要想成为一个智慧城市甚至一个智慧世界,虽然可能需要时间和有针对性的规划,但我们必须以人为本。

蒙光伟 ·  2021-02-21 10:26:41
2021关于人工智能的五大趋势

数字化变革,比过去10年更多,这主要是由于远程工作的规模,以及企业迅速部署了必要的技术,尤其是与网络安全相关的技术。那,2021关于人工智能的五大趋势会是如何的呢?

Lichu ·  2021-02-21 10:21:01
使数据中心更智能:人工智能如何发挥作用?

随着数据成为维持几乎所有业务运营以获取洞察力和业务成果的先决条件,数据中心正处于这种数字化转型的关键。

Cassie ·  2021-02-21 10:14:59
IBM拟出售Watson Health后,AI医疗还能不能碰

医疗服务仍然是一块商业上尚未被完全发掘的市场,看病难/看病贵、医疗资源紧缺、医疗资源不平均等痛点问题长期存在,对应的市场空间理应是巨大的。而Watson Health作为IBM曾寄予厚望的业务方向,为何要在此时萌生退意?它的故事给业界带来哪些启发?眼下的AI医疗市场,究竟是一副什么样的局面呢?

物联传媒 ·  2021-02-21 08:41:16
抛弃归一化,深度学习模型准确率却达到了前所未有的水平

我们知道,在传递给机器学习模型的数据中,我们需要对数据进行归一化(normalization)处理。

机器之心 ·  2021-02-20 21:09:12
华人博士生首次尝试用两个Transformer构建一个GAN

最近,CV 研究者对 transformer 产生了极大的兴趣并取得了不少突破。这表明,transformer 有可能成为计算机视觉任务(如分类、检测和分割)的强大通用模型。

Yifan Jiang ·  2021-02-20 21:04:53
无监督训练用堆叠自编码器是否落伍?ML博士对比了8个自编码器

柏林工业大学深度学习方向博士生 Tilman Krokotsch 在多项任务中对比了 8 种自编码器的性能。

Tilman Krokotsch ·  2021-02-20 20:57:16
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载