偶数科技构建新一代数据仓库,与AI应用场景更契合

作者: 杜宁 2018-07-10 11:02:48

【51CTO.com原创稿件】现如今的信息化社会,已经被各类信息资源所充斥,如何有效地管理和利用各类信息资源,是进行科学研究和决策管理的前提条件,数据处理是管理信息系统必不可少的核心部分。从人工管理阶段到文件系统阶段再到现在的数据库系统阶段,数据处理在近几十年经历了质的飞跃。

偶数科技CEO常雷近日接受51CTO的专访时表示,新一代的数据库应该与AI大脑层面相对应,更契合人工智能应用场景。所以,偶数科技抓住了这个契机,开始研发基于HAWQ的第四代数据仓库,并且拿到了由红点和红杉领投的天使轮和A轮两轮融资。

数据库的演变

谈新一代数据库之前,我们先来看看数据库的演变。从数据库系统的研究、开发到现在,历经了几十年的时间,从最开始的***代共享存储型数据库,第二代MPP型数据库,再到第三代采用存储与计算分离架构的数据库共经历了三次演变。

·共享存储型数据库,为节省资源、降低开发者成本,出现了共享存储型数据库,数据存储在高端共享存储中。传统的Oracle数据库等属于共享存储型数据库,也是最早的交易型数据库。这种类型的数据库在节点数多时存储会成为瓶颈。

·MPP型数据库,是目前大量公司在使用的数据库,包括Teradata和Vertica等。因为操作系统和文件系统等底层基础不是很成熟,Teradata使用的是专有硬件,主攻软硬件一体机,并且更改了大量的操作系统以及文件系统代码。2000年左右出现了基于x86架构的MPP型数据库,包括Vertica,Greenplum等。这些基于x86架构的MPP型数据库使用的是普通服务器,没有专有硬件做支持,软件架构方面还是和Teradata类似。

·存储与计算分离架构数据库,这类数据库典型的代表有HAWQ和Hive等。第三代数据仓库的优点是可扩展性好,但是大部分引擎比如Hive等性能较差,兼容性不是很好,所以客户用起来很困难。

人工智能场景下, 基于HAWQ的新一代分析型数据库

常雷表示,二十世纪九十年代前后,数据处理不仅仅局限于存储和管理数据,而是着眼于用户所需要的各种数据处理方式。分析数据库是面向分析应用的数据库,可以对数据进行在线统计、在线分析、随即查询等发掘信息数据价值的工作,在处理海量数据方面有一定的优势。但在人工智能场景中,大多分析型数据库还是略显吃力,迭代创新迫在眉睫。由偶数科技打造的基于HAWQ的Oushu Database专为人工智能海量数据处理上拥有得天独厚的优势。

HAWQ

新一代分析型数据库解决不同领域数据处理瓶颈

随着大数据和人工智能应用的层出不穷,对新一代数据库的海量数据处理能力以及分析能力提出了更高的要求。金融、安防、制造业等等,各个行业对数据库性能提升都有非常迫切的需求,新一代分析型数据库的诞生解决了这个需求。

在人工智能的应用场景下,如安防领域,新一代数据库可以通过图像识别、人脸识别可以进行更深层面的认知和推理;在人员身份的识别、人类轨迹分析等方面,可对视频、图片、电子车牌等不同种类的数据进行分析、碰撞、发现潜在联系,抽取有价值的信息,对可疑行为发出预警,并且对案件进行关联,协助提高公安部门案件的侦破效率。

针对实时数据等实际案例,如企业内部***别到***别的实时物联网传感器数据,新一代数据库摒弃了繁琐的Storm等方案,解决了大量编程和不能够完全适应物联网传感器数据的问题。

另外,新一代数据仓库也解决了全球规模部署需求。现如今任何一个核心应用都离不开数据分析和人工智能,比如传统银行的交易系统和信用卡反欺诈系统,在数据仓库实现两地三中心和异地多活方面,对管理PB级数据的数据仓库系统是很大的挑战。

新一代分析型数据库的应用场景

常雷认为,现在的数据库应用需求发生了巨大的变化,这也正好说明了数据库市场将会发生一个巨大的变革契机。偶数科技在这个契机点推出了两款核心产品Oushu Database和LittleBoy,Oushu Database基于Apache HAWQ,LittleBoy是一款人工智能产品,和Oushu Database无缝集成。可以应用到金融领域、税务数据、公检法数据、电网数据等数据庞大的领域。

金融领域涉及到企业到银行贷款的传统业务,银行首先要对企业做尽职调查和审查,然后再通过评委会进行评估,这些审核过程需要全人工操作;如果涉及到个人贷款和小微企业贷款业务,可以对借贷人信息进行自动审核,因为借贷人的信息相对来说比较容易获取;如果涉及到公司业务,那么就会涉及到庞杂的数据,银行需要把所有的内部数据和外部数据集中起来,然后按照主题等对内部数据先进行整合,再集成外部数据集。偶数科技利用数据存储、管理、分析以及人工智能算法建模,可以轻而易举的帮助客户构建模型流程以及模型的管理和上线,不再需要以前繁杂的审核过程,大大缩短了审核时间。

采访的***,常雷表示:“微软加速器对偶数科技帮助很大。一方面,研发上微软加速器和偶数科技已经达成了一些合作,偶数科技已经将产品移植到微软加速器的Azure公有云上;另一方面,微软加速器引荐了很多不同行业的客户资源,并且在管理、财务、招聘、PR 等方面的培训也对偶数科技进行了指导。”

数据仓库 AI 分析型数据库
上一篇:麦肯锡合伙人:中国的医疗AI处于领先,但未来有五个关键问题 下一篇:机器翻译三大核心技术原理 | AI知识科普
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

AI如何改善采矿行业现状?

人工智能的引入,有望将采矿业转化成一个更安全、利润空间更大且更为环保的行业。

佚名 ·  1天前
大小仅1MB!超轻量级的人脸识别模型火爆Github

近日,用户Linzaer在Github上开源了一款适用于边缘计算设备、移动端设备以及 PC 的超轻量级通用人脸检测模型,该模型文件大小仅1MB,一经开源就霸榜Github Trending榜单。

佚名 ·  1天前
AI艺术日渐繁荣,未来何去何从? 精选

利用人工智能创作而成的画作近年来越来越受瞩目,有的作品甚至能在知名拍卖行拍得高价。但这类作品仍有不少问题需要解答,比如它的作者是开发出算法的程序员还是计算机呢?AI艺术的市场未来将走向何方呢?

网易智能 ·  2天前
人工智能进入大学校园带来了哪些变化

在一个人的教育生涯中,大学如何成为最好的学习体验?高等教育的目的就是发展技能,探索新理论,并将其应用于现实生活中。在整个学习期间,鼓励学生完成学习任务,熟练掌握技能,同时培养一个健康的、积极的、和谐的生活态度。

风车云马 ·  3天前
图灵奖得主Yoshua Bengio:深度学习当务之急,是理解因果关系

深度学习擅长在大量数据中发现模式,但无法解释它们之间的联系,而图灵奖获得者Yoshua Bengio想要改变这一点。

佚名 ·  4天前
人工智能遇冷,自动驾驶受阻?

2016到2019,人工智能经历了梦幻般的三年,但人工智能的历史规律告诉我们:高潮过后可能会引来新的一波沉寂,人工智能助推下的自动驾驶也会受到波及。

佚名 ·  2019-10-14 11:00:27
AI核心难点之一:情感分析的常见类型与挑战

情感分析或情感人工智能,在商业应用中通常被称为意见挖掘,是自然语言处理(NLP)的一个非常流行的应用。文本处理是该技术最大的分支,但并不是唯一的分支。情绪AI有三种类型及其组合。

Veronika Vartanova ·  2019-10-12 10:14:41
机器学习帮你预测电池寿命:精确了解电池还能充几次 精选

电池寿命的确定,是移动硬件发展的重要一环,但是由于电池电化学反应的不确定性以及不同的使用环境和习惯,电池寿命变成了一门玄学。不过柏林的三位小伙伴,利用Tensorflow,在原有的预测体系基础上。更近一步,完成了电池的全寿命预测。

靓科技解读 ·  2019-10-11 13:00:40
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载