2019年的科技关键词,RPA(Robotic Process Automation,机器人流程自动化)必须拥有一席之地。在它重回风口的这段时间里,“AI+RPA"的概念被反复提起。在阿博茨CTO刘铁锋看来,二者的关系可以这样解读:“AI延伸到RPA,是把AI进一步放大;也因为有了AI的能力,我们才看到了RPA的更多可能。”

在本次专访中,雷锋网AI金融评论就与刘铁锋详细聊了聊有关RPA的多个热门话题:为什么RPA直到最近才得到风投集体青睐?这一领域的技术门槛何在?像阿博茨这样的AI企业又是如何将RPA应用到金融等重点领域的?

RPA为何重回风口? 

如果把微软为Office系列配备的宏功能当成起点,RPA其实算是一门久远的技术。刘铁锋将RPA的发展分为三大阶段,第一阶段集中在量级较小的应用开发,而真正壮大的时间节点,应该是第二阶段系统集成商这个角色的出现。

当系统集成商向企业输出解决方案时,一套新的信息化系统需要对接原有的财务系统,却发现对方的系统十分陈旧,连维护都欠缺,需要耗费大量人力和时间来转移数据,此时RPA发挥的作用即是通过自动化填写的方式,将结构化的数据填到新系统里。刘铁锋表示,这一阶段产生了自动化运维的需求,UiPath以及国内的相关厂商也就随之出现。

然而,在该阶段出现的厂商也已存在十年有余,为什么RPA迟迟没有得到资本的大规模追捧?

“在新的阶段,企业可以针对客户的业务系统,把当中能够用AI能力放大的部分给拎出来了。原先就拥有的技术,再加上RPA的重复操作,给所有AI公司提供了落地的深度,有了将技术深度嵌入到公司业务流程的机会。VC正是看好AI公司侵入到这方面的能力。”刘铁锋这样告诉AI金融评论。

与此同时,UiPath的收入增速和融资规模,也让业界看到了RPA开放平台这一新形式的可能性。企业们也不仅看中RPA的热度,更关注到背后开发平台的潜力所在。总体而言,第三阶段是各路玩家在“AI+开放平台”层面的一场角力。

AI+RPA+金融,能有多少想象空间?

RPA实现全面回暖的信号之一,是一批早有AI能力积累的企业集体切入这片广阔的市场。刘铁锋分析称,这样的顺势而为,与行业需求和技术沉淀密不可分。

区别于其他种类的机器人,RPA更强调流程性的优化。当业务试图达到全自动化,完整地经历一次从输入到输出的过程,此时RPA需要解决的,就是在流程上的断点和阻塞点。像阿博茨这样的企业会驶向RPA,也正是因为在输出AI能力服务金融客户的过程中,用户需求出现了流程上的进一步衍生。刘铁锋也表示,阿博茨对RPA的关注到投入是一个自然演进的过程,从2018年开始就已逐步在做相应的准备工作。

那么,AI的加持能为RPA做些什么?例如,传统的RPA机器人仍然需要员工作为预处理的输入终端,由人手抄或是通过OCR的方式输入信息,但是机器人不能识别和理解里面的内容,很容易在处理过程中被当前流程所困惑,从而导致大量的RPA机器人在复杂工作中失效。因此,通过AI给RPA戴上“眼睛”和“大脑”,“看得见”“读得懂”业务中的数据,也就将只能执行基于一定规则重复任务的传统RPA模式,升级成能够模拟更多初级员工重复性劳动的进阶模式。

“AI其实是区分了哪些工作可以用机器(技术能力)替换,哪些必须人来做。RPA则是往机器和机器互动方面往前多走了一步。”刘铁锋这样总结。

在这一升级过程中,怎样赋能RPA机器人,将其训练得更职业化?阿博茨创始人余宙曾在CCF-GAIR大会上表示,当其所处的工作和流程越垂直、越细分的时候,就越能够发挥机器学习的优势。

对应到金融行业,就需要RPA机器人首先具备足够的对海量金融非结构化数据的处理能力。IDC曾给出相关统计结果,企业中80%以上的数据为非结构化数据,每年按照指数增长60%。而目前金融市场的非结构化数据类型包括但不限于:科创板公告、基金财务报告、基金运营报告、合同、法律文书、研究报告、证件、票据、报表、图片、电子邮件、社交媒体、HTML、移动数据、通信、媒体、应用程序等等。

在金融领域深耕多时的阿博茨,在这一方面也有着不少的积累。其已经利用parsing智能解析、智能抽取、OCR等技术攻克该类数据,并利用Everdroid RPA平台,提高数据处理效率。与传统的数据处理流程相比,阿博茨的产品体系基于机器视觉的解析引擎,无论图片、pdf、扫描件等类型文档都能解析识别,同时也支持Chart解析、Table解析、文本解析等全类别数据解析和抽取,另外有解析工具集针对各种长尾数据。其机器学习平台,提供标注、训练工具集,能在少量标注训练情况下,覆盖新类型的文本数据抽取。

AI金融评论注意到,目前阿博茨的非结构化数据RPA已覆盖到多个应用场景,包括企业财务报表审计、一级市场数据生产、合同票据类文档审核、信贷市场资料识别录入、租赁市场资料识别录入等。

以信贷业务资料识别录入流程自动化为例,银行/公积金/P2P有大量的信贷资料如户口本、结婚证、离婚证、银行流水、护照、银行卡等需要识别入库。RPA产品可视化选择需要的输入输出,和OCR识别节点,利用OCR识别技术实现信贷资料自动化入库,人工耗时由每张证照平均半小时能够缩短至2分钟入库。

阿博茨也在现有的技术沉淀上成功构建金融RPA的平台架构,打通非结构化数据解析场景的数据获取和录入环节。并已实现针对不同类型的数据,形成平台级解决方案,利用AI机器学习平台和RPA平台,客户可自定义模型和业务流程,适应不同场景。

刘铁锋还强调,RPA之所以会在金融行业密集落地,原因之一正是银行、券商、保险等金融机构已经实现了较高的信息化水平,也因此有着更强烈的以机器替代乏味人工操作的意识。

RPA的门槛有多高?

当下,RPA领域既有发展多年、试图拥抱新技术的老牌厂商,亦有携AI而来的活跃新玩家。入局者众多,RPA的技术门槛和竞争壁垒到底在哪里?它又是否如行业人士所言,更多还是商业模式的创新?

“就好比乐高积木你有不同的模块,想要搭出飞机,脑子里还得有飞机的概念——对技术开发者来说,想要进入RPA领域,不光要了解节点的意义、API的调用,还要真正理解这项技术能够在哪个业务领域用起来。”刘铁锋给出了这样一个比喻来形容个人层面的RPA技术门槛。

上升到企业层面,他认为一家RPA企业应当有这样的准备工作如下:

一是AI能力或资源能力的服务化:“最开始只是向客户提供私有化部署,但如果需要提高开放程度和业务规模,就必须将内部私有能力走公开化道路,比如做到让第三方平台或开发者都能直接调用,这是第一步基础性的工作。”

二是RPA的平台化:“一旦要提升通用范围,就不可避免地会碰到所谓的用户界面友好性、适用性、开发简易程度等一系列问题,这就得考虑对整个RPA平台的构建。”

三是汇聚开发者形成社区,与合作伙伴共同构建行业生态体系。

刘铁锋强调,能把开放平台行之有效地建立起来,构建起生态系统,才有可能成为这个领域真正的“头号玩家”。据AI金融评论了解,目前阿博茨也正在构建相应的RPA开放平台。一部分开放是将ABC金融大脑和RPA技术开放出来,让外部的开发者通过简单的模型配置,就可以创建一个流程机器人,为企业自动化创造一个独有的解决方案。另外一部分开放,是面向渠道合作伙伴开放技术,向企业提供服务,以联合的方式完成项目实施。

单有这样的准备工作尚不完整,在刘铁锋看来,一家AI企业想要在RPA领域搭起坚不可摧的行业竞争壁垒,首先要打磨自己的这三种对待世界的能力:

一是认知世界:“通过OCR、NLP等技术去识别图像、文本、各种应用类图表,把物理世界里的数据还原到数字世界去。”

二是理解世界:“在非常强大的OCR能力之后,系统必须要理解还原后数字的关系和属性,通过知识图谱方面技术的积累,去还原数据之间的关联性。”

三是响应世界:“例如当用户产生了复杂的提问,要通过NLP来转换成查询”,实现更深层次的人机之间、机器之间的互动。 

在RPA不算太高的行业准入门槛下,业内的价格战似乎难以避免。对此他也表示,要考虑AI优先、RPA在后的思路,在这里“AI打价格战很难,除了技术能力,也的确需要行业的知识和理解。”

尽管RPA现在正处于聚光灯之下,受到企业和资本的追捧,但刘铁锋对于智能RPA产品的长远发展抱有相对冷静的态度,相信RPA未来也会被其他形式的产品或是更新的概念取代。在他看来,目前RPA工作的内在相当于人机互动或机器之间的互动,之后的RPA产品有可能会在AI层面演化,让机器自动去总结有哪些重复的工作。