人工智能进军风控,血肉之躯会不会失业?

作者: 佚名 2017-12-14 09:59:30

史蒂夫·乔布斯的“reinvents the phone”不仅重新定义了手机,而且改变了世界,将人类一举拉近移动互联网时代,并且结合金融,形成了互联网+金融的普惠模式。

目前来看,天朝的移动支付妥妥的处于全球领先地位。只要会使用智能手机,在大天朝的一线城市已经可以不带钱包出行了,普罗大众都已经能体会到互联网金融时代的便利。

而近期阿尔法狗(AlphaGo)的成功,让吃瓜群众发现 AI (人工智能-Artificial Intelligence)已非昔年靠穷举法赢棋的“深蓝”(IBM开发的国际象棋机器人),而是有了自主推理学习能力,大家不免担心人类是不是有朝一日会被人工智能机器人“颠覆”掉?

只看当下,人工智能已经在无人驾驶、图像处理、语音识别方面取得了突破性的应用,那金融领域呢?

李开复老师曾谈及人工智能应用的三个要素:数据、处理数据的能力和商业变现的场景。人工智能解决金融界问题的过程, 很好的对应了这三个要素。也许, 金融领域是人工智能最合适不过的颠覆场景了。

在金融业务的前端,已经有不少传统银行将人工智能用于为客户定制服务,开发理财产品的应用,例如巴克莱银行和花旗银行等。 国内招商银行也开始试用全新的人工智能业务模式,未来人工智能和机器学习技术在金融业前端会有更多的便捷精准服务提供给客户。

那么金融应用领域的后端呢? 尤其是信息安全、投资风控、资产管理等方面的,对于躲在触屏手机背后的客户,缺失央行数据的客户,银行没有办法通过一双双眼睛去看到用户是谦谦君子还是骗子流氓。这个时候, 金融后端,传统金融风控手段覆盖不到和难以触及的, 那么“互联网+金融”业务就要结合更广泛的互联网数据和人工智能手段, 就可以处理更广泛的金融客户问题。

从这个角度考虑,新金融时代,具备自主学习能力后的AI,是真的要“颠覆”传统金融风控了吗? 在引入人工智能处理互联网行业几十万维数据的处理手段,“降维”处理金融业界万维、千维数据的时候,会形成有效的降维攻击吗? 

在谈及机器学习在金融场景中的实际应用之前,首先我们对金融风控的一个标准业务流程进行梳理,通常一个风控业务包括前端页面用户资料申请提交和收集,反欺诈、合规、逻辑校验,核心决策授信包括申请评分和电调,以及最后的催收。

面对这套业务流程, 新金融风控领域面对的数据痛点,一般有几大类:

反欺诈

业务流程上,AI自主学习已经在每个风控节点发挥作用。比如反欺诈环节,在互联网的环境里, 金融风控面临的传统个体欺诈已迅速演变为有组织、有规模的群体欺诈和关联风险。而传统反欺诈还停留在识别一度风险等这种简单规则方式,如联系人中借贷人个数等,对于二度、三度乃至更广范围的网络全局风险苦无良策。

AI学习里面基于图的半监督算法完美解决了这一诉求,基于申请人、手机号、设备、IP地址等各类信息节点构建庞大网络图,并可在此之上进行基于规则和机器学习的反欺诈模型实时识别。

核心授权决策

在申请评分环节,传统金融风控往往是基于评分卡体系对强征信数据如银行借贷记录等进行建模,而新金融的业务下,客群的进一步“下沉”,覆盖更多收入群体,新增群体的强征信数据往往大量缺失,金融机构不得不使用更多弱金融数据, 辟如消费数据、运营商数据、互联网行为数据等。

这类底层数据的改变,对传统信用评分卡造成了巨大的困难,具体体现在:

  • 诸如互联网行为、运营商数据很多都是非结构化数据,数据繁杂, 建模前的特征工程很难用传统人工的方式完成加工。
  • 由于数据类型和范围的大幅扩大,新模型面对的往往是加工出来的上千维弱变量特征,评分卡体系根本无法融合吸收这些特征。
  • 线上新金融业务风险环境频繁演化,传统人工迭代模型无法适应风险变化速度,迭代优化太慢。

AI学习对上述问题有独到处理。面对数据繁杂的问题,基于深度学习的特征生成框架已被成熟运用于大型风控场景中,对诸如时序、文本、影像等互联网行为、运营商非结构化数据实现了深层特征加工提取,显现出对模型效果超出想象的提升。

【图注】上图为大型信用贷场景中模型重要性特征列表,机器学习特征比例已经超过专家人工特征。

经过大量实践表明,针对数据驾驭难的挑战,不同的数据用合适的模型才能挖掘出其最大价值。AI学习方法过去在互联网广告、搜索、推荐等技术的成熟应用,正是对不同类型的数据用不同的机器学习模型进行处理,将此移植到金融场景中,用复杂集成模型就可以轻车熟路地处理上千维度的弱变量,并将之与违约风险精准挂钩。

解决模型迭代慢是AI最擅长的事情。 过去互联网公司每天都产生海量用户数据,需要对搜索、推荐模型持续频繁地在线优化,自迭代频次比金融领域更快速更准确,这是人工迭代几乎无法解决的问题。因此在金融风控中,通过对模型特征、借贷群体、模型性能和业务反馈等多方面的监控,AI学习模型已经能很好地进行在线快速自迭代。

事实上,AI学习要解决的问题很清晰,所有的这一套数据适配融合、群体反欺诈、特征工程、模型构建和训练、性能监控与自迭代的机制,包括深度学习、半监督学习、在线学习等技术,核心都是为了将互联网级别的机器学习技术“降维”应用到金融领域,解决新金融场景上数据的独特性。因此,可能在不久的将来,AI风控结合大数据将成为线上主流的风控模式,只是这一天,到底有多远呢?

人工智能 金融风控 大数据
上一篇:开发者大赛路演 | 12月16日,技术创新,北京不见不散 下一篇:编程和数学基础不佳如何入门人工智能?
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

AI行业寒潮下,智能物流机器人产业迎来“风口”

“人工智能,前景很好,但‘钱’景不好 ” 、“2018年,人工智能的进展就是没有进展”、“2019年的AI行业已如石墨烯一样,尽显疲态”……一篇《投资人逃离人工智能》文章又给人工智能行业泼了一身冷水。人工智能融资难、“寒冬论”再一次戳痛每个人工智能从业者的心,激起大众的焦虑情绪。

AI报道 ·  1天前
AI行业寒潮下,智能物流机器人产业迎来“风口” 精选

“人工智能,前景很好,但‘钱’景不好 ” 、“2018年,人工智能的进展就是没有进展”、“2019年的AI行业已如石墨烯一样,尽显疲态”……一篇《投资人逃离人工智能》文章又给人工智能行业泼了一身冷水。人工智能融资难、“寒冬论”再一次戳痛每个人工智能从业者的心,激起大众的焦虑情绪。

AI报道 ·  1天前
人工智能应用在智慧社区五大场景

物联网、云计算、大数据、人工智能正逐步从概念走向应用。越来越多的传统产业也开始探索和创新,积极拥抱互联网和新技术。未来,人工智能技术可能会颠覆社区管理。

有熊 ·  1天前
基于PyTorch的CV模型框架,北大学生出品TorchCV

在机器学习带来的所有颠覆性技术中,计算机视觉领域吸引了业内人士和学术界最大的关注。

张倩、泽南 ·  1天前
高位截瘫患者重新行走:靠意念指挥外骨骼,法国脑机接口新突破 精选

依靠介入头部的 2 个传感器,法国里昂的一名瘫痪男子 Thibault 实现了操控外骨骼装备来助力行走。

孙滔 ·  1天前
2008 年预测 2020 年生活方式:基本都实现了

美国皮尤研究中心曾在 2008 年预测 2020 年的生活方式,目前来看,该研究的预测基本已经实现。而对于未来 10 年,也就是 2030 年左右人们的生活,在 2017 年底的世界经济论坛上,800 多名信息和通讯技术领域的技术高管和专家给出了如下预测。

佚名 ·  1天前
机器学习的正则化是什么意思?

正则化的好处是当特征很多时,每一个特征都会对预测y贡献一份合适的力量;所以说,使用正则化的目的就是为了防止过拟合。

佚名 ·  1天前
机器学习的正则化是什么意思?

正则化的好处是当特征很多时,每一个特征都会对预测y贡献一份合适的力量;所以说,使用正则化的目的就是为了防止过拟合。

佚名 ·  1天前
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载