近日,从多家知名大数据公司内部人员被警方带走调查,到《个人金融信息(数据)保护试行办法》酝酿出台的消息在业内传开,个人隐私保护的话题在金融行业再度升温。
在金融行业中,大数据的应用带来了人工智能和科技化的成果,带来了过去几十年都不曾发生的突飞猛进,甚至超过了很多发达国家的金融科技发展速度。
却因为种种数据应用乱象,曾风靡行业的“大数据金融”机构,纷纷更名为“智能风控”或“金融科技”公司。
一时间,“大数据”因监管成了行业里的敏感词,金融机构的数据应用,也被舆论施加了越来越多的压力。
然而,外界对金融机构数据应用的是非论断,常常又是简单而仓促的。
大数据应用:先满足普惠需求还是个人隐私权?
近几年,消金行业对数据的应用颠覆了传统金融机构的风控水平和效率,使金融快速渗透到了征信体系外的人群,也证明数据应用毫无疑问是一把普惠金融行业发展的利器。
但双刃剑上向来都是风险和机遇并存。
其实,这场关于数据应用是与非的争论,本质上是在讨论先满足普惠金融需求,还是先确保个人隐私权利。
“传统金融服务解决不了信息不对称的问题,所以必须引入替代数据。”近日,中国人民银行征信管理局局长万存知在中国普惠金融论坛上表示,替代数据的应用能推进普惠金融发展。
他还提出金融机构使用的替代数据可以分为四类:一是身份证等注册登记信息;二是资质信息;三是行政处罚方面的信息;四是社交行为等信息,也是目前存在争议最多的一类。
在具体业务中,马上消费金融首席数据决策科学家董骝焕介绍,一般金融机构采集的替代数据有几种用途:最典型的用途是贷款资质审核、反欺诈、信用风险评估、资管等。
怎么给数据应用划线?
毋庸置疑,为了更好的保护个人隐私,在数据应用中应该遵循必要性原则,但这一点又常被外界误读成一条一刀切的界限。
实际上,替代数据应用的“必要性”在不同应用中存在差异。
在金融机构的风险应用中,数据可通过风控业务逻辑的计算产生某种变量“值”,某些“数据”可能有较好的风险显著性指征而呈现出较高的信息“值”,进而成为必要性数据。
另外,数据“必要性”的差异化,还体现在针对不同信贷产品和客群的差异化:比如针对男性和女性用户、不同地区、不同年龄、不同职业特征的用户群体,不同的时间点,以及申请的不同信贷产品,采集和应用数据的必要性的也会不同。
“实际上每个金融机构对替代数据的应用本来就是有自己的度量准则,很难一概而论。”董骝焕告诉新流财经。
他举例称,比如GPS定位数据,这种表面上看似与信贷风险不直接相关的数据,但是可以通过位置来判断申贷用户是否有可能属于学生群体,或是否处在比如境外区域等不准入的范围,乃至是否处于高风险定位聚集区域,帮助金融机构进行从合规到反欺诈的判断,此时则属于必要信息。
同时,他也呼吁政府部门开放相应的政府数据,帮助金融机构进行合规经营,比如学籍信息,对于23岁以上人群,大概率不需要采集,这不是一个必要数据,但是对于23岁及以下,则是一个必要数据,因为需要判断是否在籍学生而进行合规性的拒绝准入。
此外,数据应用中的成本因素也是金融机构对用户数据取用有“度”的重要原因。
由于数据应用需要对数据进行采集、计算、清洗等工作流程,还需要考虑时间成本、人力成本、合规成本,因此金融机构对替代数据的应用是有自己必要性的“度”。
如此,给数据应用划线,其实都很难有一刀切的标准。
另外,在合理的数据应用范围内,金融机构的数据应用也诞生了相应的保密技术手段。
面对数据应用中产生的问题,“金融机构解决隐私保护问题的技术手段有很多,比如对数据进行脱敏、加密、分段、评分化、边缘计算等。”董骝焕表示。
他强调,科技的发展不应因噎废食,面对数据应用,则更应结合具体场景去深度理解数据的必要性和安全性。
显然,在数据应用发挥价值的同时,数据的隐私保护和安全性问题,以及数据开放和便利性问题,成了围绕当下金融机构数据应用中的两大相互制约的核心问题。
在金融机构进一步探索数据应用的同时,数据应用的便利化、规范化和安全化工作必须同时进行。2019年,数据应用的合规化被各大金融机构提上了重要日程。
董骝焕建议,在业务实操中,金融机构应该注意几点:
“第一,金融机构要获得用户的两端授权,申请端和采集端,并且要充分保证用户知情权,比如申贷授权页面必须要让用户充分阅读。第二,在保证业务必要性的情况下减少对不相关数据采集,加强数据脱敏加密技术,避免对用户造成干扰。”
据悉,马上消费金融在今年也主动对合作的第三方大数据公司进行了合规排查和清退。事实上,不止持牌消金,信托、银行等金融机构都主动进行了数据应用的详细排查。
大数据应用前途何在?
令人措手不及突袭整顿风波,给消金行业带来了不同程度的影响。
其中,对第三方数据平台依赖较重的中小型消金、互金机构受到影响较大,部分机构甚至因为无法找到临时替代方案,直接暂停了相关贷款产品。
“头部持牌机构受影响较小,一方面因为人行征信和机构内部的数据支持,另外一方面其数据决策中对三方数据的依赖的比例不大。”董骝焕表示,虽然风控模式的方法论并没有因此产生特殊变化,但这场风波仍给消金行业带来了一些数据应用方式的改变。
“从技术角度,比如半年前马上金融就在准备边缘计算的应用,通过不回采原始数据的方式在设备端计算特征或者评分,也就是跟风险度量相关的指标,这对个人来讲只是一串数字,没有任何泄漏隐私的可能,此外我们也不断梳理、更新数据应用过程中的合规化流程。”
“这其实不见得是一件坏事,”董骝焕对数据应用整顿的看法很乐观,“在行业肃清之后,持牌金融机构的市场空间会更大,进而可以进一步拓展人行征信体系外部人群,反哺国内信用体系的建设,同时监管的介入可以保证市场更加公平,对持牌和非持牌机构都能一碗水端平。”
在他看来,未来大数据行业可能从数据源头、交易过程、应用过程等角度被监管,金融机构则必须积极拥抱,主动适应。
作为一个钻研数据应用的资深人士,他坚信,数据本身的交叉增值等特性,对未来金融行业有着不可估量的意义,但数据应用需要合规有序、宽松便利的环境才能顺利发展。
“人工智能模型、信贷模型,比如深度学习的神经网络模型,都靠上千万条数据‘喂‘出来的,而人工智能和数据决策必然是未来方向。”