热门标签 | HotTags
当前位置:  开发笔记 > 大数据 > 正文

大数据应用的是与非:理解“替代数据”的必要性

近日,从多家知名大数据公司内部人员被警方带走调查,到《个人金融信息(数据)保护试行办法》酝酿出台的消息在业内传开,个人隐私保护的话题在金融行业再度升温。在金融行业中,大数据的应用带

近日,从多家知名大数据公司内部人员被警方带走调查,到《个人金融信息(数据)保护试行办法》酝酿出台的消息在业内传开,个人隐私保护的话题在金融行业再度升温。

在金融行业中,大数据的应用带来了人工智能和科技化的成果,带来了过去几十年都不曾发生的突飞猛进,甚至超过了很多发达国家的金融科技发展速度。

却因为种种数据应用乱象,曾风靡行业的“大数据金融”机构,纷纷更名为“智能风控”或“金融科技”公司。

一时间,“大数据”因监管成了行业里的敏感词,金融机构的数据应用,也被舆论施加了越来越多的压力。

然而,外界对金融机构数据应用的是非论断,常常又是简单而仓促的。

大数据应用:先满足普惠需求还是个人隐私权?

近几年,消金行业对数据的应用颠覆了传统金融机构的风控水平和效率,使金融快速渗透到了征信体系外的人群,也证明数据应用毫无疑问是一把普惠金融行业发展的利器。

但双刃剑上向来都是风险和机遇并存。

其实,这场关于数据应用是与非的争论,本质上是在讨论先满足普惠金融需求,还是先确保个人隐私权利。

“传统金融服务解决不了信息不对称的问题,所以必须引入替代数据。”近日,中国人民银行征信管理局局长万存知在中国普惠金融论坛上表示,替代数据的应用能推进普惠金融发展。

他还提出金融机构使用的替代数据可以分为四类:一是身份证等注册登记信息;二是资质信息;三是行政处罚方面的信息;四是社交行为等信息,也是目前存在争议最多的一类。

在具体业务中,马上消费金融首席数据决策科学家董骝焕介绍,一般金融机构采集的替代数据有几种用途:最典型的用途是贷款资质审核、反欺诈、信用风险评估、资管等。

怎么给数据应用划线?

毋庸置疑,为了更好的保护个人隐私,在数据应用中应该遵循必要性原则,但这一点又常被外界误读成一条一刀切的界限。

实际上,替代数据应用的“必要性”在不同应用中存在差异。

在金融机构的风险应用中,数据可通过风控业务逻辑的计算产生某种变量“值”,某些“数据”可能有较好的风险显著性指征而呈现出较高的信息“值”,进而成为必要性数据。

另外,数据“必要性”的差异化,还体现在针对不同信贷产品和客群的差异化:比如针对男性和女性用户、不同地区、不同年龄、不同职业特征的用户群体,不同的时间点,以及申请的不同信贷产品,采集和应用数据的必要性的也会不同。

“实际上每个金融机构对替代数据的应用本来就是有自己的度量准则,很难一概而论。”董骝焕告诉新流财经。

他举例称,比如GPS定位数据,这种表面上看似与信贷风险不直接相关的数据,但是可以通过位置来判断申贷用户是否有可能属于学生群体,或是否处在比如境外区域等不准入的范围,乃至是否处于高风险定位聚集区域,帮助金融机构进行从合规到反欺诈的判断,此时则属于必要信息。

同时,他也呼吁政府部门开放相应的政府数据,帮助金融机构进行合规经营,比如学籍信息,对于23岁以上人群,大概率不需要采集,这不是一个必要数据,但是对于23岁及以下,则是一个必要数据,因为需要判断是否在籍学生而进行合规性的拒绝准入。

此外,数据应用中的成本因素也是金融机构对用户数据取用有“度”的重要原因。

由于数据应用需要对数据进行采集、计算、清洗等工作流程,还需要考虑时间成本、人力成本、合规成本,因此金融机构对替代数据的应用是有自己必要性的“度”。

如此,给数据应用划线,其实都很难有一刀切的标准。

另外,在合理的数据应用范围内,金融机构的数据应用也诞生了相应的保密技术手段。

面对数据应用中产生的问题,“金融机构解决隐私保护问题的技术手段有很多,比如对数据进行脱敏、加密、分段、评分化、边缘计算等。”董骝焕表示。

他强调,科技的发展不应因噎废食,面对数据应用,则更应结合具体场景去深度理解数据的必要性和安全性。

显然,在数据应用发挥价值的同时,数据的隐私保护和安全性问题,以及数据开放和便利性问题,成了围绕当下金融机构数据应用中的两大相互制约的核心问题。

在金融机构进一步探索数据应用的同时,数据应用的便利化、规范化和安全化工作必须同时进行。2019年,数据应用的合规化被各大金融机构提上了重要日程。

董骝焕建议,在业务实操中,金融机构应该注意几点:

“第一,金融机构要获得用户的两端授权,申请端和采集端,并且要充分保证用户知情权,比如申贷授权页面必须要让用户充分阅读。第二,在保证业务必要性的情况下减少对不相关数据采集,加强数据脱敏加密技术,避免对用户造成干扰。”

据悉,马上消费金融在今年也主动对合作的第三方大数据公司进行了合规排查和清退。事实上,不止持牌消金,信托、银行等金融机构都主动进行了数据应用的详细排查。

大数据应用前途何在?

令人措手不及突袭整顿风波,给消金行业带来了不同程度的影响。

其中,对第三方数据平台依赖较重的中小型消金、互金机构受到影响较大,部分机构甚至因为无法找到临时替代方案,直接暂停了相关贷款产品。

“头部持牌机构受影响较小,一方面因为人行征信和机构内部的数据支持,另外一方面其数据决策中对三方数据的依赖的比例不大。”董骝焕表示,虽然风控模式的方法论并没有因此产生特殊变化,但这场风波仍给消金行业带来了一些数据应用方式的改变。

“从技术角度,比如半年前马上金融就在准备边缘计算的应用,通过不回采原始数据的方式在设备端计算特征或者评分,也就是跟风险度量相关的指标,这对个人来讲只是一串数字,没有任何泄漏隐私的可能,此外我们也不断梳理、更新数据应用过程中的合规化流程。”

“这其实不见得是一件坏事,”董骝焕对数据应用整顿的看法很乐观,“在行业肃清之后,持牌金融机构的市场空间会更大,进而可以进一步拓展人行征信体系外部人群,反哺国内信用体系的建设,同时监管的介入可以保证市场更加公平,对持牌和非持牌机构都能一碗水端平。”

在他看来,未来大数据行业可能从数据源头、交易过程、应用过程等角度被监管,金融机构则必须积极拥抱,主动适应。

作为一个钻研数据应用的资深人士,他坚信,数据本身的交叉增值等特性,对未来金融行业有着不可估量的意义,但数据应用需要合规有序、宽松便利的环境才能顺利发展。

“人工智能模型、信贷模型,比如深度学习的神经网络模型,都靠上千万条数据‘喂‘出来的,而人工智能和数据决策必然是未来方向。”


推荐阅读
  • 当前物联网领域十大核心技术解析:涵盖哪些关键技术?
    经过近十年的技术革新,物联网已悄然渗透到日常生活中,对社会产生了深远影响。本文将详细解析当前物联网领域的十大核心关键技术,包括但不限于:1. 军事物联网技术,该技术通过先进的感知设备实现战场环境的实时监测与数据传输,提升作战效能和决策效率。其他关键技术还包括传感器网络、边缘计算、大数据分析等,这些技术共同推动了物联网的快速发展和广泛应用。 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 兆芯X86 CPU架构的演进与现状(国产CPU系列)
    本文详细介绍了兆芯X86 CPU架构的发展历程,从公司成立背景到关键技术授权,再到具体芯片架构的演进,全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]
  • 本文介绍了实现人工智能的多种方法,并重点探讨了当前最热门的技术——通过深度学习训练神经网络。文章通过具体实例详细解释了神经网络的基本原理及其应用。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 独家解析:深度学习泛化理论的破解之道与应用前景
    本文深入探讨了深度学习泛化理论的关键问题,通过分析现有研究和实践经验,揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素,并提出了改进模型泛化性能的有效策略。此外,还展望了这些理论在实际应用中的广阔前景,为未来的研究和开发提供了宝贵的参考。 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • 视觉图像的生成机制与英文术语解析
    近期,Google Brain、牛津大学和清华大学等多家研究机构相继发布了关于多层感知机(MLP)在视觉图像分类中的应用成果。这些研究深入探讨了MLP在视觉任务中的工作机制,并解析了相关技术术语,为理解视觉图像生成提供了新的视角和方法。 ... [详细]
  • 本文详细介绍了 Java 网站开发的相关资源和步骤,包括常用网站、开发环境和框架选择。 ... [详细]
  • 在2019中国国际智能产业博览会上,百度董事长兼CEO李彦宏强调,人工智能应务实推进其在各行业的应用。随后,在“ABC SUMMIT 2019百度云智峰会”上,百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]
  • 深入解析国内AEB应用:摄像头和毫米波雷达融合技术的现状与前景
    本文作者程建伟,武汉极目智能技术有限公司CEO,入选武汉市“光谷3551人才计划”。文章详细探讨了国内自动紧急制动(AEB)系统中摄像头与毫米波雷达融合技术的现状及未来前景。通过分析当前技术的应用情况、存在的挑战以及潜在的解决方案,作者指出,随着传感器技术的不断进步和算法优化,AEB系统的性能将大幅提升,为交通安全带来显著改善。 ... [详细]
  • 在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。 ... [详细]
  • 你可能还记得,在《真实谎言》、《偷天陷阱》、《查理的天使》、《少数派报告》等好莱坞科幻电影中,经常出现一个类似的场景:角色将眼睛靠近某个识别设备,以完成身份验证。这种基于眼睛的生物识别技术,即指静脉识别,曾在过去近二十年间逐渐淡出公众视野。然而,随着技术的不断进步和多模态生物识别系统的兴起,指静脉识别技术正迎来新的发展机遇。该技术通过检测手指内部的静脉图案,具有高安全性、难以伪造的特点,有望在未来成为生物识别领域的重要组成部分。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 在前一篇文章《Hadoop》系列之“踽踽独行”(二)中,我们详细探讨了云计算的核心概念。本章将重点转向物联网技术,全面解析其基本原理、应用场景及未来发展前景。通过深入分析物联网的架构和技术栈,我们将揭示其在智能城市、工业自动化和智能家居等领域的广泛应用潜力。此外,还将讨论物联网面临的挑战,如数据安全和隐私保护等问题,并展望其在未来技术融合中的重要角色。 ... [详细]
author-avatar
李淑宝彦豪俊嵐
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有