热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

基于模型与不基于模型的深度增强学习_数据源不稳定?|基于动态模型融合的审批架构...

背景2019年9月6日,杭州某独角兽事件打响了数据行业整顿的第一枪。之后的两个月内,大批业内金融科技公司先后参与相关调查。截止目前,各大科
8acbdd67-111e-eb11-8da9-e4434bdf6706.png

背景

2019年9月6日,杭州某独角兽事件打响了数据行业整顿的第一枪。

之后的两个月内,大批业内金融科技公司先后参与相关调查。

截止目前,各大科技公司爬虫相关的数据业务几乎已经全面停止。如果硬要追究爬虫问题,其实许多公司都不能独善其身。说不定哪天,平台审批策略以及模型所依赖的外部数据源就突然消失了。不禁让人思考,动荡的数据条件下如何进行模型变量的配置。

8fcbdd67-111e-eb11-8da9-e4434bdf6706.png

因此本文从动态数据源的角度出发,针对对外部数据依赖同时又担心数据源不稳定的业务,提出一种基于模型组合的动态模型融合方法。防患于未然。

一、模型框架 

每种数据源一个单模型,通过各种AUC作为权重,进行加权融合。融合时候需要保证两点:

1. 对分数进行标准化。分数标准化针对单个模型,在离线训练过程中就可以做。因此不涉及上线部署问题。

2. 对权重进行标准化。需要判断当前样本究竟走哪几个模型。然后对相关模型的权重进行标准化,需要部署在线上进行逻辑判断。

93cbdd67-111e-eb11-8da9-e4434bdf6706.png

二、使用方法

判断用户具有哪种数据源,则在模型子集上对相应的模型AUC值进行标准化,得到权重。并将每个模型的预测分数校准后加权求平均,得到最终结果。

三、稳定性

根据经验来看,多模型融合的稳定性和样本调用的差异化模型数量成正比。前提是单模型效果接近且模型之间的差异足够大。因此需要通过AUC和MIC对数据源进行评估。

四、接入数据源建议

保证融合后整体的效果好且稳定,需要保证3点:

  1. 接入数据源有效,单模型AUC值不能明显低于其他模型。

  2. 不同数据源训练的模型MIC值差异较大。信息源相似的模型,其融合结果对整体区分度没有明显帮助。

  3. 预留同质数据作为备选,以备某类数据突然被斩断。




推荐阅读
  • 本周三大青年学术分享会即将开启
    由雷锋网旗下的AI研习社主办,旨在促进AI领域的知识共享和技术交流。通过邀请来自学术界和工业界的专家进行在线分享,活动致力于搭建一个连接理论与实践的平台。 ... [详细]
  • 知识图谱与图神经网络在金融科技中的应用探讨
    本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲,探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]
  • 我的读书清单(持续更新)201705311.《一千零一夜》2006(四五年级)2.《中华上下五千年》2008(初一)3.《鲁滨孙漂流记》2008(初二)4.《钢铁是怎样炼成的》20 ... [详细]
  • 本文总结了一次针对大厂Java研发岗位的面试经历,探讨了面试中常见的问题及其背后的原因,并分享了一些实用的面试准备资料。 ... [详细]
  • Requests库的基本使用方法
    本文介绍了Python中Requests库的基础用法,包括如何安装、GET和POST请求的实现、如何处理Cookies和Headers,以及如何解析JSON响应。相比urllib库,Requests库提供了更为简洁高效的接口来处理HTTP请求。 ... [详细]
  • 解决PHP项目在服务器无法抓取远程网页内容的问题
    本文探讨了在使用PHP进行后端开发时,遇到的一个常见问题:即在本地环境中能够正常通过CURL获取远程网页内容,但在服务器上却无法实现。我们将分析可能的原因并提供解决方案。 ... [详细]
  • 入门指南:使用FastRPC技术连接Qualcomm Hexagon DSP
    本文旨在为初学者提供关于如何使用FastRPC技术连接Qualcomm Hexagon DSP的基础知识。FastRPC技术允许开发者在本地客户端实现远程调用,从而简化Hexagon DSP的开发和调试过程。 ... [详细]
  • Python 领跑!2019年2月编程语言排名更新
    根据最新的编程语言流行指数(PYPL)排行榜,Python 在2019年2月的份额达到了26.42%,稳坐榜首位置。 ... [详细]
  • 从理想主义者的内心深处萌发的技术信仰,推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]
  • 本文详细介绍了如何在智能手机上将电话铃声恢复到原始状态,适用于各种品牌的智能手机。 ... [详细]
  • 从CodeIgniter中提取图像处理组件
    本指南旨在帮助开发者在未使用CodeIgniter框架的情况下,如何独立使用其强大的图像处理功能,包括图像尺寸调整、创建缩略图、裁剪、旋转及添加水印等。 ... [详细]
  • 本文介绍了ADO.NET框架中的五个关键组件:Connection、Command、DataAdapter、DataSet和DataReader。每个组件都在数据访问和处理过程中扮演着不可或缺的角色。 ... [详细]
  • 本文探讨了在一个物理隔离的环境中构建数据交换平台所面临的挑战,包括但不限于数据加密、传输监控及确保文件交换的安全性和可靠性。同时,作者结合自身项目经验,分享了项目规划、实施过程中的关键决策及其背后的思考。 ... [详细]
  • 本文详细介绍了数据分析和机器学习的基本流程,包括数据获取、特征工程、模型训练等关键步骤。通过实际案例解析,帮助读者理解如何从原始数据中提取有价值的信息,并构建有效的预测模型。 ... [详细]
  • 区块链与IDCC大数据产业的深度融合
    本文探讨了区块链技术如何与IDCC大数据产业结合,推动新型基础设施建设的发展,解决了传统数据处理中的诸多难题,并提出了具体的解决方案。 ... [详细]
author-avatar
东儿2502858537
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有