热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

基于模型与不基于模型的深度增强学习_数据源不稳定?|基于动态模型融合的审批架构...

背景2019年9月6日,杭州某独角兽事件打响了数据行业整顿的第一枪。之后的两个月内,大批业内金融科技公司先后参与相关调查。截止目前,各大科
8acbdd67-111e-eb11-8da9-e4434bdf6706.png

背景

2019年9月6日,杭州某独角兽事件打响了数据行业整顿的第一枪。

之后的两个月内,大批业内金融科技公司先后参与相关调查。

截止目前,各大科技公司爬虫相关的数据业务几乎已经全面停止。如果硬要追究爬虫问题,其实许多公司都不能独善其身。说不定哪天,平台审批策略以及模型所依赖的外部数据源就突然消失了。不禁让人思考,动荡的数据条件下如何进行模型变量的配置。

8fcbdd67-111e-eb11-8da9-e4434bdf6706.png

因此本文从动态数据源的角度出发,针对对外部数据依赖同时又担心数据源不稳定的业务,提出一种基于模型组合的动态模型融合方法。防患于未然。

一、模型框架 

每种数据源一个单模型,通过各种AUC作为权重,进行加权融合。融合时候需要保证两点:

1. 对分数进行标准化。分数标准化针对单个模型,在离线训练过程中就可以做。因此不涉及上线部署问题。

2. 对权重进行标准化。需要判断当前样本究竟走哪几个模型。然后对相关模型的权重进行标准化,需要部署在线上进行逻辑判断。

93cbdd67-111e-eb11-8da9-e4434bdf6706.png

二、使用方法

判断用户具有哪种数据源,则在模型子集上对相应的模型AUC值进行标准化,得到权重。并将每个模型的预测分数校准后加权求平均,得到最终结果。

三、稳定性

根据经验来看,多模型融合的稳定性和样本调用的差异化模型数量成正比。前提是单模型效果接近且模型之间的差异足够大。因此需要通过AUC和MIC对数据源进行评估。

四、接入数据源建议

保证融合后整体的效果好且稳定,需要保证3点:

  1. 接入数据源有效,单模型AUC值不能明显低于其他模型。

  2. 不同数据源训练的模型MIC值差异较大。信息源相似的模型,其融合结果对整体区分度没有明显帮助。

  3. 预留同质数据作为备选,以备某类数据突然被斩断。




推荐阅读
  • 阅读本文大约需要3分钟。微信8.0版本的发布带来了许多令人振奋的新功能,如烟花特效和改进的悬浮窗,引发了用户的热烈反响。 ... [详细]
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  • 探索电路与系统的起源与发展
    本文回顾了电路与系统的发展历程,从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明,还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]
  • FinOps 与 Serverless 的结合:破解云成本难题
    本文探讨了如何通过 FinOps 实践优化 Serverless 应用的成本管理,提出了首个 Serverless 函数总成本估计模型,并分享了多种有效的成本优化策略。 ... [详细]
  • 2018年3月31日,CSDN、火星财经联合中关村区块链产业联盟等机构举办的2018区块链技术及应用峰会(BTA)核心分会场圆满举行。多位业内顶尖专家深入探讨了区块链的核心技术原理及其在实际业务中的应用。 ... [详细]
  • 尽管深度学习带来了广泛的应用前景,其训练通常需要强大的计算资源。然而,并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下(如ARM CPU)高效运行深度神经网络,特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]
  • 本文作者分享了在阿里巴巴获得实习offer的经历,包括五轮面试的详细内容和经验总结。其中四轮为技术面试,一轮为HR面试,涵盖了大量的Java技术和项目实践经验。 ... [详细]
  • Netflix利用Druid实现高效实时数据分析
    本文探讨了全球领先的在线娱乐公司Netflix如何通过采用Apache Druid,实现了高效的数据采集、处理和实时分析,从而显著提升了用户体验和业务决策的准确性。文章详细介绍了Netflix在系统架构、数据摄取、管理和查询方面的实践,并展示了Druid在大规模数据处理中的卓越性能。 ... [详细]
  • 并发编程 12—— 任务取消与关闭 之 shutdownNow 的局限性
    Java并发编程实践目录并发编程01——ThreadLocal并发编程02——ConcurrentHashMap并发编程03——阻塞队列和生产者-消费者模式并发编程04——闭锁Co ... [详细]
  • vivo Y5s配备了联发科Helio P65八核处理器,这款处理器采用12纳米工艺制造,具备两颗高性能Cortex-A75核心和六颗高效能Cortex-A55核心。此外,它还集成了先进的图像处理单元和语音唤醒功能,为用户提供卓越的性能体验。 ... [详细]
  • 本文详细解释了如何使用@IfProfileValue注解来检测Spring框架中的配置文件是否处于活动状态,并探讨其与@Profile和@activeProfiles的区别。 ... [详细]
  • 本文探讨了如何在日常工作中通过优化效率和深入研究核心技术,将技术和知识转化为实际收益。文章结合个人经验,分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法,帮助读者更好地实现技术变现。 ... [详细]
  • 在PHP后端开发中遇到一个难题:通过第三方类文件发送短信功能返回的JSON字符串无法解析。本文将探讨可能的原因并提供解决方案。 ... [详细]
  • 使用JS、HTML5和C3创建自定义弹出窗口
    本文介绍如何结合JavaScript、HTML5和C3.js来实现一个功能丰富的自定义弹出窗口。通过具体的代码示例,详细讲解了实现过程中的关键步骤和技术要点。 ... [详细]
  • 本文介绍了一个基于 Java SpringMVC 和 SSM 框架的综合系统,涵盖了操作日志记录、文件管理、头像编辑、权限控制、以及多种技术集成如 Shiro、Redis 等,旨在提供一个高效且功能丰富的开发平台。 ... [详细]
author-avatar
东儿2502858537
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有