当前位置: 开发笔记 > 后端 > 正文

基于模型与不基于模型的深度增强学习_数据源不稳定？|基于动态模型融合的审批架构...

作者：东儿2502858537 | 来源：互联网 | 2023-09-09 13:39

背景2019年9月6日，杭州某独角兽事件打响了数据行业整顿的第一枪。之后的两个月内，大批业内金融科技公司先后参与相关调查。截止目前，各大科

背景

2019年9月6日&＃xff0c;杭州某独角兽事件打响了数据行业整顿的第一枪。

之后的两个月内&＃xff0c;大批业内金融科技公司先后参与相关调查。

截止目前&＃xff0c;各大科技公司爬虫相关的数据业务几乎已经全面停止。如果硬要追究爬虫问题&＃xff0c;其实许多公司都不能独善其身。说不定哪天&＃xff0c;平台审批策略以及模型所依赖的外部数据源就突然消失了。不禁让人思考&＃xff0c;动荡的数据条件下如何进行模型变量的配置。

因此本文从动态数据源的角度出发&＃xff0c;针对对外部数据依赖同时又担心数据源不稳定的业务&＃xff0c;提出一种基于模型组合的动态模型融合方法。防患于未然。

一、模型框架

每种数据源一个单模型&＃xff0c;通过各种AUC作为权重&＃xff0c;进行加权融合。融合时候需要保证两点&＃xff1a;

1. 对分数进行标准化。分数标准化针对单个模型&＃xff0c;在离线训练过程中就可以做。因此不涉及上线部署问题。

2. 对权重进行标准化。需要判断当前样本究竟走哪几个模型。然后对相关模型的权重进行标准化&＃xff0c;需要部署在线上进行逻辑判断。

二、使用方法

判断用户具有哪种数据源&＃xff0c;则在模型子集上对相应的模型AUC值进行标准化&＃xff0c;得到权重。并将每个模型的预测分数校准后加权求平均&＃xff0c;得到最终结果。

三、稳定性

根据经验来看&＃xff0c;多模型融合的稳定性和样本调用的差异化模型数量成正比。前提是单模型效果接近且模型之间的差异足够大。因此需要通过AUC和MIC对数据源进行评估。

四、接入数据源建议

保证融合后整体的效果好且稳定&＃xff0c;需要保证3点&＃xff1a;

接入数据源有效&＃xff0c;单模型AUC值不能明显低于其他模型。
不同数据源训练的模型MIC值差异较大。信息源相似的模型&＃xff0c;其融合结果对整体区分度没有明显帮助。
预留同质数据作为备选&＃xff0c;以备某类数据突然被斩断。

推荐阅读

爬虫
优化企业制度体系的构建与升级：案例剖析

本文深入探讨了一家企业的制度体系重构与升级过程，通过具体案例展示了如何在战略意图和管理理念指导下，系统性地提升企业管理制度的有效性和可操作性。 ... [详细]

蜡笔小新 2024-12-27 11:00:59
php
macOS系统及其关键功能解析

本文详细介绍了macOS系统的核心组件，包括如何管理其安全特性——系统完整性保护（SIP），并探讨了不同版本的更新亮点。对于使用macOS系统的用户来说，了解这些信息有助于更好地管理和优化系统性能。 ... [详细]

蜡笔小新 2024-12-26 18:05:04
php
微信8.0新功能解析：张小龙的创新与思考

阅读本文大约需要3分钟。微信8.0版本的发布带来了许多令人振奋的新功能，如烟花特效和改进的悬浮窗，引发了用户的热烈反响。 ... [详细]

蜡笔小新 2024-12-26 12:43:49
go
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
正则
探索电路与系统的起源与发展

本文回顾了电路与系统的发展历程，从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明，还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]

蜡笔小新 2024-12-24 13:57:05
go
FinOps 与 Serverless 的结合：破解云成本难题

本文探讨了如何通过 FinOps 实践优化 Serverless 应用的成本管理，提出了首个 Serverless 函数总成本估计模型，并分享了多种有效的成本优化策略。 ... [详细]

蜡笔小新 2024-12-24 12:44:26
php
2018 区块链技术峰会：专家深度解析核心技术与应用前景

2018年3月31日，CSDN、火星财经联合中关村区块链产业联盟等机构举办的2018区块链技术及应用峰会（BTA）核心分会场圆满举行。多位业内顶尖专家深入探讨了区块链的核心技术原理及其在实际业务中的应用。 ... [详细]

蜡笔小新 2024-12-24 10:56:15
go
优化深度神经网络在低性能硬件上的运行

尽管深度学习带来了广泛的应用前景，其训练通常需要强大的计算资源。然而，并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下（如ARM CPU）高效运行深度神经网络，特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]

蜡笔小新 2024-12-24 08:48:32
mvc
阿里Java面试全解析：从技术面到HR面的详细攻略

本文作者分享了在阿里巴巴获得实习offer的经历，包括五轮面试的详细内容和经验总结。其中四轮为技术面试，一轮为HR面试，涵盖了大量的Java技术和项目实践经验。 ... [详细]

蜡笔小新 2024-12-23 11:32:02
缓存
Netflix利用Druid实现高效实时数据分析

本文探讨了全球领先的在线娱乐公司Netflix如何通过采用Apache Druid，实现了高效的数据采集、处理和实时分析，从而显著提升了用户体验和业务决策的准确性。文章详细介绍了Netflix在系统架构、数据摄取、管理和查询方面的实践，并展示了Druid在大规模数据处理中的卓越性能。 ... [详细]

蜡笔小新 2024-12-23 11:10:01
缓存
并发编程 12—— 任务取消与关闭之 shutdownNow 的局限性

Java并发编程实践目录并发编程01——ThreadLocal并发编程02——ConcurrentHashMap并发编程03——阻塞队列和生产者-消费者模式并发编程04——闭锁Co ... [详细]

蜡笔小新 2024-12-21 12:39:07
go
vivo Y5s的核心处理器解析

vivo Y5s配备了联发科Helio P65八核处理器，这款处理器采用12纳米工艺制造，具备两颗高性能Cortex-A75核心和六颗高效能Cortex-A55核心。此外，它还集成了先进的图像处理单元和语音唤醒功能，为用户提供卓越的性能体验。 ... [详细]

蜡笔小新 2024-12-21 11:24:54
正则
Perl基础爬虫：从丁香园获取意大利新冠数据

本文介绍如何使用Perl编写一个简单的爬虫，从丁香园网站获取意大利的新冠病毒感染情况。通过LWP::UserAgent模块模拟浏览器访问并解析网页内容，最终提取所需数据。 ... [详细]

蜡笔小新 2024-12-25 12:06:26
正则
解决无法从selenium导入webdriver的错误

在学习网页爬虫时，使用Selenium进行自动化操作。初次安装selenium模块后，第二天运行代码时遇到了ImportError：无法从'selenium'导入名称'webdriver'。本文将详细解释该问题的原因及解决方案。 ... [详细]

蜡笔小新 2024-12-25 08:55:45
php
自己用过的一些比较有用的css3新属性【HTML】

web前端|html教程自己用过的一些比较用的css3新属性web前端-html教程css3刚推出不久，虽然大多数的css3属性在很多流行的浏览器中不支持，但我个人觉得还是要尽量开 ... [详细]

蜡笔小新 2024-12-24 19:26:54

东儿2502858537

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章