当前位置: 开发笔记 > 编程语言 > 正文

数据挖掘小白系列!机器学习中调参的基本思想

作者： | 来源：互联网 | 2023-09-15 20:18

本文章只用于学习交流不用于任何商业行为,所有知识点资料来源于网络,如有任何不当之处请私信联系,作者会及时改正

本文中总结自文档所有标注的页码都是附件参考文档中的页码

由于markdown不支持附件下载,附件链接如下

http://note.youdao.com/noteshare?id=c0fdd78d4a7d79165f4406402caca630

1大家都不说调参的原因

=============================

其一是因为，调参的方式总是根据数据的状况而定，所
以没有办法一概而论；其二是因为，其实大家也都没有特别好的办法。

2常规调参路线

=============================

画学习曲线，或者网格搜索，我们能够探索到调参边缘（代价可能是训练一次模型要跑三天三夜）

3高手的调参思想

=============================

1）非常正确的调参思路和方法
2）对模型评估指标的理解
3）对数据的感觉和经验
4）用洪荒之力去不断地尝试。

1）非常正确的调参思路和方法

=============================

第一步是要找准目标：我们要做什么？
一般来说，这个目标是提升某个模型评估指标，找准了这个目标，我们就需要思考：模型在未知数据上的指标受什么因素影响？
对模型效果来说:分类->准确率,回归->MSE; 对模型整体来说:泛化性+效果
而衡量模型在未知数据上的准确率的指标叫做泛化误差
总结:一般调的就是泛化误差,让模型在泛化误差最低点
PS:小数据可以直接做这个图出来,大数据就要根据对模型的理解,判断在图形的哪里.比如随机森林树模型容易过拟合,那一般就是在最低点的右边.需要在保持准确率的同时把复杂度降下来
数据挖掘小白系列!机器学习中调参的基本思想
泛化误差详见:https://www.cnblogs.com/juanjiang/p/10774616.html

2)对模型评估指标的理解

=============================

这个是太重要的了,打比赛的都知道.在不同需求下,挑选正确能让模型实际效果提升一大截,这个要自己慢慢学习,没得办法
常见各种损失函数1

常见各种损失函数2

3）对数据的感觉和经验

=============================

个人觉得就是对数据集/业务的了解程度.典型的例子就是信用卡用户.1个失信用户99个守约用户,那直接蒙全是守约用户那模型的准确率都有99%,然后这明显会让我们血亏,这是都对数据集调整或者模型权重调整就很重要了.

4）用洪荒之力去不断地尝试。

=============================

买个***配置,让电表转起来!

4个人对调参的一点想法

=============================

调参实际情况是很复杂.
从手段上来说:AUTOML+传统
从数据上来说:如果是分类的我可能会百分比抽出来,在小数据跑个大概的范围出来.大数据上应用

推荐阅读

html
网络爬虫的规范与限制

本文探讨了网络爬虫引发的问题及其解决方案，重点介绍了Robots协议的作用和使用方法，旨在为网络爬虫的合理使用提供指导。 ... [详细]

蜡笔小新 2024-11-13 15:45:41
replace
在GitHub上克隆vue-element-admin项目时遇到依赖安装错误

在 GitHub 上克隆 vue-element-admin 项目后，使用 `npm install` 安装依赖时遇到了未知的 Git 错误。具体错误信息为 `npm ERR! code 128`，提示命令执行失败。这可能是由于网络问题、Git 配置不正确或某些依赖包的仓库地址无效导致的。建议检查网络连接、更新 Git 版本并确保所有依赖项的 URL 正确无误。 ... [详细]

蜡笔小新 2024-11-04 17:01:47
数组
Java初学者必备的六大核心知识点

本文总结了Java初学者需要掌握的六大核心知识点，帮助你更好地理解和应用Java编程。无论你是刚刚入门还是希望巩固基础，这些知识点都是必不可少的。 ... [详细]

蜡笔小新 2024-11-13 18:24:59
python
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
ip
JUC（三）：深入解析AQS

本文详细介绍了Java并发工具包中的核心类AQS（AbstractQueuedSynchronizer），包括其基本概念、数据结构、源码分析及核心方法的实现。 ... [详细]

蜡笔小新 2024-11-13 15:40:34
ip
Spring 切面配置中的切点表达式详解

本文介绍了如何在Spring框架中使用AspectJ风格的切面配置，详细解释了切点表达式的语法和常见示例，帮助开发者更好地理解和应用Spring AOP。 ... [详细]

蜡笔小新 2024-11-13 14:07:16
ip
用阿里云的免费 SSL 证书让网站从 HTTP 换成 HTTPS

HTTP协议是不加密传输数据的，也就是用户跟你的网站之间传递数据有可能在途中被截获，破解传递的真实内容，所以使用不加密的HTTP的网站是不 ... [详细]

蜡笔小新 2024-11-13 14:02:50
ip
双指针法高效解决七道链表问题

双指针法在链表问题中应用广泛，能够高效解决多种经典问题，如合并两个有序链表、合并多个有序链表、查找倒数第k个节点等。本文将详细介绍这些应用场景及其解决方案。 ... [详细]

蜡笔小新 2024-11-13 13:16:55
loops
IOS Run loop详解

为什么80%的码农都做不了架构师？转自http:blog.csdn.netztp800201articledetails9240913感谢作者分享Objecti ... [详细]

蜡笔小新 2024-11-13 12:14:35
loops
HTML中span元素为何会脱离li元素对齐？

在HTML布局中，有时会遇到span元素未能与li元素保持对齐的问题。本文将探讨这一现象的原因，并提供解决方案。 ... [详细]

蜡笔小新 2024-11-12 15:11:58
ip
解决Bootstrap DataTable Ajax请求重复问题

在最近的一个项目中，我们使用了JQuery DataTable进行数据展示，虽然使用起来非常方便，但在测试过程中发现了一个问题：当查询条件改变时，有时查询结果的数据不正确。通过FireBug调试发现，点击搜索按钮时，会发送两次Ajax请求，一次是原条件的请求，一次是新条件的请求。 ... [详细]

蜡笔小新 2024-11-12 13:59:27
ip
R语言中向量（Vector）数据类型的元素索引与访问：利用中括号[]和赋值操作符在向量末尾追加数据以扩展其长度

在R语言中，向量（Vector）数据类型的元素可以通过中括号 `[]` 进行索引和访问。此外，利用中括号和赋值操作符，可以在向量的末尾追加新数据，从而动态地扩展向量的长度。这种方法不仅简洁高效，还能灵活地管理向量中的数据。 ... [详细]

蜡笔小新 2024-11-10 06:24:16
ip
a16z深入解析：代币设计的常见误区、优化策略及未来趋势分析

a16z深入解析：代币设计的常见误区、优化策略及未来趋势分析 ... [详细]

蜡笔小新 2024-11-06 14:52:58
ip
深入浅出解读奇异值分解，助你轻松掌握核心概念

深入浅出解读奇异值分解，助你轻松掌握核心概念 ... [详细]

蜡笔小新 2024-11-03 15:12:45
ip
基于iSCSI的SQL Server 2012群集测试(一)SQL群集安装

一、测试需求介绍与准备公司计划服务器迁移过程计划同时上线SQLServer2012，引入SQLServer2012群集提高高可用性，需要对SQLServ ... [详细]

蜡笔小新 2024-11-13 15:49:49

Tags | 热门标签

RankList | 热门文章