LR其实是可以做一下特征离散化的

作者：麦穗的小婷 | 来源：互联网 | 2023-05-18 16:07

今天听组里人聊天，说LR需要把特征离散化，但是GBDT并不需要把特征离散化；我很疑惑，我记得lr并不需要离散化啊。后来听他们说，LR更适合处理稀疏数据，那么把特征先离散化到4个特征维度（假设的）

今天听组里人聊天，说LR需要把特征离散化，但是GBDT并不需要把特征离散化；我很疑惑，我记得lr并不需要离散化啊。后来听他们说，LR更适合处理稀疏数据，那么把特征先离散化到4个特征维度（假设的），然后以后遇到这个特征的时候，实际上就是四个特征中的一个有值了。【实际上是做了一个哑变量处理】

以下摘自知乎：
3. 逻辑回归属于广义线性模型，表达能力受限；单变量离散化为N个后，每个变量有单独的权重，相当于为模型引入了非线性，能够提升模型表达能力，加大拟合；
6. 特征离散化以后，起到了简化了逻辑回归模型的作用，降低了模型过拟合的风险。

李沐曾经说过：模型是使用离散特征还是连续特征，其实是一个“海量离散特征+简单模型” 同 “少量连续特征+复杂模型”的权衡。既可以离散化用线性模型，也可以用连续特征加深度学习。就看是喜欢折腾特征还是折腾模型了。通常来说，前者容易，而且可以n个人一起并行做，有成功经验；后者目前看很赞，能走多远还须拭目以待。

深度学习

推荐阅读

算法
机器学习核心概念与技术

本文系统梳理了机器学习的关键知识点，涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容，并深入探讨了各算法的原理和应用场景。 ... [详细]

蜡笔小新 2024-12-22 09:15:30
深度学习
使用EmguCV 4.5.4实现LSD直线检测的C#示例

欢迎关注“视觉与AI技术前沿”公众号，获取最新的计算机视觉和深度学习干货。本文将详细介绍如何使用EmguCV 4.5.4在C#中实现LSD（Line Segment Detector）直线检测，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-20 19:49:33
深度
多智能体深度强化学习中的分布式奖励估计

本文探讨了在多智能体系统中应用分布式奖励估计技术，以解决由于环境和代理互动引起的奖励不确定性问题。通过设计多动作分支奖励估计和策略加权奖励聚合方法，本研究旨在提高多智能体强化学习（MARL）的有效性和稳定性。 ... [详细]

蜡笔小新 2024-12-15 17:04:36
深度学习
优质PHP实训与培训学校推荐

本文精选了几所优秀的PHP实训和培训学校，为希望深入学习PHP编程的学员提供参考。 ... [详细]

蜡笔小新 2024-12-14 19:53:44
人脸识别
亚马逊Go：无人零售的创新与挑战

本文探讨了亚马逊Go如何通过技术创新推动零售业的发展，以及面临的市场和隐私挑战。同时，介绍了亚马逊最新的‘刷手支付’技术及其潜在影响。 ... [详细]

蜡笔小新 2024-12-13 11:39:37
算法
浪潮AI服务器NF5488A5在MLPerf基准测试中刷新多项纪录

近日，国际权威AI基准测试平台MLPerf发布了最新的推理测试结果，浪潮AI服务器NF5488A5在此次测试中创造了18项性能纪录，显著提升了数据中心AI推理性能。 ... [详细]

蜡笔小新 2024-12-12 13:57:17
算法
图像分类算法的优化策略与实践

本文探讨了《Bag of Tricks for Image Classification with Convolutional Neural Networks》论文中的多项技术，旨在通过具体实例和实验验证，提高卷积神经网络在图像分类任务中的性能。文章详细介绍了从模型训练加速、网络结构调整到训练参数优化等多个方面的改进方法。 ... [详细]

蜡笔小新 2024-12-09 16:01:40
人工智能
盘古开源：加速智能与绿色的数据与算力设施建设

随着5G、云计算、人工智能、大数据等新技术的广泛应用，人们的生活生产方式发生了深刻变化。从人际互联到万物互联，数据存储与处理需求激增，推动了数据与算力设施的发展。 ... [详细]

蜡笔小新 2024-12-09 12:57:37
tensorflow
吴恩达推出TensorFlow实践课程，Python基础即可入门，四个月掌握核心技能

量子位报道，deeplearning.ai最新发布了TensorFlow实践课程，适合希望使用TensorFlow开发AI应用的学习者。该课程涵盖机器学习模型构建、图像识别、自然语言处理及时间序列预测等多个方面。 ... [详细]

蜡笔小新 2024-12-08 17:26:10
人脸识别
强人工智能时代，区块链的角色与前景

随着强人工智能的崛起，区块链技术在新的技术生态中扮演着怎样的角色？本文探讨了区块链与强人工智能之间的互补关系及其在未来技术发展中的重要性。 ... [详细]

蜡笔小新 2024-12-07 14:46:21
人工智能
图像标签与以图搜图技术的应用与实践

本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用，涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]

蜡笔小新 2024-12-07 14:28:06
ocr
京东AI创新之路：周伯文解析京东AI战略的独特之处

2018年4月15日，京东在北京举办了人工智能创新峰会，会上首次公开了京东AI的整体布局和发展方向。此次峰会不仅展示了京东在AI领域的最新成果，还标志着京东AI团队的首次集体亮相。本文将深入探讨京东AI的发展策略及其与BAT等公司的不同之处。 ... [详细]

蜡笔小新 2024-12-06 22:57:11
深度学习
如何用GPU服务器运行Python

如何用GPU服务器运行Python-目录前言一、服务器登录1.1下载安装putty1.2putty远程登录 1.3查看GPU、显卡常用命令1.4Linux常用命令二、 ... [详细]

蜡笔小新 2024-12-06 11:54:09
人工智能
4000名‘数学基础薄弱’的程序员逆袭成功！揭秘如何学好AI与算法

对于那些数学基础较差的程序员来说，数学在编程中的重要性往往在工作中才逐渐显现。通过两个实际案例，我们可以深入了解数学如何帮助程序员更好地理解和优化代码。 ... [详细]

蜡笔小新 2024-12-05 19:05:15
人工智能
TensorFlow 入门：MNIST 数据集实战

本文详细介绍了 TensorFlow 的入门实践，特别是使用 MNIST 数据集进行数字识别的项目。文章首先解析了项目文件结构，并解释了各部分的作用，随后逐步讲解了如何通过 TensorFlow 实现基本的神经网络模型。 ... [详细]

蜡笔小新 2024-12-05 13:06:15

麦穗的小婷

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章