热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

二机器学习

二机器学习二机器学习二机器学习SVD推荐的GitHubhttps:github.comNLP-LOVEML-NLP实现多折交叉验证在Kaggle比赛中常用集成学习方法与机器学习中

二机器学习二 机器学习




  1. SVD


推荐的GitHub

https://github.com/NLP-LOVE/ML-NLP



实现多折交叉验证



在Kaggle比赛中常用集成学习方法与机器学习中的不同∶

机器学习中的集成学习:在一个模型内部,如何使用集成学习提交单个模型的精度;
Kaggle竞赛中的集成学习:对多个模型预测结果,如何使用集成学习提交最终的精度;

√机器学习中的集成学习方法:Bagging、Boosting
https://scikit-learn.org/stable/modules/ensemble.html

√Kaggle比赛中模型集成方法:Vote、Blend、Stacking

https://mlwave.com/kaggle-ensembling-guide/

在这里插入图片描述


Blend / Average

  • 方法:将结果进行加权
  • 用途:对数值记过进行集成

在这里插入图片描述


Stacking
在交叉验证的过程中对模型进行多折训练,对训练集和测试集统计进行预测;
out of fold可以用来进行增加特征,也可以用来进行stacking



  • 需要配合交叉验证完成
  • 模型/特征多样时收益大


在这里插入图片描述



  • 特征工程



  • 传统机器学习

1.机器如何学习
2.机器学习三要素:数据、模型、算法
3.模型的获取和改进
4.模型的评价指标和质量
5.最常用的优化算法—梯度下降法
6.线性回归
7.逻辑回归
8.朴素贝叶斯分类器
9.决策树
10.SVM—支持向量机
11.SVR—支持向量回归
12.HMM—隐马尔可夫模型
13.CRF—条件随机场
14.KNN—K邻近算法
15.K-Means
16.谱聚类
17.EM算法
18.GMM—高斯混合模型
19.PCA—主成成分分析
20.感知机和神经网络



  • 传统机器学习实战

1.K邻近算法:约会网站配对、手写识别系统
2.决策树:使用决策树预测隐形眼镜类型、天池O2O优惠卷使用预测
3.朴素贝叶斯:过滤垃圾邮件、o2o
4.逻辑回归:从氙气预测病马的死亡、o2o
5.SVM:手写体识别、o2o
7.集成算法:在一个较难数据集上应用AdaBoost、o2o
8.线性回归:预测鲍鱼年龄
9.CART树:树回归和标准回归的比较、o2o
10.k-means:对地理坐标进行聚类
11.PCA:菜馆菜肴推荐系统、基于SVD的图像压缩



  • 常用

1.目标函数(损失函数)详细说一下L1 与 L2
2.监督学习
3.GridSearch



  • 集成学习

1.分类树、回归树
2.集成学习
3.XGboost



  • 机器学习和神经网络

1.绪论:面向机器学习的神经网络
2.感知器的学习过程
3.线性/逻辑神经网络和反向传播
4.学习特征词向量
5.用神经网络进行物体识别
6.模型优化:如何加快学习
7.循环神经网络RNN
8.提高神经网络模型的泛化能力
9.结合多重神经网络提高泛化能力
10.Hopfield网络和玻尔兹曼机
11.限制玻尔兹曼机
12.深度置信网络
13.生成预训练的深度神经网络
14.神经网络的模型分层结构
15.深度神经网络的应用


实战案例:

  • 房价与股市预测
  • 排序与CTR预估计算广告
  • KDD2013-NLP
  • 能源预测与分配
  • 猫狗分辨与人脸表情识别
  • 电商推荐与销量预测
  • 金融风控


数据分析:

  • 时间序列数据分析
  • 文本数据分析
  • 图像数据处理及分析
  • 量化分析

推荐阅读
  • 本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用,涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 京东AI创新之路:周伯文解析京东AI战略的独特之处
    2018年4月15日,京东在北京举办了人工智能创新峰会,会上首次公开了京东AI的整体布局和发展方向。此次峰会不仅展示了京东在AI领域的最新成果,还标志着京东AI团队的首次集体亮相。本文将深入探讨京东AI的发展策略及其与BAT等公司的不同之处。 ... [详细]
  • 本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤,帮助开发者快速掌握这一实用技巧。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • 视觉Transformer综述
    本文综述了视觉Transformer在计算机视觉领域的应用,从原始Transformer出发,详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构,还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]
  • 本文介绍如何利用动态规划算法解决经典的0-1背包问题。通过具体实例和代码实现,详细解释了在给定容量的背包中选择若干物品以最大化总价值的过程。 ... [详细]
  • 本文详细探讨了Java中的24种设计模式及其应用,并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类,帮助开发者更好地理解和应用这些模式,提升代码质量和可维护性。 ... [详细]
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
  • 深入理解 SQL 视图、存储过程与事务
    本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式,存储过程则封装了复杂的SQL逻辑,而事务确保了数据库操作的完整性和一致性。 ... [详细]
  • c# – UWP:BrightnessOverride StartOverride逻辑 ... [详细]
  • 使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表
    本文介绍了一段通用代码示例,该代码不仅能够操作 Azure Active Directory (AAD),还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级:AAD 和 Subscription。 ... [详细]
  • 本文深入探讨了 Java 中的 Serializable 接口,解释了其实现机制、用途及注意事项,帮助开发者更好地理解和使用序列化功能。 ... [详细]
  • 回顾与学习是进步的阶梯。再次审视卷积神经网络(CNNs),我对之前不甚明了的概念有了更深的理解。本文旨在分享这些新的见解,并探讨CNNs在图像识别和自然语言处理等领域中的实际应用。 ... [详细]
author-avatar
雨霖铃111130
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有