热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

机器学习的持续探索与进展

在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。
一、机器学习

基础

概率论-wiki

数据挖掘中所需的概率论与数理统计知识

理解 Bias 与 Variance 之间的权衡
//var是不同训练模型之间的差别,好比K-fold之中,如果不同模型之间差别很大(var大),也就是说他们都和自己的训练集与其他训练集不接近,所以,不同模型之间var很大->他们就都不是truth;而如果bias很大,不用细讲,那他们更不是truth

先验概率与后验概率

PR曲线、ROC曲线和AUC
详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解
//MLE隐含了参数取任何值的概率都一样,而MAP则考虑到了参数取不同值的概率是有差别的,有些值更容易取到,有些值不容易取到。比如扔十次硬币,十次都是正,那MLE估计得结果就是正的概率为1,但大家知道这明显不可能,所以要用到先验概率,就是上面所说,我们预先知道了取1几乎不可能

生成模型与判别模型

判别模型(Discriminative model)和生成模型(Generative model)

P、NP、NPC和NP-Hard相关概念的图形和解释

常见的几种最优化方法(梯度下降法、牛顿法、拟牛顿法、共轭梯度法等)

数值优化(Numerical Optimization)学习系列-线搜索方法(LineSearch)

训练集、测试集和验证集

Logistics

Logistic回归原理及公式推导

岭回归和lasso—回归的拓展

多重共线性的解决方法之——岭回归与LASSO

Softmax

Softmax回归

SVM

支持向量机SVM(一)
支持向量机SVM(二)

SMO优化算法(Sequential minimal optimization)

深入理解拉格朗日乘子法(Lagrange Multiplier) 和KKT条件

支持向量机通俗导论(理解SVM的三层境界)

支持向量机(SVM)的特点与不足

K-Means

Canopy Clustering

Canopy算法聚类

Canopy Clustering(Canopy聚类)

算法杂货铺——k均值聚类(K-means)

深入浅出K-Means算法

基本Kmeans算法介绍及其实现

贝叶斯方法

算法杂货铺——分类算法之朴素贝叶斯分类(Naive Bayesian classification)

从贝叶斯方法谈到贝叶斯网络

朴素贝叶斯算法原理小结

超细致的贝叶斯决策论

从决策树学习谈到贝叶斯分类算法、EM、HMM

决策树

信息增益,信息增益率,Gini

决策树的特性及优缺点

频繁模式

FP Tree算法原理总结

主成分分析

奇异值分解(SVD)原理

机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用

特征降维-PCA(Principal Component Analysis)

PCA 降维算法详解 以及代码示例

主成分分析(Principal components analysis)-最大方差解释

图论与社交网络

并查集——求无向图的所有连通子图

EM算法

EM算法(Expectation Maximization Algorithm)详解

简单易学的机器学习算法——EM算法

感知机

感知机(Perceptron)

反向传播算法

前馈神经网络与反向传播算法(推导过程)

A Step by Step Backpropagation Example

AutoEncoder

深度学习教程之Autoencoder

玻尔兹曼机

受限玻尔兹曼机RBM最通俗易懂的教程

深度学习教程之受限玻耳兹曼机

深度信念网络

深度信念网络(Deep Belief Network)

深度信念神经网络DBN最通俗易懂的教程

机器学习——DBN深度信念网络详解

增强学习基础

强化学习(Reinforcement Learning, RL)初步介绍

Deep Reinforcement Learning 基础知识

强化学习学习笔记列表

增强学习Reinforcement Learning经典算法梳理1:policy and value iteration

多臂赌博机

从Multi-arm Bandits问题分析 – RL进阶

多臂赌博机系列

综合

数据挖掘十大算法

二、系统的教程

Coursera-机器学习-Andrew NG

Build Intelligent Applications

台大李宏毅-线性代数、ML和DL

集体智慧编程

机器学习实战

deeplearning4j

三、大神们的Blog

学习相关

AI 传送门(很多深度学习资料、keras入门)

Albert-Lee (代表作:Python爬虫小白入门)

四去六进一 (代表作:机器学习(周志华西瓜书) 参考答案 总目录)

胡萝卜周博客 (各种资源软件)

龙哥盟飞龙blog(老哥疯狂翻译了一堆书和文档)

大学霸(网络攻防领域的老哥)

jerrylead (机器学习经典算法学习笔记)


推荐阅读
  • Coursera ML 机器学习
    2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]
  • 利用决策树预测NBA比赛胜负的Python数据挖掘实践
    本文通过使用2013-14赛季NBA赛程与结果数据集以及2013年NBA排名数据,结合《Python数据挖掘入门与实践》一书中的方法,展示如何应用决策树算法进行比赛胜负预测。我们将详细讲解数据预处理、特征工程及模型评估等关键步骤。 ... [详细]
  • Python 工具推荐 | PyHubWeekly 第二十一期:提升命令行体验的五大工具
    本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具,涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 作为一名专业的Web前端工程师,掌握HTML和CSS的命名规范是至关重要的。良好的命名习惯不仅有助于提高代码的可读性和维护性,还能促进团队协作。本文将详细介绍Web前端开发中常用的HTML和CSS命名规范,并提供实用的建议。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • C++实现经典排序算法
    本文详细介绍了七种经典的排序算法及其性能分析。每种算法的平均、最坏和最好情况的时间复杂度、辅助空间需求以及稳定性都被列出,帮助读者全面了解这些排序方法的特点。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 2023年京东Android面试真题解析与经验分享
    本文由一位拥有6年Android开发经验的工程师撰写,详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]
  • 使用Pandas高效读取SQL脚本中的数据
    本文详细介绍了如何利用Pandas直接读取和解析SQL脚本,提供了一种高效的数据处理方法。该方法适用于各种数据库导出的SQL脚本,并且能够显著提升数据导入的速度和效率。 ... [详细]
  • 探索电路与系统的起源与发展
    本文回顾了电路与系统的发展历程,从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明,还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]
  • 本文探讨了如何在iOS开发环境中,特别是在Xcode 6.1中,设置和应用自定义文本样式。我们将详细介绍实现方法,并提供一些实用的技巧。 ... [详细]
  • 深入浅出TensorFlow数据读写机制
    本文详细介绍TensorFlow中的数据读写操作,包括TFRecord文件的创建与读取,以及数据集(dataset)的相关概念和使用方法。 ... [详细]
author-avatar
手机用户2502937345
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有