热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

机器学习的持续探索与进展

在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。
一、机器学习

基础

概率论-wiki

数据挖掘中所需的概率论与数理统计知识

理解 Bias 与 Variance 之间的权衡
//var是不同训练模型之间的差别,好比K-fold之中,如果不同模型之间差别很大(var大),也就是说他们都和自己的训练集与其他训练集不接近,所以,不同模型之间var很大->他们就都不是truth;而如果bias很大,不用细讲,那他们更不是truth

先验概率与后验概率

PR曲线、ROC曲线和AUC
详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解
//MLE隐含了参数取任何值的概率都一样,而MAP则考虑到了参数取不同值的概率是有差别的,有些值更容易取到,有些值不容易取到。比如扔十次硬币,十次都是正,那MLE估计得结果就是正的概率为1,但大家知道这明显不可能,所以要用到先验概率,就是上面所说,我们预先知道了取1几乎不可能

生成模型与判别模型

判别模型(Discriminative model)和生成模型(Generative model)

P、NP、NPC和NP-Hard相关概念的图形和解释

常见的几种最优化方法(梯度下降法、牛顿法、拟牛顿法、共轭梯度法等)

数值优化(Numerical Optimization)学习系列-线搜索方法(LineSearch)

训练集、测试集和验证集

Logistics

Logistic回归原理及公式推导

岭回归和lasso—回归的拓展

多重共线性的解决方法之——岭回归与LASSO

Softmax

Softmax回归

SVM

支持向量机SVM(一)
支持向量机SVM(二)

SMO优化算法(Sequential minimal optimization)

深入理解拉格朗日乘子法(Lagrange Multiplier) 和KKT条件

支持向量机通俗导论(理解SVM的三层境界)

支持向量机(SVM)的特点与不足

K-Means

Canopy Clustering

Canopy算法聚类

Canopy Clustering(Canopy聚类)

算法杂货铺——k均值聚类(K-means)

深入浅出K-Means算法

基本Kmeans算法介绍及其实现

贝叶斯方法

算法杂货铺——分类算法之朴素贝叶斯分类(Naive Bayesian classification)

从贝叶斯方法谈到贝叶斯网络

朴素贝叶斯算法原理小结

超细致的贝叶斯决策论

从决策树学习谈到贝叶斯分类算法、EM、HMM

决策树

信息增益,信息增益率,Gini

决策树的特性及优缺点

频繁模式

FP Tree算法原理总结

主成分分析

奇异值分解(SVD)原理

机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用

特征降维-PCA(Principal Component Analysis)

PCA 降维算法详解 以及代码示例

主成分分析(Principal components analysis)-最大方差解释

图论与社交网络

并查集——求无向图的所有连通子图

EM算法

EM算法(Expectation Maximization Algorithm)详解

简单易学的机器学习算法——EM算法

感知机

感知机(Perceptron)

反向传播算法

前馈神经网络与反向传播算法(推导过程)

A Step by Step Backpropagation Example

AutoEncoder

深度学习教程之Autoencoder

玻尔兹曼机

受限玻尔兹曼机RBM最通俗易懂的教程

深度学习教程之受限玻耳兹曼机

深度信念网络

深度信念网络(Deep Belief Network)

深度信念神经网络DBN最通俗易懂的教程

机器学习——DBN深度信念网络详解

增强学习基础

强化学习(Reinforcement Learning, RL)初步介绍

Deep Reinforcement Learning 基础知识

强化学习学习笔记列表

增强学习Reinforcement Learning经典算法梳理1:policy and value iteration

多臂赌博机

从Multi-arm Bandits问题分析 – RL进阶

多臂赌博机系列

综合

数据挖掘十大算法

二、系统的教程

Coursera-机器学习-Andrew NG

Build Intelligent Applications

台大李宏毅-线性代数、ML和DL

集体智慧编程

机器学习实战

deeplearning4j

三、大神们的Blog

学习相关

AI 传送门(很多深度学习资料、keras入门)

Albert-Lee (代表作:Python爬虫小白入门)

四去六进一 (代表作:机器学习(周志华西瓜书) 参考答案 总目录)

胡萝卜周博客 (各种资源软件)

龙哥盟飞龙blog(老哥疯狂翻译了一堆书和文档)

大学霸(网络攻防领域的老哥)

jerrylead (机器学习经典算法学习笔记)


推荐阅读
  • 本文介绍了几种常用的图像相似度对比方法,包括直方图方法、图像模板匹配、PSNR峰值信噪比、SSIM结构相似性和感知哈希算法。每种方法都有其优缺点,适用于不同的应用场景。 ... [详细]
  • Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 本文对比了杜甫《喜晴》的两种英文翻译版本:a. Pleased with Sunny Weather 和 b. Rejoicing in Clearing Weather。a 版由 alexcwlin 翻译并经 Adam Lam 编辑,b 版则由哈佛大学的宇文所安教授 (Prof. Stephen Owen) 翻译。 ... [详细]
  • 解决Bootstrap DataTable Ajax请求重复问题
    在最近的一个项目中,我们使用了JQuery DataTable进行数据展示,虽然使用起来非常方便,但在测试过程中发现了一个问题:当查询条件改变时,有时查询结果的数据不正确。通过FireBug调试发现,点击搜索按钮时,会发送两次Ajax请求,一次是原条件的请求,一次是新条件的请求。 ... [详细]
  • 本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用,包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]
  • 在软件开发过程中,经常需要将多个项目或模块进行集成和调试,尤其是当项目依赖于第三方开源库(如Cordova、CocoaPods)时。本文介绍了如何在Xcode中高效地进行多项目联合调试,分享了一些实用的技巧和最佳实践,帮助开发者解决常见的调试难题,提高开发效率。 ... [详细]
  • 技术日志:使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告
    技术日志:使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告 ... [详细]
  • Hadoop 2.6 主要由 HDFS 和 YARN 两大部分组成,其中 YARN 包含了运行在 ResourceManager 的 JVM 中的组件以及在 NodeManager 中运行的部分。本文深入探讨了 Hadoop 2.6 日志文件的解析方法,并详细介绍了 MapReduce 日志管理的最佳实践,旨在帮助用户更好地理解和优化日志处理流程,提高系统运维效率。 ... [详细]
  • JVM参数设置与命令行工具详解
    JVM参数配置与命令行工具的深入解析旨在优化系统性能,通过合理设置JVM参数,确保在高吞吐量的前提下,有效减少垃圾回收(GC)的频率,进而降低系统停顿时间,提升服务的稳定性和响应速度。此外,本文还将详细介绍常用的JVM命令行工具,帮助开发者更好地监控和调优JVM运行状态。 ... [详细]
  • 本文详细介绍了 InfluxDB、collectd 和 Grafana 的安装与配置流程。首先,按照启动顺序依次安装并配置 InfluxDB、collectd 和 Grafana。InfluxDB 作为时序数据库,用于存储时间序列数据;collectd 负责数据的采集与传输;Grafana 则用于数据的可视化展示。文中提供了 collectd 的官方文档链接,便于用户参考和进一步了解其配置选项。通过本指南,读者可以轻松搭建一个高效的数据监控系统。 ... [详细]
  • 在对WordPress Duplicator插件0.4.4版本的安全评估中,发现其存在跨站脚本(XSS)攻击漏洞。此漏洞可能被利用进行恶意操作,建议用户及时更新至最新版本以确保系统安全。测试方法仅限于安全研究和教学目的,使用时需自行承担风险。漏洞编号:HTB23162。 ... [详细]
  • Hadoop平台警告解决:无法加载本机Hadoop库的全面应对方案
    本文探讨了在Hadoop平台上遇到“无法加载本机Hadoop库”警告的多种解决方案。首先,通过修改日志配置文件来忽略该警告,这一方法被证明是有效的。其次,尝试指定本地库的路径,但未能解决问题。接着,尝试不使用Hadoop本地库,同样没有效果。然后,通过替换现有的Hadoop本地库,成功解决了问题。最后,根据Hadoop的源代码自行编译本地库,也达到了预期的效果。以上方法适用于macOS系统。 ... [详细]
  • 本文详细介绍了在CentOS 6.5 64位系统上使用阿里云ECS服务器搭建LAMP环境的具体步骤。首先,通过PuTTY工具实现远程连接至服务器。接着,检查当前系统的磁盘空间使用情况,确保有足够的空间进行后续操作,可使用 `df` 命令进行查看。此外,文章还涵盖了安装和配置Apache、MySQL和PHP的相关步骤,以及常见问题的解决方法,帮助用户顺利完成LAMP环境的搭建。 ... [详细]
  • 本指南详细介绍了在Linux环境中高效连接MySQL数据库的方法。用户可以通过安装并使用`mysql`客户端工具来实现本地连接,具体命令为:`mysql -u 用户名 -p 密码 -h 主机`。例如,使用管理员账户连接本地MySQL服务器的命令为:`mysql -u root -p pass`。此外,还提供了多种配置优化建议,以确保连接过程更加稳定和高效。 ... [详细]
author-avatar
手机用户2502937345
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有