热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

法向量点云pca_PCA的四种推导方法

PCA总述我们假设把原数据中心化处理之后为,总共有m个样本,每个样本有n个特征。每一个样本为,中心化后的数据,均值为,协方差

PCA

总述

我们假设把原数据中心化处理之后为

,总共有m个样本,每个样本有n个特征。每一个样本为
, 中心化后的数据,均值为
,协方差矩阵为

PCA(principle component analysis) 是一种降低数据维度的方法。接下来我分别用四种方法来推导一下(方法之间相互等价)。

最大方差法

我们通过方差来度量数据内的信息量,我们可以看到,如果将数据投影到某个方向,比如方向1,或者方向2,当投影后的数据尽可能分散的时候,也就是方差尽可能大的时候,保留的信息量是最大的,因此方向1是更好的。

d8a70aef4f9389a409897ee1f1e8af67.png

于是,我们的问题就变成了:在多维空间下,如何选择一个最优的方向,来让投影之后的数据保留最多的信息量。于是我们假设这个方向的单位方向向量是

,在多维空间下投影之后的数据为

所以方差变为

于是我们求解的最优化的问题就是,如何使

利用拉格朗日乘子法求得

因此

就是S的特征值,而
就是对应的特征向量,
就是主成分。

最小距离法

还是上图的例子,我们希望找到一个方向,让点到投影点的距离最小,损失的信息最少。所以还是方向1更好一些,于是问题变成了

所以等价于

所以和上述方法其实是等价的。

最小协方差法(kl变换)

在通过坐标变换之后,即对原始数据进行线性变换后,尽量使得变换后的协方差矩阵

对角化(即使得除矩阵D对角线外的元素都为0)。这样根据协方差矩阵的性质,可以使得变化后,不同特征之间的相关系数最小,尽量不相关。

而这时我们会发现变换后的对角矩阵D对角线其实是S的特征值(根据线性代数的知识),而P则是由对应的特征向量组成。于是就需要我们对S进行特征值分解

或者对X进行SVD(也可以使S对角化)

基于线性回归的思想

考虑线性回归模型

我们考虑对X做一个变换,假设
的特征值,
是对应的标准正交化特征向量,我们设

模型就会变为

我们就可以发现

, 每一个特征值
都对应第i个主成分的方差是多少,即在0左右的变动有多少。所以当一些特征之间存在一些线性关系的时候,
就会有一些很小的特征值。在这种情况下,我们如果舍去后几个主成分的话,误差也不会太大。

而且在一定条件下,这种方法可能会比普通的最小二乘估计的均方误差更小。

(其实这种方法就是应用最大方差法结论反推,然后从代数方法解释了一下。)

。。。就随便写写,之后继续完善吧。。。



推荐阅读
  • 作为一名 Ember.js 新手,了解如何在路由和模型中正确加载 JSON 数据是至关重要的。本文将探讨两者之间的差异,并提供实用的建议。 ... [详细]
  • 本文详细介绍了Java中的三大类设计模式:创建型模式、结构型模式和行为型模式,并探讨了设计模式遵循的六大原则,帮助开发者更好地理解和应用这些模式。 ... [详细]
  • 叶酸聚乙二醇羧基化合物(FA-PEG-COOH)
    本产品为叶酸修饰的聚乙二醇羧基衍生物,英文名称为FA-PEG-COOH或Folic acid-PEG-acid。其分子量范围包括1k、2k、3.4k、5k、10k和20k,并可根据客户需求定制。该化合物适用于科研实验,具有高纯度和良好的水溶性。 ... [详细]
  • 本文详细介绍了在 Windows 2000 系统中启用 TELNET 服务时需要注意的 NTLM 配置问题,帮助用户解决常见的身份验证失败错误。 ... [详细]
  • 本文详细介绍了 Flink 和 YARN 的交互机制。YARN 是 Hadoop 生态系统中的资源管理组件,类似于 Spark on YARN 的配置方式。我们将基于官方文档,深入探讨如何在 YARN 上部署和运行 Flink 任务。 ... [详细]
  • 本文详细介绍了网络存储技术的基本概念、分类及应用场景。通过分析直连式存储(DAS)、网络附加存储(NAS)和存储区域网络(SAN)的特点,帮助读者理解不同存储方式的优势与局限性。 ... [详细]
  • 在尝试用另一台电脑的MySQL文件替换本地D:\xampp\mysql目录后,MySQL服务无法启动。错误提示显示MySQL意外关闭,可能是由于端口冲突、依赖缺失、权限问题或崩溃等原因引起。 ... [详细]
  • C语言标准及其GCC编译器版本
    编程语言的发展离不开持续的维护和更新。本文将探讨C语言的标准演变以及GCC编译器如何支持这些标准,确保其与时俱进,满足现代开发需求。 ... [详细]
  • 南京DBA鸽展:尽享赛鸽文化盛宴,带心仪信鸽回家
    南京DBA鸽展盛大开幕,汇聚全球顶级赛鸽和业界精英,为鸽友带来一场视觉与文化的双重盛宴。不仅有丰富的展品展示,还有机会带走心仪的信鸽。 ... [详细]
  • 开发笔记:9.八大排序
    开发笔记:9.八大排序 ... [详细]
  • 本文详细介绍了Python中列表的创建、访问、修改、排序及遍历等基本操作,帮助初学者快速掌握列表这一重要数据结构。 ... [详细]
  • 解析SQL查询结果的排序问题及其解决方案
    本文探讨了为什么某些SQL查询返回的数据集未能按预期顺序排列,并提供了详细的解决方案,帮助开发者理解并解决这一常见问题。 ... [详细]
  • 哈密顿回路问题旨在寻找一个简单回路,该回路包含图中的每个顶点。本文将介绍如何判断给定的路径是否构成哈密顿回路。 ... [详细]
  • 本文介绍了ArcXML配置文件的分类及其在不同服务中的应用,详细解释了地图配置文件的结构和功能,包括其在Image Service、Feature Service以及ArcMap Server中的使用方法。 ... [详细]
  • 本文详细介绍如何利用已搭建的LAMP(Linux、Apache、MySQL、PHP)环境,快速创建一个基于WordPress的内容管理系统(CMS)。WordPress是一款流行的开源博客平台,适用于个人或小型团队使用。 ... [详细]
author-avatar
倒转流年1990
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有