当前位置: 开发笔记 > 后端 > 正文

因子分析_主成分分析_独立成分分析_斯坦福CS229_学习笔记

作者： | 来源：互联网 | 2023-08-07 19:34

PartVIII因子分析主成分分析独立成分分析在上个部分介绍了EM算法，在此部分因子分析中，我们会再次应用到。因子分析、主成分分析和独立成分分析都作为

Part VIII 因子分析主成分分析独立成分分析

在上个部分介绍了EM算法&＃xff0c;在此部分因子分析中&＃xff0c;我们会再次应用到。

因子分析、主成分分析和独立成分分析都作为对于数据维度进行处理的手段&＃xff0c;对于我们理解数据、更好的表示数据都起到或多或少的作用&＃xff0c;因此将三者放在一起进行叙述。

Part VIII 因子分析主成分分析独立成分分析

1 因子分析&＃xff08;Factor Analysis&＃xff0c;FA&＃xff09;

1.1 背景

1.2 思想与推导

2 主成分分析&＃xff08;Principal Components Analysis&＃xff0c;PCA&＃xff09;

3 独立成分分析&＃xff08;Independent Components Analysis,ICA&＃xff09;

4 小结

1 因子分析&＃xff08;Factor Analysis&＃xff0c;FA&＃xff09;

首先介绍因子分析&＃xff08;FA&＃xff09;的提出背景&＃xff0c;接着给出算法的思想&＃xff0c;最后结合EM算法给出其参数的推导。

1.1 背景

之前介绍的各种算法&＃xff0c;我们都有着一个不容忽视假设&＃xff1a;样本的数量m足够充足&＃xff0c;这样就使得通过训练&＃xff08;迭代&＃xff09;&＃xff0c;能够求解出参数从而构造出模型。但是现实有时候是残酷的&＃xff0c;有时候会存在样本的数量匮乏的情况&＃xff08;m<

但是在当前样本数量m<

这是一个很强的限制&＃xff0c;因为这种限制认为各个参数之间是独立的&＃xff0c;实际情况下是不可取的。在协方差阵为对角阵的基础之上&＃xff0c;还可以进一步限制&＃xff0c;即协方差阵中的对角元素取值相同。这两种强限制条件大多数情况下感觉都不太适用。

在没有限制条件即原有条件下&＃xff0c;需满足 $m\geqslant n&＃43;1$

&＃xff08;2&＃xff09;原始数据空间x为n&＃xff08;图中n&＃61;2&＃xff09;维。可以将低维空间变量通过变换矩阵 $\Lambda$

&＃xff08;3&＃xff09;每个样本加上n维偏移向量 $\mu$

&＃xff08;4&＃xff09;每个样本加上n维高斯扰动ε~N(0,ψ)从而得到高维向量x

由上&＃xff0c;可将因子分析模型总结如下&＃xff1a;

从高维向量x可由潜在的低维高斯型向量z线性表示出发&＃xff0c;存在着以下假设&＃xff0c;并且在下列分布中隐变量z与随机高斯噪声 $\epsilon$

第一行表示潜在型高斯变量分布。

第二行表示随机高斯噪声的影响。

第三行表示x由z线性表示形式。

结合上述定义&＃xff0c;不难得到&＃xff08;确保明白这点&＃xff09;

接下来&＃xff0c;对于x和z的联合分布建模。由于p(x,z)&＃61;p(x|z)*p(z)&＃xff0c;两个高斯型密度函数的乘积仍然为高斯型&＃xff0c;因此将x&＃xff0c;z联合分布建模为高斯型如下&＃xff1a;

之所以在左端写成矩阵形式&＃xff0c;仅仅是为了接下来的表述方便。那么参数 $\mu _{zx}$

那么就有&＃xff1a;

$\mu _{zx}&＃61;\begin{bmatrix} EZ\\EX \end{bmatrix}&＃61;\begin{bmatrix} \vec{0}\\ \mu \end{bmatrix}$

到这里就很清晰了。还是老套路&＃xff0c;接下来利用最大似然法求解参数从而得到x&＃xff0c;z的联合分布。此时参数为 $\mu$

能够直接求偏导解出上述参数算你厉害。

此方程比较复杂&＃xff0c;很难直接解出&＃xff0c;因此就需要利用上一讲介绍EM算法进行求解了。在上一讲最后利用高斯混合模型对于EM算法的流程已经进行过介绍了。对于高斯混合模型而言&＃xff0c;隐变量z为离散型&＃xff0c;而在因子分析中隐变量z则为连续性&＃xff1b;其实就是将求和改为积分即可。下面给出EM算法的解参数步骤&＃xff1a;

&＃xff08;1&＃xff09;E-step&＃xff1a;在E-step中&＃xff0c;我们需要根据参数计算得到后验概率 $Q_{i}(z^{(i)})$

那么可得以下结论&＃xff1a; $x_{1}|x_{2}\sim N(\mu _{1|2},\Sigma _{1|2})$

因此&＃xff0c;根据此结论和前文的推导&＃xff0c;可得后验分布 $z^{(i)}|x^{(i)};\mu ,\Lambda, \epsilon \sim N(\mu _{z^{(i)}|x^{(i)}},\Sigma _{z^{(i)}|x^{(i)}})$

以上&＃xff0c;E-step顺利走通。

&＃xff08;2&＃xff09;M-step&＃xff1a;在M-step&＃xff0c;我们要最大化&＃xff1a;

简化此式得到&＃xff1a;

然后分别对于参数 $\mu ,\Lambda ,\Sigma$

在每次迭代中&＃xff0c;更新参数的值直到收敛从而得到最终参数的结果。

由此&＃xff0c;求解出三个参数&＃xff0c;原有的n维&＃xff08;高维&＃xff09;空间样本x便可由k维&＃xff08;低维&＃xff09;空间隐变量z线性表示了。

2 主成分分析&＃xff08;Principal Components Analysis&＃xff0c;PCA&＃xff09;

主成分分析&＃xff08;PCA&＃xff09;作为另外一种数据降维的手段得到了广泛的应用。

主成分分析的思想在于&＃xff0c;在数据维度&＃xff08;n维&＃xff09;较大时&＃xff0c;各个维度之间或多或少都会存在着相关性&＃xff0c;而实际上我们并不需要全部使用维度进行处理&＃xff0c;因为或许选取数据的某k维就代表了很大部分的n维特征。PCA的过程就是提取这k维的过程。

解释PCA可以从将近10种思路出发&＃xff0c;这里选取比较好理解的最大方差的思路出发进行解释。

以2维数据压缩为1维数据为例&＃xff0c;PCA要做的找到一个新的维度&＃xff0c;是数据在新维度上的方差最大&＃xff08;即投影长度最长&＃xff0c;如u1的方向所示&＃xff09;。因为根据信息论的观点&＃xff0c;数据所包含的方差越大&＃xff0c;那么数据所包含的信息量越大。如果新的投影方向u1能够包含原有数据的大部分信息&＃xff08;假设85%以上&＃xff09;&＃xff0c;那么可以认为在保证了数据信息的精度上进行了压缩。

再举一个例子&＃xff0c;假设原有5个2维样本如下图所示。

分别将原始数据按照如图所示的两个方向进行投影&＃xff0c;得到左图与右图。

这就很清晰了&＃xff0c;左图的数据明显比右图更能保留原始的数据信息。

那么包含了数据最多的新的投影方向是什么方向呢&＃xff1f;听上去是一个解最值的问题&＃xff0c;实际上也正是这样。

首先对于数据预处理。预处理的目的在于使各个维度的数据在接下来的处理中拥有着相同的尺度。预处理步骤如下。

&＃xff08;1&＃xff09;计算 $\mu &＃61;\frac{1}{m}\sum_{i&＃61;1}^{m}x^{(i)}$

因此&＃xff0c;优化问题即为在|u|&＃61;1的条件下&＃xff0c;使下式最大化

利用拉格朗日乘数法即可解决&＃xff0c;这里设 $X^{T}X&＃61;\Sigma$

对u求偏导&＃xff0c;并另偏导等于0&＃xff0c;得 $\Sigma u-\lambda u&＃61;0$

又因为 x&＃61;As,s&＃61;Wx

从而推出&＃xff1a;

接下来又到了求参环节了&＃xff0c;这里我们的参数是W&＃xff0c;同样利用最大似然法进行参数的求解。写出最大似然方程&＃xff1a;

对W求偏导&＃xff0c;可得每次迭代的更新公式为&＃xff1a;

为了表述方便&＃xff0c;可将解得的W写成如下形式&＃xff1a;

根据W&＃xff0c;那么原有数据中的每个信号的来源即可分离开了。即每个 $s_{i}&＃61;w_{i}^{T}*x$ 。由此ICA从原有混合数据中将来源于不同信号源的数据进行分离的任务便完成了。

4 小结

或许有人会疑惑同样是作为数据降维的手段&＃xff0c;好像最后的形式也差不多&＃xff0c;因子分析&＃xff08;FA&＃xff09;和主成分分析&＃xff08;PCA&＃xff09;有什么区别呢&＃xff1f;看完二者的推导&＃xff0c;谈谈我的看法。

首先&＃xff0c;差别还是挺明显的&＃xff0c;二者的思想出发点就不同。FA是想从众多特征中找出一些共性&＃xff08;即隐变量z&＃xff09;&＃xff0c;利用共性对于原有数据进行表达&＃xff1b;而PCA则是从众多特征中找出一些具有代表性的特征对于原有特征进行表达。

其次&＃xff0c;二者的着重点也不一致。FA着重于各个变量间的协方差&＃xff1b;而PCA则着重于总体的方差。

再者&＃xff0c;FA相比较而言做了一些假设&＃xff0c;较为受到限制&＃xff1b;而PCA则无需假设&＃xff0c;应用更广。

最后&＃xff0c;PCA的实际应用范围是大于FA的。PCA在许多方面都发挥着不小的作用。

独立成分分析&＃xff08;ICA&＃xff09;的目的在于从多个信号混杂的数据中&＃xff0c;解算出每个信号原有的数据。为此ICA做了一些假设&＃xff0c;包括确定信号的分布函数。在ICA中应该留意&＃xff0c;高斯分布的数据并不能直接应用ICA做分解。

推荐阅读

static
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
static
深入解析Android自定义View面试题

本文探讨了Android Launcher开发中自定义View的重要性，并通过一道经典的面试题，帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识，还提供了实际操作建议。 ... [详细]

蜡笔小新 2024-12-28 11:15:04
go
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
go
使用动态规划算法求解0-1背包问题

本文介绍如何利用动态规划算法解决经典的0-1背包问题。通过具体实例和代码实现，详细解释了在给定容量的背包中选择若干物品以最大化总价值的过程。 ... [详细]

蜡笔小新 2024-12-27 19:17:15
server
深入理解设计模式与七大原则

本文详细探讨了Java中的24种设计模式及其应用，并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类，帮助开发者更好地理解和应用这些模式，提升代码质量和可维护性。 ... [详细]

蜡笔小新 2024-12-27 19:10:10
static
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
jvm
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
go
深入解析：手把手教你构建决策树算法

本文详细介绍了机器学习中广泛应用的决策树算法，通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字，建议阅读时间5分钟。 ... [详细]

蜡笔小新 2024-12-27 13:44:59
go
C语言实现小写金额转换为大写金额

在金融和会计领域，准确无误地填写票据和结算凭证至关重要。这些文件不仅是支付结算和现金收付的重要依据，还直接关系到交易的安全性和准确性。本文介绍了一种使用C语言实现小写金额转换为大写金额的方法，确保数据的标准化和规范化。 ... [详细]

蜡笔小新 2024-12-27 12:39:06
go
深度学习理论解析与理解

梯度方向指示函数值增加的方向，由各轴方向的偏导数综合而成，其模长表示函数值变化的速率。本文详细探讨了导数、偏导数、梯度等概念，并结合Softmax函数、卷积神经网络（CNN）中的卷积计算、权值共享及池化操作进行了深入分析。 ... [详细]

蜡笔小新 2024-12-26 18:23:11
go
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02
http
帝国CMS多图上传插件详解及使用指南

本文介绍了一款用于帝国CMS的多图上传插件，该插件通过Flash技术实现批量图片上传功能，显著提升了多图上传效率。文章详细说明了插件的安装、配置和使用方法。 ... [详细]

蜡笔小新 2024-12-26 13:30:01
go
DLP数据泄露检测原理浅析

最近团队在部署DLP，作为一个技术人员对于黑盒看不到的地方还是充满了好奇心。多次咨询乙方人员DLP的算法原理是什么，他们都以商业秘密为由避而不谈，不得已只能自己查资料学习，于是有了下面的浅见。身为甲方，虽然不需要开发DLP产品，但是也有必要弄明白DLP基本的原理。俗话说工欲善其事必先利其器，只有在懂这个工具的原理之后才能更加灵活地使用这个工具，即使出现意外情况也能快速排错，越接近底层，越接近真相。根据DLP的实际用途，本文将DLP检测分为2部分，泄露关键字检测和近似重复文档检测。 ... [详细]

蜡笔小新 2024-12-25 18:19:32
server
深入理解Redis的数据结构与对象系统

本文详细探讨了Redis中的数据结构和对象系统的实现，包括字符串、列表、集合、哈希表和有序集合等五种核心对象类型，以及它们所使用的底层数据结构。通过分析源码和相关文献，帮助读者更好地理解Redis的设计原理。 ... [详细]

蜡笔小新 2024-12-25 04:11:22
go
脑机接口：连接未来的桥梁

脑机接口（BCI）技术正逐步将科幻变为现实，从帮助听障人士恢复听力到使瘫痪者重新站立，甚至可能将多年的学习过程压缩至瞬间。本文探讨了这一前沿技术的现状、挑战及其未来前景。 ... [详细]

蜡笔小新 2024-12-24 23:49:49

Tags | 热门标签

RankList | 热门文章

因子分析_主成分分析_独立成分分析_斯坦福CS229_学习笔记

Part VIII 因子分析 主成分分析 独立成分分析

1 因子分析&＃xff08;Factor Analysis&＃xff0c;FA&＃xff09;

1.1 背景

2 主成分分析&＃xff08;Principal Components Analysis&＃xff0c;PCA&＃xff09;

4 小结

Part VIII 因子分析主成分分析独立成分分析