09 因子分析(基础版)
(此篇的R代码对应本博客系列《11 R语言手册(第四站 降维方法)》)
标签: 机器学习与数据挖掘
1.检验相关性
①使用KMOI样本重组度的测量值:表示由隐含因子造成的在各个被标准化的指示变量中有共同变化的比率。当KMO比率小于0.50时,说明用因子分析法不合适。
②假设检验Bartlett’s test of Sphericity:此检验的假设是,相关性矩阵是一个单位矩阵,即变量之间存在相关性。如p值比0.1大,就没有足够的证据来拒绝零假设,可以认为变量之间是完全不相关的,因此,因子分析法将不适用。
(大数据环境下的统计测试可能会导致一些误导。由于赝本数量巨大,即使最小的容量也具有统计显著性。数据挖掘时采用交叉验证方法而不是统计推理)
所以,需要 KMO大于0.549 和 Bartlett球度检验小于0.1 。
2.列出因子矩阵
和主成分分析一样,可以先标准化矩阵,再提取 特征值 与 变异解释率的比例,累计方差百分比。

(主轴因子法:用一个反复迭代的过程估计因子的解。)

(其中的系数的计算方法推导的话,可以查看《因子分析(进阶版)》,其实,这些系数也就是其中所提到的共性方差了。)
3.旋转因子