作者:多米音乐_34067977 | 来源:互联网 | 2024-11-15 18:30
在阅读论文时,经常遇到协方差矩阵这一概念,尤其是在图像处理领域。尽管网络上有许多公式,但其物理意义却往往令人困惑。本文将详细探讨协方差矩阵的性质和应用,帮助读者更好地理解这一重要的数学工具。
在阅读论文时,经常会遇到协方差矩阵这一概念,尤其是在图像处理领域。尽管网络上有许多公式,但其物理意义却往往令人困惑。本文将详细探讨协方差矩阵的性质和应用,帮助读者更好地理解这一重要的数学工具。
统计学的基本概念
学习过概率统计的人都知道,统计中最基本的概念包括样本的均值、方差和标准差。假设有一个包含n个样本的集合,以下是这些概念的公式描述:
均值(Mean):
标准差(Standard Deviation):
方差(Variance):
均值描述的是样本集合的中心位置,而标准差描述的是样本点到均值的平均距离。例如,考虑两个集合 [0, 8, 12, 20] 和 [8, 9, 11, 12],它们的均值都是10,但标准差分别为8.3和1.8,后者更为集中,因此标准差较小。标准差用于描述数据的“散布度”,而方差则是标准差的平方。
以人均收入为例,均值反映了整体水平,而方差则反映了贫富差距。方差越大,表示社会财富分布越不均匀,贫富差距越大。
为什么需要协方差?
上述统计量主要用于描述一维数据,但在现实生活中,我们常常遇到多维数据集,例如学生各科成绩。对于多维数据,除了计算每维的方差外,我们还希望了解不同维度之间的关系。协方差就是一种度量两个随机变量关系的统计量,其定义如下:
协方差(Covariance):
协方差的结果有何意义?如果结果为正值,则说明两个变量正相关;如果为负值,则说明负相关;如果为0,则说明两个变量相互独立。例如,一个男孩子的猥琐程度和他的受欢迎程度之间可能存在正相关或负相关的关系。
协方差矩阵
协方差矩阵用于处理多维数据集。以二维数据为例,协方差矩阵为:
对于n维数据集,协方差矩阵的大小为n×n,其中对角线元素为各维度的方差,非对角线元素为不同维度之间的协方差。协方差矩阵是对称的,因为它满足 Cov(X, Y) = Cov(Y, X)。
协方差矩阵的计算步骤如下:
- 将样本矩阵中心化,即每个维度减去该维度的均值,使每个维度的均值为0。
- 用新的样本矩阵乘以其转置,然后除以 (N-1)。
这种方法实际上是协方差公式的矩阵形式,虽然理解起来不如公式直观,但在抽象的公式推导中非常常用。
参考文献
1. Pinky Jie's Blog
2. Janakiev's Blog