建议读者先阅读这篇文章:【092】韦达定理在一元n次方程中的推广 搞明白什么是韦达定理。
按照特征值的定义: A =λ
λ - A =
(λI-A) =
其中 I 表示单位矩阵。
按照特征值的定义, 不能是零向量。按照克莱姆法则,若|λI-A|≠0,则 必然是零向量。所以|λI-A|=0。
不妨设 ,显然
即 = 0
求特征值,可以把 λ 看做未知数,行列式可以化作一个一元N次方程。A的特征值 λ1,λ2,···,λn 就是这个一元n次方程的解。并且根据代数基本定理,在复数范围内,这个一元n次方程一定有解。
按照行列式的定义,
|A|=
其中 j1, j2, ··· ,jn 表示 从1到n的排序。
那么,|λI-A|=0 中,次数最高的项应该是在 (-1)τ(1,2,···,n)П(λ-aii) 中。次数第二高的项应该也在这一组连乘式子中。
为什么次数第二高的项也在(-1)τ(1,2,···,n)П(λ-aii) 中?
行列式定义的连加运算中,每一项可以这么理解:行列式每一行都选出一个数字进行连乘,并且这些选出的数不能是同一列的。次数第二高的式子必须至少有n-1个(λ-aii)。然而|λI-A|的连加运算中不可能有哪一项包含 n-1 个 (λ-aii)。因为如果存在包含n-1个(λ-aii)的项,那么假设没提供 (λ-aii) 的那行是第k行。第k行必须从别的列上取一个数,但是其他的n-1行提供的(λ-aii)把其他的n-1列都占用了并且还在对角线上。这导致第k行只能去第k列取数,而k行k列显然是(λ-akk),存在矛盾。所以次数第二高的项也在(-1)τ(1,2,···,n)П(λ-aii) 中。
(-1)τ(1,2,···,n)П(λ-aii)=П(λ-aii) ,把-1消掉是因为1,2,···,n 是正序。
根据 【092】韦达定理在一元n次方程中的推广 中的推论1,可知:
П(λ-aii) = λn - ( ∑aii ) λn-1 + ··· + (-1)nПaii
设一元n次方程 |λI-A|=0 的常数项是 C,可得:
λn - ( ∑aii ) λn-1 + ··· + C = 0
∑λi = -[- ( ∑aii ) ÷ 1] = ∑aii = Tr(A)
不妨设 n 阶矩阵 A 的 Jordan形矩阵是 J。根据《线性代数》P99:
每个方阵 A 都与一个若当(Jordan)形矩阵 J 相似,并且,若不考虑若当形矩阵 J 主对角线上若当块的排列顺序,若当形矩阵 J 由方阵 A 唯一确定,叫做方阵 A 的若当标准形。
因为 A 与 J 相似,必然存在可逆方阵 P,使得 A=PJP-1
Tr(A) = Tr(PJP-1)
Tr(A) = Tr( P-1P J ) 《深度学习》P29 Tr(AB)=Tr(BA)
Tr(A) = Tr( I J ) = Tr( J )
因为 若当形矩阵 J 主对角线上的元素都是方阵 A 的特征值。
所以 矩阵特征值的和等于矩阵的迹。