热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

漫步线性代数一——引言

我们以线性代数的中心问题开启我们的航程:解决线性方程。最重要并且也是最简单的情况就是位置函数的数目等于方程的数目。现在我们有包含n个未知变量的n个方程,

我们以线性代数的中心问题开启我们的航程:解决线性方程。最重要并且也是最简单的情况就是位置函数的数目等于方程的数目。现在我们有包含n个未知变量的n个方程,首先从n=2开始:


1x+2y=34x+5y=6(1)
未知变量是

x,y。我打算用消元和行列式两种方式来求解方程。当然

x,y

1,2,3,4,5,6这些数确定,问题就是如何利用这六个数求解出方程。


  1. 消元 第二个方程减去第一个方程的四倍。从而消去第二个方程中的x,只留下了关于y的方程:

    (2)4(1)3y=6(2)
    这样就得到y=2。然后x从第一个方程1x+2y=3计算出来:
    1x+2(2)=3x=1(3)
    计算出来后,x,y也应该满足第二个方程。代入得:4×(1)+5×2=6

  2. 行列式 y=2完全依赖于方程中的六个数。对于y存在一个公式(当然x也有),是两个行列式的比值:

    y=14361425=16341524=63=2(4)
    如果你知道2×2方阵的行列式,那么它就没有那么神秘了。它同样给出了解y=2。同样利用行列式,我们可以求出x
    x=36251425=35261524=33=1(5)

我们来比较这两种方法,考虑n非常大(在科学计算中n=1000是非常适中的大小)。事实就是直接对1000个方程使用行列式将是一个大灾难。左边将会有百万级别的数目,既然是正确的,但是效率很低。之后会提到该公式如何得到(克莱姆法则),但是目前我们需要一个很好的办法来解决这1000个方程。

最好的办法是高斯消元法。这个算法一直被用于解决大型的方程组。以后的大部分例子都是n=3,这是看不出太大区别。方程(2)(4)基本使用相同的步骤得到y=2。之后通过回带到方程(3)中很快得出x。对于更大的n值,依然有效。消去法比计算行列式要好。

消去法的想法看起来很简单,通过几个例子就能掌握它。它是非常基础的内容,通过简化矩阵我们就能理解它。在此我想讲四点更深层次的内容:


  1. 线性代数带来了平面几何。在十维空间中可视化九维平面不太容易。而理解相交于十个方程解的那些平面更难。但是不见得是不可能的。在图1 中有两条直线,相交于点(x,y)=(1,2)。线性代数将图像放到十维空间里,在这个空间里,我们的直觉不得不去想象其几何形状。


    这里写图片描述
    图1:左边是例子的单个解,中间和右边是奇异情况,分别是无解和多个解

  2. 现在考虑矩阵符号,将n个未知量表示成向量x,n个方程表示成Ax=b。我们用消去矩阵乘以A得到上三角矩阵U。这些步骤将矩阵A分解为L×U,其中L是下三角矩阵:

    A=1425=14011023=L×U(6)
    首先我们需要介绍矩阵和向量以及乘法规则。每个矩阵都存在转置AT。这个矩阵还存在逆矩阵A1

  3. 大部分情况下,消去法不会存在问题。矩阵可逆的话,方程Ax=b还有一个解。但是在特殊的情况下这种方法就被打破了,既可能是方程组的顺序出错(通过交换一笑就能产生),也可能是方程没有唯一解。如果将例子中的5换成8,就出现了奇异的情况:

    1x+2y=34x+8y=6(7)
    消去法依然用第二个减去第一个的四倍,那么结果是:
    (2)4(1)0=6

  4. 对于n个方程组,我们希望粗略算出需要多少步消去运算。计算代价经常决定着模型的精度。一百个方程需要一百万步(乘法和减法)的三分之一。计算机可以很快地计算出来。在一百步之后,舍入误差就已经很明显了。(有些问题敏感,而有些不敏感)在不知道全部细节的情况下,我们想明白实际中出现的大型系统以及他们是如何被解决的。


之后我会尽可能有效的介绍消去算法。这个算法用于各种各样的应用中,同时,用矩阵的方式(系数矩阵A,消去矩阵E,行交换矩阵P以及因子L,U)理解它也是非常重要的。我希望接下来的一系列文章能够让大家感到轻松。


推荐阅读
  • 线性Kalman滤波器在多自由度车辆悬架主动控制中的应用研究
    本文探讨了线性Kalman滤波器(LKF)在不同自由度(2、4、7)的车辆悬架系统中进行主动控制的应用。通过详细的仿真分析,展示了LKF在提升悬架性能方面的潜力,并总结了调参过程中的关键要点。 ... [详细]
  • 本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射,详细解释了两者的创建、加载及删除操作,并提供了查看表详细信息的方法。通过对比这两种表类型,帮助读者理解如何更好地管理和保护数据。 ... [详细]
  • 探讨一个显示数字的故障计算器,它支持两种操作:将当前数字乘以2或减去1。本文将详细介绍如何用最少的操作次数将初始值X转换为目标值Y。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 本文探讨如何设计一个安全的加密和验证算法,确保生成的密码具有高随机性和低重复率,并提供相应的验证机制。 ... [详细]
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • 在金融和会计领域,准确无误地填写票据和结算凭证至关重要。这些文件不仅是支付结算和现金收付的重要依据,还直接关系到交易的安全性和准确性。本文介绍了一种使用C语言实现小写金额转换为大写金额的方法,确保数据的标准化和规范化。 ... [详细]
  • 在给定的数组中,除了一个数字外,其他所有数字都是相同的。任务是找到这个唯一的不同数字。例如,findUniq([1, 1, 1, 2, 1, 1]) 返回 2,findUniq([0, 0, 0.55, 0, 0]) 返回 0.55。 ... [详细]
  • 本文探讨了卷积神经网络(CNN)中感受野的概念及其与锚框(anchor box)的关系。感受野定义了特征图上每个像素点对应的输入图像区域大小,而锚框则是在每个像素中心生成的多个不同尺寸和宽高比的边界框。两者在目标检测任务中起到关键作用。 ... [详细]
  • 网络攻防实战:从HTTP到HTTPS的演变
    本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程,探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]
  • 本文深入探讨了Linux系统中网卡绑定(bonding)的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡,实现网络冗余、带宽聚合和负载均衡,在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]
  • 本文探讨了如何在给定整数N的情况下,找到两个不同的整数a和b,使得它们的和最大,并且满足特定的数学条件。 ... [详细]
  • 深度学习理论解析与理解
    梯度方向指示函数值增加的方向,由各轴方向的偏导数综合而成,其模长表示函数值变化的速率。本文详细探讨了导数、偏导数、梯度等概念,并结合Softmax函数、卷积神经网络(CNN)中的卷积计算、权值共享及池化操作进行了深入分析。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 自学编程与计算机专业背景者的差异分析
    本文探讨了自学编程者和计算机专业毕业生在技能、知识结构及职业发展上的不同之处,结合实际案例分析两者的优势与劣势。 ... [详细]
author-avatar
亮我mc踢弯的
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有