热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

C语言科学计算入门之矩阵乘法的相关计算

这篇文章主要介绍了C语言科学计算入门之矩阵乘法的相关计算,文章中还介绍了矩阵相关的斯特拉森算法的实现,需要的朋友可以参考下

1.矩阵相乘
矩阵相乘应满足的条件:
(1) 矩阵A的列数必须等于矩阵B的行数,矩阵A与矩阵B才能相乘;
(2) 矩阵C的行数等于矩阵A的行数,矩阵C的列数等于矩阵B的列数;
(3) 矩阵C中第i行第j列的元素等于矩阵A的第i行元素与矩阵B的第j列元素对应乘积之和,即

2015122105527273.jpg (198×26)

如:

2015122105554362.jpg (225×76)

则:

2015122105625870.jpg (431×61)

2. 常用矩阵相乘算法
    用A的第i行分别和B的第j列的各个元素相乘求和,求得C的第i行j列的元素,这种算法中,B的访问是按列进行访问的,代码如下:

void arymul(int a[4][5], int b[5][3], int c[4][3])
{
 int i, j, k;
 int temp;
 for(i = 0; i <4; i++){
 for(j = 0; j <3; j++){
  temp = 0;
  for(k = 0; k <5; k++){
  temp += a[i][k] * b[k][j];
  }
  c[i][j] = temp;
  printf("%d/t", c[i][j]);
 }
 printf("%d/n");
 }
}

3. 改进的算法
    矩阵A、B、C都按行(数据的存储顺序)访问,以提高存储器访问效率,对于A的第i行中,第j列的元素分别和B的第j行的元素相乘,对于B中相同的列k在上述计算过程中求和,从而得到C第i行k列的数据,代码如下:

void arymul1(int a[4][5], int b[5][3], int c[4][3])
{
 int i, j, k;
 int temp[3] = {0};
 for(i = 0; i <4; i++){
 for(k = 0; k <3; k ++)
  temp[k] = 0;
 for(j = 0; j <5; j++){//当前行的每个元素
  for(k = 0; k <3; k++){
  temp[k] += a[i][j] * b[j][k];
  }
 }
 for(k = 0; k <3; k++){
  c[i][k] = temp[k];
  printf("%d/t", c[i][k]);
 }
 printf("%d/n");
 }
}

这种算法很容易转到稀疏矩阵的相乘算法。

PS:斯特拉森算法的实现
斯特拉森方法,是由v.斯特拉森在1969年提出的一个方法。

我们先讨论二阶矩阵的计算方法。
对于二阶矩阵

a11 a12 b11 b12 
A = a21 a22 B = b21 b22 

先计算下面7个量(1)

x1 = (a11 + a22) * (b11 + b22); 
x2 = (a21 + a22) * b11; 
x3 = a11 * (b12 - b22); 
x4 = a22 * (b21 - b11); 
x5 = (a11 + a12) * b22; 
x6 = (a21 - a11) * (b11 + b12); 
x7 = (a12 - a22) * (b21 + b22); 

再设C = AB。根据矩阵相乘的规则,C的各元素为(2)

c11 = a11 * b11 + a12 * b21 
c12 = a11 * b12 + a12 * b22 
c21 = a21 * b11 + a22 * b21 
c22 = a21 * b12 + a22 * b22 

比较(1)(2),C的各元素可以表示为(3)

c11 = x1 + x4 - x5 + x7 
c12 = x3 + x5 
c21 = x2 + x4 
c22 = x1 + x3 - x2 + x6 

根据以上的方法,我们就可以计算4阶矩阵了,先将4阶矩阵A和B划分成四块2阶矩阵,分别利用公式计算它们的乘积,再使用(1)(3)来计算出最后结果。

ma11 ma12 mb11 mb12 
A4 = ma21 ma22 B4 = mb21 mb22 

其中

a11 a12 a13 a14 b11 b12 b13 b14 
ma11 = a21 a22 ma12 = a23 a24 mb11 = b21 b22 mb12 = b23 b24 

a31 a32 a33 a34 b31 b32 b33 b34 
ma21 = a41 a42 ma22 = a43 a44 mb21 = b41 b42 mb22 = b43 b44 

实现

// 计算2X2矩阵 
void Multiply2X2(float& fOut_11, float& fOut_12, float& fOut_21, float& fOut_22, 
float f1_11, float f1_12, float f1_21, float f1_22, 
float f2_11, float f2_12, float f2_21, float f2_22) 
{ 
const float x1((f1_11 + f1_22) * (f2_11 + f2_22)); 
const float x2((f1_21 + f1_22) * f2_11); 
const float x3(f1_11 * (f2_12 - f2_22)); 
const float x4(f1_22 * (f2_21 - f2_11)); 
const float x5((f1_11 + f1_12) * f2_22); 
const float x6((f1_21 - f1_11) * (f2_11 + f2_12)); 
const float x7((f1_12 - f1_22) * (f2_21 + f2_22)); 
fOut_11 = x1 + x4 - x5 + x7; 
fOut_12 = x3 + x5; 
fOut_21 = x2 + x4; 
fOut_22 = x1 - x2 + x3 + x6; 
} 
// 计算4X4矩阵 
void Multiply(CLAYMATRIX& mOut, const CLAYMATRIX& m1, const CLAYMATRIX& m2) 
{ 
float fTmp[7][4]; 
// (ma11 + ma22) * (mb11 + mb22) 
Multiply2X2(fTmp[0][0], fTmp[0][1], fTmp[0][2], fTmp[0][3], 
m1._11 + m1._33, m1._12 + m1._34, m1._21 + m1._43, m1._22 + m1._44, 
m2._11 + m2._33, m2._12 + m2._34, m2._21 + m2._43, m2._22 + m2._44); 
// (ma21 + ma22) * mb11 
Multiply2X2(fTmp[1][0], fTmp[1][1], fTmp[1][2], fTmp[1][3], 
m1._31 + m1._33, m1._32 + m1._34, m1._41 + m1._43, m1._42 + m1._44, 
m2._11, m2._12, m2._21, m2._22); 
// ma11 * (mb12 - mb22) 
Multiply2X2(fTmp[2][0], fTmp[2][1], fTmp[2][2], fTmp[2][3], 
m1._11, m1._12, m1._21, m1._22, 
m2._13 - m2._33, m2._14 - m2._34, m2._23 - m2._43, m2._24 - m2._44); 
// ma22 * (mb21 - mb11) 
Multiply2X2(fTmp[3][0], fTmp[3][1], fTmp[3][2], fTmp[3][3], 
m1._33, m1._34, m1._43, m1._44, 
m2._31 - m2._11, m2._32 - m2._12, m2._41 - m2._21, m2._42 - m2._22); 
// (ma11 + ma12) * mb22 
Multiply2X2(fTmp[4][0], fTmp[4][1], fTmp[4][2], fTmp[4][3], 
m1._11 + m1._13, m1._12 + m1._14, m1._21 + m1._23, m1._22 + m1._24, 
m2._33, m2._34, m2._43, m2._44); 
// (ma21 - ma11) * (mb11 + mb12) 
Multiply2X2(fTmp[5][0], fTmp[5][1], fTmp[5][2], fTmp[5][3], 
m1._31 - m1._11, m1._32 - m1._12, m1._41 - m1._21, m1._42 - m1._22, 
m2._11 + m2._13, m2._12 + m2._14, m2._21 + m2._23, m2._22 + m2._24); 
// (ma12 - ma22) * (mb21 + mb22) 
Multiply2X2(fTmp[6][0], fTmp[6][1], fTmp[6][2], fTmp[6][3], 
m1._13 - m1._33, m1._14 - m1._34, m1._23 - m1._43, m1._24 - m1._44, 
m2._31 + m2._33, m2._32 + m2._34, m2._41 + m2._43, m2._42 + m2._44); 
// 第一块 
mOut._11 = fTmp[0][0] + fTmp[3][0] - fTmp[4][0] + fTmp[6][0]; 
mOut._12 = fTmp[0][1] + fTmp[3][1] - fTmp[4][1] + fTmp[6][1]; 
mOut._21 = fTmp[0][2] + fTmp[3][2] - fTmp[4][2] + fTmp[6][2]; 
mOut._22 = fTmp[0][3] + fTmp[3][3] - fTmp[4][3] + fTmp[6][3]; 
// 第二块 
mOut._13 = fTmp[2][0] + fTmp[4][0]; 
mOut._14 = fTmp[2][1] + fTmp[4][1]; 
mOut._23 = fTmp[2][2] + fTmp[4][2]; 
mOut._24 = fTmp[2][3] + fTmp[4][3]; 
// 第三块 
mOut._31 = fTmp[1][0] + fTmp[3][0]; 
mOut._32 = fTmp[1][1] + fTmp[3][1]; 
mOut._41 = fTmp[1][2] + fTmp[3][2]; 
mOut._42 = fTmp[1][3] + fTmp[3][3]; 
// 第四块 
mOut._33 = fTmp[0][0] - fTmp[1][0] + fTmp[2][0] + fTmp[5][0]; 
mOut._34 = fTmp[0][1] - fTmp[1][1] + fTmp[2][1] + fTmp[5][1]; 
mOut._43 = fTmp[0][2] - fTmp[1][2] + fTmp[2][2] + fTmp[5][2]; 
mOut._44 = fTmp[0][3] - fTmp[1][3] + fTmp[2][3] + fTmp[5][3]; 
} 

比较
在标准的定义算法中我们需要进行n * n * n次乘法运算,新算法中我们需要进行7log2n次乘法,对于最常用的4阶矩阵:   原算法 新算法
加法次数 48 72(48次加法,24次减法)
乘法次数 64 49
需要额外空间 16 * sizeof(float) 28 * sizeof(float)
新算法要比原算法多了24次减法运算,少了15次乘法。但因为浮点乘法的运算速度要远远慢于加/减法运算,所以新算法的整体速度有所提高。


推荐阅读
  • 本文将介绍如何使用 Go 语言编写和运行一个简单的“Hello, World!”程序。内容涵盖开发环境配置、代码结构解析及执行步骤。 ... [详细]
  • 线性Kalman滤波器在多自由度车辆悬架主动控制中的应用研究
    本文探讨了线性Kalman滤波器(LKF)在不同自由度(2、4、7)的车辆悬架系统中进行主动控制的应用。通过详细的仿真分析,展示了LKF在提升悬架性能方面的潜力,并总结了调参过程中的关键要点。 ... [详细]
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 探讨一个显示数字的故障计算器,它支持两种操作:将当前数字乘以2或减去1。本文将详细介绍如何用最少的操作次数将初始值X转换为目标值Y。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 本文探讨如何设计一个安全的加密和验证算法,确保生成的密码具有高随机性和低重复率,并提供相应的验证机制。 ... [详细]
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • 在金融和会计领域,准确无误地填写票据和结算凭证至关重要。这些文件不仅是支付结算和现金收付的重要依据,还直接关系到交易的安全性和准确性。本文介绍了一种使用C语言实现小写金额转换为大写金额的方法,确保数据的标准化和规范化。 ... [详细]
  • 在给定的数组中,除了一个数字外,其他所有数字都是相同的。任务是找到这个唯一的不同数字。例如,findUniq([1, 1, 1, 2, 1, 1]) 返回 2,findUniq([0, 0, 0.55, 0, 0]) 返回 0.55。 ... [详细]
  • 本文探讨了卷积神经网络(CNN)中感受野的概念及其与锚框(anchor box)的关系。感受野定义了特征图上每个像素点对应的输入图像区域大小,而锚框则是在每个像素中心生成的多个不同尺寸和宽高比的边界框。两者在目标检测任务中起到关键作用。 ... [详细]
  • 网络攻防实战:从HTTP到HTTPS的演变
    本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程,探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]
  • 本文深入探讨了Linux系统中网卡绑定(bonding)的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡,实现网络冗余、带宽聚合和负载均衡,在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]
  • 本文探讨了如何在给定整数N的情况下,找到两个不同的整数a和b,使得它们的和最大,并且满足特定的数学条件。 ... [详细]
  • 深度学习理论解析与理解
    梯度方向指示函数值增加的方向,由各轴方向的偏导数综合而成,其模长表示函数值变化的速率。本文详细探讨了导数、偏导数、梯度等概念,并结合Softmax函数、卷积神经网络(CNN)中的卷积计算、权值共享及池化操作进行了深入分析。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
author-avatar
孙誉嘉两_365
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有