当前位置: 开发笔记 > 前端 > 正文

循环交换（一）——基本概念

作者：陈大也也_384 | 来源：互联网 | 2023-08-04 22:36

交换紧嵌套中两个循环的嵌套顺序（提高程序性能最有效的变换之一）。例如：1DoI1,N2DoJ1,M3A(I,J1)A(I,J)B4ENDD

交换紧嵌套中两个循环的嵌套顺序&＃xff08;提高程序性能最有效的变换之一&＃xff09;。例如&＃xff1a;

Do I &＃61; 1,N
2

Do J &＃61; 1,M
3

A(I,J&＃43;1) &＃61; A(I,J) &＃43; B
4

ENDDO
5

ENDDO

此例子中最内层语句3存在内层循环携带依赖。无法按向量代码生成算法codegen作向量化。

但是交换这两层循环&＃xff0c;如

Do J &＃61; 1,M
2

Do I &＃61; 1,N
3

A(I,J&＃43;1) &＃61; A(I,J) &＃43; B
4

ENDDO
5

ENDDO

依赖关系变成外层循环&＃xff0c;而内层循环不携带依赖。因此&＃xff0c;内层循环可以被向量化为&＃xff1a;

Do J &＃61; 1,M
2

A(1:N,J&＃43;1) &＃61; A(1:N,J) &＃43; B
3

ENDDO

如果把此过程颠倒过来&＃xff0c;变成内层并行循环移动到最外层以增加并行粒度和减少同步开销。

结论&＃xff1a;循环变换实际上是一种重排序交换&＃xff0c;可以把循环看成所包含语句的一系列参数化实例。循环变换就是改变这些参数化实例的执行顺序&＃xff0c;但并没有产生任何新的实例。

在以下的代码中令S(I,J)表示参数为I,J的语句S的实例。换句话说&＃xff0c;S(I,J)是语句S在迭代向量为&＃xff08;I,J&＃xff09;的迭代中执行时的实例。

DO J &＃61; 1,M
2

DO I &＃61; 1,N
3

S
4

ENDDO
5

ENDDO

使用这种记法&＃xff0c;在此代码中S&＃xff08;1&＃xff0c;2&＃xff09;在S&＃xff08;2&＃xff0c;1&＃xff09;之后执行&＃xff0c;但是在循环变换后&＃xff0c;它变成在S&＃xff08;2&＃xff0c;1&＃xff09;之前执行。

循环变换实际上是重排序变换。因为是重排序变换&＃xff0c;故其合法性可以通过数据依赖关系判定。

转:https://www.cnblogs.com/bingsuixing/archive/2009/04/20/1440057.html

推荐阅读

html
《程序员的数学》：一本适合初学者的数学指南

结城浩（1963年7月出生），日本资深程序员和技术作家，居住在东京武藏野市。他开发了著名的YukiWiki软件，并在杂志上发表了大量程序入门文章和技术翻译作品。结城浩著有30多本关于编程和数学的书籍，其中许多被翻译成英文和韩文。 ... [详细]

蜡笔小新 2024-11-12 21:47:50
html
双指针法高效解决七道链表问题

双指针法在链表问题中应用广泛，能够高效解决多种经典问题，如合并两个有序链表、合并多个有序链表、查找倒数第k个节点等。本文将详细介绍这些应用场景及其解决方案。 ... [详细]

蜡笔小新 2024-11-13 13:16:55
html
图像相似度对比的多种方法

本文介绍了几种常用的图像相似度对比方法，包括直方图方法、图像模板匹配、PSNR峰值信噪比、SSIM结构相似性和感知哈希算法。每种方法都有其优缺点，适用于不同的应用场景。 ... [详细]

蜡笔小新 2024-11-13 11:04:56
html
MATLAB实现Sobel边缘检测算法

图像边缘是指图像中灰度值发生显著变化的区域。Sobel算子是一种常用的边缘检测方法，通过计算图像灰度值的梯度来检测边缘。本文介绍了Sobel算子的基本原理，并提供了基于MATLAB的实现代码。 ... [详细]

蜡笔小新 2024-11-13 10:13:04
html
JavaScript 计算两个日期之间的时间差

本文介绍了一种使用 JavaScript 计算两个日期之间时间差的方法。该方法支持多种时间格式，并能返回秒、分钟、小时和天数等不同精度的时间差。 ... [详细]

蜡笔小新 2024-11-13 09:29:58
html
C语言检测

字符串学习时间：1.5W（“W”周，下同）知识点checkliststrlen()函数的返回值是什么类型的？字 ... [详细]

蜡笔小新 2024-11-12 19:23:53
html
探索Web 2.0新概念：Widget

尽管你可能尚未注意到Widget，但正如几年前对RSS的陌生一样，这一概念正逐渐走入大众视野。据美国某权威杂志预测，2007年将是Widget年。本文将详细介绍Widget的定义、功能及其未来发展趋势。 ... [详细]

蜡笔小新 2024-11-12 18:36:54
html
ASP.NET 文件上传控件详解

本文详细介绍了 ASP.NET 中用于文件上传的控件及其使用方法，包括常见的 FileUpload 控件和其他相关技术。 ... [详细]

蜡笔小新 2024-11-12 17:39:59
css
javascript分页类支持页码格式

前端时间因为项目需要，要对一个产品下所有的附属图片进行分页显示，没考虑ajax一张张请求，所以干脆一次性全部把图片out，然 ... [详细]

蜡笔小新 2024-11-12 14:58:57
html
ANSI C中实现动态分配二维数组的方法

本文介绍了一种在ANSI C中动态分配二维数组的方法。通过创建指针数组并为每个指针分配连续空间，可以灵活地管理内存。文章还讨论了一些常见的错误和注意事项。 ... [详细]

蜡笔小新 2024-11-12 08:49:29
html
什么是vauleOf？深入解析其功能与应用场景

`valueOf` 方法（即 `Object.valueOf`）用于返回指定对象的原始值。如果该对象没有对应的基元值，则直接返回对象本身。此方法在需要将对象转换为基本类型时非常有用，例如在数值运算或字符串拼接等场景中。通过深入了解 `valueOf` 的工作原理及其应用场景，开发者可以更好地处理数据类型转换问题，提高代码的健壮性和可读性。 ... [详细]

蜡笔小新 2024-11-11 21:20:50
html
彻底清除数据库中的所有用户表（包括删除相关表结构）

在处理数据库中所有用户表的彻底清除时，目前尚未发现单一命令能够实现这一目标。因此，需要采用一种较为繁琐的方法来逐个删除相关表及其结构。具体操作可以通过编写PL/SQL脚本来实现，该脚本将动态生成并执行删除表的SQL语句。尽管这种方法相对复杂，但在缺乏更简便手段的情况下，仍是一种有效的解决方案。未来或许可以通过数据库管理工具或更高版本的数据库系统提供更简洁的处理方式。 ... [详细]

蜡笔小新 2024-11-11 18:30:49
html
PTArchiver工作原理详解与应用分析

PTArchiver工作原理及其应用分析本文详细解析了PTArchiver的工作机制，探讨了其在数据归档和管理中的应用。PTArchiver通过高效的压缩算法和灵活的存储策略，实现了对大规模数据的高效管理和长期保存。文章还介绍了其在企业级数据备份、历史数据迁移等场景中的实际应用案例，为用户提供了实用的操作建议和技术支持。 ... [详细]

蜡笔小新 2024-11-11 13:40:49
html
春日新芽，开启全新篇章之际的思考与展望

春日新芽象征着新的开始，正如学习如同春天的幼苗，虽不易察觉其成长，但每日都在进步；而中断学习则像磨刀石，虽表面无明显损耗，却日积月累地退步。这番话源自古代文人陶渊明的智慧，提醒我们珍惜时光，持续努力，方能迎来更加辉煌的未来。 ... [详细]

蜡笔小新 2024-11-11 12:51:49
html
如何将TS文件转换为M3U8直播流：HLS与M3U8格式详解

在视频传输领域，MP4虽然常见，但在直播场景中直接使用MP4格式存在诸多问题。例如，MP4文件的头部信息（如ftyp、moov）较大，导致初始加载时间较长，影响用户体验。相比之下，HLS（HTTP Live Streaming）协议及其M3U8格式更具优势。HLS通过将视频切分成多个小片段，并生成一个M3U8播放列表文件，实现低延迟和高稳定性。本文详细介绍了如何将TS文件转换为M3U8直播流，包括技术原理和具体操作步骤，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-11 12:12:04

陈大也也_384

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章