交换紧嵌套中两个循环的嵌套顺序(提高程序性能最有效的变换之一)。例如:
1Do I = 1,N
2 Do J = 1,M
3 A(I,J+1) = A(I,J) + B
4 ENDDO
5ENDDO
2 Do J = 1,M
3 A(I,J+1) = A(I,J) + B
4 ENDDO
5ENDDO
此例子中最内层语句3存在内层循环携带依赖。无法按向量代码生成算法codegen作向量化。
但是交换这两层循环,如
1Do J = 1,M
2 Do I = 1,N
3 A(I,J+1) = A(I,J) + B
4 ENDDO
5ENDDO
2 Do I = 1,N
3 A(I,J+1) = A(I,J) + B
4 ENDDO
5ENDDO
依赖关系变成外层循环,而内层循环不携带依赖。因此,内层循环可以被向量化为:
1Do J = 1,M
2 A(1:N,J+1) = A(1:N,J) + B
3ENDDO
2 A(1:N,J+1) = A(1:N,J) + B
3ENDDO
如果把此过程颠倒过来,变成内层并行循环移动到最外层以增加并行粒度和减少同步开销。
结论:循环变换实际上是一种重排序交换,可以把循环看成所包含语句的一系列参数化实例。循环变换就是改变这些参数化实例的执行顺序,但并没有产生任何新的实例。
在以下的代码中令S(I,J)表示参数为I,J的语句S的实例。换句话说,S(I,J)是语句S在迭代向量为(I,J)的迭代中执行时的实例。
1DO J = 1,M
2 DO I = 1,N
3 S
4 ENDDO
5ENDDO
2 DO I = 1,N
3 S
4 ENDDO
5ENDDO
使用这种记法,在此代码中S(1,2)在S(2,1)之后执行,但是在循环变换后,它变成在S(2,1)之前执行。
循环变换实际上是重排序变换。因为是重排序变换,故其合法性可以通过数据依赖关系判定。