当前位置: 开发笔记 > 编程语言 > 正文

DotNet并行计算使用误区(三)

作者：铁狼爷们儿 | 来源：互联网 | 2023-08-26 20:51

这篇文章主要是从实用的角度讲解并行计算需要了解的一些基础知识以及需要注意的地方，包括并行循环的方法、如何终止、线程安全、常用类型等几方面。关于TPL中提供的并行方法，这里就不

这篇文章主要是从实用的角度讲解并行计算需要了解的一些基础知识以及需要注意的地方，包括并行循环的方法、如何终止、线程安全、常用类型等几方面。

关于TPL中提供的并行方法，这里就不再多说了，网上有很多例子，本系列文章第三个Topic主要讲的不是“如何跑”，而是要讲一下“如何停”。

曾经查过很多关于二者的资料，可能是我理解的原因，总觉得很少有对其解释正确的，所以我觉得还是有必要写出我的观点，请大家指正。

Section 1.并行循环的终止：Break与Stop

关于二者网上有很多解释，很多人都认为，在并行计算中：

1．Break的调用会导致当前任务和已分配任务的终止

2．Stop的调用会导致当前任务的终止

本人对以上两点持怀疑态度，经过试验证明，Break和Stop并不像以上说的那样。

这里先解释一下名词，“当前任务”指的是当前已经触发Break(Stop)条件的那个任务；“已分配任务”指的是与“当前任务”并行执行的任务；“未分配任务”指尚未开始的循环部分。

有以下测试代码，这些代码在不同核数量的机器上返回的记录数是不同的，这一点待会再说，先看代码：


class Program 

{ 

static List<int> Data = new List<int>(); 

static ParallelOptions opt = new ParallelOptions(); 


static void Main(string[] args) 

{ 

  opt.MaxDegreeOfParallelism = Environment.ProcessorCount; 


for (int i = 0; i < 10; i++) 

  { 

    Data.Add(i); 

  } 


  Console.WriteLine("CPU Degree:" + opt.MaxDegreeOfParallelism); 

  Console.WriteLine("GeneralFor Result:"); 

new Program().GeneralFor(); 

  Console.WriteLine("ParallerStop Result:"); 

new Program().ParallerStop(); 

  Console.WriteLine("ParallelBreak Result:"); 

new Program().ParallelBreak(); 


  Console.Read(); 

} 

//一个普通的For循环 

private void GeneralFor() 

{ 

for (int i = 0; i < Data.Count; i++) 

  { 

if (Data[i] > 5) 

break; 


    Console.WriteLine(Data[i]); 

  } 

} 

//并行计算的Stop 

private void ParallerStop() 

{ 

  Parallel.For(0, Data.Count,opt, (i, LoopState) => 

  { 

if (Data[i] > 5) 

  LoopState.Stop(); 

  Thread.Sleep(10); 


  Console.WriteLine(Data[i]); 

  }); 

} 

//并行计算的Break 

private void ParallelBreak() 

{ 

  Parallel.For(0, Data.Count, opt, (i, LoopState) => 

  { 

if (Data[i] > 5) 

    LoopState.Break(); 

    Thread.Sleep(10); 


    Console.WriteLine(Data[i]); 

  }); 

 } 

}

下图分别是程序在2(32#)、4(64#)、48(64#)核CPU下运行的结果：

DotNet并行计算使用误区(三)

个人认为，不同CPU核数量对于使用Break与Stop终止循环形式的最终记录返回数量是有影响的，即这会影响TPL分配任务的方针，TPL在运行时才会“源源不断”的分配任务，开启的线程数也是递增形式的。(最大线程数应该有限制，具体是多少不确定，有的说是64也有的说是256，等待高人解答)

所以，对于Stop与Break，我的观点是，在并行任意任务中调用Stop方法，则会终止除当前任务外的所有并行任务(包括未分配的和已分配的)，返回最终结果，而不是像传说的那样，终止了当前任务；Break只会停止继续分配新任务，并不影响当前任务的和已经分配的并行任务的执行，而且同样不会终止当前任务。

Stop更改ParallelLoopState 对象的 IsStop值为true；

Break更改ParallelLoopState 对象的 LowestBreakIteration 属性值等于 true 。

	未分配的任务(未开始的任务)	已分配的任务(并行中的任务)	当前任务(触发条件的那个任务)
单行中的Break	停止分配	停止执行(相当于“当前任务”)	停止执行
Break	停止分配	继续执行	继续执行
Stop	停止分配	停止执行	继续执行

如上图中显示，调用Stop后，结果中只能可能有一个大于5的结果，因为此时未分配和已分配的任务都被终止了，而当前任务并没有停止，继续执行打印语句，打印出来的只是当前的那个大于5的任务；

而调用Break后，结果中大于5的结果数量不定，因为当当前任务因满足大于5的条件，而触发Break后，其他已分配的任务并不会停止，即使它们包含大于5的任务，同样也会打印出来，这就是上图中第三幅图中，Break任务出现两个大于5的结果的原因！

Stop和Break，它们的区别可以用下图表示：

DotNet并行计算使用误区(三)

图中实现表示运行的任务，虚线表示任务运行过程中被终止。

Section 2.线程安全

在并行计算中应当使用线程安全的类，例如有些时候我们需要不断迭代形成一个集合组织，这个集合可能是一个列表，在普通程序中List完全可以完成这个任务，但是如果在并行计算中使用List的add方法，就会出现一些错误，这些错误是随机的，也就是说有时候并不出现。

以下代码：


List<string> ls = new List< string >(); 

Parallel.For(0, 10000, (i) => 

{ 

  ls.Add(i.ToString()); 

});

以上代码偶尔会出现错误，出现错误的概率随着循环次数和并行任务的增加而增大，类似代码需求可以使用ConcurrentBag来代替，针对并行计算提供的类库请参照MSDN：http://msdn.microsoft.com/zh-cn/library/dd287108.aspx

提示：并行计算并不是天上掉下的馅饼，它不是所有时候都比串行程序快，因为并行总要付出一些额外的代价，比如任务分配、任务同步、任务通讯等，到底什么时候才能放心的吃掉这个馅饼，需要仔细地设计算法，并且应该在多台典型的服务器环境中进行测试、对比，这是一个比较烦人的过程，但是最终得到的结果可能会改变你的设计思路。

具体可以参考我的文章：

DotNet并行计算的使用误区(一)

http://www.cnblogs.com/isline/archive/2011/04/20/2022228.html

DotNet并行计算的使用误区(二)

http://www.cnblogs.com/isline/archive/2011/04/21/2023137.html

推荐阅读

stream
Web动态服务器Python基本实现

Web动态服务器Python基本实现 ... [详细]

蜡笔小新 2024-11-21 08:01:30
int
PHP与MySQL实现高效分页查询

本文探讨了如何在PHP与MySQL环境中实现高效的分页查询，包括基本的分页实现、性能优化技巧以及高级的分页策略。 ... [详细]

蜡笔小新 2024-11-22 05:45:48
int
Bootstrap Paginator 分页插件详解与应用

本文深入探讨了Bootstrap Paginator这款流行的JavaScript分页插件，提供了详细的使用指南和示例代码，旨在帮助开发者更好地理解和利用该工具进行高效的数据展示。 ... [详细]

蜡笔小新 2024-11-20 13:39:53
int
Spring MVC 中利用拦截器与自定义注解实现权限控制

本文探讨了如何在 Spring MVC 框架下，通过自定义注解和拦截器机制来实现细粒度的权限管理功能。 ... [详细]

蜡笔小新 2024-11-22 14:35:02
stream
探讨Java中将图像对象转换为文件和字节数组的方法

本文详细探讨了在Java中如何将图像对象转换为文件和字节数组（Byte[]）的技术。虽然网络上存在大量相关资料，但实际操作时仍需注意细节。本文通过使用JMSL 4.0库中的图表对象作为示例，提供了一种实用的方法。 ... [详细]

蜡笔小新 2024-11-21 21:42:59
int
深入理解函数式编程中的函子

函子（Functor）是函数式编程中的一个重要概念，它不仅是一个特殊的容器，还提供了一种优雅的方式来处理值和函数。本文将详细介绍函子的基本概念及其在函数式编程中的应用，包括如何通过函子控制副作用、处理异常以及进行异步操作。 ... [详细]

蜡笔小新 2024-11-21 20:29:15
install
解决iOS应用推送通知错误：未找到有效aps-environment权限

在尝试加载支持推送通知的iOS应用程序的Ad Hoc构建时，遇到了‘no valid aps-environment entitlement found for application’的错误提示。本文将探讨此错误的原因及多种可能的解决方案。 ... [详细]

蜡笔小新 2024-11-21 19:26:31
int
Oracle 11g 创建表空间与基础配置

本文详细介绍了Oracle 11g中的创建表空间的方法，以及如何设置客户端和服务端的基本配置，包括用户管理、环境变量配置等。 ... [详细]

蜡笔小新 2024-11-21 18:54:39
int
Struts2 + json+ jquery 实现三级联动action和jsp代码竟然有小红叉，提示缺双引号，检查了转义符号也没缺啊，求解

publicclassBindActionextendsActionSupport{privateStringproString;privateStringcitString; ... [详细]

蜡笔小新 2024-11-21 16:25:41
less
深入解析JQuery Mobile特有的事件与方法

本文详细介绍了JQuery Mobile框架中特有的事件和方法，帮助开发者更好地理解和应用这些特性，提升移动Web开发的效率。 ... [详细]

蜡笔小新 2024-11-21 14:24:21
config
Vue3中如何提高开发效率

小编给大家分享一下Vue3中如何提高开发效率，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获， ... [详细]

蜡笔小新 2024-11-20 15:33:07
int
使用 Node.js 和 Nodemailer 实现邮件发送功能

本文详细介绍了如何在 Node.js 环境中利用 Nodemailer 库实现邮件发送功能，包括环境配置、代码实现及常见问题解决方法。 ... [详细]

蜡笔小新 2024-11-20 10:43:50
int
循环双链表中指定位置的元素插入方法

本文详细介绍了如何在循环双链表的指定位置插入新元素的方法，包括必要的步骤和代码示例。 ... [详细]

蜡笔小新 2024-11-20 06:48:26
config
如何使用 org.apache.tinkerpop.gremlin.structure.VertexProperty 的 key 方法

本文详细介绍了 `org.apache.tinkerpop.gremlin.structure.VertexProperty` 类中的 `key()` 方法，并提供了多个实际应用的代码示例。通过这些示例，读者可以更好地理解该方法在图数据库操作中的具体用途。 ... [详细]

蜡笔小新 2024-11-21 17:38:10
int
Python技巧：将相同元素聚合至矩阵

本文探讨了如何在Python中将具有相同值的元素分组到矩阵中，这是一个在数据分析和处理中常见的需求。 ... [详细]

蜡笔小新 2024-11-21 17:07:12

铁狼爷们儿

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章