使用OpenMP循环时的线程安全

作者：我很丑但我可以很温柔 | 来源：互联网 | 2023-02-10 12:53

如何解决《使用OpenMP循环时的线程安全》经验，为你挑选了1个好方法。

我正在使用C ++和GMP开发小型Collatz猜想计算器，并且正在尝试使用OpenMP在其上实现并行性，但是遇到了有关线程安全性的问题。就目前而言，尝试运行代码将产生以下结果：

*** Error in `./collatz': double free or corruption (fasttop): 0x0000000001140c40 ***
*** Error in `./collatz': double free or corruption (fasttop): 0x00007f4d200008c0 ***
[1]    28163 abort (core dumped)  ./collatz

这是重现该行为的代码。

 #include 
 #include 

 mpz_class collatz(mpz_class n) {
     if (mpz_odd_p(n.get_mpz_t())) {
         n *= 3;
         n += 1;
     } else {
         n /= 2;
     }
     return n;
 }

 int main() {
     mpz_class x = 1;
 #pragma  omp parallel
     while (true) {
         //std::cout <

鉴于在取消注释输出到屏幕时的速度很慢时没有得到此错误，我认为当前的问题与线程安全有关，尤其是与试图同时增加的并发线程x有关。

我的假设正确吗？如何解决此问题并使其安全运行？


1> Zulan..：
我假设您要检查的是collatz猜想是否对所有数字都成立。您发布的程序在串行和并行的许多级别上都是错误的。

if (mpz_cmp_ui(x.get_mpz_t(), 1)) break;


意味着它将在时破裂x != 1。如果您使用正确的替换它0 == mpz_cmp_ui，那么代码将不断地2反复测试。无论如何，您都必须具有两个变量，一个用于表示要检查的内容的外部循环，另一个用于执行检查的内部循环。如果为此创建函数，则更容易实现此目的：

void check_collatz(mpz_class n) {
    while (n != 1) {
        n = collatz(n);
    }
}

int main() {
    mpz_class x = 1;
    while (true) {
        std::cout <

该while (true)循环很难推理和并行化，因此让我们做一个等效的for循环：

for (mpz_class x = 1;; x++) {
    check_collatz(x);
}


现在，我们可以讨论并行化代码。OpenMP并行化的基础是工作共享结构。您不能只打#pragma omp parallel一会儿循环。幸运的是，您可以轻松地将某些规范的for循环标记为#pragma omp parallel for。但是，为此，您不能将其mpz_class用作循环变量，而必须为循环指定结尾：

#pragma omp parallel for
for (long check = 1; check <= std::numeric_limits::max(); check++)
{
    check_collatz(check);
}


请注意，它check是隐式私有的，在其上工作的每个线程都有一个副本。OpenMP还将负责在线程之间分配工作[1 ... 2 ^ 63]。当线程调用check_collatz新的私有mpz_class对象时，将为其创建对象。

现在，您可能会注意到，mpz_class在每次循环迭代中重复创建一个新对象的成本很高（内存分配）。您可以重新使用它（通过check_collatz再次破坏）并创建一个线程专用的mpz_class工作对象。为此，您将化合物parallel for分为单独的parallel和for实用的：

#include 
#include 
#include 

// Avoid copying objects by taking and modifying a reference
void collatz(mpz_class& n)
{
    if (mpz_odd_p(n.get_mpz_t()))
    {
        n *= 3;
        n += 1;
    }
    else
    {
        n /= 2;
    }
}

int main()
{
#pragma omp parallel
    {
        mpz_class x;
#pragma omp for
        for (long check = 1; check <= std::numeric_limits::max(); check++)
        {
            // Note: The structure of this fits perfectly in a for loop.
            for (x = check; x != 1; collatz(x));
        }
    }
}


请注意，x在并行区域中进行声明将确保其隐式私有且已正确初始化。您应该更喜欢在外部声明它并对其进行标记private。这通常会导致混乱，因为private来自外部作用域的明确变量是单位化的。

您可能会抱怨这只检查了前2 ^ 63个数字。只是让它运行。这使您有足够的时间将OpenMP掌握到专家级别，并为GMP对象编写自己的自定义工作共享。

您担心每个线程都有多余的对象。这对于获得良好的性能至关重要。您无法使用锁/关键部分/原子来有效地解决此问题。您将必须保护对每个唯一相关变量的读取和写入。不会再有并行性了。

注意：巨大的for循环可能会导致负载不平衡。因此，某些线程可能比其他线程提前几个世纪完成。您可以通过动态调度或较小的静态块来解决此问题。

编辑：出于学术考虑，这是一个如何直接在GMP对象上实现工作共享的想法：

#pragma omp parallel
    {
        // Note this is not a "parallel" loop
        // these are just separate loops on distinct strided 
        int nthreads = omp_num_threads();
        mpz_class check = 1;
        // we already checked those in the other program
        check += std::numeric_limits::max(); 
        check += omp_get_thread_num();
        mpz_class x;
        for (; ; check += nthreads)
        {
            // Note: The structure of this fits perfectly in a for loop.
            for (x = check; x != 1; collatz(x));
        }
    }

推荐阅读

string
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
process
iOS 多线程技术之 GCD

本文将深入探讨 iOS 中的 Grand Central Dispatch (GCD)，并介绍如何利用 GCD 进行高效多线程编程。如果你对线程的基本概念还不熟悉，建议先阅读相关基础资料。 ... [详细]

蜡笔小新 2024-11-14 15:57:40
callback
IOS Run loop详解

为什么80%的码农都做不了架构师？转自http:blog.csdn.netztp800201articledetails9240913感谢作者分享Objecti ... [详细]

蜡笔小新 2024-11-13 12:14:35
ascii
深入剖析Java中SimpleDateFormat在多线程环境下的潜在风险与解决方案

深入剖析Java中SimpleDateFormat在多线程环境下的潜在风险与解决方案 ... [详细]

蜡笔小新 2024-11-09 19:04:36
java
深入解析CAS机制：全面替代传统锁的底层原理与应用

本文深入探讨了CAS（Compare-and-Swap）机制，分析了其作为传统锁的替代方案在并发控制中的优势与原理。CAS通过原子操作确保数据的一致性，避免了传统锁带来的性能瓶颈和死锁问题。文章详细解析了CAS的工作机制，并结合实际应用场景，展示了其在高并发环境下的高效性和可靠性。 ... [详细]

蜡笔小新 2024-11-09 15:45:07
ip
Flutter 实现公告消息提示的文字上下滚动切换效果

效果预览1基本使用代码voidmain(){启动根目录runApp(MaterialApp(home:TestTipsPage(),));}classTestTipsPageext ... [详细]

蜡笔小新 2024-10-22 13:23:54
ip
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
string
将.o文件链接到.elf文件时

我有一个从C项目编译的.o文件，该文件引用了名为init_static_pool ... [详细]

蜡笔小新 2024-11-14 10:07:21
process
如何在Java中使用DButils类

这期内容当中小编将会给大家带来有关如何在Java中使用DButils类，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。D ... [详细]

蜡笔小新 2024-11-12 13:46:11
web
开发中遇到的一些常见问题及解决方案

本文总结了一些开发中常见的问题及其解决方案，包括特性过滤器的使用、NuGet程序集版本冲突、线程存储、溢出检查、ThreadPool的最大线程数设置、Redis使用中的问题以及Task.Result和Task.GetAwaiter().GetResult()的区别。 ... [详细]

蜡笔小新 2024-11-12 08:20:05
string
Java并发编程指南：深入理解信号量机制

本文是Java并发编程系列的开篇之作，将详细解析Java 1.5及以上版本中提供的并发工具。文章假设读者已经具备同步和易失性关键字的基本知识，重点介绍信号量机制的内部工作原理及其在实际开发中的应用。 ... [详细]

蜡笔小新 2024-11-11 15:49:02
const
线程能否先以安全方式获取对象，再进行非安全发布？

线程能否先以安全方式获取对象，再进行非安全发布？ ... [详细]

蜡笔小新 2024-11-09 09:21:53
ip
Leetcode学习成长记：天池leetcode基础训练营Task01数组

前言这是本人第一次参加由Datawhale举办的组队学习活动，这个活动每月一次，之前也一直关注，但未亲身参与过，这次看到活动 ... [详细]

蜡笔小新 2024-11-14 18:01:31
const
Java反射机制详解及应用场景

本文详细介绍了Java反射机制的基本概念、获取Class对象的方法、反射的主要功能及其在实际开发中的应用。通过具体示例，帮助读者更好地理解和使用Java反射。 ... [详细]

蜡笔小新 2024-11-13 16:08:08
sum
深入解析 Lifecycle 的实现原理

本文将详细介绍 Android Jetpack 中 Lifecycle 组件的实现原理，帮助开发者更好地理解和使用 Lifecycle，避免常见的内存泄漏问题。 ... [详细]

蜡笔小新 2024-11-12 14:05:19

我很丑但我可以很温柔

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章