热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

关于PGI加速编译器常见问题

问:PGIAccelerator编译器在哪些操作上运行?答:PGI2011年及以后的版本支持64位和32位Linux,Windows和MacOSX。

问:PGI Accelerator编译器在哪些操作上运行?

答:PGI 2011年及以后的版本支持64位和32LinuxWindowsMac OS X


问:PGI Accelerator编译器主要针对哪些加速器?

答:PGI Accelerator编译器支持所有计算能力为1.0及以上的NVIDIA CUDA GPU 加速器。PGI也在针对其他加速器做可行性研究。


问:我是否需要安装CUDA软件?

答:PGI Accelerator编译器依靠NVIDIA CUDA软件开发工具包(SDK)的几个组件。PGI安装包里包含了NVIDIA CUDA SDK的所有必要的组件。在PGI安装指南里有详细描述。


问:编译器是否支持IEEE标准的浮点运算?

答:现在的GPU加速器可以支持IEEE浮点标准。但是,他们不支持所有的模式,有一些操作,尤其是平方根、指数、对数,和其他超越函数,可能无法提供完全精确的结果。这是一个硬件的限制,编译器无法克服。


问:PGI Accelerator编译器是否支持双精度呢?

答:是的。


问:我可以从我的PGI编译的代码中调用CUDA内核函数?

答:PGI正在设计一个功能,让您您可以直接从你的CFortran程序调用CUDAPTX或其他语言编写的内核函数。等完善后,我们将宣布这一功能。


问:编译器是否可以在同一程序中支持两个或两个以上的GPU

答:象CUDA一样,您可以利用多个线程来使用两个或两个以上的GPU,每个线程连接到不同的GPU在GPU上运行其内核。当前版本中不支持从相同加速器区自动控制两个或两个以上的GPU


问:为什么有OpenACC的标准呢?

答:一个高层次的编程是高效编程的关键。相比2005年,现在的CUDAOpenCL在GPU编程上已经是一个伟大的飞跃。但他们仍然是低阶编程语言,编程者对硬件需要更多的了解。 为了获得最佳性能,编程者不得不用算法来调整每个具体设备。当采用CUDAOpenCL,即使是最小的,最平凡的循环需要一个完整的重写。而高阶编程则将这个责任从程序员身上转移到编译器上。

OpenMP标准自1997年以来,已为共享内存多处理器和多核系统支持高层次的编程模型。它并没有完全取代较低级别的模型,像POSIX线程编程,但到目前为止,大多数应用程序的程序员喜欢的更高水平的方法。一个标准允许程序员和独立软件厂商(ISV)开发可移植的并行程序。

对于GPU编程,特别是在一般的加速器编程,社会需要一个高层次的,便携式的机制可以管理和优化在GPU其他加速器上的数据流,从而优化GPU代码。而OpenACC担任这一角色。


问:为什么PGI支持OpenACC,而不是仅仅关注PGI加速器模型?

答:PGI加速器模型已成功地让许多客户使用NVIDIA GPU来开发应用。我们明确且精心地设计我们的模型以便在任何设备类型上可以方便使用。我们没有在指令中用PGI命名,因为从一开始,我们的想法和计划就是朝着这个模型标准化发展。

几个系统供应商已经在产品中使用GPU加速器。不管如何精心设计,相比仅由一个单一的供应商支持,更多的科学家和ISV将愿意采取跨编译器厂商的标准化模型。OpenACC就是这样的模型。


问:我可以在一台没有加速器的机器上运行我的程序吗?

答:是的。PGI Accelerator编译器可以生成PGI Unified Binary技术,可以不管加速器存在与否都可执行。


问:我需要对不同的GPU型号来重建我的应用吗

答:一个GPU的代码生成,使用了与图形应用和游戏同样的技术。 也就是说,这个程序使用了一个可移植的中间格式,然后可以通过你电脑里由GPU供应商提供的驱动在运行时进行动态转换和重新优化。这将确保您的投资,让你的程序继续工作,即使您升级GPU卡,或一台机器上使用不同型号的GPU型号。


问:我可以在我的GPU代理里使用函数调用或者过程调用?

答:目前GPU不支持函数调用。只有当他们可以被内联,编译器将支持函数调用。


问:在此版本支持的所有指定的指令吗

答:2011 PGI中 Fortran&Ç加速器编程模型白皮书V.1.2包括所有指令。


问:我能试试吗?
答:尝试PGI Accelerator编译器,遵循以下三个步骤:

a.Download的任何可用的软件包为您的操作系统。

B.查看PGI安装指南或PGI Visual Fortran的安装指南,并配置您的环境。

C.获得许可证密钥。


推荐阅读
  • 本文探讨了Flutter和Angular这两个流行框架的主要区别,包括它们的设计理念、适用场景及技术实现。 ... [详细]
  • Android开发经验分享:优化用户体验的关键因素
    随着Android市场的不断扩展,用户对于移动应用的期望也在不断提高。本文探讨了在Android开发中如何优化用户体验,以及为何用户体验的重要性超过了技术本身。 ... [详细]
  • 计算机视觉初学者指南:如何顺利入门
    本文旨在为计算机视觉领域的初学者提供一套全面的入门指南,涵盖基础知识、技术工具、学习资源等方面,帮助读者快速掌握计算机视觉的核心概念和技术。 ... [详细]
  • 【小白学习C++ 教程】二十三、如何安装和使用 C++ 标准库
    【小白学习C++ 教程】二十三、如何安装和使用 C++ 标准库 ... [详细]
  • 本文通过基准测试(Benchmark)对.NET Core环境下Thrift和HTTP客户端的微服务通信性能进行对比分析。基准测试是一种评估系统或组件性能的方法,通过运行一系列标准化的测试来衡量其表现。 ... [详细]
  • 兆芯X86 CPU架构的演进与现状(国产CPU系列)
    本文详细介绍了兆芯X86 CPU架构的发展历程,从公司成立背景到关键技术授权,再到具体芯片架构的演进,全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]
  • V8不仅是一款著名的八缸发动机,广泛应用于道奇Charger、宾利Continental GT和BossHoss摩托车中。自2008年以来,作为Chromium项目的一部分,V8 JavaScript引擎在性能优化和技术创新方面取得了显著进展。该引擎通过先进的编译技术和高效的垃圾回收机制,显著提升了JavaScript的执行效率,为现代Web应用提供了强大的支持。持续的优化和创新使得V8在处理复杂计算和大规模数据时表现更加出色,成为众多开发者和企业的首选。 ... [详细]
  • 解决Xcode PBXcp 错误:找不到文件或目录
    当在Xcode中遇到PBXcp错误提示'No such file or directory'时,通常是由于文件引用问题导致的。本文将介绍两种有效的方法来解决这一常见问题。 ... [详细]
  • 本文将深入探讨 Unreal Engine 4 (UE4) 中的距离场技术,包括其原理、实现细节以及在渲染中的应用。距离场技术在现代游戏引擎中用于提高光照和阴影的效果,尤其是在处理复杂几何形状时。文章将结合具体代码示例,帮助读者更好地理解和应用这一技术。 ... [详细]
  • Flutter 核心技术与混合开发模式深入解析
    本文深入探讨了 Flutter 的核心技术,特别是其混合开发模式,包括统一管理模式和三端分离模式,以及混合栈原理。通过对比不同模式的优缺点,帮助开发者选择最适合项目的混合开发策略。 ... [详细]
  • 在Windows系统中安装TensorFlow GPU版的详细指南与常见问题解决
    在Windows系统中安装TensorFlow GPU版是许多深度学习初学者面临的挑战。本文详细介绍了安装过程中的每一个步骤,并针对常见的问题提供了有效的解决方案。通过本文的指导,读者可以顺利地完成安装并避免常见的陷阱。 ... [详细]
  • 在Conda环境中高效配置并安装PyTorch和TensorFlow GPU版的方法如下:首先,创建一个新的Conda环境以避免与基础环境发生冲突,例如使用 `conda create -n pytorch_gpu python=3.7` 命令。接着,激活该环境,确保所有依赖项都正确安装。此外,建议在安装过程中指定CUDA版本,以确保与GPU兼容性。通过这些步骤,可以确保PyTorch和TensorFlow GPU版的顺利安装和运行。 ... [详细]
  • Hadoop平台警告解决:无法加载本机Hadoop库的全面应对方案
    本文探讨了在Hadoop平台上遇到“无法加载本机Hadoop库”警告的多种解决方案。首先,通过修改日志配置文件来忽略该警告,这一方法被证明是有效的。其次,尝试指定本地库的路径,但未能解决问题。接着,尝试不使用Hadoop本地库,同样没有效果。然后,通过替换现有的Hadoop本地库,成功解决了问题。最后,根据Hadoop的源代码自行编译本地库,也达到了预期的效果。以上方法适用于macOS系统。 ... [详细]
  • Parallels Desktop for Mac 是一款功能强大的虚拟化软件,能够在不重启的情况下实现在同一台电脑上无缝切换和使用 Windows 和 macOS 系统中的各种应用程序。该软件不仅提供了高效稳定的性能,还支持多种高级功能,如拖放文件、共享剪贴板等,极大地提升了用户的生产力和使用体验。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
author-avatar
乐橙味_367
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有