热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

12月上旬的一些记录

上午8点一直等着ben,ben来了之后告诉我,他最近太忙,等着他发邮件。。。。****中午考完了学术规范,题目还是比较难新暖

上午8点一直等着ben,ben来了之后告诉我,他最近太忙,等着他发邮件。。。。

****

中午考完了学术规范,题目还是比较难

新暖壶的苦味可用泡瓶塞解决。

***

http://www.docin.com/p-503100080.html

这个是CUDA技术培训的一个教程,可以作为书上的补充

晚上找到了另一个教程http://www.youku.com/playlist_show/id_25920932.html

忽然发现自己根本没使用nsight,当然无法在线程级别上调试。于是N多绕路,找了个教程https://cudazone.nvidia.cn/forum/forum.php?mod=viewthread&tid=6290

******

CUDA程序里用到了MPI,也就是多核之间的通信的问题。看到目前的程度我才明白唐老师开学时候跟我提的MPI,那时候确实是一知半解。

不过现在也遇到一些问题:

在调用MPI_Comm_size(MPI_COMM_WORLD,&NumProcs);的时候,读到的NumProcs总是1,可是我一开始设置就是2呢。。这里显然是要获取默认组的大小

我使用的MPI的实现是MPICH2,书上说这个是Argonne和MSU研制的。

MPI程序的所有进程形成一个默认的组,MPI命名为Communicator MPI_COMM_WORLD组。

****

今天上午在行政楼网建办8点半到11点多一直在弄CUDA,但是一直没弄清楚kernel。

下午忽然明白了diagonalComputation里面的参数值是怎么来的了。

github的代码中,(NO_THREADS/L_B)*L_B的目的很明确,就是要分块。

而上面一行&#xff08;L_A<3000000&#xff09;?16384:131072;这行一开始我也不明白&#xff0c;为什么要2的十三次方&#xff0c;又17次方&#xff1f;就是说&#xff0c;字符串如果过长&#xff0c;就分配更多的线程&#xff0c;小于30万则13次方就够了。至于为什么是30万我还没搞清。

而blocksize则更容易解释了&#xff0c;就是待处理字符串的长度&#xff0c;即每个线程块中的线程

 DATA_SZ_A &#61; L_A * sizeof(int); 这句的意思就是数据大小&#xff0c;但是为什么是字符串长度乘上二倍呢&#xff0c;没搞清楚

再就是GridSize和BlockSize如何设置的问题

 ***

跟丁师兄他们吃完饭路上八卦了一下&#xff0c;然后回来找到了一个CUDA的教程&#xff0c;比较实用

http://www.cnblogs.com/viviman/archive/2012/11/28/2792521.html

特别是最后提了&#xff1a;Block数目与其Size有如下几种设定方式&#xff1a; Ø 2 blocks x 384 threads Ø 3 blocks x 256 threads Ø 4 blocks x 192 threads Ø 6 blocks x 128 threads Ø 8 blocks x 96 threads 

****

今天4号&#xff0c;在网建办&#xff0c;程序看明白到Length的

int noBlocks &#61; NO_THREADS/L_B;
    int Length &#61; (L_A- L_B)/noBlocks;
    int L_A_ &#61; Length &#43; L_B;

前一阵一直不明白为什么要用length&#xff0c;这里的length其实就是为了让两个序列对齐

CUDA中的计时:

cudaEvent_t start,stop;
cudaEventCreate(&start);
cudaEventCreate(&stop);
cudaEventRecord(start,0);

***

下午搜cudaMemcpy的时候&#xff0c;找到了魏老师说的那个论坛&#xff0c;于是找了一下

http://bbs.gpuworld.cn/thread-8758-1-1.html

***

晚上5点半吃晚饭去天外天技术交流&#xff0c;于是回实验室登录了一下论坛&#xff0c;学术资源确实很多&#xff0c;找了一个论坛http://bbs.myboyan.com/index.php?x&#61;151776

转:https://www.cnblogs.com/ubiwind/p/5011934.html



推荐阅读
  • Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]
  • Docker的安全基准
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • 探讨如何高效使用FastJSON进行JSON数据解析,特别是从复杂嵌套结构中提取特定字段值的方法。 ... [详细]
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
  • 本文介绍如何在 Android 中通过代码模拟用户的点击和滑动操作,包括参数说明、事件生成及处理逻辑。详细解析了视图(View)对象、坐标偏移量以及不同类型的滑动方式。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]
  • PyCharm下载与安装指南
    本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境(IDE),涵盖Windows、macOS和Linux系统,同时提供详细的安装步骤及配置建议。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 本文详细介绍了如何解决Uploadify插件在Internet Explorer(IE)9和10版本中遇到的点击失效及JQuery运行时错误问题。通过修改相关JavaScript代码,确保上传功能在不同浏览器环境中的一致性和稳定性。 ... [详细]
  • 导航栏样式练习:项目实例解析
    本文详细介绍了如何创建一个具有动态效果的导航栏,包括HTML、CSS和JavaScript代码的实现,并附有详细的说明和效果图。 ... [详细]
  • 本文基于刘洪波老师的《英文词根词缀精讲》,深入探讨了多个重要词根词缀的起源及其相关词汇,帮助读者更好地理解和记忆英语单词。 ... [详细]
  • 本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先,通过change事件监听用户选择的省份,并动态加载对应的城市列表。其次,详细讲解了使用Validation插件进行表单验证的方法,包括内置规则、自定义规则及实时验证功能。 ... [详细]
  • Java 中的 BigDecimal pow()方法,示例 ... [详细]
author-avatar
总铺
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有