热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

深度学习基础硬件CPUGPU知识笔记

参考:李沐《动手学深度学习v2》https:www.bilibili.comvideoBV1TU4y1j7Wd桌面GPU排名:https:www.my

参考:李沐《动手学深度学习v2》https://www.bilibili.com/video/BV1TU4y1j7Wd

桌面GPU排名:https://www.mydrivers.com/zhuanti/tianti/gpu/index.html
桌面CPU排名:https://www.mydrivers.com/zhuanti/tianti/cpu/index.html


CPU与GPU

在这里插入图片描述
(GPU,控制流单元删了很多,也没有三级缓存留给计算单位)


基本配置

在这里插入图片描述

Intel i7-6700K

在这里插入图片描述


提升利用率


提升GPU利用率

在这里插入图片描述
并行:取决于矩阵尺寸,神经网络大小,小的神经网络并行性小


提升CPU利用率

空间和时间
在这里插入图片描述
并行
在这里插入图片描述
在这里插入图片描述


CPU/GPU带宽

在这里插入图片描述


更多选择

在这里插入图片描述


CPU/GPU高性能编程

在这里插入图片描述


总结

在这里插入图片描述


更多芯片

在这里插入图片描述


DPS

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


总结

在这里插入图片描述


单机多卡并行

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
总结:
在这里插入图片描述


GPU使用选择


  1. 服务器 DGX A100 100万钱
  2. 云 3年=服务器
  3. 高端显卡+GPU

GPU配置对比

在这里插入图片描述

在这里插入图片描述
3080增速下降
在这里插入图片描述
在这里插入图片描述
内存
在这里插入图片描述


提高性能


  • 大的批量大小(太大收敛也会变慢)
  • 快的数据类型,如16位浮点数
  • 实现好的性能版本

购买GPU


  • 显存
  • 计算能力
  • 价格

在这里插入图片描述

不同型号核越多


  • 价格与性价正比、买最新最贵的

推荐阅读
  • Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性,但Python作为一种通用编程语言,适用于更广泛的领域,包括Web开发、自动化脚本和机器学习等。对于初学者而言,Python的学习曲线更为平缓,上手更加容易。此外,Python拥有庞大的社区支持和丰富的第三方库,使其在实际应用中更具灵活性和扩展性。 ... [详细]
  • Cookie学习小结
    Cookie学习小结 ... [详细]
  • 兆芯X86 CPU架构的演进与现状(国产CPU系列)
    本文详细介绍了兆芯X86 CPU架构的发展历程,从公司成立背景到关键技术授权,再到具体芯片架构的演进,全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]
  • 在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。 ... [详细]
  • 在《Linux高性能服务器编程》一书中,第3.2节深入探讨了TCP报头的结构与功能。TCP报头是每个TCP数据段中不可或缺的部分,它不仅包含了源端口和目的端口的信息,还负责管理TCP连接的状态和控制。本节内容详尽地解析了TCP报头的各项字段及其作用,为读者提供了深入理解TCP协议的基础。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 理工科男女不容错过的神奇资源网站
    十一长假即将结束,你的假期学习计划进展如何?无论你是在家中、思念家乡,还是身处异国他乡,理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档,能够帮助你在假期中高效学习和提升专业技能。 ... [详细]
  • 深入解析经典卷积神经网络及其实现代码
    深入解析经典卷积神经网络及其实现代码 ... [详细]
  • 本文整理了一份基础的嵌入式Linux工程师笔试题,涵盖填空题、编程题和简答题,旨在帮助考生更好地准备考试。 ... [详细]
  • 本文详细介绍了 Java 网站开发的相关资源和步骤,包括常用网站、开发环境和框架选择。 ... [详细]
  • 本文介绍了如何查看PHP网站及其源码的方法,包括环境搭建、本地测试、源码查看和在线查找等步骤。 ... [详细]
  • 如何查询计算机的显卡型号及性能参数? ... [详细]
  • Java Socket 关键参数详解与优化建议
    Java Socket 的 API 虽然被广泛使用,但其关键参数的用途却鲜为人知。本文详细解析了 Java Socket 中的重要参数,如 backlog 参数,它用于控制服务器等待连接请求的队列长度。此外,还探讨了其他参数如 SO_TIMEOUT、SO_REUSEADDR 等的配置方法及其对性能的影响,并提供了优化建议,帮助开发者提升网络通信的稳定性和效率。 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • 在稀疏直接法视觉里程计中,通过优化特征点并采用基于光度误差最小化的灰度图像线性插值技术,提高了定位精度。该方法通过对空间点的非齐次和齐次表示进行处理,利用RGB-D传感器获取的3D坐标信息,在两帧图像之间实现精确匹配,有效减少了光度误差,提升了系统的鲁棒性和稳定性。 ... [详细]
author-avatar
静待花开0088
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有