热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

怎么做深度学习服务器,怎么搭建深度学习的服务器

在如今的时代,人工智能的技术已经开始使用在各行各业,例如人脸识别等计算机视觉技术已经开始广泛的使用在人们的日常生活中去,如果我们要自己去训练模型,首先我们需要的是寻找到数据集,因为

在如今的时代,人工智能的技术已经开始使用在各行各业,例如人脸识别等计算机视觉技术已经开始广泛的使用在人们的日常生活中去 ,如果我们要自己去训练模型,首先我们需要的是寻找到数据集,因为深度学习的技术是需要有非常多的数据,其次最为重要的也就是“算力”,深度学习模型的训练需要基于强大算力平台。也就是GPU,深度学习的模型训练的过程中大量张量会在GPU上完成求导等计算梯度的运算,但是单单有GPU是不行的,还需要有CPU进行配合,甚至SSD固态硬盘,内存等多个问题组成,那么如何选择一台“性价比”最高的深度学习服务器呢?请看下面的解释:

GPU:GPU(图像处理单元)也就是我们常说的显卡,GPU是整个深度学习服务器中最为重要的东西,一般的笔记本的显卡配置的都是GTX1060显卡,显存6G,可以用来执行一些简单的数据集,但是coco等大型数据集就不适合了,现在一般的深度学习服务器中主流选择的GTX1080ti,显存11G,RTX2080ti,显存11G,两个的显存很大,且性价比最高,同时为了提高训练的速度,个人推荐四块GTX1080ti,或者四块RTX2080TI最为合适。当然也有特殊情况,比如使用的数据集数据过大,造成GPU的显存溢出,可以选择更大显存的显卡,接下来是重点Tesla v100 16G/32G,或者RTX8000,48G显存。他们二者的区别在于具体的用途,Tesla v100 支持双精度训练,RTX8000仅仅支持单精度训练,双精度训练一般用于医学图像上的目标检查或者分割,也就是要求极其严格的领域,除此之外均不需要双精度。另外根据BP反向传播算法的原理,Batch size越大,测到的梯度越是准确,因此大显存使用推荐RTX8000显卡,另外比较一下显卡的散热方式,显卡在运行时会出现对大量的热,散热方式尤其重要,Tesla v100为被动散热的风扇散热,噪音较大,且风扇散热效果不好,造成显卡温度超过86℃,会使得GPU的主频下降,利用率减低,RTX8000为主动的涡轮散热,散热效果更好,噪音更小。

CPU: CPU用于深度学习模型训练过程中的数据预处理与多卡训练的均值LOSS损失函数计算,因此CPU很有可能成为深度学习模型训练的瓶颈,因此需要使用较高的主频,考虑得到性价比,目标选择为金牌6149与银牌4125,二者参数分别为8核 16进程3.2GHZ ,16核 32进程 3.1GHZ,虽然主频降低0.1GHZ,但是核心数增大了一倍,因此金牌6149更加具有性价比,除此之外,CPU分为正显版与正式版,一般来说,正显版指的是在CPU正式售出前的测试版,但是均是通过测试的,所以正显没有问题,CPU的铂金系列售价最为昂贵,不建议使用,CPU由于需要处理大量的运算,因此核心与主频不会都高,一般来说核心越多的,主频会降低,可以并行运算多线程,主频高的执行单个进程速度最快,根据目的选择。

内存:根据CPU的读写通道数,内存在为6的倍数时间读写更快,因此选择616GB,或者632GB,现在一些数据集比如imagnet数据集已经超过了100GB,因此选择192GB的内存比较合适,甚至一些主机已经超过了200GB,不过已经够用了,选择R4版本内存条效果最好。

磁盘存储:磁盘分为固态硬盘与机械硬盘两个部分的存储,固态硬盘的价格比较便宜,为了加快地读取的速度,可以使用磁盘阵列做成阵列卡,加快读取速度,举个例子一张12GB的硬盘速度不如3张4TB的机械硬盘,同时阵列卡更加安全,其中一张卡损坏,数据仍然可以读出来。

最后说一下服务器的机架,分为塔式与机架式,塔式的占地面积小,更加省地方,一般均选择塔式。

以上就是所有深度学习服务器的选择指南,包涵了很多的计算机硬件的基础知识,只有充分了解这些技术的知识吗,才能根据不同的用途选择最为合适的服务器,做到物尽其用!加油加油!

作者微信公众号: AI学习经历分享
简书社区:https://www.jianshu.com/p/bdf412f1ef5b


推荐阅读
  • 2017年人工智能领域的十大里程碑事件回顾
    随着2018年的临近,我们一同回顾过去一年中人工智能领域的重要进展。这一年,无论是政策层面的支持,还是技术上的突破,都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]
  • 随着技术的发展,黑客开始利用AI技术在暗网中创建用户的‘数字孪生’,这一现象引起了安全专家的高度关注。 ... [详细]
  • 网络攻防实战:从HTTP到HTTPS的演变
    本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程,探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]
  • 智慧城市建设现状及未来趋势
    随着新基建政策的推进及‘十四五’规划的实施,我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型,促进数字政府建设,新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计,以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]
  • 浪潮AI服务器NF5488A5在MLPerf基准测试中刷新多项纪录
    近日,国际权威AI基准测试平台MLPerf发布了最新的推理测试结果,浪潮AI服务器NF5488A5在此次测试中创造了18项性能纪录,显著提升了数据中心AI推理性能。 ... [详细]
  • 图像分类算法的优化策略与实践
    本文探讨了《Bag of Tricks for Image Classification with Convolutional Neural Networks》论文中的多项技术,旨在通过具体实例和实验验证,提高卷积神经网络在图像分类任务中的性能。文章详细介绍了从模型训练加速、网络结构调整到训练参数优化等多个方面的改进方法。 ... [详细]
  • 随着5G、云计算、人工智能、大数据等新技术的广泛应用,人们的生活生产方式发生了深刻变化。从人际互联到万物互联,数据存储与处理需求激增,推动了数据与算力设施的发展。 ... [详细]
  • 强人工智能时代,区块链的角色与前景
    随着强人工智能的崛起,区块链技术在新的技术生态中扮演着怎样的角色?本文探讨了区块链与强人工智能之间的互补关系及其在未来技术发展中的重要性。 ... [详细]
  • 本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用,涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 解决MongoDB Compass远程连接问题
    本文记录了在使用阿里云服务器部署MongoDB后,通过MongoDB Compass进行远程连接时遇到的问题及解决方案。详细介绍了从防火墙配置到安全组设置的各个步骤,帮助读者顺利解决问题。 ... [详细]
  • 通过与阿里云的合作,牛客网成功解决了跨国视频面试中的网络卡顿问题,为求职者和面试官提供了更加流畅的沟通体验。 ... [详细]
  • 探索电路与系统的起源与发展
    本文回顾了电路与系统的发展历程,从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明,还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]
  • 华为智慧屏:超越屏幕尺寸的智能进化
    继全球发布后,华为智慧屏于9月26日在上海正式亮相,推出65英寸和75英寸版本。该产品不仅在屏幕尺寸上有所突破,更在性能和智能化方面实现了显著提升。 ... [详细]
  • vivo Y5s配备了联发科Helio P65八核处理器,这款处理器采用12纳米工艺制造,具备两颗高性能Cortex-A75核心和六颗高效能Cortex-A55核心。此外,它还集成了先进的图像处理单元和语音唤醒功能,为用户提供卓越的性能体验。 ... [详细]
author-avatar
笨蛋說愛我8_382
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有