深度学习工程师能力评估标准(Deeplearningengineercapabilityevaluationstandard)

作者：520文雅_293 | 来源：互联网 | 2023-08-19 06:08

前言本标准按照GB／T1.1-2009给出的规则起草。本标准由中国软件行业协会提出并归口。本标准起草单位：深度学习技术及应用国家工程实验室࿰

前言

本标准按照GB&＃xff0f;T1.1-2009 给出的规则起草。本标准由中国软件行业协会提出并归口。本标准起草单位&＃xff1a;深度学习技术及应用国家工程实验室&＃xff0c;北京百度网讯科技有限公司&＃xff0c;中国软件行业协会过程改进分会。本标准主要起草人&＃xff1a;喻友平&＃xff0c;马艳军&＃xff0c;程思&＃xff0c;陆超&＃xff0c;丁二锐&＃xff0c;忻舟&＃xff0c;陈尚义&＃xff0c;李黎&＃xff0c;陈斌&＃xff0c;蒋晓琳&＃xff0c;马婧&＃xff0c;刘皓&＃xff0c;黄群。本标准为首次制定。

深度学习工程师能力评估标准
1.范围

本标准规定了深度学习工程师需要具备的能力及评估维度。本标准适用于指导深度学习工程师的考核和培训。

2.术语和定义

下列术语和定义适用于本文件。

2.1人工智能artificial intelligence

研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。注&＃xff1a;该领域的研究范畴包括机器人、语音识别、语音合成、图像识别、自然语言处理和专家系统等。

2.2机器学习machine learning

研究计算机模拟或实现人类的学习行为&＃xff0c;以获取新的知识或技能&＃xff0c;重新组织已有的知识结构&＃xff0c;使之不断改善自身的性能。

2.3深度学习deep learning

机器学习研究中的一个领域&＃xff0c;是机器学习中一种基于对数据进行表征学习的方法。

2.4神经网络neural networks

一种应用类似于大脑神经突触连接的结构进行信息处理的数学模型。

2.5工程能力engineering capability

将系统化的、严格约束的、可量化的方法应用于开发、运行和维护。

2.6算法algorithms

能够解决特定问题的无歧义、机械、有效的运算流程和规则。

2.7模型model

一类问题的解题步骤&＃xff0c;即一类问题的算法。

2.8自然语言处理natural language processing

研究能实现人与计算机之间用自然语言进行有效沟通的各种理论和方法。

2.9计算机视觉computer vision

使用计算机及相关设备对生物视觉的一种模拟。

2.10语音处理speechprocessing

包括语音唤醒&＃xff0c;语音识别&＃xff0c;语音合成等处理技术。

3.深度学习工程师能力评估要素

深度学习工程师能力评估标准主要面向软件相关行业的企业员工及社会人士&＃xff0c;能力级别分为初级&＃xff0c;中级&＃xff0c;高级三个级别。深度学习工程师能力评估要素主要包括专业知识&＃xff0c;工程能力&＃xff0c;业务理解与实践共3大类9小类。其中&＃xff0c;专业知识包括编程基础、机器学习基础、神经网络基础、深度学习基础&＃xff1b;工程能力包括代码规范能力、算法模型实现能力、工程开发与架构设计能力&＃xff1b;业务理解与实践包括行业及业务知识、业务应用能力&＃xff0c;如图1所示。
在这里插入图片描述

4.深度学习初级工程师

4.1基本要求

能够熟练开发、修改和运行深度学习代码&＃xff0c;并进行工程化层面上的改造&＃xff1b;具有将初等复杂的应用问题初步转化为适当的机器学习问题&＃xff0c;并予以解决的能力。

4.2专业知识要求

4.2.1编程基础

应具备程序开发经历和经验。
具体要求包括&＃xff1a;
a)能够较为熟练地使用编程语言&＃xff08;以Python为例&＃xff09;&＃xff1b;
b)能够使用编程语言处理文本数据、图片数据及语音数据等&＃xff1b;
c)能够按照文档说明使用矩阵运算包和机器学习包&＃xff08;以numpy&＃xff0c;sklearn 为例&＃xff09;&＃xff1b;
d)能够使用高级语言开发实现给定需求。

4.2.2机器学习基础

应具备机器学习模型使用经验。具体要求包括&＃xff1a;
a)熟悉三种以上监督学习算法的原理&＃xff1b;
b)具备机器学习模型的使用及调优经验。

4.2.3神经网络基础

应对神经网络有一定的理解。具体要求包括&＃xff1a;
a)能够理解基础神经网络模型的原理并完成运行&＃xff1b;
b)能够对关键参数&＃xff08;如数据策略、网络中的核心模块、参数规模、优化算法、损失函数、正则项等&＃xff09;建立起自己的理解&＃xff0c;并能对参数调整的结果进行预判&＃xff1b;
c)能够按照一定的指导原则对神经网络进行调优。

4.2.4深度学习基础

应熟悉深度学习模型应用。具体要求包括&＃xff1a;熟悉自然语言处理、计算机视觉、语音三大领域中的至少一类任务&＃xff08;如文本分类、序列标注、文本生成、图像分类、目标检测、图像分割、语音识别、语音合成等&＃xff09;&＃xff0c;独立运行这一任务上的深度学习模型。

4.3工程能力要求

4.3.1代码规范能力

应具备良好的文档习惯&＃xff0c;有规范化意识。具体要求包括&＃xff1a;
a)能够组织维护技术文档或技术博客&＃xff1b;
b)能够根据代码规范要求&＃xff0c;独立撰写设计文档&＃xff1b;
c)能够遵守代码规范进行开发&＃xff0c;有规范化意识。

4.3.2算法模型实现能力

应具备一定的开发经验和独立开发的能力。具体要求包括&＃xff1a;
a)能够遵循一定理论和原则&＃xff0c;独立地进行数据策略迭代及特征工程相关工作&＃xff1b;
b)能够独立使用指定的机器学习平台&＃xff0c;训练机器学习模型&＃xff0c;进行预测计算&＃xff0c;并对模型效果进行调优。

4.3.3工程开发与架构设计能力

应熟悉使用工具开发。具体要求包括&＃xff1a;
a)能够熟练地使用一种机器学习平台或机器学习工具&＃xff1b;
b)能够在给定的性能要求下&＃xff0c;部署及运用工具进行开发。

4.4业务理解与实践能力要求

4.4.1行业及业务知识

应能够理解所在行业的业务和产品。具体要求包括&＃xff1a;
a)了解所在行业同类深度学习项目的业务知识&＃xff1b;
b)了解产品的特性及需求。

4.4.2业务应用能力

应能将已有模型运用于自身业务及产品。具体要求包括&＃xff1a;了解已有模型&＃xff0c;并对自身业务需求进行分析、评估及实现。

5.深度学习中级工程师

5.1基本要求

能够对自然语言处理、计算机视觉、语音三大领域中的任一类任务&＃xff0c;通过调优使得该任务上的模型达到特定的需求指标&＃xff1b;熟悉机器学习算法的原理及不同算法间的差异&＃xff0c;能够对中等复杂的应用问题进行合理选型、设计相应的指标完成全流程构建并解决问题。

5.2专业知识要求

5.2.1编程基础

应熟练掌握算法开发。具体要求包括&＃xff1a;
a)充分理解编程语言&＃xff08;以Python和C&＃43;&＃43;为例&＃xff09;的特性&＃xff0c;并能熟练开发&＃xff1b;
b)熟练进行各种数据处理和复杂的数学运算&＃xff08;以使用numpy为例&＃xff09;&＃xff1b;
c)能够针对并行处理数据或计算提供技术解决方案&＃xff1b;
d)能够混合使用脚本语言结合高级语言&＃xff08;以Python及C&＃43;&＃43;语言为例&＃xff09;调用合适的第三方工具&＃xff0c;开发完整的机器学习任务。

5.2.2机器学习基础

应熟练掌握机器学习算法的开发及优化。具体要求包括&＃xff1a;
a)能够准确地判断应用任务是否适合用机器学习技术解决&＃xff1b;
b)能够快速判断并选择所需要的模型&＃xff1b;
c)具备机器学习模型的使用及调优经验。

5.2.3神经网络基础

应能够进行神经网络模型调研与开发。具体要求包括&＃xff1a;
a)具备神经网络模型使用及实战经验&＃xff1b;
b)能够调研及运行深度的神经网络模型&＃xff0c;当需要进行参数调整和适配到自身的应用问题时&＃xff0c;对关键参数&＃xff08;数据策略、网络中的核心模块、参数规模、优化算法、损失函数、正则项&＃xff09;能提出解决方案&＃xff1b;
c)能够按照论文及技术资料实现新模型&＃xff0c;并验证其效果。

5.2.4深度学习基础

应熟练掌握深度学习算法的开发及优化。具体要求包括&＃xff1a;能够针对自然语言处理、计算机视觉、语音三大领域中的至少一类任务&＃xff0c;对该任务上的模型进行调优达到特定的需求指标。

5.3工程能力要求

5.3.1代码规范能力

应能够熟练运用文档、代码和质量保障规范。具体要求包括&＃xff1a;
a)规范化意识已经融入工作&＃xff08;包括文档规范、代码规范、质量保障规范&＃xff09;&＃xff1b;
b)能够按照规范参与多人合作。

5.3.2算法模型实现能力

应具备独立的算法开发能力, 并熟悉机器学习任务开发全流程。具体要求包括&＃xff1a;
a)能够独立地使用指定的机器学习平台&＃xff0c;训练机器学习模型&＃xff0c;对模型效果进行一定的调优&＃xff1b;
b)能够以机器学习理论为指导&＃xff0c;分析数据、迭代数据策略、选择模型、完成特征优化、模型训练、学习效果迭代、预测服务开发&＃xff1b;
c)熟悉机器学习应用开发的全流程。

5.3.3工程开发与架构设计能力

应能够对性能优化问题提出方案并执行。具体要求包括&＃xff1a;
a)能够熟练地使用多种机器学习平台或机器学习工具&＃xff1b;
b)能够在给定的性能要求下&＃xff0c;部署及运用工具进行开发&＃xff1b;
c)能够拆解并实施不完全熟悉的技术方案&＃xff1b;
d)能够完成工程性能指标的优化。

5.4业务理解与实践能力要求

5.4.1行业及业务知识

应能够理解所在行业的业务和产品。具体要求包括&＃xff1a;
a)掌握所在行业同类深度学习项目核心业务知识&＃xff0c;并熟悉研发关键点&＃xff1b;
b)深入了解产品的特性及需求。

5.4.2业务应用能力

应能够推动深度学习在自身业务和产品上的应用。具体要求包括&＃xff1a;
a)深入分析业务需求&＃xff0c;了解产品特性&＃xff1b;
b)能够使用深度学习建模方法解决实际需求问题。

6.深度学习高级工程师

6.1基本要求

应能够深入分析自身业务或同类业务的需求&＃xff0c;了解产品特性和研发关键点&＃xff0c;理解算法本质&＃xff0c;能够合理组合、改造并创新模型来解决更加复杂的应用问题。

6.2专业知识要求

6.2.1编程基础

应能够提出业务技术方案&＃xff0c;解决特定技术问题。具体要求包括&＃xff1a;
a)对机器学习应用开发过程中遇到的技术难题能够提供技术解决方案&＃xff1b;
b)对矩阵计算和计算程序的开发技术选型有一定的判断和见解&＃xff1b;
c)有机器学习应用开发经验。

6.2.2机器学习基础

应具备独立进行模型选择&＃xff0c;设计&＃xff0c;开发的能力。具体要求包括&＃xff1a;
a)能够在面对用户需求和业务需求时&＃xff0c;将其准确转换为机器学习语言、算法及模型&＃xff1b;
b)能够对机器学习技术要素进行组合使用&＃xff0c;并具备建模能力&＃xff1b;
c)根据业务实际需求&＃xff0c;具备技术选型能力&＃xff1b;
d)在标准算法基础上&＃xff0c;具备组合多种机器学习技术要素进行模型设计及调优的能力。

6.2.3神经网络基础

应能自主开发神经网络算法。具体要求包括&＃xff1a;
a)能够充分地理解各种新型模型和相关技术资料&＃xff1b;
b)能够根据实际业务需求&＃xff0c;自主工具或现有平台自主搭建神经网络模型&＃xff1b;
c)能够充分理解前沿技术。

6.2.4深度学习基础

应能独立开发或指导团队开发。具体要求包括&＃xff1a;
a)能够针对自然语言处理、计算机视觉、语音三大领域中的至少一类任务&＃xff0c;对该任务上的模型进行调优达到特定的需求指标&＃xff1b;
b)能够合理组合、改造并创新深度学习模型来解决更加复杂的应用问题&＃xff0c;有成功开发经验。

6.3工程能力要求

6.3.1代码规范能力

应能够组织制定代码规范。具体要求包括&＃xff1a;
a)规范化意识已经融入工作&＃xff08;包括文档规范、代码规范、质量保障规范&＃xff09;&＃xff1b;
b)能够组织制定文档规范及技术规范&＃xff1b;
c)能够按照规范参与及指导多人合作。

6.3.2算法模型实现能力

应能够指导团队开发。具体要求包括&＃xff1a;
a)有良好的机器学习基础知识&＃xff1b;
b)能够理解业务需求&＃xff0c;并准确地转化为技术语言&＃xff1b;
c)能够快速选择模型&＃xff0c;制定技术方案&＃xff0c;提出学习性能优化方案&＃xff1b;
d)能够将业务需求转化为算法策略&＃xff0c;提出见解和方案。

6.3.3工程开发与架构设计能力

应能够组织技术选型&＃xff0c;并具备决断能力。具体要求包括&＃xff1a;
a)对工具选择、性能优化问题具备独立见解&＃xff1b;
b)能够组织技术讨论&＃xff0c;完成技术选型&＃xff0c;有技术决断能力&＃xff1b;
c)能够拆解并实施不完全熟悉的技术方案&＃xff1b;
d)能够完成工程性能指标的优化。

6.4业务理解与实践能力要求

6.4.1行业及业务知识

应能够理解所在行业的业务和产品。具体要求包括&＃xff1a;
a)掌握同类核心业务知识&＃xff0c;对行业未来发展趋势有独立见解&＃xff1b;
b)深入了解产品的特性及需求&＃xff0c;对产品发展和技术架构趋势有独立见解。

6.4.2业务应用能力

应能够推动深度学习在自身业务和产品上的应用。具体要求包括&＃xff1a;
a)深入分析业务需求&＃xff0c;了解产品特性和研发关键点&＃xff1b;
b)在技术设计时能针对产品、架构的未来发展进行预留性及可扩展性的设计&＃xff1b;
c)能够熟练使用深度学习建模方法解决实际需求问题。

推荐阅读

go
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
go
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
go
云原生边缘计算之KubeEdge简介及功能特点

本文介绍了云原生边缘计算中的KubeEdge系统，该系统是一个开源系统，用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建，并为网络应用程序提供基础架构支持。同时，KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外，KubeEdge还支持跨平台工作，在私有、公共和混合云中都可以运行。同时，KubeEdge还提供数据管理和数据分析管道引擎的支持。最后，本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]

蜡笔小新 2023-12-14 16:49:01
go
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新 2023-12-13 12:59:48
go
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
join
统一知识图谱学习和建议：更好地理解用户偏好

本文介绍了一种将知识图谱纳入推荐系统的方法，以提高推荐的准确性和可解释性。与现有方法不同的是，本方法考虑了知识图谱的不完整性，并在知识图谱中传输关系信息，以更好地理解用户的偏好。通过大量实验，验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]

蜡笔小新 2023-12-11 11:11:02
object
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
go
移动传感器扫描覆盖

移动传感器扫描覆盖摘要：关于传感器网络中的地址覆盖问题，已经做过很多尝试。他们通常归为两类，全覆盖和栅栏覆盖，统称为静态覆盖 ... [详细]

蜡笔小新 2023-10-17 12:41:17
go
数据库的存储结构及其重要性

本文介绍了数据库的存储结构及其重要性，强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离，可以实现对物理存储的重新组织和数据库的迁移，而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构，并介绍了表空间的概念和作用。 ... [详细]

蜡笔小新 2023-12-14 16:00:02
go
在Windows 8上安装gvim中的插件的错误加载问题

本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置，但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置，并列出了出现的错误信息。 ... [详细]

蜡笔小新 2023-12-14 14:44:00
settings
Android Studio Bumblebee | 2021.1.1（大黄蜂版本使用介绍）

本文介绍了Android Studio Bumblebee | 2021.1.1（大黄蜂版本）的使用方法和相关知识，包括Gradle的介绍、设备管理器的配置、无线调试、新版本问题等内容。同时还提供了更新版本的下载地址和启动页面截图。 ... [详细]

蜡笔小新 2023-12-14 10:34:15
数组
Perl的测试框架Test::Base简介及使用方法

本文介绍了Perl的测试框架Test::Base，它是一个数据驱动的测试框架，可以自动进行单元测试，省去手工编写测试程序的麻烦。与Test::More完全兼容，使用方法简单。以plural函数为例，展示了Test::Base的使用方法。 ... [详细]

蜡笔小新 2023-12-13 20:05:31
数组
GPT-3发布，动动手指就能自动生成代码的神器来了！

近日，OpenAI发布了最新的NLP模型GPT-3，该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB，参数个数高达1750亿，训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站，用户只需用英语描述需求，前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年，OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型，在限定条件下以2:0完胜人类冠军。 ... [详细]

蜡笔小新 2023-12-11 11:04:43
数组
TiDB | TiDB在5A级物流企业核心系统的应用与实践

TiDB在5A级物流企业核心系统的应用与实践前言一、业务背景科捷物流概况神州金库简介二、现状与挑战神州金库现有技术体系业务挑战应对方案三、TiDB解决方案测试迁移收益问题四、说在最 ... [详细]

蜡笔小新 2023-10-17 14:03:52
数组
ICRA2019最佳论文 Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio

文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议：ICRA2019标题：《MakingSenseofVision ... [详细]

蜡笔小新 2023-10-17 12:49:25

520文雅_293

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章