当前位置: 开发笔记 > 后端 > 正文

对标TensorFlow、PyTorch，中国自主的AI框架砸向开源生态

作者：陈俊凯660638 | 来源：互联网 | 2023-06-04 12:11

本文授权转载自电子发烧友网，作者黄晶晶目前比较主流的AI深度学习框架主要由国际巨头领衔，比如谷歌的TensorFlow和Facebook的PyTorch

本文授权转载自电子发烧友网&＃xff0c;作者黄晶晶

目前比较主流的AI深度学习框架主要由国际巨头领衔&＃xff0c;比如谷歌的TensorFlow和Facebook的PyTorch等。2017年中国的一家初创团队悄悄成立&＃xff0c;他们做的是对标这些主流框架的技术开发。

今年初&＃xff0c;这家公司声名鹊起&＃xff0c;并获得了由高瓴创投领投的5000万元A轮融资。这家公司叫一流科技&＃xff0c;他们的深度学习框架叫做OneFlow&＃xff0c;今年7月31日&＃xff0c;OneFlow即将迎来自己的开源一周年纪念日。

对框架的超前定位&＃xff0c;有力支撑了深度学习领域的创业

一流科技创始人袁进辉在创办公司之前&＃xff0c;在微软研究院工作多年&＃xff0c;主要从事机器学习、分布式系统的研发。“当时我们认为随着AI数据和算力需求的不断增加&＃xff0c;现有的深度学习框架在未来会遇到瓶颈&＃xff0c;几年前我多次在公开演讲中提到过这个观点&＃xff0c;但当时业界不以为然。”袁进辉说道。

袁进辉分析&＃xff0c;从机器视觉到人机对话&＃xff0c;再到认知智能&＃xff0c;AI不断突破能力边界&＃xff0c;同时伴随着模型参数的指数级提升&＃xff0c;AI模型加速膨胀导致训练成本攀升&＃xff0c;预计2025年最先进的AI训练模型成本将达到1亿美元。

而单芯片存在算力天花板&＃xff0c;单芯片在物理层面存在性能极限&＃xff0c;先进制程发展已难以维持摩尔定律&＃xff1b;分布式硬件难以高效协同运转&＃xff0c;分布式方案芯片间传输带宽低于片上带宽&＃xff0c;多芯片集群难以像“超级芯片”一样高效工作。

针对内存墙、用户接口不友好和定制化成本高等AI分布式训练痛点&＃xff0c;OneFlow从底层机制提出Actor机制、一致性视角和自动并行技术加以解决。

袁进辉表示&＃xff0c;随着大规模参数模型爆发&＃xff0c;OneFlow需求匹配程度愈发提高&＃xff0c;将超过TensorFlow和PyTorch逐渐占据更多的市场空间。

近两年&＃xff0c;一些国内科技巨头也纷纷推出深度学习框架&＃xff0c;例如百度飞桨PaddlePaddle、华为的MindSpore等。他们大多拥有自己的生态圈&＃xff0c;能够将硬件和软件搭配使用。相比之下&＃xff0c;一流科技的OneFlow属于独立的第三方框架&＃xff0c;更具有中立性&＃xff0c;可以广泛地与芯片厂商进行适配。

“GPU芯片巨头英伟达在美国的软件栈团队对我们的深度学习框架表示了密切关注&＃xff0c;每两个星期我们会就框架优化与合作问题进行探讨。”袁进辉透露。

虽然TensorFlow和PyTorch等深度学习框架为也英伟达的芯片所适配&＃xff0c;不过显然&＃xff0c;英伟达注意到OneFlow这个由独立的软件公司研发的框架的好处和价值。

开源与良好的商业模式并不冲突

去年OneFlow框架开源之后获得了非常高的关注。OneFlow的开源代码发布到了Github&＃xff0c;开源让全球开发者能够直观接触、下载、使用OneFlow。开源十个月Star数量超过2500&＃xff0c;超过华为Mindspore。

袁进辉直言&＃xff0c;“在开源社区里面&＃xff0c;有很多基础软件&＃xff0c;胜出的不是大公司&＃xff0c;而是初创团队&＃xff0c;比如主导Spark的Databricks等。一些互联网大公司都在用的软件&＃xff0c;刚开始都是小团队做的。只要技术上过硬&＃xff0c;就有机会。”显然&＃xff0c;一流科技有这个技术实力&＃xff0c;在其框架开源之后&＃xff0c;获得了谷歌、Facebook、华为、百度等同行的关注&＃xff0c;也受到了资本的青睐。

但是&＃xff0c;一个问题是&＃xff0c;开源与公司的商业模式是否冲突呢&＃xff1f;公司又如何建立自己的商业价值&＃xff1f;

袁进辉分析&＃xff0c;开源的商业模式主要有两种&＃xff0c;一种是虽然一些有技术能力的互联网公司或开发者自行下载开源软件&＃xff0c;进行项目开发&＃xff0c;但是对于没有开发能力的用户&＃xff0c;他们需要付费购买开源软件的商业版来使用。

另一种是云上托管。如今很多企业将数据计算在云上进行&＃xff0c;在用某个软件处理大数据、AI计算的任务时他可以把开源工具下载下来在云上部署&＃xff0c;这种方式下公司必须自己雇用工程师对这一流程进行调优&＃xff0c;需要承担较高的人力成本。但也可以直接从云上使用开源公司部署的软件&＃xff0c;这种做法用户需要承担的成本较低&＃xff0c;也更方便省事。

目前开源云托管是最好的商业模式&＃xff0c;在美国已经运用相对成熟。相信在中国也将有越来越多的用户接受这一模式。

OneFlow用起来不仅是快&＃xff0c;下一步打通易用性

OneFlow选择自上向下占领市场&＃xff0c;占据技术制高点&＃xff0c;从高效性向易用性和完备性延伸。以高效性作为突破口&＃xff0c;切入市场打破竞争格局。

目前&＃xff0c;用OneFlow训练比其他框架快的口碑已经在业内传开。一个数据是&＃xff0c;OneFlow v0.2.0实现了多达17个性能优化&＃xff0c;使得CNN和BERT的自动混合精度&＃xff08;AMP&＃xff09;训练速度大幅提升&＃xff0c;不仅远超其他各个主要框架的官方实现&＃xff0c;同时也超过了NVIDIA深度优化过的版本&＃xff0c;成为在主流旗舰显卡&＃xff08;V100 16G&＃xff09;上训练ResNet50-v1.5和BERT-base模型最快的框架。OneFlow ResNet50-v1.5 AMP单卡比NVIDIA深度优化过的PyTorch快80%&＃xff0c;比TensorFlow2.3快35%。

袁进辉表示&＃xff0c;我们即将发布新的版本&＃xff0c;将重点提升软件的易用性体验&＃xff0c;首先在单卡代码上保证和PyTorch的体验一致&＃xff0c;而同时在多卡场景下推出了全新的接口设计&＃xff0c;将给用户带来革命性的开发体验。相信这个版本的发布将极大地带动开发者群体&＃xff0c;扩大OneFlow的使用数量和应用范围。

在铺设高效性和易用性之后&＃xff0c;OneFlow还将打造完备性&＃xff0c;从而形成自上而下、三位一体的布局。袁进辉有信心&＃xff0c;在不久的将来和TensorFlow、PyTorch是三分天下的市场格局。

AI软件生态&＃xff0c;OneFlow需当此重任

在移动端&＃xff0c;开源的安卓系统形成强大的生态而成功。深度学习框架就像AI的操作系统一样&＃xff0c;它是模型算法和硬件资源之间的接口&＃xff0c;是AI系统资源的管理者&＃xff0c;实现对底层硬件资源的调度&＃xff0c;让开发者无需关心实现细节。

袁进辉认为&＃xff0c;生态建设就是0和1的问题&＃xff0c;OneFlow必然建设强大的生态才能实现更多的可能&＃xff0c;取得最终的成功。

目前&＃xff0c;OneFlow的硬核创新在核心AI开发圈树立了口碑&＃xff0c;得到全球框架专家的高度认可&＃xff0c;国内外深度学习框架产品已在积极跟进OneFlow所开创的设计理念。一流科技已与北京智源人工智能研究院、粤港澳大湾区数字经济研究院、之江实验室、中关村智用人工智能研究院等顶尖AI科研院所开展深度合作。同时&＃xff0c;联合芯片、云厂商等上下游企业加强配合&＃xff0c;已与寒武纪、燧原科技等推进超大模型训练方案。下一步将推动与更多芯片厂商和广大开发者的合作&＃xff0c;打造AI平台的繁荣生态。

开源生态已经得到国家层面的重视&＃xff0c;“开源”写进了今年的十四五规划&＃xff0c;而开源将是中国占领科技高地的机会。例如硬件方面现在大力发展的RISC-V开源指令集架构&＃xff0c;软件方面OneFlow做为中国的深度学习框架&＃xff0c;也将借助开源的力量进一步壮大其AI生态。

基于深度学习的软件2.0时代将打开30万亿美元的市场&＃xff0c;袁进辉表示&＃xff0c;中国拥有大量的基础软件人才&＃xff0c;积累了丰富的AI应用场景&＃xff0c;OneFlow有机会在这个AI时代乘风而行。

其他人都在看

浅谈GPU虚拟化和分布式深度学习框架的异同
OneFlow v0.4.0 正式发布
动态调度的“诅咒”③
数据搬运的“诅咒”②
资源依赖的“诅咒”①

点击“阅读原文”&＃xff0c;欢迎下载体验OneFlow新一代开源深度学习框架

推荐阅读

git
2017年人工智能领域的十大里程碑事件回顾

随着2018年的临近，我们一同回顾过去一年中人工智能领域的重要进展。这一年，无论是政策层面的支持，还是技术上的突破，都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]

蜡笔小新 2024-12-16 17:59:16
git
图像标签与以图搜图技术的应用与实践

本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用，涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]

蜡笔小新 2024-12-07 14:28:06
ci
百度AI Studio实战：利用高性能GPU集群进行线性回归

本文介绍百度AI Studio这一集成开发平台，涵盖丰富的AI教程、经典数据集及云端计算资源。通过具体示例——在AI Studio上构建线性回归项目，帮助初学者快速掌握其核心功能与操作方法。 ... [详细]

蜡笔小新 2024-12-20 06:24:41
ci
2017苹果全球开发者大会前瞻：iOS革新、Siri智能音箱与AI技术引领未来

2017年苹果全球开发者大会即将开幕，预计iOS将迎来重大更新，同时Siri智能音箱有望首次亮相，AI技术成为大会焦点。 ... [详细]

蜡笔小新 2024-12-18 18:02:27
ci
强人工智能时代，区块链的角色与前景

随着强人工智能的崛起，区块链技术在新的技术生态中扮演着怎样的角色？本文探讨了区块链与强人工智能之间的互补关系及其在未来技术发展中的重要性。 ... [详细]

蜡笔小新 2024-12-07 14:46:21
api
京东AI创新之路：周伯文解析京东AI战略的独特之处

2018年4月15日，京东在北京举办了人工智能创新峰会，会上首次公开了京东AI的整体布局和发展方向。此次峰会不仅展示了京东在AI领域的最新成果，还标志着京东AI团队的首次集体亮相。本文将深入探讨京东AI的发展策略及其与BAT等公司的不同之处。 ... [详细]

蜡笔小新 2024-12-06 22:57:11
struct
TensorFlow 入门：MNIST 数据集实战

本文详细介绍了 TensorFlow 的入门实践，特别是使用 MNIST 数据集进行数字识别的项目。文章首先解析了项目文件结构，并解释了各部分的作用，随后逐步讲解了如何通过 TensorFlow 实现基本的神经网络模型。 ... [详细]

蜡笔小新 2024-12-05 13:06:15
api
NVIDIA Titan RTX深度评测

NVIDIA的Titan RTX被誉为当前最强大的桌面显卡之一，其卓越的性能和高昂的价格吸引了众多专业人士和技术爱好者的关注。本文将详细介绍Titan RTX的技术规格、性能表现及应用场景。 ... [详细]

蜡笔小新 2024-12-19 20:04:56
api
解决PyCharm中安装PyTorch深度学习d2l包的问题

本文详细介绍了如何在PyCharm中成功安装用于PyTorch深度学习的d2l包，包括环境配置、安装步骤及常见问题的解决方案。 ... [详细]

蜡笔小新 2024-12-19 14:19:22
asp.net
新手指南：在Windows 10上搭建深度学习与PyTorch开发环境

本文详细记录了一名新手在Windows 10操作系统上搭建深度学习环境的过程，包括安装必要的软件和配置环境变量等步骤，旨在帮助同样初入该领域的读者避免常见的错误。 ... [详细]

蜡笔小新 2024-12-17 03:14:23
asp.net
a16z 推出加密研究实验室

a16z 宣布成立全新的加密研究实验室，旨在推动加密技术和 Web3 领域的科学发展。 ... [详细]

蜡笔小新 2024-12-11 10:17:03
asp.net
如何用GPU服务器运行Python

如何用GPU服务器运行Python-目录前言一、服务器登录1.1下载安装putty1.2putty远程登录 1.3查看GPU、显卡常用命令1.4Linux常用命令二、 ... [详细]

蜡笔小新 2024-12-06 11:54:09
api
4000名‘数学基础薄弱’的程序员逆袭成功！揭秘如何学好AI与算法

对于那些数学基础较差的程序员来说，数学在编程中的重要性往往在工作中才逐渐显现。通过两个实际案例，我们可以深入了解数学如何帮助程序员更好地理解和优化代码。 ... [详细]

蜡笔小新 2024-12-05 19:05:15
api
利用神经网络破解数学难题：求解偏微分方程的新途径

一项来自Quantamagazine的最新研究揭示，借助人工智能的深度学习技术，特别是深度神经网络，科学家们能够在数学建模领域取得突破，显著提高了处理复杂系统中偏微分方程的速度与效率。 ... [详细]

蜡笔小新 2024-12-01 14:44:13
ci
《计算机视觉：算法与应用》第二版初稿上线，全面更新迎接未来

经典计算机视觉教材《计算机视觉：算法与应用》迎来了其第二版，现已开放初稿下载。本书由Facebook研究科学家Richard Szeliski撰写，自2010年首版以来，一直是该领域的标准参考书。 ... [详细]

蜡笔小新 2024-11-30 20:56:47

陈俊凯660638

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章