当前位置: 开发笔记 > 编程语言 > 正文

万亿大模型究竟怎么用？达摩院浙大上海人工智能实验室联手推出洛犀平台：大小模型端云协同进化...

作者：工程技术公司团委 | 来源：互联网 | 2023-08-27 16:12

鱼羊发自凹非寺量子位|公众号QbitAIAI领域这股大模型之风，可谓是席卷全球，越吹越劲。单说2021年下半年，前有微软英伟达联手推出53

鱼羊发自凹非寺
量子位 | 公众号 QbitAI

AI领域这股大模型之风&＃xff0c;可谓是席卷全球&＃xff0c;越吹越劲。

单说2021年下半年&＃xff0c;前有微软英伟达联手推出5300亿参数NLP模型&＃xff0c;后又见阿里达摩院一口气将通用预训练模型参数推高至10万亿。

而就在最近&＃xff0c;扎克伯格还宣布要豪砸16000块英伟达A100&＃xff0c;搞出全球最快超级计算机&＃xff0c;就为训练万亿参数级大模型。

大模型正当其道&＃xff0c;莫非小模型就没啥搞头了&＃xff1f;

就在“中国工程院院刊&＃xff1a;信息领域青年学术前沿论坛”上&＃xff0c;阿里巴巴达摩院、上海浙江大学高等研究院、上海人工智能实验室联手给出了一个新的答案&＃xff1a;

须弥藏芥子&＃xff0c;芥子纳须弥。
大小模型协同进化&＃xff0c;才能充分利用大模型应用潜力&＃xff0c;构建新一代人工智能体系。

此话怎讲&＃xff1f;

这就得先说说大模型“军备竞赛”背后的现实困境了。

大小模型协同进化

核心问题总结起来很简单&＃xff0c;就是大模型到底该怎么落地&＃xff1f;

参数规模百亿、千亿&＃xff0c;乃至万亿的大模型们&＃xff0c;固然是语言能力、创作能力全面开花&＃xff0c;但真想被部署到实际的业务当中&＃xff0c;却面临着能耗和性能平衡的难题。

说白了&＃xff0c;就是参数量竞相增长的大模型们&＃xff0c;规模太过庞大&＃xff0c;很难真正在手机、汽车等端侧设备上被部署应用——

要知道&＃xff0c;1750亿参数的GPT-3&＃xff0c;模型大小已经超过了700G。

达摩院2022年十大科技趋势报告中也提到&＃xff0c;在经历了一整年的参数竞赛模式之后&＃xff0c;在新的一年&＃xff0c;大模型的规模发展将进入冷静期。

不过在这个“阵痛期”&＃xff0c;倒也并非没有人试吃“大模型工业化应用”这只螃蟹。

比如&＃xff0c;支付宝搜索框背后&＃xff0c;已经试点集成业界首个落地的端上预训练模型。

当然&＃xff0c;不是把大模型强行塞进手机里——

来自阿里巴巴达摩院、上海浙江大学高等研究院、上海人工智能实验室的联合研究团队&＃xff0c;通过蒸馏压缩和参数共享等技术手段&＃xff0c;将3.4亿参数的M6模型压缩到了百万参数&＃xff0c;以大模型1/30的规模&＃xff0c;保留了大模型90%以上的性能。

具体而言&＃xff0c;压缩后的M6小模型大小仅为10MB&＃xff0c;与开源的16M ALBERT-zh小模型相比&＃xff0c;体积减少近40%&＃xff0c;并且效果更优。难得的是&＃xff0c;10MB的M6模型依然具有文本生成能力。

在移动端排序模型部署方面&＃xff0c;这支研究团队同样有所尝试。

主流的模型压缩、蒸馏、量化或参数共享&＃xff0c;通常会使得到的小模型损失较大精度。

该团队发现&＃xff0c;把云上排序大模型拆分后部署&＃xff0c;可形成小于10KB的端侧精细轻量化子模型&＃xff0c;即保证端侧推理精度无损失&＃xff0c;同时实现了轻量级应用端侧资源。这也就是端云协同推理。

在阿里的应用场景下&＃xff0c;研究团队基于这样的协同推理机制&＃xff0c;结合表征矩阵压缩、云端排序打分作为特征、实时序列等技术和信息&＃xff0c;构建了端重排模型。

该技术试点部署在支付宝搜索、淘宝相关应用中&＃xff0c;取得了较为显著的推理效果提升&＃xff0c;且相关百模设计解决了在不牺牲热门用户服务体验的同时&＃xff0c;最大化冷门用户体验的难题。

从以上的案例中&＃xff0c;不难总结出大模型落地应用的一条可行的途径&＃xff1a;

取大模型之精华&＃xff0c;化繁为简&＃xff0c;通过高精度压缩&＃xff0c;将大模型化身为终端可用的小模型。

这样做的好处&＃xff0c;还不只是将大模型的能力释放到端侧&＃xff0c;通过大小模型的端云协同&＃xff0c;小模型还可以向大模型反馈算法与执行成效&＃xff0c;反过来提升云端大模型的认知推理能力。

达摩院、浙大和上海人工智能实验室&＃xff0c;还进一步将这一技术路线总结为端云协同AI范式&＃xff1a;

云端大模型作为超级大脑&＃xff0c;拥有庞大的先验知识&＃xff0c;能进行深入的“慢思考”。
而端侧小模型作为四肢&＃xff0c;能完成高效的“快思考”和有力执行。
两者共同进化&＃xff0c;让AI向具有认知力和接近人类水平的智能迈进。

基于这样的思考和实践经验&＃xff0c;三方联合研究团队最新推出了端云协同平台洛犀。

该平台旨在将端云两侧的最佳实践以文档、算法组件、平台服务的形式沉淀下来&＃xff0c;为开发者提供一站式端云协同模型训练、部署、通信能力。

具体而言&＃xff0c;洛犀平台可拆解为端侧、云侧、端云链路三部分。

其中&＃xff0c;端侧以Python/js package的形式提供服务&＃xff0c;称为Luoxi-lite&＃xff0c;包含表征、文本理解、图计算等能力。

端云链路侧&＃xff0c;平台提供实现端云协同关键的通信能力&＃xff0c;包括方案分发链路、数据通信链路。

端云协同的模型训练沉淀在云端&＃xff0c;称为Luoxi-cloud&＃xff0c;包含端模型训练等。

目前&＃xff0c;除了前文提到的部署于搜索场景的M6模型、排序模型&＃xff0c;研究团队还借助洛犀完成了图神经网络、强化学习等技术在端云协同范式下的部署。

值得一提的是&＃xff0c;1月12日&＃xff0c;洛犀平台中云上大模型核心技术“超大规模高性能图神经网络计算平台及其应用”&＃xff0c;获得了2021年中国电子学会科学技术进步奖一等奖。

芥子纳须弥&＃xff0c;加速大模型落地应用

说了这么多&＃xff0c;简单总结一下就是&＃xff0c;大模型展现的效果再怎么惊艳&＃xff0c;对于业界而言&＃xff0c;终归是落地应用方为真。

因此&＃xff0c;对于大模型发展的下一阶段来说&＃xff0c;比拼的将不仅仅是谁烧的GPU更多、谁的模型参数规模更大&＃xff0c;更会是谁能把大模型的能力充分应用到具体场景之中。

在这个大模型从拼“规模”到拼“落地”的过渡时期&＃xff0c;达摩院、浙大、上海人工智能实验室三方此番提出的“须弥藏芥子、芥子纳须弥”的思路&＃xff0c;便格外值得关注。

“庞大的须弥山如何纳入极微小的种子中&＃xff1f;”

对于当下大模型、小模型的思辨而言&＃xff0c;解决了这样一个问题&＃xff0c;也就在充分利用大模型能力、探索下一代人工智能系统的路途上更进了一步。

结合历史上计算形态的变化&＃xff0c;随着物联网技术的爆发&＃xff0c;在当下&＃xff0c;尽管云计算模式已经在通信技术的加持下得到了进一步强化&＃xff0c;但本地计算需求也在指数级持续涌现&＃xff0c;将全部的计算和数据均交由集中式的云计算中心来处理并不符合实际。

就是说&＃xff0c;发展既发挥云计算优势、又调动端计算敏捷性的计算模式&＃xff0c;才是当下的需求所在。

也正是在这样端云协同的趋势之下&＃xff0c;大小模型的协同演进有了新的范式可依&＃xff1a;云侧有泛化模型&＃xff0c;端侧有个性化模型&＃xff0c;两个模型相互协作、学习、推理&＃xff0c;实现端云双向协同。

而这&＃xff0c;正解决了我们在开头提到的&＃xff0c;大模型落地过程中面临的性能与能耗平衡之困。

正如浙江大学上海高等研究院常务副院长吴飞教授所言&＃xff0c;从大模型到终端可用的小模型&＃xff0c;关键在于“取其精华、化繁为简”&＃xff0c;实现高精度压缩&＃xff1b;而在端云协同框架之下&＃xff0c;小模型的实践积累对于大模型而言&＃xff0c;将是“集众智者无畏于圣人”。

你觉得呢&＃xff1f;

推荐阅读

js
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
io
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
ip
小程序与小视频：创业公司的左右抉择

对于众多创业公司而言，选择小程序或小视频的发展方向至关重要。本文将深入分析小程序和小视频的特点、优势及局限，帮助创业者做出更明智的选择。 ... [详细]

蜡笔小新 2024-11-12 18:48:34
ip
如何撰写数据分析师（包括转行者）的面试简历？

CDA数据分析师团队出品，作者：徐杨老师，编辑：Mika。本文将帮助您了解如何撰写一份高质量的数据分析师简历，特别是对于转行者。 ... [详细]

蜡笔小新 2024-11-12 18:20:52
ip
深入解析国内AEB应用：摄像头和毫米波雷达融合技术的现状与前景

本文作者程建伟，武汉极目智能技术有限公司CEO，入选武汉市“光谷3551人才计划”。文章详细探讨了国内自动紧急制动（AEB）系统中摄像头与毫米波雷达融合技术的现状及未来前景。通过分析当前技术的应用情况、存在的挑战以及潜在的解决方案，作者指出，随着传感器技术的不断进步和算法优化，AEB系统的性能将大幅提升，为交通安全带来显著改善。 ... [详细]

蜡笔小新 2024-11-11 17:31:27
js
【Python 实战：汇率转换器 v1.02】

本项目通过Python编程实现了一个简单的汇率转换器v1.02。主要内容包括：1. Python的基本语法元素：（1）缩进：用于表示代码的层次结构，是Python中定义程序框架的唯一方式；（2）注释：提供开发者说明信息，不参与实际运行，通常每个代码块添加一个注释；（3）常量和变量：用于存储和操作数据，是程序执行过程中的重要组成部分。此外，项目还涉及了函数定义、用户输入处理和异常捕获等高级特性，以确保程序的健壮性和易用性。 ... [详细]

蜡笔小新 2024-11-11 16:34:26
io
您的数据库配置是否安全？DBSAT工具助您一臂之力！

本文探讨了Oracle提供的免费工具DBSAT，该工具能够有效协助用户检测和优化数据库配置的安全性。通过全面的分析和报告，DBSAT帮助用户识别潜在的安全漏洞，并提供针对性的改进建议，确保数据库系统的稳定性和安全性。 ... [详细]

蜡笔小新 2024-11-11 14:44:47
js
深入解析浏览器内核与版本的发展历程

浏览器作为我们日常不可或缺的软件工具，其背后的运作机制却鲜为人知。本文将深入探讨浏览器内核及其版本的演变历程，帮助读者更好地理解这一关键技术组件，揭示其内部运作的奥秘。 ... [详细]

蜡笔小新 2024-11-11 13:34:37
js
Win10 S系统与Chrome浏览器兼容性问题分析

2017年5月2日，微软在美国推出了最新的Windows 10 S操作系统，专为教育领域设计，旨在为教师和学生提供一系列高效的产品和服务。该系统的最大特点是其简洁的设计和快速的响应速度，然而在与某些应用的兼容性方面，特别是Chrome浏览器，仍存在一些问题。本文将深入分析这些兼容性问题，并探讨可能的解决方案。 ... [详细]

蜡笔小新 2024-11-09 23:50:49
js
中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程

中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程 ... [详细]

蜡笔小新 2024-11-03 13:52:28
js
接入支付宝小程序功能，人人租机实现从零到百的快速增长

人人租机作为国内领先的信用免押租赁平台，为企业和个人提供全方位的新租赁服务。通过接入支付宝小程序功能，该平台实现了从零到百的迅猛增长，成为全国首家推出“新租赁小程序”开发服务的阿里巴巴小程序服务商（ISV）。这一创新举措不仅提升了用户体验，还显著增强了平台的市场竞争力。 ... [详细]

蜡笔小新 2024-11-02 13:00:12
js
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
js
解决Bootstrap DataTable Ajax请求重复问题

在最近的一个项目中，我们使用了JQuery DataTable进行数据展示，虽然使用起来非常方便，但在测试过程中发现了一个问题：当查询条件改变时，有时查询结果的数据不正确。通过FireBug调试发现，点击搜索按钮时，会发送两次Ajax请求，一次是原条件的请求，一次是新条件的请求。 ... [详细]

蜡笔小新 2024-11-12 13:59:27
io
如何在Linux服务器上配置MySQL和Tomcat的开机自动启动

在Linux服务器上部署Web项目时，通常需要确保MySQL和Tomcat服务能够随系统启动而自动运行。本文将详细介绍如何在Linux环境中配置MySQL和Tomcat的开机自启动，以确保服务的稳定性和可靠性。通过合理的配置，可以有效避免因服务未启动而导致的项目故障。 ... [详细]

蜡笔小新 2024-11-11 19:41:03
io
Python错误重试让多少开发者头疼？高效解决方案出炉

### 优化后的摘要在处理 Python 开发中的错误重试问题时，许多开发者常常感到困扰。为了应对这一挑战，`tenacity` 库提供了一种高效的解决方案。首先，通过 `pip install tenacity` 安装该库。使用时，可以通过简单的规则配置重试策略。例如，可以设置多个重试条件，使用 `|`（或）和 `&`（与）操作符组合不同的参数，从而实现灵活的错误重试机制。此外，`tenacity` 还支持自定义等待时间、重试次数和异常处理，为开发者提供了强大的工具来提高代码的健壮性和可靠性。 ... [详细]

蜡笔小新 2024-11-11 10:33:20

工程技术公司团委

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

万亿大模型究竟怎么用？达摩院浙大上海人工智能实验室联手推出洛犀平台：大小模型端云协同进化...

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI

大小模型协同进化

芥子纳须弥&＃xff0c;加速大模型落地应用

鱼羊发自凹非寺
量子位 | 公众号 QbitAI