热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

AIGC的里程碑——ChatGPT凭什么引爆科技圈?

摘要事件:11 月 30 日,OpenAI 上线了新模型 ChatGPT,其网页应用允许用户免费使用,ChatGPT 能够理解人类语言并且回答问题,不限于普通聊天、协助写代码、解决具体难题等等应用场景

摘要

事件:11 月 30 日,OpenAI 上线了新模型 ChatGPT,其网页应用允许用户免费使用,ChatGPT 能够理解人类语言并且回答问题,不限于普通聊天、协助写代码、解决具体难题等等应用场景。因为其高质量的回答、高效获取信息的方式、以及上瘾式的交互体验,ChatGPT 引起了社交媒体的广泛传播与关注。


ChatGPT 效果出人意料,“全能 AI”火遍社交媒体。ChatGPT 的交互界面简洁,只有一个输入框,AI 将根据输入内容进行回复,并允许在一个语境下持续聊天。ChatGPT 的聊天范围广泛,涵盖大部分领域,根据亲身体验以及社交媒体分享的内容来看,ChatGPT 能在绝大部分知识领域给出专业回答,同时对输入的理解能力和包容度高。无论是让 ChatGPT 写首押韵的诗、检查代码的 bug、回答科学问题、对推特未来的发展提出建议都不在话下,其回复内容每次都是随机的,但总体保持着一定的专业性和信息量,具备很强的参考意义。与 ChatGPT 持续对话是一种令人上瘾的体验,因此在该应用发布的短短几天内,就能看到国内外的社交媒体上就有大量关于 ChatGPT 对话的分享。


ChatGPT 的背后离不开大模型、大数据、大算力。ChatGPT 成为 AIGC 里程碑的背后,是算力发展和数字时代形成的大数据所共同支持的大模型训练,才能实现目前的效果。由 OpenAI 研发的 ChatGPT 是微调后的 GPT-3.5 系列模型,有着多达 1750 亿个模型参数,并在今年年初训练完成。模型训练的背后离不开大数据的支持,OpenAI 主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。在算力方面,GPT-3.5 在 Azure AI 超算基础设施(由 V100GPU 组成的高带宽集群)上进行训练,总算力消耗约 3640 PF-days(即每秒一千万亿次计算,运行 3640 个整日)。


AIGC 不仅改变创作,还将改变获取信息的主要方式。在之前的报告中,我们讨论过 AIGC 对于创作的替代,降低了创作门槛,为元宇宙数字内容的丰富打下基础。而在此之上,ChatGPT 所展示了作为生产力的存在,ChatGPT 在寻找答案、解决问题的效率上已经部分的超越了如今的搜索引擎,ChatGPT 或许在未来会改变我们获取信息、输出内容的方式,AIGC 有望成为数字经济时代驱动需求爆发的杀手级应用。


模型缺点瑕不掩瑜,未来迭代值得期待。据官网显示,ChatGPT 目前存在着一些局限性,包括:有时会给出看上去正确但荒谬的答案、微调提问的方式会得到完全不同的答案、有时会反复使用某些句子等等。在我们实际体验中也能感受到,这些问题来自训练过程和数据集的局限性。ChatGPT 本次面向用户免费开放能够进一步强化训练,从而完善模型质量。


投资建议:软硬件与数据集。生成算法、NLP 与算力决定 AIGC 能否运行,而高质量的数据集决定了 AIGC 质量与商业模式。软件层面主要包括自然语言处理技术:谷歌、微软、科大讯飞、拓尔思;AIGC 生成算法模型及数据集:视觉中国、万兴科技、蓝色光标、昆仑万维;算力层包括:三大运营商(移动、电信、联通)、英伟达、澜起科技、中兴通讯、新易盛、天孚通信、中际旭创等。


风险提示技术创新不及预期;政策监管风险。




11 月 30 日,OpenAI 上线了新模型 ChatGPT,该模型允许用户以对话的方式与其交互。ChatGPT 是之前发布的 InstructGPT 的兄弟模型,后者被训练用于根据输入给出详细的一段输出。同时,ChatGPT 模型为了获得更多用户反馈,在目前阶段对用户开放免费使用,用户可通过 chat.openai.com 进行应用交互体验。


ChatGPT 的交互界面简洁,只有一个输入框,用户可以任意开启话题或者给出指令,模型将根据输入内容给出输出。ChatGPT 的一大特点就是允许在同一个语境下持续交流,能够根据上下文进行回复。


ChatGPT 的聊天范围广泛,涵盖大部分领域,具备参考意义。根据亲身体验以及社交媒体分享的内容来看,ChatGPT 能在绝大部分知识领域给出专业回答,同时对输入的理解能力和包容度高。无论是让 ChatGPT 写首押韵的诗、检查代码的 bug、回答科学问题、对推特未来的发展提出建议都不在话下,其回复内容每次都是随机的,但总体保持着一定的专业性和信息量,具备很强的参考意义。



ChatGPT 的对话内容开始在社交媒体引起关注。因为 ChatGPT 对话的随机性以及较为丰富的信息量,与 ChatGPT 持续对话令人上瘾,在该应用发布的短短几天内,国内外的社交媒体上就有大量关于 ChatGPT 对话的分享。这其中包括马斯克向 ChatGPT 请教如何改变推特,也有各类有趣的问答合辑。


AIGC 里程碑的背后离不开大模型、大数据、大算力。ChatGPT 成为 AIGC 里程碑的背后,是算力发展和数字时代形成的大数据所共同支持的大模型训练,才能实现目前的效果。由 OpenAI 研发的 ChatGPT 是微调后的 GPT-3.5 系列模型(GPT 模型专门用于人类语言应用),有着多达 1750 亿个模型参数,并在今年年初训练完成。


模型训练的背后离不开大数据的支持,公共爬虫数据集有着超过万亿单词的人类语言数据集,OpenAI 团队在此基础上进行整理加工形成用于训练模型的数据集。在算力方面,GPT-3.5 在 Azure AI 超算基础设施(由 V100GPU 组成的高带宽集群)上进行训练,总算力消耗约 3640 PF-days(即每秒一千万亿次计算,运行 3640 个整日)。



AIGC 不仅改变创作,还将改变获取信息的主要方式。在之前的报告中,我们讨论过 AIGC 对于创作的替代,降低了创作门槛,为元宇宙数字内容的丰富打下基础。而在此之上,ChatGPT 所展示了作为生产力的存在,ChatGPT 在寻找答案、解决问题的效率上已经部分的超越了如今谷歌等搜索引擎,ChatGPT 或许在未来会改变我们获取信息的方式,AIGC 成为新时代的用户入口。


模型缺点瑕不掩瑜,未来迭代值得期待。官网注明了 ChatGPT 目前存在着一些局限性及原因,在我们的实际体验中,也确实遇到这些问题:


1)有时 ChatGPT 会写一些看上去合理但错误且荒谬的答案,这个在体验中较少但会出现。据官网描述,这个问题是难以解决的,因为:第一,在训练期间,并没有提问者目前所有的事实;第二,如果让模型过于谨慎,那么他能回答的问题也会拒绝回答;第三,有观察的训练误导了模型,因为正确的答案来源于模型的数据库而非人类知道什么。


2)ChatGPT 对输入的改变比较敏感。例如,给出一句问题,模型声称无法得知答案,但轻微地改变问题,就能正确地回答。这种特性在体验中表现的比较明显。


3)ChatGPT 有时会非常重复表达,反复使用某些句子,例如:重申自己是 OpenAI 训练的语言模型。这个问题在我们的体验中也经常出现,根据官网,该问题来自于训练数据的偏差,以及过度拟合问题。


4)在理想情况下,当用户问题模糊时,模型应该会提问将问题清晰化。但目前的模型经常不去追问问题,直接猜想用户可能问的方向。


除了官网提到的局限性外,根据实际体验,ChatGPT 即使在输入的明确要求下,也难以在表达中使用数据支持,这可能是因为 ChatGPT 所使用的语言数据集并不包含太多关于数据的内容。



投资建议


相比于此前的 AI 绘画,ChatGPT 更具有将 AI 能力与工作流程相结合的潜力,例如我们试着让其解释“光学模块中的光芯片和电芯片是什么?当前的全球主流供应商是谁?中国企业的竞争地位如何?未来是否有什么技术可以替代 InP 材料?”这类问题时,ChatGPT 能够给出颇为专业的答复,且语言表达流畅。如果将 ChatGPT 与 Midjourney 等创作工具融合,有可能直接输出设计图稿等内容,毕竟文字生成是基础,而用户要做的尽量调整自己的输入,以促使 AI 输出更质量的内容,这本身也是一种训练和反馈过程。目前部分用户已在社交媒体上表达了对 ChatGPT 的付费意愿,可见 C 端用户为了提高效率有意愿订阅此类服务。


目前 OpenAI 等巨头已着手自建计算集群来满足 AIGC 的要求,这种集中式的训练对 GPU、存储、机房、供电等基础设施均有巨大需求。国内部分创业团队目前基于公有云训练,随着需求的增加,也有望转向自建集群。


今年以来,我国“东数西算”战略自上而下快速推进,作为数字经济的基础,“算力即权力”,其重要性不言而喻,此前我们更多的互联网应用聚焦于“存”而非“算”,随着 AIGC 技术在全球的兴起,“东数西算”的算力需求将越来越显著。


关于 AIGC 的投资策略,能够从软硬件与数据集的三个角度梳理,生成算法、NLP 与算力决定 AIGC 能否运行,而高质量的数据集决定了 AIGC 质量与商业模式。


软件层面主要包括自然语言处理技术:谷歌、微软、科大讯飞、拓尔思。


AIGC 生成算法模型及数据集:蓝色光标、视觉中国、昆仑万维、万兴科技。


算力层包括:三大运营商(移动、电信、联通)、英伟达、澜起科技、中兴通讯、新易盛、天孚通信、中际旭创等。


风险提示

技术创新不及预期:AIGC 的技术发展不及预期,以及底层硬件技术,如:超级计算机,算力的发展不及预期。


政策监管风险:目前 AIGC 还处于相对早期,后续是否会出台 AIGC 作品相关的知识版权或其他法律监管条款尚不明确。


本文节选自国盛证券研究所已于 2022 年 12 月 5 日发布的报告《AIGC 的里程碑——Chat GPT 凭什么引爆科技圈?》,具体内容请详见相关报告。

宋嘉吉  S0680519010002   songjiaji@gszq.com

特别声明:《证券期货投资者适当性管理办法》于 2017 年 7 月 1 日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。

重要声明:本订阅号是国盛证券通信团队设立的。本订阅号不是国盛通信团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。

本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。

版权所有,未经许可禁止转载或传播。


东港股份

嘉楠科技

公链 2020H1

漫画区块链

比特币 UTXO

比特币挖矿初探

比特币挖矿产业链

比特币与黄金相关性

DCEP 专利分析

DCEP 双离线支付

DCEP 标的

Libra

区块链 + 电子发票

区块链 + 溯源

区块链 + 供应链金融

区块链标准委标的


韩锋

唯链

帅初 -Qtum

段新星 -OKCoin

孙鸣 - 法律专家

张原 - 比特大陆

咕噜

白硕 - 上交所前总工

余文波 - 分布式资本

张元杰 -Conflux

吕国宁 -Nervos

郑义 -Qtum

孟岩 -CSDN

陈雷 - 比特蓝鲸

周沙 - 区块链早期参与者

俞阳 - 矿海会


【国盛区块链系列之元宇宙】


2021.6.28 国盛区块链独家带你——在“元宇宙”中看元宇宙


2021.7.16  国盛区块链:中国版 Roblox 上线,元宇宙 UGC 生态迎来新发展


2021.8.2  国盛区块链:元宇宙之二:算力重构,通向 Metaverse 的阶梯


2021.8.5  国盛区块链:元宇宙是“方块”搭成的?


2021.8.30 国盛区块链:元宇宙(四):GameFi 赛道崛起,元宇宙踏上破圈征程


2021.10.12 国盛区块链:元宇宙(五 ) : NFT 商业落地中的思考


2021.12.21 国盛区块链:虚拟人的“灵魂”是什么?


【国盛区块链系列之数字货币】


2019.9.24 国盛区块链:初探中国央行数字货币:目标、定位、机制与影响


2019.10.9 国盛区块链 | 再探央行数字货币:对电子支付产业有何影响?


2019.11.15 国盛区块链:数字货币的双离线支付是什么?


2020.4.8 国盛区块链专题:三探央行数字货币:透过专利看“超级货币”蓝图


2020.4.17 国盛区块链:一图看懂央行数字货币相关标的


2020.6.24 国盛区块链:四探央行数字货币:第三方支付产业新变量


2020.7.9 国盛区块链:五探数字货币:NFC+SIM 卡打造 DCEP 安全支付环境


2020.9.22 国盛区块链:六探央行数字货币:他山之石,枕戈待旦


2021.3.9  国盛区块链:大行发力 DCEP,数字人民币渐行渐近


2021.4.20 盛区块链:数字人民币测试加速,应用场景不断丰富


2021.4.19 盛区块链:数字人民币与加密货币分而治之,公测在即


2021.5.7 盛区块链:不可或缺的数字货币


2021.7.18 盛区块链:数字货币再加速,大国竞争新赛道


2021.9.8 盛区块链:数字人民币产业链初现,亮相服贸会


2021.11.9 国盛区块链:币兑换机亮相进博会,数字人民币国际化提速


2022.1.5  国盛区块链: 数字人民币 App 上线,新电子支付体系显露真容


【国盛区块链系列之 DeFi】


2021.1.25 国盛区块链:DEFI 生态、以太坊 2.0:锁仓推动 eth 价格持续新高


2021.2.1 国盛区块链:链上费用 Top10 DeFi 占八席、以太坊扩容和二层网络值得期待


2021.4.22 国盛区块链·深度:DeFi 新金融(一):构筑加密世界开放金融新生态


2021.4.24 国盛区块链·深度:DeFi 新金融(二):超额抵押与资产映射


2021.5.12 国盛区块链·深度:DeFi 新金融(三):DeFi 高收益从何而来?


2021.6.16 国盛区块链·深度:DeFi 新金融(四):暴跌下的压力测试,DeFi 韧性如何?


2021.8.1 国盛区块链·深度:DeFi 新金融(五):稳定币的昨天、今天和明天


2021.9.18 国盛区块链:掉进兔子洞——DeFi 的诱人承诺与风险


【国盛区块链系列之 NFT】


2021.3.15 国盛区块链|频频“出圈”的 NFT:链接真实世界的入口


2021.4.11 国盛区块链·深度:NFT:数字资产化桥梁,进化才刚刚开始


2021.8.31 盛区块链: 互联网巨头入局元宇宙,NFT 收藏品市场持续升温


2021.9.7  OpenSea——全球最大 NFT 交易平台的创新与破圈


2021.9.9 国盛区块链:何为 NFT?价值何来?


【国盛区块链系列之上市公司】


2019.3.4 国盛区块链:Facebook 计划发行加密货币、新加坡政府投资公司参与 Coinbase 融资


2019.11.24 国盛通信宋嘉吉:嘉楠科技深度:全球矿机第一股,产业延伸看 AI


2020.2.15 国盛区块链&轻工:东港股份深度:龙头转型,区块链业务锋芒渐露


2020.3.3 国盛区块链&轻工: 东港股份 002117:北京试点区块链电子发票,公司步入快车道


2020.4.14 国盛区块链&轻工:东港股份 002117:主业平稳,区块链业务驶入快车道


2021.1.11 国盛区块链:矿场股和矿机股有何不同?


2021.2.8 国盛区块链:比特币价格高企,中嘉博创布局算力运营产业链


2021.2.23 国盛区块链·深度:全球比特币挖矿股全景解析


2021.3.16 国盛区块链·深度:Coinbase 上市:里程碑与新起点


2021.3.22 国盛区块链:香港首家持牌数字资产交易所上线,Coinbase 推迟至下月上市


2021.4.2 国盛区块链:聚光灯下的 Coinbase


2021.4.17 国盛区块链:嘉楠科技(CAN):比特币看多期权,业绩有望延后爆发


2021.8.11 国盛区块链:Coinbase 月活增速亮眼,以太坊交易量首超比特币


【国盛区块链系列之周观点】


2020.12.21 国盛区块链:数字黄金渐行渐近,比特币会成为全球储备资产吗


2020.12.28 国盛区块链:比特币新高下,挖矿行业怎么看?


2021.1.4 国盛区块链:比特币价格上限在哪里?


2021.1.18 国盛区块链:跨链生态引领币市热点,灰度下架 XRP 信托产品


2021.2.22 国盛区块链:比特币持续新高,概念股惊艳资本市场


2021.2.16 国盛区块链|特斯拉购入比特币,数字黄金再“出圈”


2021.3.1 国盛区块链:以太坊 1559 提案:矿工、持币人和社区利益的再平衡


2021.3.8 国盛区块链:火币科技虚拟资产基金登陆香港,行业加速合规化


2021.3.22 国盛区块链:香港首家持牌数字资产交易所上线,Coinbase 推迟至下月上市


2021.4.5 国盛区块链:VISA 将支持加密货币结算,crypto 加速渗透传统金融


2021.4.17 国盛区块链:嘉楠科技(CAN):比特币看多期权,业绩有望延后爆发


2021.4.20 国盛区块链:数字人民币测试加速,应用场景不断丰富


2021.4.21 国盛区块链:Chia 新模式催化,硬盘存储设备供不应求


2021.4.26 国盛区块链:Chia 下周开启交易,挖矿新模式迎来市场首秀


2021.6.1 国盛区块链:加密货币挖矿监管趋严,BSC 安全事件频发


2021.6.15 国盛区块链:中国数据安全法出台,隐私计算推动数据要素市场化


2021.6.29 国盛区块链:密货币监管持续收紧,蚂蚁链 NFT 迎来首秀


2021.8.10 国盛区块链:太坊 1559 提案正式实施,代币销毁效果显著


2021.8.31 国盛区块链: 互联网巨头入局元宇宙,NFT 收藏品市场持续升温


2021.9.7 国盛区块链:OpenSea——全球最大 NFT 交易平台的创新与破圈


2021.9.21 国盛区块链:Loot 异军突起,虚拟经济的新尝试


2021.10.24 国盛区块链: 从比特币期货 ETF 获批,看全球区块链产业变迁


2021.10.25 国盛区块链:Facebook 计划更名,加速构建元宇宙版图


【国盛区块链系列之其他】


2021.5.1 国盛区块链|2021 掘金丰水期——融合、出圈与合规


2021.4.29 国盛区块链·深度:迭代与竞争——以太坊的 Layer2 扩容之路


2021.4.16 国盛区块链:美联储全景解读 DeFi 的颠覆力量


2021.1.24 国盛区块链:区块链新基建(四):中欧投资协定背景下,隐私计算开启新蓝海


(向下滑动,查看更多)


推荐阅读
author-avatar
孤独游侠1976_127
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有