热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

艺术不死,只是以生成AI的形式存在

原文作者:GuidoAppenzeller,MattBornstein,MartinCasado,YokoLi,

50446764346502bf0e0ec17a9731427d.gif

原文作者:Guido Appenzeller,Matt Bornstein,Martin Casado, Yoko Li,由巴比特Kyle翻译编辑。

427507b3a313676256da5d8ec080f5f9.png

图片来源:由无界版图 AI 生成

为什么人工智能(AI)模型会在取代程序员之前先取代艺术家。

也许我们从生成人工智能(generative AI)中看到的最令人费解的含义是,与“创造力将是人类独创力的最后堡垒”的普遍观点相反,实际上将相当困难的创造性任务自动化似乎比将相对简单的编程任务自动化要容易得多。为了理解这一点,我们比较了两个更流行的生成 AI 用例:代码生成和图像生成。但我们相信这种说法更普遍,即使生成模型扩展到更复杂的应用程序也是如此。

简单来说,虽然像 GitHub Copilot 这样的产品,在其当前形式下,可以使编码更高效,但它并不能消除对具有编程知识的有能力的软件开发人员的需求。一个重要原因是,在构建程序时,正确性真的很重要。如果 AI 生成一个程序,它仍然需要人来验证它是否正确——这项工作的重要程度几乎与开始创建它的水平相同。

另一方面,任何会打字的人都可以使用像 Stable Diffusion 这样的模型在几分钟内生成高质量、独一无二的图像,而且成本要低很多个数量级。创造性的工作产品通常没有严格的正确性约束,模型的输出非常完整。很难不看到依赖创意视觉的行业发生全面的相变,因为对于许多用途而言,人工智能现在能够产生的视觉效果已经足够了,而我们仍处于该技术的早期阶段。

我们完全承认,按照该领域的发展速度,很难对任何预测充满信心。不过现在,我们似乎更有可能看到完全由程序员创建的充满创意图像的应用程序,而不是完全由创作者构建的具有人工设计艺术的应用程序。

为什么炒作,为什么是现在?

在我们深入了解代码生成与图像生成的具体细节之前,了解一下目前 AI 整体现状和生成 AI 的流行程度是很有用的。

f648300a86940fe7e58b44ca9a42960c.png

生成 AI 正以前所未有的速度被开发人员采用。在我们撰写本文时,Stable Diffusion 轻松遥遥领先于 GitHub 存储库的趋势图表。它的增长远远领先于基础设施或加密领域的任何最新技术(见上图)。几乎每天都有使用该技术的初创公司的启动和融资公告,在线社交网络上充斥着由生成模型创建的内容。

过去十年对人工智能的总体投资水平也不容小觑。自 2010 年代中期以来,我们已经看到仅出版物的数量就呈指数级增长(见下图)。今天,arXiv 上发布的所有文章中约有 20% 是关于 AI、ML 和 NLP 的。重要的是,理论成果已经跨越了一个临界阈值,它们变得易于使用,并引发了新技术、软件和初创公司的寒武纪大爆发。

86542a90a18292aa8170ddc0f5be2a52.png

上图中最近的峰值主要是由于生成人工智能。在短短十年内,我们已经从可以对图像进行分类和创建词嵌入的专家专用 AI 模型,发展为可以编写有效代码并使用自然语言提示创建非常准确图像的公开可用模型。创新的步伐刚刚加快也就不足为奇了,当生成模型开始侵入曾经由人类主导的其他领域时也就不足为奇了。

生成 AI 和编程

生成 AI 的最早用途之一是作为程序员的辅助。它的工作方式是在大量代码库(例如 GitHub 中的所有公共存储库)上训练模型,然后在程序员编码时向他们提出建议。结果非常出色。如此大量的使用使这种方法有望成为未来编程的代名词。

43c15a51fca735368400d8fe5587153b.png

生成的代码:防止不使用分号而遭受的攻击

然而,相对于我们将在下面介绍的图像生成,生产率的提高并不大。如上所述,部分原因是正确性在编程中至关重要(实际上是更广泛的工程问题,但我们在这篇文章中专注于编程)。例如,最近的一项研究发现,对于匹配高风险 CWE(常见弱点枚举)的场景,40% 的 AI 生成代码包含漏洞。

因此,用户必须在生成足够的代码以提供有意义的生产力提升与仍然限制它以便检查正确性之间取得平衡。因此,Copilot 帮助提高了开发人员的工作效率——最近的研究(这里和这里)将收益提高了 2 倍或更少——但达到了我们在开发人员语言和工具之前的进步中看到的水平。例如,根据一些估计,从汇编语言到 C 语言的跳跃将生产率提高了 2-5 倍。

对于更有经验的程序员来说,关注点可能会超出代码的正确性并扩展到整体代码质量。正如 fast.ai 的 Jeremy Howard 就最新版本的 OpenAI Codex 模型所解释的那样,“它编写冗长的代码是因为它生成的是平均代码。对我来说,将普通代码变成我喜欢并且我知道是正确的代码比从头开始编写要慢得多——至少在我熟悉的语言中是这样。”

因此,虽然很明显生成编程是开发人员生产力的阶跃函数,但尚不清楚这种改进与我们之前看到的有很大不同。生成 AI 可以培养更好的程序员,但他们仍然必须进行编程。

生成 AI 和视觉效果

另一方面,生成模型对图像生成等创造性工作输出的影响是极端的。它在效率和成本方面带来了许多数量级的改进,并且很难不看到它在整个行业范围内带来阶段性转变。

生成 AI 在这个领域的工作方式是从用户那里获取简单的文本输入,称为提示(promts),然后模型生成视觉输出。目前,有用于创建许多输出格式的模型,包括图像、视频、3 D 模型和纹理。

特别有趣的是如何扩展这些模型以生成新的或特定领域的图像,而几乎没有创造性的干预。例如,Guido(作者之一)采用了预训练图像模型,并在他自己的几十张照片上对其进行了重新训练。从那里,他能够在提示中使用 生成图片。以下是根据以下提示生成的照片:“ 美国队长”、“ 在巴黎”、“ 在油画中”。

ba748dace4f17a9c0568542db5585c7b.png

在商业环境中,图像生成与代码生成的巨大差异在于生成式 AI 在多大程度上改变了经济计算。为了创建上述图片,Guido 在基础设施资源上为几张照片花费了大约 0.50 美元来训练模型。经过训练后,生成图像的计算资源成本约为 0.001 美元,可以在云端或最新一代笔记本电脑上完成。此外,生成图像只需几秒钟。

如果没有生成 AI,获得自定义图像的唯一方法是聘请艺术家或自己动手。即使我们假设一个人可以在一小时内以 10 美元的价格创建完全定制的逼真图像,生成 AI 方法也很容易便宜四个数量级,速度也快一个数量级。更现实地说,任何定制艺术品或图形设计项目都可能需要数天或数周时间,并且将花费数百甚至数千美元。

与上述编程辅助工具类似,生成 AI 将被艺术家用作一种工具,两者都需要一定程度的用户监督。但是,很难夸大图像模型模仿完整艺术家输出的能力所产生的经济差异。使用代码生成模型,即使编写执行标准计算任务的非常基本的功能程序也需要审查、编辑和添加许多代码片段的测试。但对于一个基本图像,输入 promt 并从十几个建议中挑选图像可以在一分钟内完成。

以我们自己的漫画家(和投资伙伴)Yoko Li (@stuffyokodraws) 为例。我们使用她之前的 70 张图像训练了一个模型,该模型能够生成具有令人毛骨悚然的模仿水平的图像。每个艺术家都必须弄清楚下一步要创作什么,她甚至发现经过训练的模型可以呈现出比她想象的更多的选择——至少在给定时间段内被迫生产某些东西时是这样。绘制同一对象的方法有数百种,但生成模型可以立即明确哪些路径值得探索。

因此,当涉及到此类任务时,我们并不是说计算机在 1:1 的基础上一定比人类更好。但与许多其他任务一样,当计算机可以产生完整的工作输出时,它们会在规模上秒杀我们。

试着猜猜下面哪些图是 Yoko 直接画的,哪些是生成的。

b3a0736dbf94fdc69f08f35d02297ebb.png

答:AI 模型生成的图像拥有一个非白色背景

经济的巨大进步、创造新风格和新概念的灵活性以及生成完整或接近完整作品的能力向我们表明,我们准备好看到创意资产是业务主要部分的所有行业发生显着变化。并且这不仅限于图像,而是适用于整个设计领域。例如:

  • 生成 AI 可以创建 2 D 艺术、纹理、3 D 模型,并帮助进行游戏关卡设计。

  • 在营销方面,它看起来有望取代库存艺术、产品摄影和插图。

  • 我们已经在网页设计、室内设计和景观设计中看到了应用。

我们真的才刚刚开始。如果一个用例需要创造性地生成内容,那么很难理解为什么生成 AI 不会颠覆它或至少成为这个流程的一部分。

0f8571f42213bbbb2b223567fd63133a.gif

AI作画从入门到精通,

三位老师带你学会使用多种AI作画工具,

提升作画审美。

让我们一起学习,

成为“AI artist”。

点击海报了解↓↓↓

48a30a9ee2e558856e389d0893f158d7.png

中文推特:https://twitter.com/8BTC_OFFICIAL

英文推特:https://twitter.com/btcinchina

Discord社区:https://discord.gg/defidao

电报频道:https://t.me/Mute_8btc

电报社区:https://t.me/news_8btc

15a90999e610eb2cff883f50cd8ada65.jpeg


推荐阅读
  • 本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤,帮助开发者快速掌握这一实用技巧。 ... [详细]
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 自学编程与计算机专业背景者的差异分析
    本文探讨了自学编程者和计算机专业毕业生在技能、知识结构及职业发展上的不同之处,结合实际案例分析两者的优势与劣势。 ... [详细]
  • 精选30本C# ASP.NET SQL中文PDF电子书合集
    欢迎订阅我们的技术博客,获取更多关于C#、ASP.NET和SQL的最新资讯和资源。 ... [详细]
  • 从零开始构建完整手机站:Vue CLI 3 实战指南(第一部分)
    本系列教程将引导您使用 Vue CLI 3 构建一个功能齐全的移动应用。我们将深入探讨项目中涉及的每一个知识点,并确保这些内容与实际工作中的需求紧密结合。 ... [详细]
  • 深入理解Java泛型:JDK 5的新特性
    本文详细介绍了Java泛型的概念及其在JDK 5中的应用,通过具体代码示例解释了泛型的引入、作用和优势。同时,探讨了泛型类、泛型方法和泛型接口的实现,并深入讲解了通配符的使用。 ... [详细]
  • 通过与阿里云的合作,牛客网成功解决了跨国视频面试中的网络卡顿问题,为求职者和面试官提供了更加流畅的沟通体验。 ... [详细]
  • 随着网络安全威胁的不断演变,电子邮件系统成为攻击者频繁利用的目标。本文详细探讨了电子邮件系统中的常见漏洞及其潜在风险,并提供了专业的防护建议。 ... [详细]
  • 微软Exchange服务器遭遇2022年版“千年虫”漏洞
    微软Exchange服务器在新年伊始遭遇了一个类似于‘千年虫’的日期处理漏洞,导致邮件传输受阻。该问题主要影响配置了FIP-FS恶意软件引擎的Exchange 2016和2019版本。 ... [详细]
  • 本文深入探讨了HTTP请求和响应对象的使用,详细介绍了如何通过响应对象向客户端发送数据、处理中文乱码问题以及常见的HTTP状态码。此外,还涵盖了文件下载、请求重定向、请求转发等高级功能。 ... [详细]
  • 深入解析Java枚举及其高级特性
    本文详细介绍了Java枚举的概念、语法、使用规则和应用场景,并探讨了其在实际编程中的高级应用。所有相关内容已收录于GitHub仓库[JavaLearningmanual](https://github.com/Ziphtracks/JavaLearningmanual),欢迎Star并持续关注。 ... [详细]
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • 本文详细介绍了Python编程语言的学习路径,涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划,帮助初学者快速掌握Python的核心技能。 ... [详细]
  • 探索电路与系统的起源与发展
    本文回顾了电路与系统的发展历程,从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明,还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]
author-avatar
郁小草__
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有