文字生成图片：输入描述语，人工智能自动帮你绘图！

作者：单色设计 | 来源：互联网 | 2023-06-01 19:56

DiscoDiffusion是发布于GoogleColab平台的一款利用人工智能深度学习进行数字艺术创作的工具，它是基于MIT许可协议的开源工具，可以在

Disco Diffusion 是发布于 Google Colab 平台的一款利用人工智能深度学习进行数字艺术创作的工具&＃xff0c;它是基于 MIT 许可协议的开源工具&＃xff0c;可以在 Google Drive 直接运行&＃xff0c;也可以部署到本地运行&＃xff0c;目前最新的版本是 Disco Diffusion v5.2。

主创是 Somnai&＃xff08;&＃64;Somnai_dreams&＃xff09;和 Adam Letts&＃xff08;&＃64;gandamu_ml&＃xff09;&＃xff0c;在 Chris Allen&＃xff08;&＃64;zippy731&＃xff09;、HostsServer&＃xff08;&＃64;HostsServer&＃xff09;和 Tom Mason&＃xff08;&＃64;nin_artificial&＃xff09;的协作下迭代到了今天的版本。

用白话讲 Disco Diffusion 的基本工作就是把你给出的 Prompts&＃xff08;提示/描述&＃xff09;由文字信息变成图像信息&＃xff0c;把你用文字描述的画面「画」出来。实际操作也基本如此&＃xff0c;很简单&＃xff0c;先来看几张用 Disco Diffusion 生成的图片。

Prompt: A digital painting of cyberpunk city by beeple, mist, trending on artstation, V-Ray.

Prompt: Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Greg Rutkowski, concept art.

Prompt: A beautiful painting of captivating castles on hills and mountains, along plains and rivers, by Ismail Inceoglu.

更多例子&＃xff1a;

图片下方是我给出的 Prompts&＃xff0c;Disco Diffusion 会根据这些内容去生成画面&＃xff0c;并且每一次都会产生不同的结果&＃xff0c;这些还是我初期基本按默认参数渲染的&＃xff0c;所以精度其实不算太高&＃xff0c;如果提高参数设置&＃xff0c;做出更好的描述&＃xff0c;你会得到质量更高的图片。下面就进入教程环节吧。

____准备工作________________________________________________________________________________________

注册一个谷歌账号。

____入门教程________________________________________________________________________________________

01. 使用浏览器打开 Disco Diffusion v5.2 [w/ VR Mode]。

02. 点击页面右上角「登录」按钮&＃xff0c;登入你的谷歌账号。

03. 点击「复制到云端硬盘」或点击「文件」选择「在云端硬盘中保存一份副本」。

04. 副本创建完成会出现「笔记本的副本已完成」弹窗&＃xff0c;点击「在新标签页中打开」。

05. 点击「“Disco Diffusion v5.2 [w/ VR Mode]”的副本」修改笔记本名称&＃xff08;以下所有代码可视为源文件/源代码&＃xff0c;此处是源文件的名称&＃xff0c;可按创作主题或其他方式命名&＃xff0c;方便后期修改和区分&＃xff09;。

06. 修改 batch_name&＃xff08;图片保存在云盘的名称&＃xff09;&＃xff1b;设置 steps&＃xff0c;可按默认值&＃xff08;数值越大画面越精细&＃xff09;&＃xff1b;设置 width_height&＃xff08;图片尺寸&＃xff0c;需是 64 的倍数&＃xff09;。

07. 点击 Extra Settings 前面的小三角&＃xff0c;设置 intermediate_saves&＃xff08;设置过程图保存张数&＃xff0c;设置为 0 渲染完成只保存最后一张图&＃xff0c;设置为 2&＃xff0c;渲染完成会得到一张进度 33%、一张 66% 和一张 100% 的图片&＃xff0c;数值越大数量越多&＃xff0c;不影响渲染速度&＃xff09;。

08. 设置 Prompts&＃xff08;在这里输入描述画面的语句&＃xff0c;格式为"XXXX, XXXX, XXXX."&＃xff0c;建议在其他地方编辑好直接粘贴过来&＃xff0c;保留最前和最后的引号&＃xff0c;使用一个 Prompt 即可&＃xff0c;不要求是完整的句子&＃xff0c;可以是长短句或单词&＃xff0c;可参考默认结构&＃xff0c;前置词描述画作类别&＃xff0c;中间描述画面内容&＃xff0c;后接参考风格的艺术家&＃xff0c;另外可以增加整体风格的词汇或者其他内容&＃xff0c;emoji 也可以&＃xff09;。

09. 设置 display_rate&＃xff08;渲染预览图的刷新频率&＃xff0c;建议设置为 5&＃xff0c;每过 5 个 steps 更新一次预览图&＃xff09;&＃xff0c;设置 n_batches&＃xff08;以这个主题渲染的图片张数&＃xff0c;因为每次渲染的结果都是不同的&＃xff0c;所以可以设置多张图片&＃xff0c;一张渲染完成后会接着渲染下一张&＃xff0c;已经渲染完成的会自动保存&＃xff0c;可按需要设置&＃xff09;。

10. 点击「代码执行程序」选择「全部运行」。

11. 弹出「笔记本需要高 RAM」的窗口&＃xff0c;点击「确定」。

12. 弹出「您还在设备面前吗&＃xff1f;」的窗口&＃xff0c;点击「进行人机身份验证」&＃xff0c;按指令进行验证。

13. 弹出「允许此笔记本访问您的 Google 云端硬盘文件吗&＃xff1f;」的窗口&＃xff0c;点击「连接到 Google 云端硬盘」。

14. 弹出「登录 - Google 账号」窗口&＃xff0c;选择你的谷歌账号&＃xff0c;点击「允许」。

15. 回到 Disco Diffusion 的页面你会发现每段代码前面都有个中间有个三角形的圆&＃xff0c;外面在转圈圈的就是在运行当前的代码&＃xff0c;运行完成后前面会出现一个绿色的小勾&＃xff0c;第一次运行需要等待几分钟&＃xff0c;稍等片刻你会看到在「4. Diffuse!」的末尾会出现一张充满噪点的图&＃xff0c;就表示开始渲染了&＃xff0c;图片上方的 Batches 会显示你的渲染总进度&＃xff0c;下方显示的是当前这张图的渲染进度&＃xff0c;后面有预计的渲染时间&＃xff0c;网页最下方会显示运行时间计时。

16. 过几分钟可能还会出现一次「您还在设备面前吗&＃xff1f;」的弹窗&＃xff0c;点击「进行人机身份验证」&＃xff0c;按指令进行验证&＃xff0c;之后就可以慢慢渲了。&＃xff08;steps 设置为 250 实际上渲染只到 240&＃xff0c;如果 display_rate 设置为了 5&＃xff0c;那么图片下方的进度条每增加 5 个 steps 图片就会刷新一次&＃xff0c;在这里右击是可以直接保存当前的图片的&＃xff0c;当然按你的设置也会根据进度自动保存图片到你的谷歌云盘&＃xff09;

17. 之后你便可以在 Google Drive 直接查看保存的图片了&＃xff0c;在 AI - Disco_Diffusion - images_out 相应的文件夹里&＃xff0c;若设置了 intermediate_saves 会多出一个 partials 的子文件夹&＃xff0c;里面是过程图。所有的图片都是随着进程实时更新的&＃xff0c;每完成一个进度就会自动保存一张&＃xff0c;在这里可以把图片下载到本地。Colab Notebooks 这个文件夹里保存的是你的源文件。

____进阶教程________________________________________________________________________________________

除了直接用文字描述的方式&＃xff0c;Disco Diffusion 也可以在一张图片的基础上做渲染&＃xff0c;你可以选择自己拍摄的照片、涂鸦的画作或是之前渲染的图片作为一个起点&＃xff0c;再配合 Prompts 描述变成一个全新的作品。

基础的操作是一致的&＃xff0c;我们只需要多一个步骤&＃xff0c;就是在 Settings 里写入 init_image。首先我们需要把使用的图片上传到 content 中&＃xff0c;这里有两种操作方式。

方式一

01. 点击左侧的第四个「文件」图标展开文件窗口。&＃xff08;如果是新建的文件可能会出现入门教程第 11、12 步的弹窗&＃xff0c;确定加验证就可以了&＃xff09;

02. 点击文件窗口上方第一个「上传到会话存储空间」图标&＃xff0c;选择你要上传的图片并点击「打开」&＃xff0c;图片就会开始上传&＃xff08;你也可以把图片直接拖进文件窗口的空白处&＃xff09;。

03. 上传完成后图片会显示在文件窗口的列表中&＃xff0c;找到你要使用的图片并点击文件名后方的三个小圆点&＃xff0c;选择「复制路径」。

方式二

01. 进入 Google Drive 登入你的账号&＃xff0c;在云端硬盘左侧依次点击 AI - Disco_Diffusion - init_images 进入文件夹。

02. 把图片直接拖进文件窗口的空白处&＃xff08;你也可以在空白处右击选择上传文件&＃xff09;。

03. 打开或新建 DD 文件&＃xff0c;按方式一打开左侧文件窗口&＃xff0c;在列表中依次展开 drive - MyDrive - AI - Disco_Diffusion - init_images&＃xff0c;找到你要使用的图片并点击文件名后方的三个小圆点&＃xff0c;选择「复制路径」。

若在文件窗口找不到 drive 文件夹&＃xff0c;请点击文件窗口第三个「装载 Google 云端硬盘」图标&＃xff0c;并按提示操作&＃xff0c;载入你的 Google 云端硬盘&＃xff0c;若文件夹还未出现&＃xff0c;请点击文件窗口第二个「刷新」图标。

04. 找到 Settings - Init Settings - init_image&＃xff0c;将路径粘贴在此处。

05. 设置 init_scale&＃xff08;默认值为 1000&＃xff0c;数值越小变化越大&＃xff09;&＃xff1b;设置 skip_steps&＃xff08;默认值 100&＃xff0c;就是将你的图片处理为初始噪点后&＃xff0c;直接从 101 步开始使用 Prompts 渲染&＃xff09;。

06. 按照入门教程设置其他内容并运行代码即可。

____高阶教程________________________________________________________________________________________

高阶玩法就是各种摆弄参数了&＃xff0c;大家可以参考 Disco Diffusion 内的 Tutorial 部分&＃xff0c;这里对部分参数做了一些解释&＃xff0c;也可以研究一下 Zippy&＃39;s Disco Diffusion Cheatsheet v0.2 这个文档。

目前通过 v5.2 的版本我们不仅可以使用 DD 生成 2D 的图像&＃xff0c;还可以制作 3D 的内容&＃xff0c;包括视频&＃xff0c;甚至可以制作 VR 视频。由于本人也是接触不久&＃xff0c;目前还没有研究&＃xff0c;这边就不做介绍了。

____本地运行________________________________________________________________________________________

上面提到过 Disco Diffusion 是可以部署到本地运行的&＃xff0c;这边有一个本地部署的教程&＃xff0c;供大家参考。

Disco Diffusion AI Guide by Eliso

本地运行需要 Nvidia 12GB VRAM 的 GPU&＃xff0c;如果你的电脑无此配置&＃xff0c;可以使用 CPU 本地运行&＃xff0c;但是速度会很慢。

以上就是本教程的全部内容了&＃xff0c;若有其他疑问&＃xff0c;欢迎留言。

推荐阅读

config
解决github访问慢的问题的方法集锦

本文总结了国内用户在访问github网站时可能遇到的加载慢的问题，并提供了解决方法，其中包括修改hosts文件来加速访问。 ... [详细]

蜡笔小新 2023-12-11 20:38:46
config
大坑|左上角_pycharm连接服务器同步写代码(图文详细过程)

篇首语：本文由编程笔记#小编为大家整理，主要介绍了pycharm连接服务器同步写代码(图文详细过程)相关的知识，希望对你有一定的参考价值。pycharm连接服务 ... [详细]

蜡笔小新 2023-10-17 19:47:17
io
XML介绍与使用的概述及标签规则

本文介绍了XML的基本概念和用途，包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则，包括标签的尖括号和合法标识符的组成，标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读，读者可以对XML的基本知识有一个全面的了解。 ... [详细]

蜡笔小新 2023-12-13 17:39:50
io
HTML学习02 图像标签的使用和属性

本文介绍了HTML中图像标签的使用和属性，包括定义图像、定义图像地图、使用源属性和替换文本属性。同时提供了相关实例和注意事项，帮助读者更好地理解和应用图像标签。 ... [详细]

蜡笔小新 2023-12-13 11:31:26
get
Android 7自学笔记总结、移动架构视频、安卓面试真题、项目实战源码讲义

本文介绍了Android 7的学习笔记总结，包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容，并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同，否则会出现问题。 ... [详细]

蜡笔小新 2023-12-13 10:06:58
int
服务器上的操作系统有哪些，如何选择适合的操作系统？

本文介绍了服务器上常见的操作系统，包括系统盘镜像、数据盘镜像和整机镜像的数量。同时，还介绍了共享镜像的限制和使用方法。此外，还提供了关于华为云服务的帮助中心，其中包括产品简介、价格说明、购买指南、用户指南、API参考、最佳实践、常见问题和视频帮助等技术文档。对于裸金属服务器的远程登录，本文介绍了使用密钥对登录的方法，并提供了部分操作系统配置示例。最后，还提到了SUSE云耀云服务器的特点和快速搭建方法。 ... [详细]

蜡笔小新 2023-12-12 13:33:19
io
Vagrant虚拟化工具的安装和使用教程

本文介绍了Vagrant虚拟化工具的安装和使用教程。首先介绍了安装virtualBox和Vagrant的步骤。然后详细说明了Vagrant的安装和使用方法，包括如何检查安装是否成功。最后介绍了下载虚拟机镜像的步骤，以及Vagrant镜像网站的相关信息。 ... [详细]

蜡笔小新 2023-12-11 14:24:00
config
Centos7搭建ELK（Elasticsearch、Logstash、Kibana）教程及注意事项

本文介绍了在Centos7上搭建ELK（Elasticsearch、Logstash、Kibana）的详细步骤，包括下载安装包、安装Elasticsearch、创建用户、修改配置文件等。同时提供了使用华为镜像站下载安装包的方法，并强调了保证版本一致的重要性。 ... [详细]

蜡笔小新 2023-12-10 16:27:21
io
C# Word模版打印方案详解

本文详细介绍了使用C#实现Word模版打印的方案。包括添加COM引用、新建Word操作类、开启Word进程、加载模版文件等步骤。通过该方案可以实现C#对Word文档的打印功能。 ... [详细]

蜡笔小新 2023-12-10 14:09:00
config
网页播放视频的三种实现方式

本文介绍了网页播放视频的三种实现方式，分别是使用html5的video标签、使用flash来播放以及使用object标签。其中，推荐使用html5的video标签来简单播放视频，但有些老的浏览器不支持html5。另外，还可以使用flash来播放视频，需要使用object标签。 ... [详细]

蜡笔小新 2023-12-10 13:24:30
config
在IDEA中运行CAS服务器的配置方法

本文介绍了在IDEA中运行CAS服务器的配置方法，包括下载CAS模板Overlay Template、解压并添加项目、配置tomcat、运行CAS服务器等步骤。通过本文的指导，读者可以轻松在IDEA中进行CAS服务器的运行和配置。 ... [详细]

蜡笔小新 2023-12-09 09:48:06
get
Java多线程总结（8）concurrent.locks包下的锁机制的使用

1Lock与ReadWriteLock1.1LockpublicinterfaceLock{voidlock();voidlockInterruptibl ... [详细]

蜡笔小新 2023-12-09 09:15:17
get
解决IDEA的HTML文件格式的显示问题

用IDEA在显示HTML文件的时候，格式非常奇怪，比如body标签下面不会自动缩进，每次都需要手动缩进，怪麻烦的。解决办法如下：settings&amp;gt;Ed ... [详细]

蜡笔小新 2023-10-17 19:04:54
config
markdown [软件代理设置]

本文由编程笔记#小编为大家整理，主要介绍了markdown[软件代理设置]相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-17 18:19:28
io
idaas是什么意思,云盾idaas平台

寻求更强大的身份和访问管理（IAM）平台的企业正在转向云，并接受身份即服务（IDaaS）的灵活性。要为IAM选择正确的场外解决方案，业务管理人员和IT专业人员必须在实施之前评估安全 ... [详细]

蜡笔小新 2023-10-17 17:23:44

单色设计

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章