热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

文字生成图片:输入描述语,人工智能自动帮你绘图!

DiscoDiffusion是发布于GoogleColab平台的一款利用人工智能深度学习进行数字艺术创作的工具,它是基于MIT许可协议的开源工具,可以在

Disco Diffusion 是发布于 Google Colab 平台的一款利用人工智能深度学习进行数字艺术创作的工具,它是基于 MIT 许可协议的开源工具,可以在 Google Drive 直接运行,也可以部署到本地运行,目前最新的版本是 Disco Diffusion v5.2。

主创是 Somnai(@Somnai_dreams)和 Adam Letts(@gandamu_ml),在 Chris Allen(@zippy731)、HostsServer(@HostsServer)和 Tom Mason(@nin_artificial)的协作下迭代到了今天的版本。

用白话讲 Disco Diffusion 的基本工作就是把你给出的 Prompts(提示/描述)由文字信息变成图像信息,把你用文字描述的画面「画」出来。实际操作也基本如此,很简单,先来看几张用 Disco Diffusion 生成的图片。

Prompt: A digital painting of cyberpunk city by beeple, mist, trending on artstation, V-Ray.

Prompt: Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Greg Rutkowski, concept art.

Prompt: A beautiful painting of captivating castles on hills and mountains, along plains and rivers, by Ismail Inceoglu.

更多例子:

图片下方是我给出的 Prompts,Disco Diffusion 会根据这些内容去生成画面,并且每一次都会产生不同的结果,这些还是我初期基本按默认参数渲染的,所以精度其实不算太高,如果提高参数设置,做出更好的描述,你会得到质量更高的图片。下面就进入教程环节吧。

____准备工作________________________________________________________________________________________

注册一个谷歌账号。

____入门教程________________________________________________________________________________________

01. 使用浏览器打开 Disco Diffusion v5.2 [w/ VR Mode]

02. 点击页面右上角「登录」按钮,登入你的谷歌账号

03. 点击复制到云端硬盘」或点击「文件」选择「在云端硬盘中保存一份副本」。

04. 副本创建完成会出现「笔记本的副本已完成」弹窗,点击在新标签页中打开」。

05. 点击「“Disco Diffusion v5.2 [w/ VR Mode]”的副本」修改笔记本名称(以下所有代码可视为源文件/源代码,此处是源文件的名称,可按创作主题或其他方式命名,方便后期修改和区分)。

06. 修改 batch_name(图片保存在云盘的名称);设置 steps,可按默认值(数值越大画面越精细);设置 width_height(图片尺寸,需是 64 的倍数)。

07. 点击 Extra Settings 前面的小三角,设置 intermediate_saves(设置过程图保存张数,设置为 0 渲染完成只保存最后一张图,设置为 2,渲染完成会得到一张进度 33%、一张 66% 和一张 100% 的图片,数值越大数量越多,不影响渲染速度)。

08. 设置 Prompts(在这里输入描述画面的语句,格式为"XXXX, XXXX, XXXX.",建议在其他地方编辑好直接粘贴过来,保留最前和最后的引号,使用一个 Prompt 即可,不要求是完整的句子,可以是长短句或单词,可参考默认结构,前置词描述画作类别,中间描述画面内容,后接参考风格的艺术家,另外可以增加整体风格的词汇或者其他内容,emoji 也可以)。

09. 设置 display_rate(渲染预览图的刷新频率,建议设置为 5,每过 5 个 steps 更新一次预览图),设置 n_batches(以这个主题渲染的图片张数,因为每次渲染的结果都是不同的,所以可以设置多张图片,一张渲染完成后会接着渲染下一张,已经渲染完成的会自动保存,可按需要设置)。

10. 点击「代码执行程序」选择「全部运行」。

11. 弹出「笔记本需要高 RAM」的窗口,点击确定」。

12. 弹出「您还在设备面前吗?」的窗口,点击进行人机身份验证」,按指令进行验证。

13. 弹出「允许此笔记本访问您的 Google 云端硬盘文件吗?」的窗口,点击连接到 Google 云端硬盘」。

14. 弹出「登录 - Google 账号」窗口,选择你的谷歌账号,点击允许」。

15. 回到 Disco Diffusion 的页面你会发现每段代码前面都有个中间有个三角形的圆,外面在转圈圈的就是在运行当前的代码,运行完成后前面会出现一个绿色的小勾,第一次运行需要等待几分钟,稍等片刻你会看到在「4. Diffuse!」的末尾会出现一张充满噪点的图,就表示开始渲染了,图片上方的 Batches 会显示你的渲染总进度,下方显示的是当前这张图的渲染进度,后面有预计的渲染时间,网页最下方会显示运行时间计时。

16. 过几分钟可能还会出现一次「您还在设备面前吗?」的弹窗,点击进行人机身份验证」,按指令进行验证,之后就可以慢慢渲了。(steps 设置为 250 实际上渲染只到 240,如果 display_rate 设置为了 5,那么图片下方的进度条每增加 5 个 steps 图片就会刷新一次,在这里右击是可以直接保存当前的图片的,当然按你的设置也会根据进度自动保存图片到你的谷歌云盘)

17. 之后你便可以在 Google Drive 直接查看保存的图片了,在 AI - Disco_Diffusion - images_out 相应的文件夹里,若设置了 intermediate_saves 会多出一个 partials 的子文件夹,里面是过程图。所有的图片都是随着进程实时更新的,每完成一个进度就会自动保存一张,在这里可以把图片下载到本地。Colab Notebooks 这个文件夹里保存的是你的源文件。



 

____进阶教程________________________________________________________________________________________

除了直接用文字描述的方式,Disco Diffusion 也可以在一张图片的基础上做渲染,你可以选择自己拍摄的照片、涂鸦的画作或是之前渲染的图片作为一个起点,再配合 Prompts 描述变成一个全新的作品。

基础的操作是一致的,我们只需要多一个步骤,就是在 Settings 里写入 init_image。首先我们需要把使用的图片上传到 content 中,这里有两种操作方式。

方式一

01. 点击左侧的第四个「文件图标展开文件窗口。(如果是新建的文件可能会出现入门教程第 11、12 步的弹窗,确定加验证就可以了)

02. 点击文件窗口上方第一个「上传到会话存储空间图标,选择你要上传的图片并点击「打开」,图片就会开始上传(你也可以把图片直接拖进文件窗口的空白处)。

03. 上传完成后图片会显示在文件窗口的列表中,找到你要使用的图片并点击文件名后方的三个小圆点,选择「复制路径」。

方式二

01. 进入 Google Drive 登入你的账号,在云端硬盘左侧依次点击 AI - Disco_Diffusion - init_images 进入文件夹。

02. 把图片直接拖进文件窗口的空白处(你也可以在空白处右击选择上传文件)

03. 打开或新建 DD 文件,按方式一打开左侧文件窗口,在列表中依次展开 drive - MyDrive - AI - Disco_Diffusion - init_images,找到你要使用的图片并点击文件名后方的三个小圆点,选择「复制路径」。

若在文件窗口找不到 drive 文件夹,请点击文件窗口第三个「装载 Google 云端硬盘图标,并按提示操作,载入你的 Google 云端硬盘,若文件夹还未出现,请点击文件窗口第二个「刷新」图标。

04. 找到 Settings - Init Settings - init_image,将路径粘贴在此处。

05. 设置 init_scale(默认值为 1000,数值越小变化越大);设置 skip_steps(默认值 100,就是将你的图片处理为初始噪点后,直接从 101 步开始使用 Prompts 渲染)。

06. 按照入门教程设置其他内容并运行代码即可。

____高阶教程________________________________________________________________________________________

高阶玩法就是各种摆弄参数了,大家可以参考 Disco Diffusion 内的 Tutorial 部分,这里对部分参数做了一些解释,也可以研究一下 Zippy's Disco Diffusion Cheatsheet v0.2 这个文档。

目前通过 v5.2 的版本我们不仅可以使用 DD 生成 2D 的图像,还可以制作 3D 的内容,包括视频,甚至可以制作 VR 视频。由于本人也是接触不久,目前还没有研究,这边就不做介绍了。

____本地运行________________________________________________________________________________________

上面提到过 Disco Diffusion 是可以部署到本地运行的,这边有一个本地部署的教程,供大家参考。

Disco Diffusion AI Guide by Eliso

本地运行需要 Nvidia 12GB VRAM 的 GPU,如果你的电脑无此配置,可以使用 CPU 本地运行,但是速度会很慢。

以上就是本教程的全部内容了,若有其他疑问,欢迎留言。


推荐阅读
  • 解决github访问慢的问题的方法集锦
    本文总结了国内用户在访问github网站时可能遇到的加载慢的问题,并提供了解决方法,其中包括修改hosts文件来加速访问。 ... [详细]
  • 大坑|左上角_pycharm连接服务器同步写代码(图文详细过程)
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了pycharm连接服务器同步写代码(图文详细过程)相关的知识,希望对你有一定的参考价值。pycharm连接服务 ... [详细]
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • HTML学习02 图像标签的使用和属性
    本文介绍了HTML中图像标签的使用和属性,包括定义图像、定义图像地图、使用源属性和替换文本属性。同时提供了相关实例和注意事项,帮助读者更好地理解和应用图像标签。 ... [详细]
  • 本文介绍了Android 7的学习笔记总结,包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容,并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同,否则会出现问题。 ... [详细]
  • 服务器上的操作系统有哪些,如何选择适合的操作系统?
    本文介绍了服务器上常见的操作系统,包括系统盘镜像、数据盘镜像和整机镜像的数量。同时,还介绍了共享镜像的限制和使用方法。此外,还提供了关于华为云服务的帮助中心,其中包括产品简介、价格说明、购买指南、用户指南、API参考、最佳实践、常见问题和视频帮助等技术文档。对于裸金属服务器的远程登录,本文介绍了使用密钥对登录的方法,并提供了部分操作系统配置示例。最后,还提到了SUSE云耀云服务器的特点和快速搭建方法。 ... [详细]
  • Vagrant虚拟化工具的安装和使用教程
    本文介绍了Vagrant虚拟化工具的安装和使用教程。首先介绍了安装virtualBox和Vagrant的步骤。然后详细说明了Vagrant的安装和使用方法,包括如何检查安装是否成功。最后介绍了下载虚拟机镜像的步骤,以及Vagrant镜像网站的相关信息。 ... [详细]
  • Centos7搭建ELK(Elasticsearch、Logstash、Kibana)教程及注意事项
    本文介绍了在Centos7上搭建ELK(Elasticsearch、Logstash、Kibana)的详细步骤,包括下载安装包、安装Elasticsearch、创建用户、修改配置文件等。同时提供了使用华为镜像站下载安装包的方法,并强调了保证版本一致的重要性。 ... [详细]
  • 本文详细介绍了使用C#实现Word模版打印的方案。包括添加COM引用、新建Word操作类、开启Word进程、加载模版文件等步骤。通过该方案可以实现C#对Word文档的打印功能。 ... [详细]
  • 本文介绍了网页播放视频的三种实现方式,分别是使用html5的video标签、使用flash来播放以及使用object标签。其中,推荐使用html5的video标签来简单播放视频,但有些老的浏览器不支持html5。另外,还可以使用flash来播放视频,需要使用object标签。 ... [详细]
  • 在IDEA中运行CAS服务器的配置方法
    本文介绍了在IDEA中运行CAS服务器的配置方法,包括下载CAS模板Overlay Template、解压并添加项目、配置tomcat、运行CAS服务器等步骤。通过本文的指导,读者可以轻松在IDEA中进行CAS服务器的运行和配置。 ... [详细]
  • 1Lock与ReadWriteLock1.1LockpublicinterfaceLock{voidlock();voidlockInterruptibl ... [详细]
  • 解决IDEA的HTML文件格式的显示问题
    用IDEA在显示HTML文件的时候,格式非常奇怪,比如body标签下面不会自动缩进,每次都需要手动缩进,怪麻烦的。解决办法如下:settings>Ed ... [详细]
  • 本文由编程笔记#小编为大家整理,主要介绍了markdown[软件代理设置]相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 寻求更强大的身份和访问管理(IAM)平台的企业正在转向云,并接受身份即服务(IDaaS)的灵活性。要为IAM选择正确的场外解决方案,业务管理人员和IT专业人员必须在实施之前评估安全 ... [详细]
author-avatar
单色设计
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有