当前位置: 开发笔记 > 编程语言 > 正文

这些假脸实在太逼真了！英伟达造出新一代GAN，生成壁纸级高清大图毫无破绽...

作者：飞跃星空2502906253 | 来源：互联网 | 2023-10-10 11:05

栗子晓查发自凹非寺量子位报道|公众号QbitAI不敢相信，上面这些人脸，全都是假的。是英伟达的AI生成的。借用风格迁移的思路，团队为GAN

栗子晓查发自凹非寺
量子位报道 | 公众号 QbitAI

640?wx_fmt&＃61;png

不敢相信&＃xff0c;上面这些人脸&＃xff0c;全都是假的。

是英伟达的AI生成的。

借用风格迁移的思路&＃xff0c;团队为GAN创造了一种新的生成器。

连GAN之父Goodfellow老师也忍不住发推称赞优秀&＃xff01;

640?wx_fmt&＃61;png

这个结构不需要人类监督&＃xff0c;可以自动分离图像中的各种属性。这样&＃xff0c;在或粗糙或精细的不同尺度上&＃xff0c;人类便能自如地控制GAN的生成。

另外&＃xff0c;英伟达的人脸生成模型&＃xff0c;支持1024 x 1024的高清大图生成。毕竟&＃xff0c;GAN从小吃的是高清数据集。团队还说&＃xff0c;数据集很快就要开源了。

实际效果展示

640?wx_fmt&＃61;gif

人物自然&＃xff0c;背景自然&＃xff0c;边缘又自然。足以骗过我这个普通人类的肉眼了。

输入两张图&＃xff0c;图A决定生成人物的性别&＃xff0c;年龄&＃xff0c;头发长度&＃xff0c;以及姿势&＃xff1b;一张决定其他一切因素&＃xff1a;比如肤色、发色、衣服颜色等等。

这样&＃xff0c;就可以把图B的一部分人物特征&＃xff0c;迁移到图A上了&＃xff1a;

640?wx_fmt&＃61;gif

不过&＃xff0c;人脸的朝向和表情&＃xff0c;还是A的。

就算人种发生剧烈变化&＃xff0c;也丝毫不会违和。你看&＃xff0c;把非裔人类的脸部特征“移植”给四位白种人&＃xff0c;嘴唇的厚度、鼻子的形态&＃xff0c;以及额头&＃xff0c;都有明显的变化。

640?wx_fmt&＃61;gif

再来看看从不同尺度调节的效果吧。

这是粗糙尺度 (Coarse Styles) &＃xff0c;也是三种尺度中最大规模的调整&＃xff0c;会涉及脸部朝向的变化&＃xff0c;脸型和发型也是在这里调整的&＃xff1a;

640?wx_fmt&＃61;gif

然后看看中间尺度 (Middle Styles) &＃xff0c;调整仅限于面部特征和发色发量了&＃xff0c;姿势、发型、脸型都不会有明显变化&＃xff1a;

640?wx_fmt&＃61;gif

再来就是精细尺度 (Fine Styles) &＃xff0c;只是调整图像的配色&＃xff0c;几乎不会给人物变脸了&＃xff1a;

640?wx_fmt&＃61;gif

全新的生成器

我们前面说过&＃xff0c;这个GAN不用人类监督&＃xff0c;就可以自动分割图像里的各种部分。

经过训练&＃xff0c;它就可以把这些部分&＃xff0c;按照一定的方式组合到一起。

具体怎么组合呢&＃xff1a;

这种新的生成器&＃xff0c;像风格迁移算法一样&＃xff0c;把一张图像&＃xff0c;看做许多风格 (Styles) 的集合。

每种风格都会在一个不同的尺度 (Scale) 上控制图像的效果&＃xff1a;

粗糙 (Coarse Styles) &＃xff1a;姿势、头发、脸型。
中度 (Middle Styles) &＃xff1a;面部特征、眼睛。
精细 (Fine Styles) &＃xff1a;配色。

三者组合在一起&＃xff0c;才是最终的生成结果。

调节不同“风格”&＃xff0c;就可以在不同尺度上调节人脸图片。

640?wx_fmt&＃61;png

另外&＃xff0c;这只GAN还可以自动把那些无关紧要的变化 (Inconsequential Variation) 剔除出去。

所谓无关紧要&＃xff0c;就是说画面发生了变化&＃xff0c;但看上去主角还是原来的主角。
粗糙的噪音&＃xff1a;如大尺度上的卷发程度。
精细的噪音&＃xff1a;更加精细的细节&＃xff0c;如质地等。
无噪音&＃xff1a;没有特征的、像画画一样的样子 (Featurelessly “painterly” look) 。

640?wx_fmt&＃61;png

相同图片&＃xff0c;输入不同的噪音&＃xff0c;效果就不一样。

人类也可以选择&＃xff0c;每种Style的强度 (Strength) 多大。

选择高强度 (High Strength) 的话&＃xff0c;生成的图像就会比较多样化&＃xff0c;但生成坏图也会有一些。

如果是低强度 (Low Strength) &＃xff0c;生成的图像之间不会有太多变化&＃xff0c;但也几乎不会出现坏图。

从结构上来看&＃xff0c;这个新的生成器是这样的&＃xff1a;

640?wx_fmt&＃61;png

传统的图像生成器仅通过输入层提供潜在编码&＃xff08;Latent Code&＃xff09;&＃xff0c;英伟达从一开始就舍弃了这种设计方案。

就像上图展示的那样&＃xff0c;他们设计的新生成器先将输入从潜在空间Z映射到中间的潜在空间W&＃xff0c;将映射网络生成结果输入到下一层。在生成网络g每次卷积运算之后&＃xff0c;加入高斯噪声&＃xff08;Gaussian noise&＃xff09;&＃xff0c;也就是图像的随机变化。

图像在不同尺度上的“风格”&＃xff0c;就是由上面的每个卷积层控制的&＃xff0c;它实现了直接控制各层级的图像特征强度&＃xff08;Strength&＃xff09;。

从生成图像中的随机自动变化中。它可以无监督地从中分离出图像的“风格”。

发布更强人脸数据集

除了发布图像生成算法外&＃xff0c;英伟达从Flickr中选取了7万张1024×1024分辨率的照片&＃xff0c;形成了一个新的人脸数据集FFHQ&＃xff08;Flickr-Faces-HQ&＃xff09;。

640?wx_fmt&＃61;png

它能提供了高度多样化、高质量的人脸数据&＃xff0c;并且涵盖了比现有高分辨率数据集&＃xff08;如CelebA-HQ&＃xff09;更多的变化&＃xff0c;比如更多佩戴眼镜、帽子的照片。

英伟达将在不久后公开提供此数据集&＃xff0c;并放出源代码和预训练网络。

最后&＃xff0c;给广大猫奴们送出福利。英伟达的图片生成器不仅能用于人脸&＃xff0c;研究人员还用LSUN数据集造出了很多猫咪的图片。

640?wx_fmt&＃61;jpeg

你能看出它们都是假的吗&＃xff1f;

传送门

论文地址&＃xff1a;
https://arxiv.org/pdf/1812.04948.pdf

源代码和人脸数据不久后将放出&＃xff1a;
http://stylegan.xyz/code

— 完 —

活动报名

加入社群

量子位AI社群开始招募啦&＃xff0c;欢迎对AI感兴趣的同学&＃xff0c;在量子位公众号&＃xff08;QbitAI&＃xff09;对话界面回复关键字“交流群”&＃xff0c;获取入群方式&＃xff1b;

此外&＃xff0c;量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募&＃xff0c;面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号&＃xff08;QbitAI&＃xff09;对话界面回复关键字“专业群”&＃xff0c;获取入群方式。&＃xff08;专业群审核较严&＃xff0c;敬请谅解&＃xff09;

诚挚招聘

量子位正在招募编辑/记者&＃xff0c;工作地点在北京中关村。期待有才气、有热情的同学加入我们&＃xff01;相关细节&＃xff0c;请在量子位公众号(QbitAI)对话界面&＃xff0c;回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ&＃39;ᴗ&＃39; ի 追踪AI技术和产品新动态

推荐阅读

function
H5技术实现经典游戏《贪吃蛇》

本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术，我们将探讨如何构建这款游戏的两种主要玩法：积分闯关和无尽模式。 ... [详细]

蜡笔小新 2024-11-21 20:16:59
window
视觉Transformer综述

本文综述了视觉Transformer在计算机视觉领域的应用，从原始Transformer出发，详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构，还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]

蜡笔小新 2024-11-22 19:53:16
require
ABAP开发者需关注的几大关键问题

长期从事ABAP开发工作的专业人士，在面对行业新趋势时，往往需要重新审视自己的发展方向。本文探讨了几位资深专家对ABAP未来走向的看法，以及开发者应如何调整技能以适应新的技术环境。 ... [详细]

蜡笔小新 2024-11-21 18:21:06
require
黑客松获奖名单出炉、NFT艺术周圆满落幕 |Oasis周报

黑客松获奖名单出炉、NFT艺术周圆满落幕 |Oasis周报 ... [详细]

蜡笔小新 2024-11-22 18:23:40
main
如何在没有提交按钮的情况下提交HTML表单？

探讨了在HTML表单中使用元素代替进行表单提交的方法。 ... [详细]

蜡笔小新 2024-11-22 17:48:42
get
使用Matlab创建动态GIF动画

动态GIF图可以有效增强数据表达的直观性和吸引力。本文将详细介绍如何利用Matlab软件生成动态GIF图，涵盖基本代码实现与高级应用技巧。 ... [详细]

蜡笔小新 2024-11-22 16:52:32
import
Ubuntu 14.04 环境下搭建 Caffe（仅限 CPU）

本文详细介绍了如何在 Ubuntu 14.04 系统上搭建仅使用 CPU 的 Caffe 深度学习框架，包括环境准备、依赖安装及编译过程。 ... [详细]

蜡笔小新 2024-11-22 16:43:30
import
深入解析Promise：流程与源码实现

本文探讨了异步编程的发展历程，从最初的AJAX异步回调到现代的Promise、Generator+Co以及Async/Await等技术。文章详细分析了Promise的工作原理及其源码实现，帮助开发者更好地理解和使用这一重要工具。 ... [详细]

蜡笔小新 2024-11-22 15:42:30
window
WPF菜单控件前景与背景颜色设置指南

尽管在WPF中工作了一段时间，但在菜单控件的样式设置上遇到了一些基础问题，特别是关于如何正确配置前景色和背景色。 ... [详细]

蜡笔小新 2024-11-22 15:30:54
window
吴石访谈：腾讯安全科恩实验室如何引领物联网安全研究

腾讯安全科恩实验室曾两次成功破解特斯拉自动驾驶系统，并远程控制汽车，展示了其在汽车安全领域的强大实力。近日，该实验室负责人吴石接受了InfoQ的专访，详细介绍了团队未来的重点方向——物联网安全。 ... [详细]

蜡笔小新 2024-11-22 13:27:32
require
PHP - 如何通过OpenID获取用户个人信息

本文探讨了使用lightopenid库实现网站登录，并在用户成功登录后，如何获取其姓名、电子邮件及出生日期等详细信息的方法。特别针对Google OpenID进行了说明。 ... [详细]

蜡笔小新 2024-11-22 12:44:21
stream
探讨Java中将图像对象转换为文件和字节数组的方法

本文详细探讨了在Java中如何将图像对象转换为文件和字节数组（Byte[]）的技术。虽然网络上存在大量相关资料，但实际操作时仍需注意细节。本文通过使用JMSL 4.0库中的图表对象作为示例，提供了一种实用的方法。 ... [详细]

蜡笔小新 2024-11-21 21:42:59
window
解决iOS应用推送通知错误：未找到有效aps-environment权限

在尝试加载支持推送通知的iOS应用程序的Ad Hoc构建时，遇到了‘no valid aps-environment entitlement found for application’的错误提示。本文将探讨此错误的原因及多种可能的解决方案。 ... [详细]

蜡笔小新 2024-11-21 19:26:31
text
Python 开发环境最佳实践：Anaconda + Jupyter Notebook 快速上手指南

对于初学者而言，搭建一个高效稳定的 Python 开发环境是入门的关键一步。本文将详细介绍如何利用 Anaconda 和 Jupyter Notebook 来构建一个既易于管理又功能强大的开发环境。 ... [详细]

蜡笔小新 2024-11-21 18:30:23
text
使用CSS实现鼠标悬停时图片或按钮的平滑放大效果

通过CSS技术，当鼠标悬停在图片或按钮上时，可以实现元素平滑放大的视觉效果，并可自由调整动画的持续时间。本文将详细介绍如何利用CSS实现这一功能。 ... [详细]

蜡笔小新 2024-11-21 17:56:51

飞跃星空2502906253

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

这些假脸实在太逼真了！英伟达造出新一代GAN，生成壁纸级高清大图毫无破绽...

栗子 晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI

实际效果展示

全新的生成器

发布更强人脸数据集

传送门

栗子晓查发自凹非寺
量子位报道 | 公众号 QbitAI