当前位置: 开发笔记 > 编程语言 > 正文

GAN零基础入门：从伪造视频到生成假脸

作者：誓言俱乐部 | 来源：互联网 | 2023-09-17 15:56

来源：forbes，编辑：大明目前，人工智能（AI）领域正在快速发展，每隔一段时间就取得新的突破。最近突出的一个词是GenerativeAdversarialNetwork（GAN）-但这是什么意思？

GAN零基础入门：从伪造视频到生成假脸

来源：forbes，编辑：大明

目前，人工智能（AI）领域正在快速发展，每隔一段时间就取得新的突破。最近突出的一个词是Generative Adversarial Network（GAN） - 但这是什么意思？

名词解释：究竟什么是生成对抗网络（GAN）？

GAN背后的理念最初是在2014年提出的，在最基本的层面上将，它描述了一个系统，这个系统中将两个AI系统（神经网络）相互对立，以提高模型输出结果的质量。

为了理解GAN是如何工作的，可以想象一个盲人伪造者试图仿造一幅大师的画作。首先，他并不知道这幅画应该是什么样子的，但他碰巧有一位朋友对所有大师的杰作都有照片般的记忆。

这位朋友相当于一名侦探，必须确定他的朋友所展示的画作是与真正伟大大师创作的画作一致，还是明显的赝品。

这是GAN运行的基本机制——只不过这位伪造者他的朋友都是AI，行事速度超快，每秒可以制造和检测数千件赝品。然后两人都从结果中进行“学习”，以改善在未来的表现。侦探在检测赝品方面的能力越来越强，要求伪造者必须要把赝品做的更逼真才行。

近年来，由于GAN能够基于现有的真实信息建立的规则制造出“新”信息，因此在人工智能开发领域引起了广泛关注。编写说明书可能是一个典型的例子。开发人员在成千上万的指导手册的内容作为训练数据对GAN进行训练，有朝一日可以创建一个可以查看任何工具，设备或软件的系统，再为这个系统生成一份使用说明书。

如何设计了解你感觉的AI

GAN零基础入门：从伪造视频到生成假脸

接下来，让我们更深入地研究一下GAN的工作机制。负责创建虚假数据的“伪造”网络被称为 生成网络 ，它的工作是阅读并理解训练数据的特征属性。然后尝试通过生成遵循相同规则的“候选”数据集来复制这些训练数据。

“侦探”网络的作用是识别生成网络的输出数据是（人工生成的）假数据，还是真实的（训练）数据，这个“侦探”称为 判别网络 。因为判别网络与生成网络进行对抗性竞争，所以整个系统被描述为“对抗性网络”。

对于GAN的应用实例，最典型的就是“假脸生成工具”。为网站提供动力的网络已经学会了制作人脸的超逼真图像，虽然这些人脸图像几乎完美再现了真实人脸图像的一切细节特征和规则，但无一例外都是计算机程序生成的，现实世界中并不存在。

人们可能存在这样的固有印象，即计算机是将人们的眼睛、耳朵、嘴巴和头发的数据库中的碎片数据组合在一起，来构建面部图像的，但事实并非如此。生成网络的“输入”数据只是一串数字，只有判别网络才能看到训练数据。生成网络需要完全基于判别网络的输出来改善自己的输出。

作为判别网络给出的唯一反馈，是对生成网络输出是否与训练数据匹配的“是或否”的判断，这个生成—判断—再生成的过程要循环多次，生成网络和判别网络的性能不断提升后，才可能产生与训练输入足够相似的人脸图像输出。

GAN零基础入门：从伪造视频到生成假脸

（ 这个例子实际上借用了去年由Nvidia开发的proGAN模型 ，该模型在与运行过程中会逐渐增加生成网络输出的图像分辨率，从4*4超低分辨率开始，最终生成逼真的人脸。）

用于训练对抗性网络的数据不必为标记数据，因为判别网络可以完全基于训练数据本身的特征来对生成网络的输出做出判断。所以， GAN既可以用于监督学习，也可以用于无监督学习和强化学习。

GAN的另一个用处是 为其他AI应用程序高效地创建训练数据集。 大多数当前的AI技术，特别是深度学习技术，都依赖于海量的训练数据。

GAN可以生成遵循“自然”数据集的所有规则的数据集，因此理论上可以用于深度学习模型的训练。这一点对于医学成像领域非常有用，收集真实数据成本高、耗时久，而且需要患者同意，以及大量的医学专业知识才能对其进行数据标记。利用GAN可以有效克服这些障碍。

GAN可用于创建虚构的图像，移动视频，文本甚至是音乐。虽然近期对GAN存在着大量炒作，但它显然是近年来从AI领域出现的最有趣的新概念之一，我们可以期待在不久的将来看到更多基于GAN的令人兴奋的新应用。

参考链接：

https://www.forbes.com/sites/bernardmarr/2019/06/12/artificial-intelligence-explained-what-are-generative-adversarial-networks-gans/#4c727de37e00

声明：本文来自新智元，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。

以上所述就是小编给大家介绍的《GAN零基础入门：从伪造视频到生成假脸》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对我们的支持！

推荐阅读

rsa
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
rsa
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
sum
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
request
兆芯X86 CPU架构的演进与现状（国产CPU系列）

本文详细介绍了兆芯X86 CPU架构的发展历程，从公司成立背景到关键技术授权，再到具体芯片架构的演进，全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]

蜡笔小新 2024-11-14 15:04:34
case
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
case
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
case
应用链时代，详解 Avalanche 与 Cosmos 的差异

应用链时代，详解 Avalanche 与 Cosmos 的差异 ... [详细]

蜡笔小新 2024-11-13 09:37:19
java
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
search
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
chat
OpenAI首席执行官Sam Altman展望：人工智能的未来发展方向与挑战

OpenAI首席执行官Sam Altman展望：人工智能的未来发展方向与挑战 ... [详细]

蜡笔小新 2024-11-11 09:47:50
default
iOS 多线程技术之 GCD

本文将深入探讨 iOS 中的 Grand Central Dispatch (GCD)，并介绍如何利用 GCD 进行高效多线程编程。如果你对线程的基本概念还不熟悉，建议先阅读相关基础资料。 ... [详细]

蜡笔小新 2024-11-14 15:57:40
java
Java 并发编程：RunnableScheduledFuture 接口详解

本文深入解析了 Java 并发编程中 RunnableScheduledFuture 接口的源代码及其在标准线程池中的应用。 ... [详细]

蜡笔小新 2024-11-14 12:00:59
char
三角测量计算三维坐标的代码_双目三维重建——层次化重建思考

双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记，本文从宏观的角度阐 ... [详细]

蜡笔小新 2024-11-13 19:31:37
sum
【图像分类实战】利用DenseNet在PyTorch中实现秃头识别

本文详细介绍了如何使用DenseNet模型在PyTorch框架下实现秃头识别。首先，文章概述了项目所需的库和全局参数设置。接着，对图像进行预处理并读取数据集。随后，构建并配置DenseNet模型，设置训练和验证流程。最后，通过测试阶段验证模型性能，并提供了完整的代码实现。本文不仅涵盖了技术细节，还提供了实用的操作指南，适合初学者和有经验的研究人员参考。 ... [详细]

蜡笔小新 2024-11-06 15:21:35
char
使用JavaScript生成Java兼容的UUID代码实现与优化技巧

本文介绍了UUID（通用唯一标识符）的概念及其在JavaScript中生成Java兼容UUID的代码实现与优化技巧。UUID是一个128位的唯一标识符，广泛应用于分布式系统中以确保唯一性。文章详细探讨了如何利用JavaScript生成符合Java标准的UUID，并提供了多种优化方法，以提高生成效率和兼容性。 ... [详细]

蜡笔小新 2024-11-05 18:19:54

誓言俱乐部

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章