《经济学人》：GAN能伪造音视频文件，眼见不再为实

作者：革斤Hero_394 | 来源：互联网 | 2023-09-09 11:09

在今年早些时候，一段关于法国音乐家FrançoiseHardy的YouTube视频在网上流传。视频中，台下的人问她，为何唐纳德·特朗普会让其新闻秘书SeanSpicer在就职典礼人

在今年早些时候，一段关于法国音乐家Françoise Hardy的YouTube视频在网上流传。视频中，台下的人问她，为何唐纳德·特朗普会让其新闻秘书Sean Spicer在就职典礼人数一事上撒谎。Hardy回答说，此事是极有争议的，Spicer先生给出了“多种事实”。

这一视频的内容很奇怪，尤其是Françoise Hardy女士本人。虽然她现在已经73岁了，视频中看起来却只有20岁，而且她说话的声音像极了特朗普的顾问Kellyanne Conway女士的声音。

实际上，这段视频是德国艺术家Mario Klingemann的杰作“Alternative Face v1.1”，通过用一个人的脸建模生成式对抗网络，生成新的面孔。这是基于Conway女士的一段NBC采访生成的假视频，原本是关于Conway女士一段声名狼藉的对话，却通过Hardy女士之口说了出来。Mario Klingemann使用不同的声音片段作为输入数据，基于Françoise Hardy女士的脸进行训练。视频看起来有些摇晃，且像素也被调整过。其实通过视频软件来制作可能画面效果会更好，但是Klingemann没有使用编辑软件来完成视频，相反，他只花了几天时间在台式电脑上用一种机器学习算法——生成式对抗网络（GAN）来创建了一个剪辑视频，电脑被强制输入Hardy女士的音乐视频后，自动生成了Klingemann想要的声音片段，在这段假视频中放出的声音片段其实是不存在的，Hardy女士从未说过这些话。

Klingemann先生的实验让虚假视频走入大众视线，预示着未来可能会有一场关于真伪视频的战争。原本书面的信息可以轻易的伪造，图像和声音却难以伪造，因此图像和声音证据原是非常可信的，但目前GAN的存在可能会改变这一局面，它可能会让图像和声音变得也不那么可信了。

事实上音频更容易伪造。通常情况下，计算机通过连接大量语音短记录片段来创建一个句子，这也是Siri声音的生成原理。但这样的数字声音受限于它们记住的片段范围，因此数字声音只有在说到某些特定短语的时候才听起来真实。

而GAN 生成音频的工作方式则不同，它使用神经网络算法来学习音频源的统计属性，然后在任何其他的上下文中再现这些属性，以毫秒级而非秒级的片段建模。如果我们想要让特朗普或者其他任何一个公众人物说出指定的话，其实就是将对应人物的演讲材料作为输入，告诉算法你想要输出的语音是什么。在过去几年里，谷歌在英国的DeepMind团队，百度在硅谷的深度学习研究院和蒙特利尔研究院，都发表了从文字到语音的高性能算法。目前这些算法只有大型公司的计算能力才能实现，但这种情况终将改变。

相比音频，机器生成图像更难实现。 2014年，Ian Goodfellow推出了GANs，彼时他还是 Yoshua Bengio在MILA的学生。尽管深度学习允许机器能够轻易完成图像识别的任务，辨别不同种类的数据，比如机器能轻易分辨一张猫和一只狗的图片，但是想要机器能自动生成猫和狗的图片就没那么容易了，计算机很难通过数据库中的大量训练图像，自动生成有意义的图片。

Goodfellow转而想到了另一种方法实现图像生成：竞争。不再请求软件凭空生成有用的东西，而是提供了另一个软件作为原软件的对手来推动图像生成。对手会辨别原软件生成的图像，判断它们是否“真实”。通过试图愚弄对手，生成软件学会创造看起来真实的生成图像。对抗软件“了解”现实世界是什么样子，因此赋予了生成图片意义和界限。

目前，GANs可以根据一句语言的描述，生成小型的邮票大小的图像。当你告诉GANs，“这只鸟是白色的，有一些黑色头和翅膀，并有一个长长的橙色喙“，它会为你画出来。可能画出来的图像并不完美，但一眼看过去却很真实。

当时这样的算法效果并不出奇，但GAN的发展非常迅速。在过去五年中，由相似算法推动的照片分类软件错误率已从25％降低到百分之几。人们期望图像生成领域也能取得同样的进展。谷歌的机器学习艺术家麦克·泰卡已经通过训练GANs算法生成了人脸的图像，分辨率像素大小为768，这像素超过了以前同等研究实验像素的两倍。

Goodfellow现在在搜索巨头谷歌的内部AI研究院Google Brain工作，如果一定要估计这一算法实现时间的话，他认为，生成YouTube假视频有可能在三年内实现。其他人则认为可能需要更长时间。但是所有人都同意这只是时间问题，而不是能不能实现的问题。Goodfellow说道，“我们认为AI会改变我们所信赖的证据——图像和音频”。

本文为雷锋网根据《经济学人》编译，未经雷锋网许可不得转载。

原文链接：http://www.economist.com/news/science-and-technology/21724370-fake-news-you-aint-seen-nothing-yet-generating-convincing-audio-and-video-fake，雷锋网(公众号：雷锋网)编译

雷锋网版权文章，未经授权禁止转载。详情见。

《经济学人》：GAN能伪造音视频文件，眼见不再为实

推荐阅读

function
Coursera ML 机器学习

2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]

蜡笔小新 2024-12-22 16:09:09
function
机器学习核心概念与技术

本文系统梳理了机器学习的关键知识点，涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容，并深入探讨了各算法的原理和应用场景。 ... [详细]

蜡笔小新 2024-12-22 09:15:30
function
百度AI Studio实战：利用高性能GPU集群进行线性回归

本文介绍百度AI Studio这一集成开发平台，涵盖丰富的AI教程、经典数据集及云端计算资源。通过具体示例——在AI Studio上构建线性回归项目，帮助初学者快速掌握其核心功能与操作方法。 ... [详细]

蜡笔小新 2024-12-20 06:24:41
php
采用IKE方式建立IPsec安全隧道

一、【组网和实验环境】按如上的接口ip先作配置，再作ipsec的相关配置，配置文本见文章最后本文实验采用的交换机是H3C模拟器，下载地址如 ... [详细]

蜡笔小新 2024-12-22 20:24:15
php
CodeChef 2014 April Challenge - Chef的最终对决：数据结构与整体二分的应用

本题探讨了在大数据结构背景下，如何通过整体二分和CDQ分治等高级算法优化处理复杂的时间序列问题。题目设定包括节点数量、查询次数和权重限制，并详细分析了解决方案中的关键步骤。 ... [详细]

蜡笔小新 2024-12-22 19:34:39
client
ZooKeeper集群脑裂问题及其解决方案

本文深入探讨了ZooKeeper集群中可能出现的脑裂问题，分析其成因，并提供了多种有效的解决方案，确保集群在高可用性环境下的稳定运行。 ... [详细]

蜡笔小新 2024-12-22 17:19:52
process
SQL Server 相关

1.执行sqlsever存储过程，消息：SQLServer阻止了对组件“AdHocDistributedQueries”的STATEMENT“OpenRowsetOpenDatas ... [详细]

蜡笔小新 2024-12-21 20:05:21
format
智能医疗：迈向未来的新篇章

智能医疗，即通过先进的物联网技术和信息平台，实现患者、医护人员和医疗机构之间的高效互动。它不仅提升了医疗服务的便捷性和质量，还推动了整个医疗行业的现代化进程。 ... [详细]

蜡笔小新 2024-12-21 17:01:59
shell
Python 工具推荐 | PyHubWeekly 第二十一期：提升命令行体验的五大工具

本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具，涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]

蜡笔小新 2024-12-21 14:45:11
client
深入解析ESFramework中的AgileTcp组件

本文详细介绍了ESFramework框架中AgileTcp组件的设计与实现。AgileTcp是ESFramework提供的ITcp接口的高效实现，旨在优化TCP通信的性能和结构清晰度。 ... [详细]

蜡笔小新 2024-12-21 13:56:06
sum
由二叉树到贪心算法

二叉树很重要树是数据结构中的重中之重，尤其以各类二叉树为学习的难点。单就面试而言，在 ... [详细]

蜡笔小新 2024-12-21 13:13:13
client
主调|大侠_重温C++

主调|大侠_重温C++ ... [详细]

蜡笔小新 2024-12-20 20:43:56
client
使用EmguCV 4.5.4实现LSD直线检测的C#示例

欢迎关注“视觉与AI技术前沿”公众号，获取最新的计算机视觉和深度学习干货。本文将详细介绍如何使用EmguCV 4.5.4在C#中实现LSD（Line Segment Detector）直线检测，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-20 19:49:33
shell
备战BAT面试：掌握这些MySQL核心问题

本文深入探讨了MySQL中常见的面试问题，包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析，帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]

蜡笔小新 2024-12-20 18:58:01
php
解决Spring Boot项目创建失败的问题

在尝试创建新的Spring Boot项目时遇到了一些问题，具体表现为在项目创建过程中的两个关键步骤出现错误。本文将详细探讨这些问题及其解决方案。 ... [详细]

蜡笔小新 2024-12-20 10:15:24

革斤Hero_394

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章