热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

《经济学人》:GAN能伪造音视频文件,眼见不再为实

在今年早些时候,一段关于法国音乐家FrançoiseHardy的YouTube视频在网上流传。视频中,台下的人问她,为何唐纳德·特朗普会让其新闻秘书SeanSpicer在就职典礼人

《经济学人》:GAN能伪造音视频文件,眼见不再为实

在今年早些时候,一段关于法国音乐家Françoise Hardy的YouTube视频在网上流传。视频中,台下的人问她,为何唐纳德·特朗普会让其新闻秘书Sean Spicer在就职典礼人数一事上撒谎。Hardy回答说,此事是极有争议的,Spicer先生给出了“多种事实”。

这一视频的内容很奇怪,尤其是Françoise Hardy女士本人。虽然她现在已经73岁了,视频中看起来却只有20岁,而且她说话的声音像极了特朗普的顾问Kellyanne Conway女士的声音。

实际上,这段视频是德国艺术家Mario Klingemann的杰作“Alternative Face v1.1”,通过用一个人的脸建模生成式对抗网络,生成新的面孔。这是基于Conway女士的一段NBC采访生成的假视频,原本是关于Conway女士一段声名狼藉的对话,却通过Hardy女士之口说了出来。Mario Klingemann使用不同的声音片段作为输入数据,基于Françoise Hardy女士的脸进行训练。视频看起来有些摇晃,且像素也被调整过。其实通过视频软件来制作可能画面效果会更好,但是Klingemann没有使用编辑软件来完成视频,相反,他只花了几天时间在台式电脑上用一种机器学习算法——生成式对抗网络(GAN)来创建了一个剪辑视频,电脑被强制输入Hardy女士的音乐视频后,自动生成了Klingemann想要的声音片段,在这段假视频中放出的声音片段其实是不存在的,Hardy女士从未说过这些话。

Klingemann先生的实验让虚假视频走入大众视线,预示着未来可能会有一场关于真伪视频的战争。原本书面的信息可以轻易的伪造,图像和声音却难以伪造,因此图像和声音证据原是非常可信的,但目前GAN的存在可能会改变这一局面,它可能会让图像和声音变得也不那么可信了。

事实上音频更容易伪造。通常情况下,计算机通过连接大量语音短记录片段来创建一个句子,这也是Siri声音的生成原理。但这样的数字声音受限于它们记住的片段范围,因此数字声音只有在说到某些特定短语的时候才听起来真实。

而GAN 生成音频的工作方式则不同,它使用神经网络算法来学习音频源的统计属性,然后在任何其他的上下文中再现这些属性,以毫秒级而非秒级的片段建模。如果我们想要让特朗普或者其他任何一个公众人物说出指定的话,其实就是将对应人物的演讲材料作为输入,告诉算法你想要输出的语音是什么。在过去几年里,谷歌在英国的DeepMind团队,百度在硅谷的深度学习研究院和蒙特利尔研究院,都发表了从文字到语音的高性能算法。目前这些算法只有大型公司的计算能力才能实现,但这种情况终将改变。

相比音频,机器生成图像更难实现。 2014年,Ian Goodfellow推出了GANs,彼时他还是 Yoshua Bengio在MILA的学生。尽管深度学习允许机器能够轻易完成图像识别的任务,辨别不同种类的数据,比如机器能轻易分辨一张猫和一只狗的图片,但是想要机器能自动生成猫和狗的图片就没那么容易了,计算机很难通过数据库中的大量训练图像,自动生成有意义的图片。

Goodfellow转而想到了另一种方法实现图像生成:竞争。不再请求软件凭空生成有用的东西,而是提供了另一个软件作为原软件的对手来推动图像生成。对手会辨别原软件生成的图像,判断它们是否“真实”。通过试图愚弄对手,生成软件学会创造看起来真实的生成图像。对抗软件“了解”现实世界是什么样子,因此赋予了生成图片意义和界限。

目前,GANs可以根据一句语言的描述,生成小型的邮票大小的图像。当你告诉GANs,“这只鸟是白色的,有一些黑色头和翅膀,并有一个长长的橙色喙“,它会为你画出来。可能画出来的图像并不完美,但一眼看过去却很真实。

当时这样的算法效果并不出奇,但GAN的发展非常迅速。在过去五年中,由相似算法推动的照片分类软件错误率已从25%降低到百分之几。人们期望图像生成领域也能取得同样的进展。谷歌的机器学习艺术家麦克·泰卡已经通过训练GANs算法生成了人脸的图像,分辨率像素大小为768,这像素超过了以前同等研究实验像素的两倍。

Goodfellow现在在搜索巨头谷歌的内部AI研究院Google Brain工作,如果一定要估计这一算法实现时间的话,他认为,生成YouTube假视频有可能在三年内实现。其他人则认为可能需要更长时间。但是所有人都同意这只是时间问题,而不是能不能实现的问题。Goodfellow说道,“我们认为AI会改变我们所信赖的证据——图像和音频”。

本文为雷锋网根据《经济学人》编译,未经雷锋网许可不得转载。

原文链接:http://www.economist.com/news/science-and-technology/21724370-fake-news-you-aint-seen-nothing-yet-generating-convincing-audio-and-video-fake,雷锋网(公众号:雷锋网)编译

雷锋网版权文章,未经授权禁止转载。详情见。


《经济学人》:GAN能伪造音视频文件,眼见不再为实


推荐阅读
  • Python正则表达式学习记录及常用方法
    本文记录了学习Python正则表达式的过程,介绍了re模块的常用方法re.search,并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具,通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 嵌入式处理器的架构与内核发展历程
    本文主要介绍了嵌入式处理器的架构与内核发展历程,包括不同架构的指令集的变化,以及内核的流水线和结构。通过对ARM架构的分析,可以更好地理解嵌入式处理器的架构与内核的关系。 ... [详细]
  • Question该提问来源于开源项目:react-native-device-info/react-native-device-info ... [详细]
  • Linux重启网络命令实例及关机和重启示例教程
    本文介绍了Linux系统中重启网络命令的实例,以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法,以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 本文详细介绍了Android中的坐标系以及与View相关的方法。首先介绍了Android坐标系和视图坐标系的概念,并通过图示进行了解释。接着提到了View的大小可以超过手机屏幕,并且只有在手机屏幕内才能看到。最后,作者表示将在后续文章中继续探讨与View相关的内容。 ... [详细]
  • Python脚本编写创建输出数据库并添加模型和场数据的方法
    本文介绍了使用Python脚本编写创建输出数据库并添加模型数据和场数据的方法。首先导入相应模块,然后创建输出数据库并添加材料属性、截面、部件实例、分析步和帧、节点和单元等对象。接着向输出数据库中添加场数据和历程数据,本例中只添加了节点位移。最后保存数据库文件并关闭文件。文章还提供了部分代码和Abaqus操作步骤。另外,作者还建立了关于Abaqus的学习交流群,欢迎加入并提问。 ... [详细]
  • 本文介绍了brain的意思、读音、翻译、用法、发音、词组、同反义词等内容,以及脑新东方在线英语词典的相关信息。还包括了brain的词汇搭配、形容词和名词的用法,以及与brain相关的短语和词组。此外,还介绍了与brain相关的医学术语和智囊团等相关内容。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置,但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置,并列出了出现的错误信息。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文讨论了使用差分约束系统求解House Man跳跃问题的思路与方法。给定一组不同高度,要求从最低点跳跃到最高点,每次跳跃的距离不超过D,并且不能改变给定的顺序。通过建立差分约束系统,将问题转化为图的建立和查询距离的问题。文章详细介绍了建立约束条件的方法,并使用SPFA算法判环并输出结果。同时还讨论了建边方向和跳跃顺序的关系。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
author-avatar
革斤Hero_394
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有