视频声音都能伪造!这该怎么办?

#科技13:13403

众译鸣谢

原文字幕:[B]One静茹于2018.07.26制作完成

译文字幕:[B]One静茹于2018.08.19制作完成

审核过程:4

字幕详情

您正在观看冷流科技
嗨!欢迎来到这期冷流科技视频
十年前 造假这个词
通常跟整容手术或者盗版DVD联系到一起
但随着互联网越来越普及
任何人在任何地方都能创造并发布故事或图片
我们经常要问“这是假的吗?”
在本期视频里 我们会从一个新奇的角度探索深度伪造的兴起
这种科技能够节省成百上千美元
但同时也会有些现实后果
让我们开始吧
但首先 我想要给本期视频的金主Audible一个大大的赞
我知道大部分在北半球的观众即将迎来夏天
你会花更多时间在户外 海滩上 公路旅行什么的
但为何不在夏天花大量时间来充实自己呢
来Audible就是充实自己的好方法
它涉及超广范围的书籍 包括科学和技术
Audible会赠送给大家一本有声书和30天的会员试用期
直接去www.audible.com/coldfusion
或者输入‘COLDFUSION’到500-500 并免费下载字幕
曾经有句流行语 “摄像机永不说谎”
然而 即使在PS出现前 这句话也不怎么可信
当拍出这张照片时 上面没有Acme的商标
它是通过数码方式放上去的
它也能够同样地被轻松去除
水珠也能放在商标去除后留下的空位上
只需选中现有的水珠
然后在几厘米外复制
该系统的潜力远不止于此
工作人员说 举个例子 他们可以拍一组照片
然后毫无破绽地把人们的头安在其他人肩膀上
几乎无法判断出这张照片是不是修改过
这不禁让人疑问 照片还比言语更让人信服吗
但那句俗话“摄像机永不说谎”又能信吗
视频则依然未从神坛跌落
如果有个人在视频里
那么你就有了绝佳的证据
认为一些想法和行动是出自于他的
但由于深度伪造 这一切都要改变了
那么深度伪造是什么?
深度伪造通常是通过神经网络制造出来的造假视频
可以在身体上叠加一张名人的脸
看起来就像是他们在做那些他们实际上没做过的事
你也可以截取一段话 替换掉内容
让脸部动作符合你插入的音频
甚至在深度伪造出现前 你可能已经看过这个基础系统的应用了
就是Snapchat上那些狗狗滤镜
用上滤镜就能有狗狗般的眼睛或者魔鬼的脸
背后的科技就是人脸识别
其实也不算是一种新技术
即使老式数码相机也有这个功能
2001年 Paul Viola和Michael Jones提出了一个实时人脸检测系统
如今被称为Viola Jones人脸检测框架
基本上 这个框架能让机器通过分辨像素级别的不同亮度
轻松识别人脸
今天 我们仍然运用这个基本前提
但已经加上了许多新步骤
这些组合到一起 就形成了电脑版本
Viola Jones的理论部分被用于对人脸上的基本标记进行高层次检测
但Snapchat在数百张脸上训练他们的系统
人工标记出嘴唇 眼睛 鼻子和脸部的边界
经过训练的应用就能将一个有标记的面具匹配到你的脸上
这是基于它从你相机里每秒24帧画面中获得的数据
这样你就能让狗狗的耳朵待对地方 或者换脸
Snapchat的技术大部分是基于2015年收购乌克兰公司Looksery
得来的实验经验
这花了Snapchat1.5亿美元
在短短三年内 技术发展飞快
我们知道 电影制片厂很多年来都能用换脸技术
Oliver Reed在《角斗士》的一些场景中用了
年轻版的Carrier Fisher重现《星球大战:侠盗一号》
但这个过程漫长且烧钱
他们在《星球大战》里是这么替换塔金的
我们制作这样一个场景的过程像这样
要做的第一件事是拍摄真人动作
我现在正拍摄的这位是Guy Henry
他穿着全套剧服
他戴着一个头戴式摄像装置
专门用来捕捉他的脸部表情
魅力永恒
这是最初的测试
这是我们第一次看到Guy的动作转换成模型
然后放在Tarkan身上 一开始就像这样
问题是Cushing的脸部动作和Henry的脸部动作不总是一致的
这就需要非常艰辛的调整 有时逐帧调
不断地完善你所能想到的最细微的细节
这种方法要花费18个月和一大笔钱
我个人认为 成果与电子游戏过场情景的效果差不多
然而今天 像Fake一样的免费应用
使得脸部合成技术成为任何人都能操作的技术
为了解释得更清楚点 下面有个侠盗一号中莉亚公主的视频对比
一组镜头是花费了成百上千美元 在一台贵到离谱的电脑上
艰辛制作出来的
另一个是一个普通人在一台普通电脑上花30分钟免费制作出来的
确实 有明显的区别
但说实话 这点区别值得花费成百上千美元吗?
前面的场景是由Fake应用程序制作出来的
以下是它的制作步骤
如果你想要把超人电影里的露易丝·莱恩换上尼古拉斯·凯奇的脸
第一步就是挑选源视频
然后找到一堆艾米·亚当斯的照片 就是露易丝·莱恩的扮演者
还有尼古拉斯·凯奇的照片
这些照片成为了人工智能的训练数据
你不需要自己一张张下载图片
这个应用程序有一个即刻下载所有图片的自动脚本
第二步就是去除掉图片里我们不想要的部分
比如场景中的物体
这一切做好之后 脸部识别就很容易了
第三部就是让AI来施展魔法了
神经网络模型开始学习如何重建图片里提供的脸
这是Fake应用里的一组快照例子
前六列展示了A脸转化到B脸的过程
后六列反之亦然
每三张图为一组里面 最左边的是原始图片
中间的图片是模型重建原始图片的尝试
最右边的是预测的转换结果
然后网络输出数值
用来细化转换过程中差错的数量
当数值足够低时 恭喜你!
说明你做出来的深度伪造效果相当不错
如今在实时视频里通过图片将一张脸替换到另一张脸上也有可能
视频只是一堆快速切换的图片 以每秒24到30次的速度
所以当你仔细想想 也有道理
这种科技削减了开销和大量的工作
把高效的工具交到每个普通人手里
但是会产生什么消极影响呢?
不出意料的 出现了很多名人出镜的
少儿不宜或成人影片场景的假视频
你所要做的就是找到体型相似的女明星
然后大部分工作都由算法来帮你完成
这一大波涌现出来的假视频
背后最主要的驱动者是成人色情市场
然而 假视频带来的最大风险应该在于政治领域
政治家经常上镜
经常站在讲台上或者坐着被采访 姿势固定
非常容易被当成造假视频的素材
你只需要找个演员 做出你想要的口型
然后就能套用在政治家身上
替换掉他们的动作甚至是说的话
你可能在想“还是需要一个好声优来配音”
前不久
在2016年的Adobe大会上 Zeyu Jin发布了Voco
Voco其实就是音频版的PS
他通过学习算法来分析讲话模式
然后转换成文本
仅仅只用40分钟长的讲话
就几乎能获得讲话者所讲语言的所有发音
所以要是想重新创造一个新音频 你只要打字就可以了
这太简单了
我们在这里输入单词“狗狗”
然后
[假音频]: 我亲吻了我的妻子和狗狗
呜!
[观众的掌声]
还有 还有更好的
我们可以输入原本不存在的词
把单词“我的”去掉 换成“乔丹”
[假音频]: 我亲吻了乔丹和狗狗
哈哈哈哈哈哈哈!
[观众的掌声]
我们不止是要改一两个词
我们其实还可以输入短语
比如说......我们把这些词去掉
然后输入“三次”
哈哈哈!呜!
[观众笑声]
然后再播放
[假音频]: 我亲吻了乔丹三次
哈哈哈!呜![掌声]
最近 华盛顿大学的研究者
能够让奥巴马毫无破绽地说出任何话
他们的AI能够精确学习模仿奥巴马的嘴部动作
我们算法的核心是周期性神经网络
将输入的音频转换成实时变动的口型
现在 大部分人不是通过市场获得医疗保险
而是通过就业 医疗保险或医疗补助获得
接着我们合成嘴巴及周边组织
你应该知道 多亏了平价医疗法案
现在你的医保覆盖范围比之前更多了
接下来 补充牙齿细节
我将会推行免费预防保健
在基本医疗服务上 不再有年均或年龄上的限制
最后 我们渲染嘴部到重调时轴的视频中 并贴合动作
妇女可以获得免费检查
你也不会仅仅因为是女性而被收取更多费用
年轻人可以和父母共享方案 直到26岁
和创造就业机会的基础设施行业
更不用说帮助人们获得岗位所需新技能的职业培训了
我们甚至能通过声音模仿演员
创造出一段奥巴马的视频
就是这样
巴拉克·奥巴马总统
当你在讲话时
一定要停顿很多次
以一种很古怪的语调
一升一降 一降一升
仔细想想 如果你能让政治家说出你想让他说的话
这会有多大的影响
从更广的层面看 如果这些视频变得司空见惯
或许这也给了那些政治家们
否认他们说过的话的机会
到时候要怎样才能相信给出的证据 成了一个问题
这引出了最后一个问题
你要怎么证明那个视频是真的?
这非常困难
如果你能找到假视频上传时的原始格式
你就能找到一些指示标志
每一个数码录像设备都有自己独特的算法
来决定储存什么信息
你没办法存储每一帧的每一个像素
太多数据了
所以要是颜色相近的话
相机就会将它们压缩到一起成一小组
这种行为就有点像相机样式的指纹
那么专家就能看出哪里被替换过了
但问题是 一旦这个视频被上传和下载了好几次
就很难一下子就发现了
但一旦它在网络中流转 就几乎不可能看得出来
有时候当脸部动得很奇怪时
又或者当3D面具不完全吻合头部移动时
这就是指示性的小毛病
但这种软件会逐步改进 更难发现这些错误
那么还有希望吗?
当然有 在未来 这些东西可能拯救我们
比如 我们可以靠AI来跟AI作战
就是一个专门用来检测伪造视频的AI
简单说一下这个理论
如果训练AI学习一系列假视频和真视频
并告诉它哪些是假 哪些是真
大概经过充足训练后
AI就能比我们更准确地判断出哪些是假视频
另一个解决方案就是将认证的视频存储在区块链中
这样它们就无法造假了
而且当你从区块链中某一个区下载视频时
就会知道这些是真实的
这就是目前我们所处的境遇
能力越大 责任越大
深度伪造有非常有用的一面
但如你所见 也会带来坏处
那么我要向各位提出这个问题了
你对深度伪造怎么看?
欢迎在下方评论区留言告诉我
虽然我已经发现了留言区质量的下降
这里是Dagogo 你正在看的是冷流科技
如果你只是偶然点进这个频道 欢迎关注
下期视频我们会很快再见的
谢谢大家!祝生活愉快
[音乐]冷流科技 新的想法
以下内容有剧透 , 请注意打开姿势

精彩推荐

  • 被遗忘的技术--激光影碟

    10:11206

  • A.I. 不断发展的前方是什么

    12:07581

  • 解密“维基解密”

    08:55403

  • 尼古拉·特斯拉part2

    11:49350

  • 三星有多大?(让你知道三星有多么的大!)

    11:22912

  • 苹果公司失去了它的魔力了吗

    07:44206

  • 埃隆·马斯克的人工智能击败了冠军玩家

    10:22432

  • 女孩们,去发明创造吧!

    01:39281

更多视频, 请移步译学馆APP欣赏  GET APP