人脸交换是一种深度伪装技术,利用人工智能和机器学习,它可以将现有媒体中的人脸提取出来, 并将其替换为其他人的脸部特征,目前其已被MixBooth和SnapChat之类的应用程序推广开来,尽管其底层技术使复杂的图像编辑成为可能,但它同时也引起了人们对潜在误用或滥用的担忧。
不同的组织已经编译了可操纵的媒体来支持人脸交换检测方法的发展,但截止目前,以发布的样本数量相对较少或者过于人工化,基于此,SenseTime 研究院的研究人员与新加坡南洋理工大学达成合作,共同开发了一种大规模人脸检测数据集——“DeeperForensics-1.0”,研究人员表示该数据集是同类数据集中最大的一个,拥有超过6万个视频,,其中包含大约1,760万帧。
根据研究人员的说法,“DeeperForensics-1.0”中所有的源视频都经过精挑细选,它们的质量和多样性都很好。从表面来看,由于它们更接近现实世界中真实的检测场景,所以它们比其他数据集更为真实。而且它们还包含压缩、模糊和传输伪像,这些伪影与野外环境发现的是一致的。
为了构建“DeeperForensics-1.0”,研究人员收集了来自26个不同国家的100名男女演员的面部数据,他们的年龄20岁到45岁不等,所有人都被要求在9种灯光条件下转动头,自然地用53种以上的表情进行表达。他们通过AI框架(DeepFake Variational AutoEncoder简称DF-VAE)来运行这些视频,并使用1,000个YouTube视频作为目标视频,100个演员的每一个面孔都被交换到10个目标上。他们故意用35种不同的方式扭曲每个视频来模拟真实世界的场景,从而使得最终的数据集包含了5万个未经处理的视频和1万个经过处理的视频。
“我们发现,在建立高质量数据集的过程中,源人脸比目标人脸扮演着更为关键的角色,”研究人员在一份预先打印的论文中详细介绍了他们的工作。“特别是源面部的表情、姿势和光照条件应该更加丰富,以实现可靠的面部交换。”
研究人员还在“DeeperForensics-1.0”中创建了他们所谓的“隐藏”测试集——一组精心挑选的400个视频,以便更好地模拟真实场景中的假视频。策划这组视频的过程包括收集由未知的换脸方法生成的伪造视频,然后用真实场景中常见的失真掩盖它们,最后只选择在100个用户研究中选择至少欺骗了50个人类观察者的50个视频。
为了评估“DeeperForensics-1.0”与其他公开数据集的质量,研究人员让100名计算机视觉专家对其中包含的视频子集的质量进行排名。报告称,与FaceForensics++、Celeb-DF等其他流行的Deepfake检测语料相比,“DeeperForensics-1.0”在真实性方面领先。
在未来的工作中,研究团队打算逐步扩展DeeperForensics,并与研究界合作,共同确定面部伪造检测方法的评估指标。
从全球范围来看,全球与深度伪造的斗争似乎正在加剧。去年夏天,DARPA的Media Forensics计划的成员测试了一种原型系统,该系统可以通过查找不自然的闪烁等提示来自动检测AI生成的视频;初创公司Truepic在去年7月融资了800万美元,正在尝试使用深度伪造的“检测即服务”业务模型; 在2019年12月,Facebook与微软、学者合作伙伴共同发起了Deepfake检测挑战赛,该挑战赛将提供数百万美元的赠款和奖励,以刺激Deepfake检测系统的开发。
(本文编译自外网,内容尚有增减)