最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

2020-04-10 08:41:17 来源:网络整理 作者:管理员

原标题:最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

智东西(公众号:zhidxcom)

编 | 董温淑

备选标题:

1、AI分类器可能误判!科学家设计攻击实验,让Deepfake以假乱真

2、指望AI鉴别Deepfake?最新研究显示可靠性较低

智东西4月9日消息,谷歌公司和加州大学伯克利分校的研究人员最近的一项研究显示,现有的鉴定分类器在一些情况下不能有效甄别出Deepfake作品。

用人工智能手段进行人体图像合成被称为Deepfake。简单来说,Deepfake技术可以给图片、视频中的人物“换脸”。网络上流行的换脸app、一键脱衣app均是基于Deepfake技术实现功能。

提起Deepfake,就不能不提到滥用这种技术会造成严重恶性后果。例如此前曝出的新闻:网络IP伪造名人色情影片、犯罪分子冒充英国能源公司CEO挪用公司资金、别有用心者在大选期间传播对竞选者不利的虚假材料等等。

为了避免这种情况,许多网站引入了能够区分真假内容的AI鉴定分类系统。

然而,谷歌公司和加州大学伯克利分校的研究表明,即使是最先进的分类器也很容易被攻击影响。

无独有偶,另一个由加州大学圣地亚哥分校主导的研究也表明,只要在虚假视频中添加一些信息,分类器就无法把它辨别出来。

这些研究结果为我们敲响了警钟:目前的分类器并不是100%可靠,仍需警惕Deepfake制作的虚假信息。

目前谷歌和加州大学伯克利分校的研究已经发表在学术网站arXiv上,论文标题为《用白盒、黑盒攻击绕过Deepfake图像鉴别工具(Evading Deepfake-Image Detectors with White- and Black-Box Attacks)》

论文链接:https://arxiv.org/pdf/2004.00622.pdf

最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

实验中用到的假图像基于生成对抗网络(generative adversarial networks,GAN)来合成。GAN由一个生成网络和一个判别网络组成。

GAN模型的学习过程就是生成网络和判别网络的相互博弈的过程:生成网络从潜在空间中随机取样作为输入,目标是输出与训练集中样本一致的图像。判别网络的目标则是判定生成网络的输出是否属于训练集。

经过一段时间的学习,生成网络输出的图像将与训练集中的十分相似,不能被判别网络识别出来。

研究人员共对3个分类器做了测试,其中两个为第三方分类器,一个为研究人员训练出的用于对照的分类器。

研究人员选用了两种不同训练方式的第三方分类器。

第一个的分类器模型基于深度残差网络ResNet-50(Deep residual network)。

研究人员预先用大型视觉数据库ImageNet对ResNet-50进行了训练。训练集中包括720000个训练图像和4000个验证图像,其中一半为真实图像,另一半是用ProGAN生成的合成图像。训练集中的图像采用空间模糊和JEPG压缩方法增强。

经过训练后,这个分类器能准确识别出ProGAN生成的图像,而且还能分类其他未被发现的图像。

第二个鉴定分类器采用的是基于相似性学习(similar learning-based)的方法。经过训练后这款分类器可以准确辨认出由不同生成器合成的图像。

研究团队还自己搭建了一个鉴定分类器模型,作为前述两个鉴定分类器的对照示例。这个分类器采用一百万个ProGAN生成的图像进行训练,其中真假图像各占一半。论文中指出,这个分类器的训练管道比前述两种简单很多,因此错误率是前面两个模型的3倍。

研究人员根据分类器是否开放了访问权限,选用了不同的攻击方式。对开发访问权限的分类器采用白盒攻击;对不开放访问权限的分类器采用黑盒攻击。

另外,研究人员用接收者操作特征曲线(ROC曲线)评估分类器的正确率。评估标准是曲线下面积(AUC)的大小。AUC的取值范围为0~1,一般来说AUC>0.5即代表分类器有预测价值,AUC值越大代表分类器准确率越高。

一、白盒攻击

对于开放了访问权限的分类器,研究人员用白盒攻击评估其稳健性。

白盒攻击即攻击者能够获知分类器所使用的算法以及算法使用的参数。在产生对抗性攻击数据的过程中,攻击者能够与分类器系统产生交互。

攻击过程中用到的所有图像都来自一个包含94036张图像的视觉数据库。

开始白盒攻击之前,基于这个数据库的分类器得到了0.97的AUC数值。即使在执行典型的清洗策略隐藏图像合成痕迹后,分类器的AUC数值仍保持在0.94以上。

接下来研究人员使用了4种白盒攻击方法。这4种攻击在之前的对抗性示例中已有过研究。攻击的具体方式是对图像进行修改,使分类器误认为它们是真实的。

最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

▲四种攻击前后,分类器的ROC曲线图。蓝色实线代表JPEG格式的合成图像,蓝色虚线代表PNG格式的合成图像

1、失真最小化攻击(Distortion-minimizing Attack)

失真最小化攻击即对合成图像添加一个较小的加法扰动δ。假设一个合成图像x先被分类器判定为假,施加扰动后,(x+δ)就会被判定为真。

最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

▲a:分类器把假图像识别为真;b:分类器把真图像识别为假。把像素翻转1%,就会有一半的假图像被判定为真;把像素翻转7%,就会有一半的真图像被判定为假。

2、损失最大化攻击(Loss-Maximizing Attack)

损失最大化攻击即定义一个更简单的目标函数,更大限度地提升合成图像被判定为真的概率。

3、通用对抗性补丁攻击(Universal Adversarial-Patch Attack)

失真最小化攻击方法有有一个局限性:攻击者需要花费0.1秒为每个图像定制攻击方式。

为了弥补这一局限性,研究人员创建了一个单一的可视噪声模板补丁。这个补丁可以叠加在任何假图像上,有效增加了假图像的迷惑性。

4、通用潜空间攻击(Universal Latent-Space Attack)

不同于之前三种方法通过对假图像施加扰动来影响分类结果,第四种攻击方法是对图像的潜在空间进行攻击。

最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

▲a为通用对抗性补丁攻击效果,b~d为通用潜空间攻击效果。图中所有假图像都被分类器误判为真

经过白盒攻击,分类器的AUC数值下降到了0.1以下。

二、黑盒攻击

论文指出,现实中的社交网站、约会网站等,并不会公开其鉴定分类器的算法,因此很难进行前面所说的白箱攻击。

面对这种情况,研究人员进行了黑盒攻击。黑盒攻击假设对方知道攻击的存在,并且掌握了一般的防御策略。

研究结果显示,即使在这种限制性较强的黑盒攻击条件下,鉴定分类器也很容易受到对抗性因素影响。经过黑盒攻击,分类器的AUC数值下降到0.22以下。

结语:现有分类器有局限性,仍需深入研究

谷歌公司和加州大学伯克利分校研究团队证明,只要对虚假图片适当加以处理,就能使其“骗”过分类器。

这种现象令人担忧,论文中写道:“部署这样的分类器会比不部署还糟糕,不仅虚假图像本身显得十分真实,分类器的误判还会赋予它额外的可信度”。

因此,研究人员建议开创新的检测方法,研究出可以识别经过再压缩、调整大小、降低分辨率等扰动手段处理的假图像。

据悉,目前有许多机构正在从事这一工作,如脸书、亚马逊网络服务及其他机构联合发起了“Deepfake鉴别挑战”,期待能探索出更好的解决方案。

文章来源:VentureBeat,arXiv

显示全文
为您推荐
杨紫造型翻车撞脸西门大妈
杨紫造型翻车撞脸西门大妈

近日,女星杨紫在参加时尚活动的红毯上翻车,造型遭到了网友的激烈吐槽。杨紫的脸显得特别黑,口红色彩太淡,与礼服风格不搭,整个造型看起来非常没气色。杨紫工作室宣布的精修图还算能够,但实际走上红毯之后,整个.........

发布时间:2023-06-10 23:06:43

白居易最深情的一首诗(含赏析)
白居易最深情的一首诗(含赏析)

【导读】 白居易最深情的一首诗(含赏析),下面是小编为你收集整理的,希望对你有帮助!我们都知道白居易是我国唐朝非常著名的诗人,有很多流传甚广的诗篇,例如《琵琶行》《忆江南》《长恨歌》《卖炭翁》《赋得古原草送别》等等。也知道他这一生蓄养家妓无数,甚至只要13-15岁的少女,每三年就换掉......

发布时间:2023-06-10 23:01:21

镇元子为什么要跪观音:在天庭无官职(观音地位高)
镇元子为什么要跪观音:在天庭无官职(观音地位高)

【导读】 镇元子为什么要跪观音:在天庭无官职(观音地位高),下面是小编为你收集整理的,希望对你有帮助!镇元子其实也是《西游记》中的一个角色,也就是著名的人参果树的主人,是《西游记》中一个非常有名的情节,而据说镇元子被称为是“地仙之祖”,那么他为什么会跪观音呢?接下来我们就一起去......

发布时间:2023-06-10 22:01:14

赤潮和水华的主要危害:赤潮破坏海洋生态(水华污染饮用水)
赤潮和水华的主要危害:赤潮破坏海洋生态(水华污染饮用水)

【导读】 赤潮和水华的主要危害:赤潮破坏海洋生态(水华污染饮用水),下面是小编为你收集整理的,希望对你有帮助!赤潮和水华都是自然界当中的自然生态现象,这两种现象在我国古代历史上就有记载,原本它们并没有对海洋环境和人类造成什么危害,但是现在赤潮和水华反而变成了自然灾害,它们的主要危害是什么呢,一起来了解一下吧。......

发布时间:2023-06-10 21:01:12

考导游证需背哪四本书
考导游证需背哪四本书

【导读】 考导游证需背哪四本书,下面是小编为你收集整理的,希望对你有帮助!导游证,它是指参加导游人员资格考试并合格,取得导游人员资格证书的人员,经与旅行社订立劳动合同或者在导游服务公司登记,由旅******政部门颁发的导游证。持有正式导游证的人员,可以是专职的导游人员,也可以是兼职......

发布时间:2023-06-10 20:01:06

张韶涵紧身背心配破洞裤露蛮腰 与妹妹同框各有风情
张韶涵紧身背心配破洞裤露蛮腰 与妹妹同框各有风情

5月7日,张韶涵一身劲装与妹妹出现在台北松山机场,引来不少粉丝关注拍照。只见张韶涵身穿黑色紧身小背心配破洞裤,露香肩蛮腰,大秀好身材,姐妹花同框各有风情。 .........

发布时间:2023-06-10 19:04:26

楼兰古城女尸为什么不腐 葡萄酒保养美貌(4000年不朽)
楼兰古城女尸为什么不腐 葡萄酒保养美貌(4000年不朽)

【导读】 楼兰古城女尸为什么不腐 葡萄酒保养美貌(4000年不朽),下面是小编为你收集整理的,希望对你有帮助!千年前的楼兰古城充满了神秘色彩,尤其是在古城内发现的少女古尸,尸身保存完好,这让在场的专家大吃一惊,为何尸身千年不腐呢?下面就让探物志小编带大家了解一下吧!楼兰古城女尸楼兰女尸出土于1980年,位于孔......

发布时间:2023-06-10 19:01:07

汉服的五种形制指的是哪五种?
汉服的五种形制指的是哪五种?

【导读】 汉服的五种形制指的是哪五种?,下面是小编为你收集整理的,希望对你有帮助!“汉服”全称为“汉民族传统服饰”,由于历史悠久,所以其风格鲜明、样式多变,是我国礼仪之邦的重要体现点。古代的汉服按照用途有祭服、朝服、公服、常服之分,我们现在在大街上还能看到穿各种花色款式汉服的人。遇......

发布时间:2023-06-10 18:01:19

地中海气候区的雨季通常在什么季节
地中海气候区的雨季通常在什么季节

【导读】 地中海气候区的雨季通常在什么季节,下面是小编为你收集整理的,希望对你有帮助!地中海气候区的雨季通常在冬季。地中海气候主要分布在南北纬30~40的大陆西岸,以地中海地区最为典型,所以称为地中海气候。与亚热带季风气候相比,地中海气候全年的降水较少,而且高温季节雨量甚少。夏季炎热干......

发布时间:2023-06-10 17:01:08

老挝为什么不是汉字文化圈
老挝为什么不是汉字文化圈

【导读】 老挝为什么不是汉字文化圈,下面是小编为你收集整理的,希望对你有帮助!说起中国的一位邻居老挝,相信大家不会陌生了。老挝的国土面积约23万平方公里,人口约600万。老挝虽然有几十个民族,但主要民族是老族。老族的祖先最初生活在中国西南地区,他们与中国傣族、壮族的血缘关系非常......

发布时间:2023-06-10 16:01:05

沈腾参加活动时睡着了
沈腾参加活动时睡着了

5月28日,艺人沈腾在一次活动中忽然登上热搜榜,引发了广泛重视和热议。起因是他和张译、吴京等人参加活动时,沈腾直接躺在椅子上睡着了,而其别人则露出了惊奇的表情。这一场景完全推翻了人们对明星参加活动时的.........

发布时间:2023-06-10 15:11:35

路易十三是什么酒
路易十三是什么酒

【导读】 路易十三是什么酒,下面是小编为你收集整理的,希望对你有帮助!路易十三是一款干邑白兰地酒,是人头马最具代表性的酒款,人头马则是法国最古老的干邑品牌之一。路易十三采用干邑地区的优质葡萄为原料,进行陈酿,由1200种生命之水调配而成,陈酿时间达到了50年,甚至更久。......

发布时间:2023-06-10 15:01:08