人脸伪造检测方法、装置及电子设备与流程



1.本技术实施例涉及人工智能(artificial intelligence,ai)技术领域,尤其涉及一种人脸伪造检测方法、装置及电子设备。


背景技术:



2.深度伪造(deepfake)是一种基于生成对抗网络(generative adversarial network,gan)等机器学习模型,将个人的声音、面部表情、身体动作拼接合成虚假图片或者虚假视频的人工智能技术。人脸伪造(face forgery)特指深度伪造中针对人脸的篡改技术。
3.随着人脸伪造技术伴随的安全隐患的增加,人脸伪造检测技术得到了越来越多的重视。目前常用的人脸伪造检测方法是:先通过机器学习模型,获取真实人脸视频样本的特征在特征空间上的分布,再通过判断待检测人脸视频的特征是否偏离上述分布的中心来确定待检测人脸视频是否是通过人脸伪造技术获取的。
4.然而,随着机器学习模型在训练过程中使用的真实人脸视频样本的数量增加,特征空间中的特征会增加,使得真实人脸视频样本的特征在特征空间上存在多个分布,那么就会存在多个分布中心,进而影响对待检测人脸视频的特征是否偏离分布中心的判断,从而影响人脸伪造检测的准确性。


技术实现要素:



5.本技术提供一种人脸伪造检测方法、装置及电子设备,以提高人脸伪造检测的准确性。
6.第一方面,本技术提供一种人脸伪造检测方法,该方法包括:获取待检测人脸视频;将待检测人脸视频输入至人脸图像重建模型,以通过人脸图像重建模型对待检测人脸视频进行帧采样,得到待检测人脸视频在当前分辨率下的n个第一待检测人脸视频帧,对n个第一待检测人脸视频帧进行特征提取,得到n个待检测人脸视频帧的至少一个第一初始特征,根据至少一个第一真实人脸特征和至少一个第一初始特征确定第一重建人脸图像特征,根据第一重建人脸图像特征,得到n个第一重建人脸图像,n为正整数;根据n个第一待检测人脸视频帧和n个第一重建人脸图像的差异检测待检测人脸视频是否为伪造人脸视频;其中,人脸图像重建模型是通过真实人脸视频训练得到的。
7.第二方面,本技术提供一种人脸伪造检测装置,包括:获取模块、输入模块、处理模块、检测模块,其中,获取模块用于获取待检测人脸视频;输入模块用于将待检测人脸视频输入至人脸图像重建模型,处理模块用于:通过人脸图像重建模型对待检测人脸视频进行帧采样,得到待检测人脸视频在当前分辨率下的n个第一待检测人脸视频帧,对n个第一待检测人脸视频帧进行特征提取,得到n个待检测人脸视频帧的至少一个第一初始特征,根据至少一个第一真实人脸特征和至少一个第一初始特征确定第一重建人脸图像特征,根据第一重建人脸图像特征确定n个第一重建人脸图像,n为正整数;检测模块用于根据n个第一待
检测人脸视频帧和n个第一重建人脸图像的差异检测待检测人脸视频是否为伪造人脸视频;其中,人脸图像重建模型是通过真实人脸视频训练得到的。
8.第三方面,提供一种电子设备,包括:处理器和存储器,该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,执行如第一方面或其各实现方式中的方法。
9.第四方面,提供一种计算机可读存储介质,用于存储计算机程序,计算机程序使得计算机执行如第一方面或其各实现方式中的方法。
10.第五方面,提供一种计算机程序产品,包括计算机程序指令,该计算机程序指令使得计算机执行如第一方面或其各实现方式中的方法。
11.第六方面,提供一种计算机程序,计算机程序使得计算机执行如第一方面或其各实现方式中的方法。
12.通过本技术技术方案,电子设备可以先获取待检测人脸视频,然后,电子设备可以将待检测人脸视频输入至人脸图像重建模型,以通过该人脸图像重建模型对待检测人脸视频进行帧采样,得到待检测人脸视频在当前分辨率下的n个第一待检测人脸视频帧,对n个第一待检测人脸视频帧进行特征提取,得到n个待检测人脸视频帧的至少一个第一初始特征,根据至少一个第一真实人脸特征和至少一个第一初始特征确定第一重建人脸图像特征,根据第一重建人脸图像特征,得到n个第一重建人脸图像,n为正整数,最后,电子设备可以根据n个第一待检测人脸视频帧和n个第一重建人脸图像的差异检测待检测人脸视频是否为伪造人脸视频,其中,人脸图像重建模型是通过真实人脸视频训练得到的。相比于现有技术中需要先确定真实人脸视频样本的特征在特征空间上的分布,再通过判断待检测人脸视频的特征是否偏离该分布的中心来确定待检测人脸视频是否是伪造人脸视频的方法,本技术提供的技术方案无需根据上述分布中心来确定待检测人脸视频是否为伪造人脸视频,从而可以解决由于存在多个分布中心而影响人脸伪造检测准确性的问题,以提高人脸伪造检测的准确性。在上述过程中,由于人脸图像重建模型是通过真实人脸视频训练得到,而且人脸图像重建模型确定第一重建人脸图像特征时使用了第一真实人脸特征,所以第一重建人脸图像特征是比较接近真实人脸特征的,因此,电子设备通过上述人脸图像重建模型得到的第一重建人脸图像是较接近真实人脸图像的,基于此,对于属于伪造人脸视频的待检测人脸视频,在电子设备将其输入上述人脸图像重建模型后,可以得到接近真实人脸图像的第一重建人脸图像,显然该接近真实人脸图像的第一重建人脸图像和上述属于伪造人脸视频的待检测人脸视频对应的第一待检测人脸视频帧存在较大差异,那么电子设备可以根据该差异检测出上述待检测人脸视频是伪造人脸视频;类似的,对于属于真实人脸视频的待检测人脸视频,在电子设备将其输入上述人脸图像重建模型后,可以得到接近真实人脸图像的第一重建人脸图像,那么电子设备可以根据该接近真实人脸图像的第一重建人脸图像和上述待检测人脸视频对应的第一待检测人脸视频帧的较小差异检测出上述待检测人脸视频不是伪造人脸视频,也就是说,通过本技术技术方案,电子设备可以较为准确地检测出待检测人脸视频是否是伪造人脸视频,即可以提高人脸伪造检测的准确性。
附图说明
13.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使
用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
14.图1为本技术实施例提供的一种系统构架示意图;
15.图2为本技术实施例提供的一种人脸伪造检测方法的流程图;
16.图3为本技术实施例提供的一种人脸伪造检测方法的示意图;
17.图4为本技术实施例提供的另一种人脸伪造检测方法的流程图;
18.图5为本技术实施例提供的另一种人脸伪造检测方法的示意图;
19.图6为本技术实施例提供的再一种人脸伪造检测方法的示意图;
20.图7为本技术实施例提供的又一种人脸伪造检测方法的示意图;
21.图8为本技术实施例提供的再一种人脸伪造检测方法的流程图;
22.图9为本技术实施例提供的又一种人脸伪造检测方法的流程图;
23.图10为本技术实施例提供的又一种人脸伪造检测方法的流程图;
24.图11为本技术实施例提供的又一种人脸伪造检测方法的流程图;
25.图12为本技术实施例提供的又一种人脸伪造检测方法的示意图;
26.图13为本技术实施例提供的一种模型训练方法的流程图;
27.图14为本技术实施例提供的一种人脸伪造检测装置1400的示意图;
28.图15是本技术实施例提供的电子设备1500的示意性框图。
具体实施方式
29.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
30.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
31.如上所述,现有技术中的人脸伪造检测方法需要先确定真实人脸视频样本的特征在特征空间上的分布,再通过判断待检测人脸视频的特征是否偏离该分布的中心来确定待检测人脸视频是否是伪造人脸视频,然而,随着机器学习模型在训练过程中使用的真实人脸视频样本的数量增加,特征空间中的特征会增加,使得真实人脸视频样本的特征在特征空间上存在多个分布,那么就会存在多个分布中心,进而影响对待检测人脸视频的特征是否偏离分布中心的判断,从而影响人脸伪造检测的准确性。
32.为了解决上述技术问题,本技术的发明构思是:电子设备可以将待检测人脸视频输入人脸图像重建模型,并通过人脸图像重建模型根据第一真实人脸特征和待检测人脸视
频对应的第一待检测人脸视频帧的第一初始特征,得到第一重建人脸图像,通过第一重建人脸图像和第一待检测人脸视频帧的差异检测待检测人脸视频是否是伪造人脸视频,其中,人脸图像重建模型是通过真实人脸视频训练得到的。
33.应理解的是,本技术技术方案可以应用于如下场景,但不限于:
34.本技术技术方案可以应用于各种人脸伪造检测场景中。例如,人脸伪造检测场景可以是对上传至视频播放器中的人脸视频进行审核的场景,也可以是需要根据用户本人的人脸视频来确认商品交易信息的商品交易场景。
35.下面将对本技术实施例涉及的系统架构进行介绍:
36.图1为本技术实施例提供的一种系统构架示意图。如图1所示,该系统架构可以包括:用户设备101、数据采集设备102、训练设备103、执行设备104、数据库105和内容库106。
37.其中,数据采集设备102用于从内容库106中读取真实人脸视频,并将读取的真实人脸视频存储至数据库105中。
38.训练设备103基于数据库105中维护的真实人脸视频,对人脸图像重建模型进行训练,使得训练后的人脸图像重建模型可以准确地输出该真实人脸视频对应的重建人脸图像。训练设备103得到的人脸图像重建模型可以应用到不同的系统或设备中。
39.另外,如图1所示,执行设备104配置有i/o接口107,与外部设备进行数据交互。比如通过i/o接口接收用户设备101发送的待检测人脸视频。执行设备104中的计算模块109使用训练好的人脸图像重建模型对输入的待检测人脸视频进行处理,输出待检测人脸视频对应的重建人脸图像,并通过i/o接口将输出的重建人脸图像发送至用户设备101。用户设备101可以根据重建人脸图像和待检测人脸视频对应的待检测人脸视频帧的差异检测待检测人脸视频是否为伪造人脸视频,其中,待检测人脸视频对应的待检测人脸视频帧可以是用户设备101根据待检测人脸视频生成的,或者,执行设备104中的计算模块109可以使用训练好的人脸图像重建模型对输入的待检测人脸视频进行帧采样,得到待检测人脸视频对应的待检测人脸视频帧,并通过i/o接口将得到的待检测人脸视频帧发送至用户设备101,本技术对此不做限制。
40.其中,用户设备101可以包括手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device,mid)或其他具有安装浏览器功能的终端设备。
41.执行设备104可以为服务器。可选地,服务器可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备。该服务器可以是独立的测试服务器,也可以是多个测试服务器所组成的测试服务器集。
42.执行设备104可以通过网络与用户设备101连接。上述网络可以是企业内部网(intranet)、互联网(internet)、全球移动通讯系统(global system of mobile communication,gsm)、宽带码分多址(wideband code division multiple access,wcdma)、4g网络、5g网络、蓝牙(bluetooth)、wi-fi、通话网络等无线或有线网络。
43.需要说明的是,图1中所示设备、器件、模块等之间的位置关系不构成任何限制。可选地,上述数据采集设备102与用户设备101、训练设备103和执行设备104可以为同一个设备,上述数据库105可以分布在一个服务器上也可以分布在多个服务器上,上述的内容库106可以分布在一个服务器上也可以分布在多个服务器上,本技术对此不做限制。
44.下面将对本技术技术方案进行详细阐述:
45.图2为本技术实施例提供的一种人脸伪造检测方法的流程图,该方法可以由电子设备执行,例如,该电子设备可以是图1中的执行设备。此外,该电子设备也可以是处理器等,本技术对此不做限制。如图2所示,该方法可以包括:
46.s201:获取待检测人脸视频;
47.s202:将待检测人脸视频输入至人脸图像重建模型;
48.s203:通过人脸图像重建模型对待检测人脸视频进行帧采样,得到待检测人脸视频在当前分辨率下的n个第一待检测人脸视频帧,人脸图像重建模型是通过真实人脸视频训练得到的,n为正整数;
49.s204:通过人脸图像重建模型对n个第一待检测人脸视频帧进行特征提取,得到n个待检测人脸视频帧的至少一个第一初始特征;
50.s205:通过人脸图像重建模型根据至少一个第一真实人脸特征和至少一个第一初始特征,确定第一重建人脸图像特征;
51.s206:通过人脸图像重建模型根据第一重建人脸图像特征,得到n个第一重建人脸图像;
52.s207:根据n个第一待检测人脸视频帧和n个第一重建人脸图像的差异检测待检测人脸视频是否为伪造人脸视频。
53.在一些可实现方式中,待检测人脸视频可以是电子设备从视频播放器上获取的某一人脸视频,也可以是在某一商品交易场景下,电子设备获取的用户人脸认证视频,本技术对此不做限制。
54.在一些可实现方式中,如图3所示,电子设备可以先获取待检测人脸视频,然后,电子设备可以将待检测人脸视频输入人脸图像重建模型,该人脸图像重建模型可以包括:帧采样模块、编码器、组合模块、解码器,接着,电子设备可以通过人脸图像重建模型的帧采样模块对待检测人脸视频进行帧采样,得到待检测人脸视频在当前分辨率下的3个第一待检测人脸视频帧,接着,电子设备可以通过人脸图像重建模型的编码器对上述3个第一待检测人脸视频帧进行特征提取,得到3个待检测人脸视频帧的多个第一初始特征,接着,电子设备可以通过人脸图像重建模型的组合模块将多个第一真实人脸特征和上述多个第一初始特征进行组合,确定第一重建人脸图像特征,然后,电子设备可以通过人脸图像重建模型的解码器根据第一重建人脸图像特征得到3个第一重建人脸图像,最后,电子设备可以根据上述3个第一待检测人脸视频帧和上述3个第一重建人脸图像的差异检测待检测人脸视频是否为伪造人脸视频。
55.示例性的,待检测人脸视频帧的至少一个第一初始特征可以包括空间分布特征和/或时间分布特征,其中,空间分布特征包括每个待检测人脸视频帧包括的人脸特征,如脸部边缘特征、脸部五官特征、脸部阴影特征、脸部扭曲特征等;时间分布特征包括多个待检测人脸视频帧的空间分布特征在时间上的分布特征,如多个待检测人脸视频帧的脸部边缘特征在时间上的分布特征、多个待检测人脸视频帧的脸部五官特征在时间上的分布特征等,本技术对此不做限制。类似的,第一真实人脸特征也可以包括空间分布特征和/或时间分布特征,第一重建人脸图像特征也可以包括空间分布特征和/或时间分布特征,本技术对此不做赘述。
56.示例性的,电子设备通过人脸图像重建模型对待检测人脸视频进行的帧采样可以
是较稀疏的帧采样,例如,假设待检测人脸视频是一个100秒、帧率为30fps的视频,电子设备通过人脸图像重建模型对待检测人脸视频进行帧采样时,可以选择帧采样间隔为10秒,每秒采样1帧,得到10个待检测人脸视频帧;或者,也可以选择帧采样间隔为5秒,每秒采样1帧,得到20个待检测人脸视频帧。如此一来,可以使得到的相邻待检测人脸视频帧间的相似性较低,进而使得人脸图像重建模型提取到的相邻待检测人脸视频帧各自的空间分布特征的相似性较低,从而可以使人脸图像重建模型提取到较丰富的待检测人脸视频帧的时间分布特征,那么得到的第一重建人脸图像就会更准确,可以进一步提高人脸伪造检测的准确性。类似的,在对人脸图像重建模型进行训练时,也可以对真实人脸视频进行较稀疏的帧采样,可以增加人脸图像重建模型提取特征的难度,提高人脸图像重建模型的学习能力,防止模型退化,还可以在应用人脸图像重建模型时,使通过较稀疏的帧采样可以得到较好的输出结果,而不是过于拟合通过较密集的帧采样得到的输出结果,即可以实现对人脸图像模型的正则,防止陷入局部极小点。
57.需要说明的是,第一真实人脸特征是电子设备根据多个真实人脸图像或者多个真实人脸视频得到的,例如,电子设备可以先获取多个真实人脸图像,再对该多个真实人脸图像进行特征提取,得到第一真实人脸特征。
58.示例性的,电子设备可以将第一真实人脸特征存储在电子设备的本地数据库或者云端数据库,在电子设备通过人脸图像重建模型的组合模块将第一真实人脸特征和第一初始特征进行组合前,电子设备可以先通过组合模块从电子设备的本地数据库或者云端数据库读取第一真实人脸特征,然后,电子设备可以通过组合模块将读取的第一真实人脸特征和第一初始特征进行组合;或者,电子设备也可以在通过人脸图像重建模型的组合模块将第一真实人脸特征和第一初始特征进行组合前,将第一真实人脸特征输入人脸图像重建模型,那么电子设备可以直接通过组合模块将第一真实人脸特征和第一初始特征进行组合,本技术对此不做限制。
59.示例性的,电子设备通过人脸图像重建模型的组合模块将多个真实人脸特征和多个第一初始特征进行组合可以是将多个真实人脸特征和多个第一初始特征进行拼接,但不限于此。
60.在上述实施例中,人脸图像重建模型根据第一真实人脸特征和第一初始特征确定第一重建人脸图像特征可以抑制模型的泛化性,其中,模型的泛化性可以理解为:经过训练的模型可以对输入的新数据做出较准确的预测能力。可以理解的是,若电子设备通过人脸图像重建模型仅根据第一初始特征确定第一重建人脸图像特征,则会由于模型的泛化性以及第一初始特征是对待检测人脸视频帧进行特征提取得到的,导致人脸图像重建模型可以根据仅由第一初始特征确定的第一重建人脸图像特征,得到和待检测人脸视频帧差异较小的第一重建人脸图像,那么在待检测人脸视频是伪造人脸视频时,电子设备可能会因为判断第一重建人脸图像和待检测人脸视频帧的差异较小,而判断该待检测人脸视频不是伪造人脸视频,显然这会影响人脸伪造检测的准确性。但是,在第一重建人脸图像特征是人脸图像重建模型对第一真实人脸特征和第一初始特征进行组合确定的时,若待检测人脸视频是伪造人脸视频,虽然第一初始特征是对待检测人脸视频帧即伪造人脸视频帧进行特征提取得到的,但是由于第一真实人脸特征是根据真实人脸图像得到的,所以根据第一真实人脸特征和第一初始特征进行组合确定的第一重建人脸图像特征是接近真实人脸特征的,从而
使得根据该第一重建人脸图像特征确定的第一重建人脸图像是接近真实人脸图像的,那么对于属于伪造人脸视频的待检测人脸视频,电子设备可以判断出该待检测人脸视频和接近真实人脸图像的第一重建人脸图像是有较大差异的,从而可以判断待检测人脸视频是伪造人脸视频。所以根据第一真实人脸特征和第一初始特征确定第一重建人脸图像特征可以防止第一重建人脸图像过于接近伪造人脸图像,而影响电子设备对待检测人脸视频是否是伪造人脸视频的检测,即可以抑制模型的泛化性,提高人脸伪造检测的准确性。
61.需要说明的是,编码器对待检测人脸视频帧进行特征提取后得到的待检测人脸视频帧的第一初始特征可以是特征向量的形式,该特征向量可以表达待检测人脸视频帧中的图片信息,如脸部边缘信息、脸部五官信息、脸部阴影信息、脸部扭曲信息等,类似的,第一真实人脸特征也可以是特征向量的形式,该特征向量可以表达第一真实人脸的脸部边缘信息等信息,第一重建人脸图像特征也可以是特征向量的形式,该特征向量可以表达第一重建人脸图像的脸部边缘信息、脸部五官信息、脸部阴影信息、脸部扭曲信息等,那么解码器根据第一重建人脸图像特征得到第一重建人脸图像,具体可以是:解码器可以识别第一重建人脸图像特征对应的特征向量表达的脸部边缘信息、脸部五官信息、脸部阴影信息、脸部扭曲信息等重建人脸图像信息,然后,解码器可以根据识别的重建人脸图像信息绘制像素点,从而得到第一重建人脸图像。
62.示例性的,编码器和解码器可以采用基于转换器(transformer)的结构,也可以采用基于卷积神经网络(convolutional neural networks,cnn)的结构,本技术对此不做限制。
63.在上述实施例中,电子设备可以先获取待检测人脸视频,然后,电子设备可以将待检测人脸视频输入至人脸图像重建模型,以通过该人脸图像重建模型对待检测人脸视频进行帧采样,得到待检测人脸视频在当前分辨率下的n个第一待检测人脸视频帧,对n个第一待检测人脸视频帧进行特征提取,得到n个待检测人脸视频帧的至少一个第一初始特征,根据至少一个第一真实人脸特征和至少一个第一初始特征确定第一重建人脸图像特征,根据第一重建人脸图像特征,得到n个第一重建人脸图像,n为正整数,最后,电子设备可以根据n个第一待检测人脸视频帧和n个第一重建人脸图像的差异检测待检测人脸视频是否为伪造人脸视频,其中,人脸图像重建模型是通过真实人脸视频训练得到的。相比于现有技术中需要先确定真实人脸视频样本的特征在特征空间上的分布,再通过判断待检测人脸视频的特征是否偏离该分布的中心来确定待检测人脸视频是否是伪造人脸视频的方法,本技术提供的技术方案无需根据上述分布中心来确定待检测人脸视频是否为伪造人脸视频,从而可以解决由于存在多个分布中心而影响人脸伪造检测准确性的问题,以提高人脸伪造检测的准确性。在上述过程中,由于人脸图像重建模型是通过真实人脸视频训练得到,而且人脸图像重建模型确定第一重建人脸图像特征时使用了第一真实人脸特征,所以第一重建人脸图像特征是比较接近真实人脸特征的,因此,电子设备通过上述人脸图像重建模型得到的第一重建人脸图像是较接近真实人脸图像的,基于此,对于属于伪造人脸视频的待检测人脸视频,在电子设备将其输入上述人脸图像重建模型后,可以得到接近真实人脸图像的第一重建人脸图像,显然该接近真实人脸图像的第一重建人脸图像和上述属于伪造人脸视频的待检测人脸视频对应的第一待检测人脸视频帧存在较大差异,那么电子设备可以根据该差异检测出上述待检测人脸视频是伪造人脸视频;类似的,对于属于真实人脸视频的待检测人
脸视频,在电子设备将其输入上述人脸图像重建模型后,可以得到接近真实人脸图像的第一重建人脸图像,那么电子设备可以根据该接近真实人脸图像的第一重建人脸图像和上述待检测人脸视频对应的第一待检测人脸视频帧的较小差异检测出上述待检测人脸视频不是伪造人脸视频,也就是说,通过本技术技术方案,电子设备可以较为准确地检测出待检测人脸视频是否是伪造人脸视频,即可以提高人脸伪造检测的准确性。
64.在一些可实现方式中,电子设备在通过人脸图像重建模型的编码器对n个第一待检测人脸视频帧进行特征提取,得到n个第一待检测人脸视频帧的至少一个初始特征之前,电子设备可以先对n个第一待检测人脸视频帧进行进行预编码即预特征提取,得到n个第一待检测人脸视频帧的原始特征,然后,电子设备可以将n个第一待检测人脸视频帧的原始特征输入编码器,得到至少一个初始特征,其中,原始特征的格式符合编码器的输入数据格式,以使得编码器可以更好地进行特征提取。
65.在一些可实现方式中,电子设备通过人脸图像重建模型对待检测人脸视频进行帧采样时,可以基于人脸检测器进行帧采样,以保证n个第一待检测人脸视频帧中每个第一待检测人脸视频帧的人脸是一致的即保证帧对齐,进一步提高人脸伪造检测的准确性。
66.图4为本技术实施例提供的另一种人脸伪造检测方法的流程图,基于图2,如图4所示,上述s204之前,还包括:
67.s401:通过人脸图像重建模型将n个第一待检测人脸视频帧中的每个第一待检测人脸视频帧划分为多个区域,n为正整数;
68.s402:通过人脸图像重建模型擦除n个第一待检测人脸视频帧中至少一个区域;
69.s403:通过人脸图像重建模型确定第一类型区域和第二类型区域,第一类型区域是在n个第一待检测人脸视频帧中均被擦除的同一区域,第二类型区域是多个区域中除第一类型区域以外的区域;
70.s404:通过人脸图像重建模型确定第一类型区域的位置编码;
71.s405:通过人脸图像重建模型将第二真实人脸特征和第一类型区域的位置编码进行拼接,得到第一类型区域的特征。
72.相应的,如图4所示,上述s204可以包括:
73.s406:通过人脸图像重建模型对n个第一待检测人脸视频帧中的第二类型区域进行特征提取,得到至少一个第一初始特征。
74.相应的,如图4所示,上述s205可以包括:
75.s407:通过人脸图像重建模型根据第一类型区域的特征、至少一个第一真实人脸特征和至少一个第一初始特征确定第一重建人脸图像特征。
76.在一些可实现方式中,如图5所示,电子设备可以先获取待检测人脸视频,然后,电子设备可以将待检测人脸视频输入人脸图像重建模型,该人脸图像重建模型可以包括:帧采样模块、擦除模块、编码器、组合模块、解码器,接着,电子设备可以通过人脸图像重建模型的帧采样模块对待检测人脸视频进行帧采样,得到待检测人脸视频在当前分辨率下的3个第一待检测人脸视频帧,接着,电子设备可以通过人脸图像重建模型的擦除模块将上述3个第一待检测人脸视频帧中的每个第一待检测人脸视频帧划分为多个区域,并擦除3个第一待检测人脸视频帧中至少一个区域,接着,电子设备可以通过人脸图像重建模型的擦除模块确定第一类型区域和第二类型区域,第一类型区域是在3个第一待检测人脸视频帧中
均被擦除的同一区域,第二类型区域是多个区域中除第一类型区域以外的区域,接着,电子设备可以通过人脸图像重建模型的编码器确定第一类型区域的位置编码,并通过人脸图像重建模型的组合模块将第二真实人脸特征和第一类型区域的位置编码进行拼接,得到第一类型区域的特征,接着,电子设备可以通过人脸图像重建模型的编码器对3个第一待检测人脸视频帧中的第二类型区域进行特征提取,得到多个第一初始特征,接着,电子设备可以通过人脸图像重建模型的组合模块将第一类型区域的特征、多个第一真实人脸特征和多个第一初始特征进行组合,确定第一重建人脸图像特征,然后,电子设备可以通过人脸图像重建模型的解码器根据第一重建人脸图像特征得到3个第一重建人脸图像,最后,电子设备可以根据上述3个第一待检测人脸视频帧和上述3个第一重建人脸图像的差异检测待检测人脸视频是否为伪造人脸视频。
77.示例性的,电子设备通过人脸图像重建模型的组合模块将第一类型区域的特征、多个第一真实人脸特征和多个第一初始特征进行组合可以是将第一类型区域的特征、多个第一真实人脸特征和多个第一初始特征进行拼接,但不限于此。
78.可以理解的是,为了便于电子设备根据第一待检测人脸视频帧和第一重建人脸图像的差异检测待检测人脸视频是否为伪造人脸视频,电子设备得到的第一重建人脸图像的数量应该和第一待检测人脸视频帧的数量是一致,所以用于构建第一重建人脸图像的第一重建人脸图像特征的数量应该和第一待检测人脸视频帧在没有被擦除时的第一初始特征的数量是一致,而由于在擦除第一待检测人脸视频帧中的第一类型区域后,编码器得到的第一初始特征的数量会变少,所以电子设备需要生成第一类型区域的特征,以使得第一重建人脸图像特征的数量和第一待检测人脸视频帧在没有被擦除时的第一初始特征的数量一致。如图5中的第一初始特征对应的“9个方块”所示,第一待检测人脸视频帧在没有被擦除时的第一初始特征的数量是“9”,如图6中的第一初始特征对应的“6个方块”所示,在对第一待检测视频帧的第一类型区域进行擦除后,编码器得到的第一初始特征的数量会减少为“6”,所以,如图6中的第一类型区域的特征对应的“3个方块”所示,电子设备需要生成第一类型区域的特征的数量为“3”。
79.需要说明的是,第二真实人脸特征是电子设备根据多个真实人脸图像或者多个真实人脸视频得到的,例如,电子设备可以先获取多个真实人脸图像,再通过编码器对该多个真实人脸图像进行特征提取,得到第二真实人脸特征。类似于第一初始特征,第二真实人脸图像特征也可以包括空间分布特征和/或时间分布特征。
80.示例性的,电子设备可以将第二真实人脸特征存储在电子设备的本地数据库或者云端数据库,在电子设备通过人脸图像重建模型的组合模块将第二真实人脸特征和第一类型区域的位置编码进行拼接前,电子设备可以先通过组合模块从电子设备的本地数据库或者云端数据库读取第二真实人脸特征,然后,电子设备可以通过组合模块将读取的第二真实人脸特征和第一类型区域的位置编码进行拼接;或者,电子设备也可以在通过人脸图像重建模型的组合模块将第二真实人脸特征和第一类型区域的位置编码进行拼接前,将第二真实人脸特征输入人脸图像重建模型,那么电子设备可以直接通过组合模块将第二真实人脸特征和第一类型区域的位置编码进行拼接,本技术对此不做限制。
81.示例性的,电子设备可以根据第一类型区域在第一待检测人脸视频帧中的位置信息,通过编码器确定第一类型区域的位置编码,但不限于此。可以理解的是,位置编码可以
表示图像中某一区域在该图像中的位置信息。
82.在上述实施例中,通过对第一类型区域的位置编码和第二真实人脸特征进行拼接,得到第一类型区域的特征,不仅可以补充在擦除第一待检测人脸视频帧的第一类型区域后第一重建人脸图像特征中“缺失的特征”,还可以使“补充”后的第一重建人脸图像特征更接近真实人脸特征,使得到的第一重建人脸图像更接近真实人脸,进一步提高人脸伪造检测的准确性。
83.示例性的,如图6中的(a)所示,电子设备可以通过擦除模块可以将3个第一待检测人脸视频帧中的每个第一待检测人脸视频帧划分为9个区域,每个区域的序号如图6中的(a)中的数字所示,接着,如图6中的(b)中的斜线所示,电子设备可以通过擦除模块擦除第一待检测人脸视频帧1中的区域1、区域3、区域5,得到擦除后的第一待检测人脸视频帧1,类似的,电子设备可以通过擦除模块擦除第一待检测人脸视频帧2中的区域1、区域5,得到擦除后的第一待检测人脸视频帧2,电子设备可以通过擦除模块擦除第一待检测人脸视频帧3中的区域1、区域6、区域8,得到擦除后的第一待检测人脸视频帧3,显然,每个第一待检测人脸视频帧中的区域1都被擦除,所以电子设备可以通过擦除模块确定第一类型区域为上述3个第一待检测人脸视频帧中的区域1,第二类型区域是上述3个第一待检测人脸视频帧中的区域2、区域3、区域4、区域5、区域6、区域7、区域8、区域9。当然,电子设备在擦除至少一个区域时,可以先确定擦除比例,如80%,然后按照擦除比例对第一待检测人脸视频帧进行擦除。
84.需要说明的是,本技术对电子设备将n个第一待检测人脸视频帧中的每个第一待检测人脸视频帧划分为多个区域的方式、擦除n个第一待检测人脸视频帧中至少一个区域的方式不做限制。
85.可以理解的是,在电子设备擦除第一待检测人脸视频帧中的多个区域后,每个待检测人脸视频帧中的图片信息会变少,那么每个待检测人脸视频帧的空间分布特征会变少,进而使得人脸图像重建模型可以提取到更丰富的待检测人脸视频帧的时间分布特征,那么得到的第一重建人脸图像就会更准确,可以进一步提高人脸伪造检测的准确性。类似的,在对人脸图像重建模型进行训练时,也可以对真实人脸视频进行擦除,以增加人脸图像重建模型提取特征的难度,提高人脸图像重建模型的学习能力,防止模型退化。
86.在一些可实现方式中,电子设备在根据第一类型区域的特征、至少一个第一真实人脸特征和至少一个第一初始特征确定第一重建人脸图像特征时,可以针对至少一个第一初始特征中的每个第一初始特征,确定至少一个第一真实人脸特征中每个第一真实人脸特征的权重,根据每个第一真实人脸特征的权重对每个第一真实人脸特征进行加权求和,得到第二重建人脸图像特征,将第一初始特征和第二重建人脸图像特征进行拼接,得到第三重建人脸图像特征,并根据第一类型区域的特征和至少一个第一初始特征分别对应的第三重建人脸图像特征确定第一重建人脸图像特征。
87.示例性的,电子设备根据第一类型区域的特征和至少一个第一初始特征分别对应的第三重建人脸图像特征确定第一重建人脸图像特征时,可以对第一类型区域的特征和至少一个第一初始特征分别对应的第三重建人脸图像特征进行组合,得到第一重建人脸图像特征,但不限于此。
88.示例性的,电子设备确定至少一个第一真实人脸特征中每个第一真实人脸特征的
权重时,可以先计算第一初始特征和每个第一真实人脸特征的相似度,再将第一初始特征和每个第一真实人脸特征的相似度转换为每个第一真实人脸特征的权重。或者,电子设备可以将任一数值确定为至少一个第一真实人脸特征中每个第一真实人脸特征的权重。
89.示例性的,本技术在此以至少一个第一初始特征中的第一初始特征q1为例,对电子设备确定第三重建人脸图像特征进行介绍,对于根据至少一个第一初始特征中的其他第一初始特征确定第三重建人脸图像特征的方法,和此处类似,本技术在此不再赘述。如图7所示,对于第一初始特征q1,电子设备可以计算第一初始特征q1和第一真实人脸特征pi的相似度,i=1,2,
……
,i,i为正整数,i表示至少一个第一真实人脸特征包括的第一真实人脸特征的数量,例如电子设备可以通过注意力机制来计算该相似性,但不限于此。然后,电子设备可以通过softmax将该相似度转换为第一真实人脸特征pi的权重wi,然后,电子设备可以根据第一真实人脸特征pi的权重wi对第一真实人脸特征pi进行加权求和,得到第二重建人脸图像特征p1。
90.示例性的,在得到至少一个第一初始特征分别对应的第三重建人脸图像特征后,如图7所示,电子设备可以对第一类型区域的特征和至少一个第一初始特征分别对应的第三重建人脸图像特征进行组合,得到第一重建人脸图像特征。
91.应理解的是,本技术对电子设备在根据第一类型区域的特征、至少一个第一真实人脸特征和至少一个第一初始特征确定第一重建人脸图像特征的方式不做限制。
92.可以理解的是,电子设备在根据至少一个第一真实人脸特征和至少一个第一初始特征确定第一重建人脸图像特征时,可以和上述确定第三重建人脸图像特征的方式类似:针对至少一个第一初始特征中的每个第一初始特征,电子设备可以确定至少一个第一真实人脸特征中每个第一真实人脸特征的权重,根据每个第一真实人脸特征的权重对每个第一真实人脸特征进行加权求和,得到该第一初始特征对应的重建人脸图像特征,将第一初始特征和该第一初始特征对应的重建人脸图像特征进行拼接,得到第三重建人脸图像特征。
93.图8为本技术实施例提供的再一种人脸伪造检测方法的流程图,基于图2,如图8所示,上述s207可以包括:
94.s801:计算n个第一待检测人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的平方,n为正整数;
95.s802:根据n个第一待检测人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的平方确定第一重建误差;
96.s803:根据第一重建误差检测待检测人脸视频是否为伪造人脸视频。
97.在一些可实现方式中,电子设备还可以根据n个第一待检测人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的绝对值来确定第一重建误差,或者,电子设备可以根据n个第一待检测人脸视频帧中每个像素点的像素值和n个第一重建人脸图像中对应像素点的像素值的差值的绝对值来确定第一重建误差,还可以根据n个第一待检测人脸视频帧中每个像素点的像素值和n个第一重建人脸图像中对应像素点的像素值的差值的平方来确定第一重建误差,本技术对此不做限制。
98.可以理解的是,一张图像中每个像素的颜都由红(red)、绿(green)、蓝(blue)三基叠加而形成,三基中的每种颜都有256个亮度等级,因此,不同亮度的三基组合可形成256*256*256=16777216种颜。像素点的rgb值可以表示构成该像素点的
颜中红、绿、蓝各自的亮度,例如,某一像素点的rgb值=(11,22,33)表示构成该像素点的颜中的红、绿、蓝各自的亮度分别为11、22、33。对于有差异的两张图像,一定会存在至少一对对应像素点的rgb值存在差异,那么电子设备就可以根据n个第一待检测人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差异如差值的平方,确定出n个第一待检测人脸视频帧和n个第一重建人脸图像的第一重建误差,从而可以根据第一重建误差检测待检测人脸视频是否为伪造人脸视频。
99.可以理解的是,像素点的像素值表示该像素的平均亮度信息,对于有差异的两张图像,一定会存在至少一对对应像素点的像素值存在差异,那么电子设备就可以根据n个第一待检测人脸视频帧中每个像素点的像素值和n个第一重建人脸图像中对应像素点的像素值的差异如差值的平方,确定出n个第一待检测人脸视频帧和n个第一重建人脸图像的第一重建误差,从而可以根据第一重建误差检测待检测人脸视频是否为伪造人脸视频。
100.示例性的,本技术在此对计算n个第一待检测人脸视频帧中第一个第一待检测人脸视频帧的左上角第一个像素点的rgb值和n个第一重建人脸图像中第一个第一重建人脸图像的左上角第一个像素点的rgb值的差值的平方的方法进行介绍,对于计算n个第一待检测人脸视频帧和n个第一重建人脸图像中其他像素点之间的差值的平方的方法和此处类似,本技术在此不再赘述。假设第一个第一待检测人脸视频帧的左上角第一个像素点的rgb值为(11,22,33),第一个第一重建人脸图像的左上角第一个像素点的rgb值为(10,20,30),那么其差值的平方为[(11,22,33)-(10,20,30)]*[(11,22,33)-(10,20,30)]=(1,4,9)。
[0101]
示例性的,电子设备根据n个第一待检测人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的平方确定第一重建误差,可以通过以下方式实现:计算n个第一待检测人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的平方之和,得到第一重建误差。当然,电子设备也可以对上述全部的对应像素点的差值的平方取平均值,然后根据求取的平均值来确定第一重构误差。例如,假设有1个第一待检测人脸视频帧和1个第一重建人脸图像,其分别有3个像素点,电子设备可以计算得到第1对对应的像素点的rgb值的差值的平方为(3,3,9),第2对对应的像素点的rgb值的差值的平方为(0,0,0),第3对对应的像素点的rgb值的差值的平方为(3,0,0),那么电子设备可以计算这3对对应像素点的rgb值的差值的平方之和为(6,3,9),这3对对应像素点的rgb值的差值的平方的平均值为(2,1,3),那么电子设备可以将(6,3,9)确定为第一重建误差,也可以将(2,1,3)确定为第一重构误差。
[0102]
需要说明的是,电子设备根据n个第一待检测人脸视频帧中每个像素点的像素值和n个第一重建人脸图像中对应像素点的像素值的差异,确定第一重构误差时,可以根据对上述差异的求和、平均值、中值、最大值、最小值来确定第一重构误差,这和上述根据n个第一待检测人脸视频帧和n个第一重建人脸图像中对应像素点的rgb值确定第一重构误差的方法类似,本技术在此不再赘述。
[0103]
需要说明的是,本技术对电子设备得到第一重建误差的方式不做限制。
[0104]
示例性的,电子设备根据第一重建误差检测待检测人脸视频是否为伪造人脸视频具体可以包括:电子设备可以先设定第一预设阈值,然后电子设备可以通过比较第一预设阈值和第一重建误差来确定待检测人脸视频是否为伪造人脸视频,若第一重建误差大于第一预设阈值,则确定待检测人脸视频为伪造人脸视频;若第一重建误差小于或等于第一预
设阈值,则确定待检测人脸视频不是伪造人脸视频。例如,假设第一预设阈值为(5,5,5),若第一重建误差为(6,6,9),那么电子设备可以确定第一重构误差大于第一预设阈值,从而可以确定待检测人脸视频为伪造人脸视频;若第一重建误差为(1,1,1),那么电子设备可以确定第一重构误差小于第一预设阈值,从而可以确定待检测人脸视频为伪造人脸视频。
[0105]
图9为本技术实施例提供的又一种人脸伪造检测方法的流程图,基于图2,如图9所示,上述s207之前,还包括:
[0106]
s901:通过人脸图像重建模型将n个第一待检测人脸视频帧调整为m组第二待检测人脸视频帧,m组第二待检测人脸视频帧中每组第二待检测人脸视频帧包括n个第二待检测人脸视频帧,且每组第二待检测人脸视频帧与n个第一待检测人脸视频帧的分辨率不同,m为正整数,n为正整数;
[0107]
s902:针对每组第二待检测人脸视频帧,通过人脸图像重建模型对该组第二待检测人脸视频帧进行特征提取,得到该组第二待检测人脸视频帧的至少一个第二初始特征,根据至少一个第一真实人脸特征和至少一个第二初始特征确定第四重建人脸图像特征,根据第四重建人脸图像特征确定n个第二重建人脸图像。
[0108]
相应的,如图9所示,上述s207可以包括:
[0109]
s903:根据n个第一待检测人脸视频帧、n个第一重建人脸图像、m组第二待检测人脸视频帧和m组第二待检测人脸视频帧分别对应的n个第二重建人脸图像,检测待检测人脸视频是否为伪造人脸视频。
[0110]
在一些可实现方式中,假设3个第一待检测人脸视频帧的分辨率为640*480,那么,电子设备可以通过人脸图像重建模型将上述3个第一待检测人脸视频帧调整为2组第二待检测人脸视频帧,第1组第二待检测人脸视频帧包括3个分辨率为1280*720第二待检测人脸视频帧,第2组第二待检测人脸视频帧包括3个分辨率为320*240第二待检测人脸视频帧。
[0111]
在一些可实现方式中,可以将电子设备通过人脸图像重建模型调整第一待检测人脸视频帧的分辨率理解为:电子设备通过人脸图像重建模型调整第一待检测人脸视频帧的尺度,尺度可以表示待检测人脸视频帧的分辨率。例如,假设n个第一待检测人脸视频帧的尺度为1,那么电子设备可以通过人脸图像重建模型将n个第一待检测人脸视频帧调整为m组第二待检测人脸视频帧,每组第二待检测人脸视频帧包括n个第二待检测人脸视频帧,n个第二待检测人脸视频帧的尺度可以是0.25、0.5、1.5、2.0等和1不同的尺度。
[0112]
需要说明的是,上述s902的解释说明、内容、效果等和上述s204、s205的解释说明、内容、效果等类似,至少一个第二初始特征和上述至少一个第一初始特征类似,第一重建人脸图像特征和第四重建人脸图像特征类似,本技术在此不做赘述。
[0113]
可以理解的是,图像的分辨率可以用于表示图像中存储的信息量,图像的分辨率可以表示为:水平像素数*垂直像素数,如图像的分辨率为640*480就表示该图像在水平方向上有640个像素点、在垂直方向上有480个像素点,由此可见,调整图像的分辨率可以改变图像包括的像素点数量和存储的信息量。那么可以理解的是,在上述实施例中,由于第二待检测人脸视频帧的分辨率和第一待检测人脸视频帧的分辨率不同,所以第二待检测人脸视频帧存储的信息量和第一待检测人脸视频帧存储的信息量不同,那么第二待检测人脸视频帧对应的第二初始特征就和第一待检测人脸视频帧对应的第一初始特征不同,例如,对于较第一待检测人脸视频帧的分辨率高的第二待检测人脸视频帧,其存储的信息量较多,如
该第二待检测人脸视频帧中的人脸五官信息、脸部阴影信息等更丰富,那么对应的第二初始特征更丰富。在第二待检测人脸视频帧对应的第二初始特征就和第一待检测人脸视频帧对应的第一初始特征不同时,电子设备通过人脸图像重建模型,根据该对应的第二初始特征和该对应的第一初始特征分别确定的重建人脸图像不同,例如,对于根据较第一待检测人脸视频帧的分辨率高的第二待检测人脸视频帧,由于其对应的第二初始特征更丰富,所以人脸图像重建模型根据其确定的重建人脸图像即第四重建人脸图像中的存储的信息量更丰富,如该重建人脸图像中的人脸五官信息、脸部阴影信息等更丰富。如此一来,电子设备可以通过人脸图像重建模型,根据不同分辨率下的待检测人脸视频帧确定出不同的多个重建人脸图像,该不同的多个重建人脸图像存储的人脸五官信息、脸部阴影信息等信息不同,则不同的多个重建人脸图像可以从不同程度接近真实人脸图像,所以上述实施例可以更准确地检测出待检测人脸视频是否是伪造人脸视频,即可以进一步提高人脸伪造检测的准确性。
[0114]
在一些可实现方式中,图10为本技术实施例提供的再一种人脸伪造检测方法的流程图,基于图9,如图10所示,上述s903可以包括:
[0115]
s1001:计算n个第一待检测人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的平方,n为正整数;
[0116]
s1002:根据n个第一待检测人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的平方确定第一重建误差;
[0117]
s1003:针对m组第二待检测人脸视频帧中的每组第二待检测人脸视频帧,计算该组第二待检测人脸视频帧中每个像素点的rgb值和对应的n个第二重建人脸图像中对应像素的rgb值的差值的平方,并根据该组第二待检测人脸视频帧中每个像素点的rgb值和对应的n个第二重建人脸图像中对应像素的rgb值的差值的平方确定第二重建误差,m为正整数;
[0118]
s1004:根据第一重建误差和m组第二待检测人脸视频帧分别对应的第二重建误差检测待检测人脸视频是否为伪造人脸视频。
[0119]
可以理解的是,对上述s1001、s1002、s1003的解释说明、内容、效果等和上述s801和s802的解释说明、内容、效果等类似,可以参考上述s801和s802的解释说明、内容、效果等,本技术在此不再赘述。
[0120]
在一些可实现方式中,上述s1004可以包括:计算第一重建误差和m组第二待检测人脸视频帧分别对应的第二重建误差之后,得到第三重建误差;根据第三重建误差检测待检测人脸视频是否为伪造人脸视频。例如,假设第一重构误差是(2,1,3),2组第二待检测人脸视频帧分别对应的第二重建误差为(0,1,1)、(1,1,0),那么电子设备可以确定第三重建误差为(3,3,4)。当然,电子设备也可以将对第一重建误差和m组第二待检测人脸视频帧分别对应的第二重建误差求取平均值或者中值、最大值、最小值的结果作为第三重建误差,本技术对此不做限制。
[0121]
示例性的,电子设备根据第三重建误差检测待检测人脸视频是否为伪造人脸视频具体可以包括:电子设备可以先设定第二预设阈值,然后电子设备可以通过比较第二预设阈值和第三重建误差来确定待检测人脸视频是否为伪造人脸视频,若第三重建误差大于第二预设阈值,则确定待检测人脸视频为伪造人脸视频;若第三重建误差小于或等于第二预设阈值,则确定待检测人脸视频不是伪造人脸视频。例如,假设第二预设阈值为(5,5,5),若
第三重建误差为(6,6,9),那么电子设备可以确定第三重构误差大于第二预设阈值,从而可以确定待检测人脸视频为伪造人脸视频;若第三重建误差为(1,1,1),那么电子设备可以确定第三重构误差小于第二预设阈值,从而可以确定待检测人脸视频为伪造人脸视频。
[0122]
图11为本技术实施例提供的又一种人脸伪造检测方法的流程图,基于图2,如图11所示,上述s206之后,还包括:
[0123]
s1101:针对至少一个第一真实人脸特征中的每个第一真实人脸特征,确定至少一个第一初始特征中每个第一初始特征的权重,根据每个第一初始特征的权重对每个第一初始特征进行加权求和,得到第三真实人脸特征,对第三真实人脸特征和第一真实人脸特征进行加权求和,得到第四真实人脸特征,将第一真实人脸特征更新为第四真实人脸特征。
[0124]
本技术在此以至少一个第一真实人脸特征中的第一真实人脸特征p1为例,对电子设备将第一真实人脸特征p1更新为第四真实人脸特征q1的方法进行介绍,对于电子设备更新其他第一真实人脸特征的方法,和此处类似,本技术在此不再赘述。
[0125]
在一些可实现方式中,如图12所示,对于第一真实人脸特征p1,电子设备可以计算第一真实人脸特征p1和第一初始特征qj的相似度,j=1,2,
……
,j,j为正整数,j表示至少一个第一初始特征包括的第一初始特征的数量,例如电子设备可以通过注意力机制来计算该相似性,但不限于此。然后,电子设备可以通过softmax将该相似度转换为第一初始特征qj的权重vj,然后,电子设备可以将第一初始特征qj映射为第一初始特征mj,以使第一初始特征mj的表达形式和第一真实人脸特征p1的表达形式一致,便于对其进行加权求和,然后,电子设备可以根据第一初始特征qj的权重vj即第一初始特征mj的权重vj对第一初始特征mj进行加权求和,得到第三真实人脸特征m1,然后,电子设备可以对第三真实人脸特征m1和第一真实人脸特征p1进行加权求和,得到第四真实人脸特征q1,最后,电子设备可以将第一真实人脸特征p1更新为第四真实人脸特征q1。
[0126]
在上述实施例中,电子设备可以使用根据第一初始特征和第一真实人脸特征确定的第四真实人脸特征更新第一真实人脸特征,从而使得更新后的第一真实人脸特征所表达的人脸信息具有普遍性,从而可以适用于针对各种待检测人脸视频的检测,提高人脸伪造检测的准确性和应用范围。
[0127]
下面对上述人脸图像重建模型的训练步骤进行说明:
[0128]
图13为本技术实施例提供的一种模型训练方法的流程图,该方法可以由上述电子设备执行,或者,该方法还可以由其他电子设备执行,例如,其他电子设备可以是图1中的训练设备,也可以是处理器等,本技术对此不做限制。如图13所示,该方法可以包括:
[0129]
s1301:获取真实人脸视频;
[0130]
s1302:将真实人脸视频输入至人脸图像重建模型;
[0131]
s1303:通过人脸图像重建模型对真实人脸视频进行帧采样,得到真实人脸视频在当前分辨率下的n个第一真实人脸视频帧,n为正整数;
[0132]
s1304:通过人脸图像重建模型对n个第一真实人脸视频帧进行特征提取,得到n个第一真实人脸视频帧的至少一个第一初始特征;
[0133]
s1305:通过人脸图像重建模型根据至少一个第一真实人脸特征和至少一个第一初始特征,确定第一重建人脸图像特征;
[0134]
s1306:通过人脸图像重建模型根据第一重建人脸图像特征,得到n个第一重建人
脸图像;
[0135]
s1307:根据n个第一真实人脸视频帧和n个第一重建人脸图像对人脸图像重建模型进行训练。
[0136]
可以理解的是,电子设备在训练人脸图像重建模型时,使用的是真实人脸视频,可以不用使用伪造人脸视频,从而可以不用对人脸视频进行标注,所以本技术提供的人脸图像重建模型属于无监督学习模型,而电子设备在训练人脸图像重建模型时,可以根据人脸图像重建模型的输入即真实人脸视频和人脸图像重建模型的输出即重建人脸图像训练人脸图像重建模型,所以本技术提供的人脸图像重建模型属于自监督学习模型。
[0137]
在一些可实现方式中,上述s1303之前,电子设备可以通过人脸图像重建模型将n个第一真实人脸视频帧中的每个第一真实人脸视频帧划分为多个区域,并擦除n个真实人脸视频帧中至少一个区域,然后,电子设备可以通过人脸图像重建模型确定第一类型区域和第二类型区域,第一类型区域是在n个第一真实人脸视频帧中均被擦除的同一区域,第二类型区域是多个区域中除第一类型区域以外的区域,接着,电子设备可以通过人脸图像重建模型确定第一类型区域的位置编码,将第二真实人脸特征和第一类型区域的位置编码进行拼接,得到第一类型区域的特征,相应的,上述s1304可以包括:对n个第一真实人脸视频帧中的第二类型区域进行特征提取,得到至少一个第一初始特征,相应的,上述s1305可以包括:根据述第一类型区域的特征、至少一个第一真实人脸特征和至少一个初始特征确定重建人脸图像特征。应理解的是,该人脸图像重建模型可以用于实现上述人脸伪造检测方法,此处内容和效果可参考上述人脸伪造检测方法,本技术对其内容和效果不再赘述。
[0138]
在一些可实现方式中,上述s1307可以包括:计算n个第一真实人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的平方;根据n个第一真实人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的平方确定第一重建误差;根据第一重建误差对人脸图像重建模型进行训练。应理解的是,该人脸图像重建模型可以用于实现上述人脸伪造检测方法,此处内容和效果可参考上述人脸伪造检测方法,本技术对其内容和效果不再赘述。
[0139]
在一些可实现方式中,上述s1307之前,可以包括:通过人脸图像重建模型将n个第一真实人脸视频帧调整为m组第二真实人脸视频帧,m组第二真实人脸视频帧中每组第二真实人脸视频帧包括n个第二真实人脸视频帧,且每组第二真实人脸视频帧与n个第一真实人脸视频帧的分辨率不同,m为正整数;针对每组第二真实人脸视频帧,通过人脸图像重建模型对该组第二真实人脸视频帧进行特征提取,得到该组第二真实人脸视频帧的至少一个第二初始特征,根据至少一个第一真实人脸特征和至少一个第二初始特征确定第四重建人脸图像特征,根据第四重建人脸图像特征确定n个第二重建人脸图像;相应的,上述s1307包括:根据n个第一真实人脸视频帧、n个第一重建人脸图像、m组第二真实人脸视频帧和m组第二真实人脸视频帧分别对应的n个第二重建人脸图像对人脸图像重建模型进行训练。应理解的是,该人脸图像重建模型可以用于实现上述人脸伪造检测方法,此处内容和效果可参考上述人脸伪造检测方法,本技术对其内容和效果不再赘述。
[0140]
在一些可实现方式中,上述s1306之后,还包括:针对至少一个第一真实人脸特征中的每个第一真实人脸特征,确定至少一个第一初始特征中每个第一初始特征的权重,根据每个第一初始特征的权重对每个第一初始特征进行加权求和,得到第三真实人脸特征,
对第三真实人脸特征和第一真实人脸特征进行加权求和,得到第四真实人脸特征,将第一真实人脸特征更新为第四真实人脸特征。应理解的是,该人脸图像重建模型可以用于实现上述人脸伪造检测方法,此处内容和效果可参考上述人脸伪造检测方法,本技术对其内容和效果不再赘述。
[0141]
应理解的是,该人脸图像重建模型可以用于实现上述人脸伪造检测方法,其内容和效果可参考上述人脸伪造检测方法,本技术对其内容和效果不再赘述。
[0142]
图14为本技术实施例提供的一种人脸伪造检测装置1400的示意图,如图14所示,该装置1400包括:获取模块1401、输入模块1402、处理模块1403、检测模块1404,其中,
[0143]
获取模块1401用于获取待检测人脸视频;
[0144]
输入模块1402用于将待检测人脸视频输入至人脸图像重建模型,处理模块1403用于通过人脸图像重建模型对待检测人脸视频进行帧采样,得到待检测人脸视频在当前分辨率下的n个第一待检测人脸视频帧,对n个第一待检测人脸视频帧进行特征提取,得到n个待检测人脸视频帧的至少一个第一初始特征,根据至少一个第一真实人脸特征和至少一个第一初始特征确定第一重建人脸图像特征,根据第一重建人脸图像特征,得到n个第一重建人脸图像,n为正整数;
[0145]
检测模块1404用于根据n个第一待检测人脸视频帧和n个第一重建人脸图像的差异检测待检测人脸视频是否为伪造人脸视频;
[0146]
其中,人脸图像重建模型是通过真实人脸视频训练得到的。
[0147]
在一些可实现方式中,装置1400还包括:划分模块1405、擦除模块1406、第一确定模块1407、第二确定模块1408、拼接模块1409,其中,划分模块1405用于将n个第一待检测人脸视频帧中的每个第一待检测人脸视频帧划分为多个区域;擦除模块1406用于擦除n个第一待检测人脸视频帧中至少一个区域;第一确定模块1407用于确定第一类型区域和第二类型区域,第一类型区域是在n个第一待检测人脸视频帧中均被擦除的同一区域,第二类型区域是多个区域中除第一类型区域以外的区域;第二确定模块1408用于确定第一类型区域的位置编码;拼接模块1409用于将第二真实人脸特征和第一类型区域的位置编码进行拼接,得到第一类型区域的特征;相应的,处理模块1403具体用于对n个第一待检测人脸视频帧中的第二类型区域进行特征提取,得到至少一个第一初始特征;相应的,处理模块1403具体用于根据第一类型区域的特征、至少一个第一真实人脸特征和至少一个第一初始特征确定第一重建人脸图像特征。
[0148]
在一些可实现方式中,处理模块1403具体用于针对至少一个第一初始特征中的每个第一初始特征,确定至少一个第一真实人脸特征中每个第一真实人脸特征的权重,根据每个第一真实人脸特征的权重对每个第一真实人脸特征进行加权求和,得到第二重建人脸图像特征,将第一初始特征和第二重建人脸图像特征进行拼接,得到第三重建人脸图像特征;根据第一类型区域的特征和至少一个第一初始特征分别对应的第三重建人脸图像特征确定第一重建人脸图像特征。
[0149]
在一些可实现方式中,处理模块1403具体用于对第一类型区域的特征和至少一个第一初始特征分别对应的第三重建人脸图像特征进行组合,得到第一重建人脸图像特征。
[0150]
在一些可实现方式中,处理模块1403具体用于计算第一初始特征和每个第一真实人脸特征的相似度;将第一初始特征和每个第一真实人脸特征的相似度转换为每个第一真
实人脸特征的权重。
[0151]
在一些可实现方式中,检测模块1404具体用于计算n个第一待检测人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的平方;根据n个第一待检测人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的平方确定第一重建误差;根据第一重建误差检测待检测人脸视频是否为伪造人脸视频。
[0152]
在一些可实现方式中,检测模块1404具体用于计算n个第一待检测人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的平方之和,得到第一重建误差。
[0153]
在一些可实现方式中,检测模块1404具体用于若第一重建误差大于第一预设阈值,则确定待检测人脸视频为伪造人脸视频;若第一重建误差小于或等于第一预设阈值,则确定待检测人脸视频不是伪造人脸视频。
[0154]
在一些可实现方式中,装置1400还包括:调整模块1410、提取模块1411、第三确定模块1412、第四确定模块1413,其中,调整模块1410用于通过人脸图像重建模型将n个第一待检测人脸视频帧调整为m组第二待检测人脸视频帧,m组第二待检测人脸视频帧中每组第二待检测人脸视频帧包括n个第二待检测人脸视频帧,且每组第二待检测人脸视频帧与n个第一待检测人脸视频帧的分辨率不同;针对每组第二待检测人脸视频帧,提取模块1411用于通过人脸图像重建模型对该组第二待检测人脸视频帧进行特征提取,得到该组第二待检测人脸视频帧的至少一个第二初始特征,第三确定模块1412用于根据至少一个第一真实人脸特征和至少一个第二初始特征确定第四重建人脸图像特征,第四确定模块1413用于根据第四重建人脸图像特征确定n个第二重建人脸图像;相应的,检测模块1404具体用于根据n个第一待检测人脸视频帧、n个第一重建人脸图像、m组第二待检测人脸视频帧和m组第二待检测人脸视频帧分别对应的n个第二重建人脸图像,检测待检测人脸视频是否为伪造人脸视频,m为正整数。
[0155]
在一些可实现方式中,检测模块1404具体用于计算n个第一待检测人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的平方;根据n个第一待检测人脸视频帧中每个像素点的rgb值和n个第一重建人脸图像中对应像素点的rgb值的差值的平方确定第一重建误差;针对m组第二待检测人脸视频帧中的每组第二待检测人脸视频帧,计算该组第二待检测人脸视频帧中每个像素点的rgb值和对应的n个第二重建人脸图像中对应像素的rgb值的差值的平方,并根据该组第二待检测人脸视频帧中每个像素点的rgb值和对应的n个第二重建人脸图像中对应像素的rgb值的差值的平方确定第二重建误差;根据第一重建误差和m组第二待检测人脸视频帧分别对应的第二重建误差检测待检测人脸视频是否为伪造人脸视频。
[0156]
在一些可实现方式中,检测模块1404具体用于计算第一重建误差和m组第二待检测人脸视频帧分别对应的第二重建误差之和,得到第三重建误差;根据第三重建误差检测待检测人脸视频是否为伪造人脸视频。
[0157]
在一些可实现方式中,检测模块1404具体用于若第三重建误差大于第二预设阈值,则确定待检测人脸视频为伪造人脸视频;若第三重建误差小于或等于第二预设阈值,则确定待检测人脸视频不是伪造人脸视频。
[0158]
在一些可实现方式中,装置1400还包括:第五确定模块1414、第一加权求和模块1415、第二加权求和模块1416、更新模块1417,其中,针对至少一个第一真实人脸特征中的每个第一真实人脸特征,第五确定模块1414用于确定至少一个第一初始特征中每个第一初始特征的权重,第一加权求和模块1415用于根据每个第一初始特征的权重对每个第一初始特征进行加权求和,得到第三真实人脸特征,第二加权求和模块1416用于对第三真实人脸特征和第一真实人脸特征进行加权求和,得到第四真实人脸特征,更新模块1417用于将第一真实人脸特征更新为第四真实人脸特征。
[0159]
应理解的是,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图14所示的装置1400可以执行上述方法实施例,并且装置1400中的各个模块的前述和其它操作和/或功能分别为了实现上述各个方法中的相应流程,为了简洁,在此不再赘述。
[0160]
上文中结合附图从功能模块的角度描述了本技术实施例的装置1400。应理解,该功能模块可以通过硬件形式实现,也可以通过软件形式的指令实现,还可以通过硬件和软件模块组合实现。具体地,本技术实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成,结合本技术实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。可选地,软件模块可以位于随机存储器,闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法实施例中的步骤。
[0161]
图15是本技术实施例提供的电子设备1500的示意性框图。
[0162]
如图15所示,该电子设备1500可包括:
[0163]
存储器1510和处理器1520,该存储器1510用于存储计算机程序,并将该程序代码传输给该处理器1520。换言之,该处理器1520可以从存储器1510中调用并运行计算机程序,以实现本技术实施例中的方法。
[0164]
例如,该处理器1520可用于根据该计算机程序中的指令执行上述方法实施例。
[0165]
在本技术的一些实施例中,该处理器1520可以包括但不限于:
[0166]
通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。
[0167]
在本技术的一些实施例中,该存储器1510包括但不限于:
[0168]
易失性存储器和/或非易失性存储器。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddr sdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同
步连接动态随机存取存储器(synch link dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,dr ram)。
[0169]
在本技术的一些实施例中,该计算机程序可以被分割成一个或多个模块,该一个或者多个模块被存储在该存储器1510中,并由该处理器1520执行,以完成本技术提供的方法。该一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述该计算机程序在该电子设备中的执行过程。
[0170]
如图15所示,该电子设备还可包括:
[0171]
收发器1530,该收发器1530可连接至该处理器1520或存储器1510。
[0172]
其中,处理器1520可以控制该收发器1530与其他设备进行通信,具体地,可以向其他设备发送信息或数据,或接收其他设备发送的信息或数据。收发器1530可以包括发射机和接收机。收发器1530还可以进一步包括天线,天线的数量可以为一个或多个。
[0173]
应当理解,该电子设备中的各个组件通过总线系统相连,其中,总线系统除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。
[0174]
本技术还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被计算机执行时使得该计算机能够执行上述方法实施例的方法。或者说,本技术实施例还提供一种包含指令的计算机程序产品,该指令被计算机执行时使得计算机执行上述方法实施例的方法。
[0175]
当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本技术实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,dvd))、或者半导体介质(例如固态硬盘(solid state disk,ssd))等。
[0176]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0177]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合
或通信连接,可以是电性,机械或其它的形式。
[0178]
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。例如,在本技术各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
[0179]
以上仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以该权利要求的保护范围为准。

技术特征:


1.一种人脸伪造检测方法,其特征在于,包括:获取待检测人脸视频;将所述待检测人脸视频输入至人脸图像重建模型,以通过所述人脸图像重建模型对所述待检测人脸视频进行帧采样,得到所述待检测人脸视频在当前分辨率下的n个第一待检测人脸视频帧,对所述n个第一待检测人脸视频帧进行特征提取,得到所述n个待检测人脸视频帧的至少一个第一初始特征,根据至少一个第一真实人脸特征和所述至少一个第一初始特征确定第一重建人脸图像特征,根据所述第一重建人脸图像特征,得到n个第一重建人脸图像,n为正整数;根据所述n个第一待检测人脸视频帧和所述n个第一重建人脸图像的差异检测所述待检测人脸视频是否为伪造人脸视频;其中,所述人脸图像重建模型是通过真实人脸视频训练得到的。2.根据权利要求1所述的方法,其特征在于,所述对所述n个第一待检测人脸视频帧进行特征提取,得到所述n个待检测人脸视频帧的至少一个第一初始特征之前,还包括:将所述n个第一待检测人脸视频帧中的每个第一待检测人脸视频帧划分为多个区域;擦除所述n个第一待检测人脸视频帧中至少一个区域;确定第一类型区域和第二类型区域,所述第一类型区域是在所述n个第一待检测人脸视频帧中均被擦除的同一区域,所述第二类型区域是所述多个区域中除所述第一类型区域以外的区域;确定所述第一类型区域的位置编码;将第二真实人脸特征和所述第一类型区域的位置编码进行拼接,得到所述第一类型区域的特征;相应的,所述对所述n个第一待检测人脸视频帧进行特征提取,得到所述n个待检测人脸视频帧的至少一个第一初始特征,包括:对所述n个第一待检测人脸视频帧中的第二类型区域进行特征提取,得到所述至少一个第一初始特征;相应的,所述根据至少一个第一真实人脸特征和所述至少一个第一初始特征确定第一重建人脸图像特征,包括:根据所述第一类型区域的特征、所述至少一个第一真实人脸特征和所述至少一个第一初始特征确定所述第一重建人脸图像特征。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一类型区域的特征、所述至少一个第一真实人脸特征和所述至少一个第一初始特征确定所述第一重建人脸图像特征,包括:针对所述至少一个第一初始特征中的每个第一初始特征,确定所述至少一个第一真实人脸特征中每个第一真实人脸特征的权重,根据所述每个第一真实人脸特征的权重对所述每个第一真实人脸特征进行加权求和,得到第二重建人脸图像特征,将所述第一初始特征和所述第二重建人脸图像特征进行拼接,得到第三重建人脸图像特征;根据所述第一类型区域的特征和所述至少一个第一初始特征分别对应的第三重建人脸图像特征确定所述第一重建人脸图像特征。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一类型区域的特征和所述
至少一个第一初始特征分别对应的第三重建人脸图像特征确定所述第一重建人脸图像特征,包括:对所述第一类型区域的特征和所述至少一个第一初始特征分别对应的第三重建人脸图像特征进行组合,得到所述第一重建人脸图像特征。5.根据权利要求3所述的方法,其特征在于,所述确定所述至少一个第一真实人脸特征中每个第一真实人脸特征的权重,包括:计算所述第一初始特征和所述每个第一真实人脸特征的相似度;将所述第一初始特征和所述每个第一真实人脸特征的相似度转换为所述每个第一真实人脸特征的权重。6.根据权利要求1-5任一项所述的方法,其特征在于,所述根据所述n个第一待检测人脸视频帧和所述n个第一重建人脸图像的差异检测所述待检测人脸视频是否为伪造人脸视频,包括:计算所述n个第一待检测人脸视频帧中每个像素点的rgb值和所述n个第一重建人脸图像中对应像素点的rgb值的差值的平方;根据所述n个第一待检测人脸视频帧中每个像素点的rgb值和所述n个第一重建人脸图像中对应像素点的rgb值的差值的平方确定第一重建误差;根据所述第一重建误差检测所述待检测人脸视频是否为伪造人脸视频。7.根据权利要求6所述的方法,其特征在于,所述根据所述n个第一待检测人脸视频帧中每个像素点的rgb值和所述n个第一重建人脸图像中对应像素点的rgb值的差值的平方确定第一重建误差,包括:计算所述n个第一待检测人脸视频帧中每个像素点的rgb值和所述n个第一重建人脸图像中对应像素点的rgb值的差值的平方之和,得到所述第一重建误差。8.根据权利要求6所述的方法,其特征在于,所述根据所述第一重建误差检测所述待检测人脸视频是否为伪造人脸视频,包括:若所述第一重建误差大于第一预设阈值,则确定所述待检测人脸视频为伪造人脸视频;若所述第一重建误差小于或等于所述第一预设阈值,则确定所述待检测人脸视频不是伪造人脸视频。9.根据权利要求1-5任一项所述的方法,其特征在于,所述根据所述n个第一待检测人脸视频帧和所述n个第一重建人脸图像的差异检测所述待检测人脸视频是否为伪造人脸视频之前,还包括:通过所述人脸图像重建模型将所述n个第一待检测人脸视频帧调整为m组第二待检测人脸视频帧,所述m组第二待检测人脸视频帧中每组第二待检测人脸视频帧包括n个第二待检测人脸视频帧,且所述每组第二待检测人脸视频帧与所述n个第一待检测人脸视频帧的分辨率不同,m为正整数;针对所述每组第二待检测人脸视频帧,通过所述人脸图像重建模型对该组第二待检测人脸视频帧进行特征提取,得到该组第二待检测人脸视频帧的至少一个第二初始特征,根据所述至少一个第一真实人脸特征和所述至少一个第二初始特征确定第四重建人脸图像特征,根据所述第四重建人脸图像特征确定n个第二重建人脸图像;
相应的,所述根据所述n个第一待检测人脸视频帧和所述n个第一重建人脸图像的差异检测所述待检测人脸视频是否为伪造人脸视频,包括:根据所述n个第一待检测人脸视频帧、所述n个第一重建人脸图像、所述m组第二待检测人脸视频帧和所述m组第二待检测人脸视频帧分别对应的n个第二重建人脸图像,检测所述待检测人脸视频是否为伪造人脸视频。10.根据权利要求9所述的方法,其特征在于,所述根据所述n个第一待检测人脸视频帧、所述n个第一重建人脸图像、所述m组第二待检测人脸视频帧和所述m组第二待检测人脸视频帧分别对应的n个第二重建人脸图像,检测所述待检测人脸视频是否为伪造人脸视频,包括:计算所述n个第一待检测人脸视频帧中每个像素点的rgb值和所述n个第一重建人脸图像中对应像素点的rgb值的差值的平方;根据所述n个第一待检测人脸视频帧中每个像素点的rgb值和所述n个第一重建人脸图像中对应像素点的rgb值的差值的平方确定第一重建误差;针对所述m组第二待检测人脸视频帧中的每组第二待检测人脸视频帧,计算该组第二待检测人脸视频帧中每个像素点的rgb值和对应的n个第二重建人脸图像中对应像素的rgb值的差值的平方,并根据该组第二待检测人脸视频帧中每个像素点的rgb值和对应的n个第二重建人脸图像中对应像素的rgb值的差值的平方确定第二重建误差;根据所述第一重建误差和所述m组第二待检测人脸视频帧分别对应的第二重建误差检测所述待检测人脸视频是否为伪造人脸视频。11.根据权利要求10所述的方法,其特征在于,所述根据所述第一重建误差和所述m组第二待检测人脸视频帧分别对应的第二重建误差检测所述待检测人脸视频是否为伪造人脸视频,包括:计算所述第一重建误差和所述m组第二待检测人脸视频帧分别对应的第二重建误差之和,得到第三重建误差;根据所述第三重建误差检测所述待检测人脸视频是否为伪造人脸视频。12.根据权利要求11所述的方法,其特征在于,所述根据所述第三重建误差检测所述待检测人脸视频是否为伪造人脸视频,包括:若所述第三重建误差大于第二预设阈值,则确定所述待检测人脸视频为伪造人脸视频;若所述第三重建误差小于或等于所述第二预设阈值,则确定所述待检测人脸视频不是伪造人脸视频。13.根据权利要求1-5任一项所述的方法,其特征在于,所述根据至少一个第一真实人脸特征和所述至少一个第一初始特征确定第一重建人脸图像特征之后,还包括:针对所述至少一个第一真实人脸特征中的每个第一真实人脸特征,确定所述至少一个第一初始特征中每个第一初始特征的权重,根据所述每个第一初始特征的权重对所述每个第一初始特征进行加权求和,得到第三真实人脸特征,对所述第三真实人脸特征和所述第一真实人脸特征进行加权求和,得到第四真实人脸特征,将所述第一真实人脸特征更新为所述第四真实人脸特征。14.一种人脸伪造检测装置,其特征在于,包括:获取模块、输入模块、处理模块、检测模
块;所述获取模块用于获取待检测人脸视频;所述输入模块用于将所述待检测人脸视频输入至人脸图像重建模型,所述处理模块用于:通过所述人脸图像重建模型对所述待检测人脸视频进行帧采样,得到所述待检测人脸视频在当前分辨率下的n个第一待检测人脸视频帧,对所述n个第一待检测人脸视频帧进行特征提取,得到所述n个待检测人脸视频帧的至少一个第一初始特征,根据至少一个第一真实人脸特征和所述至少一个第一初始特征确定第一重建人脸图像特征,根据所述第一重建人脸图像特征确定n个第一重建人脸图像,n为正整数;所述检测模块用于根据所述n个第一待检测人脸视频帧和所述n个第一重建人脸图像的差异检测所述待检测人脸视频是否为伪造人脸视频;其中,所述人脸图像重建模型是通过真实人脸视频训练得到的。15.一种电子设备,其特征在于,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-13任一项所述的方法。

技术总结


本申请提供了一种人脸伪造检测方法、装置及电子设备,包括:获取待检测人脸视频;将待检测人脸视频输入至人脸图像重建模型,以通过人脸图像重建模型对待检测人脸视频进行帧采样,得到N个第一待检测人脸视频帧,对N个第一待检测人脸视频帧进行特征提取,得到至少一个第一初始特征,根据至少一个第一真实人脸特征和至少一个第一初始特征确定第一重建人脸图像特征,根据第一重建人脸图像特征,得到N个第一重建人脸图像,N为正整数;根据N个第一待检测人脸视频帧和N个第一重建人脸图像的差异检测待检测人脸视频是否为伪造人脸视频;其中,人脸图像重建模型是通过真实人脸视频训练得到的。以提高人脸伪造检测的准确性。以提高人脸伪造检测的准确性。以提高人脸伪造检测的准确性。


技术研发人员:

梁涛 杨青

受保护的技术使用者:

度小满科技(北京)有限公司

技术研发日:

2022.09.27

技术公布日:

2022/12/23

本文发布于:2024-09-23 16:19:33,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/44853.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:特征   视频   图像   所述
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议