克隆网页检测方法及装置与流程



1.本发明实施例涉及网络安全技术领域,特别涉及一种克隆网页检测方法及装置。


背景技术:



2.常见的互联网欺诈方式,是通过对他人网站页面进行模仿复制,制作成克隆网页,诱骗用户在访问目标网站时登录到克隆网页,在克隆网页上进行操作后,造成用户相关信息的泄露。
3.现有技术中,克隆网页的检测方式包括url特征检测、黑名单匹配、机器学习等检测方式。但存在漏报率高、检测成功率低、成本高等缺点。


技术实现要素:



4.基于上述问题,本发明实施例提供了一种克隆网页检测方法及装置。
5.第一方面,本发明实施例提供了一种克隆网页检测方法,包括:
6.确定目标网页的代码所对应的目标检测特征;
7.根据所述目标检测特征生成检测代码;
8.在所述目标网页的源代码中加入所述检测代码,以使用户端在加载网页之前读取该网页的源代码时,若读取的源代码中包含所述检测代码,则执行所述检测代码;
9.其中,所述检测代码在被执行时用于:将当前所属源代码的检测特征与所述目标检测特征进行比对,并根据比对结果确定该网页是否为克隆网页。
10.在一种可能的实现方式,所述确定目标网页的源代码所对应的目标检测特征,包括:
11.将所述目标网页的源代码的哈希值确定为所述目标检测特征。
12.在一种可能的实现方式,所述确定目标网页的源代码所对应的目标检测特征,包括:
13.确定在基于网页的源代码进行网页克隆时该源代码中会被修改的代码部分;
14.根据所述会被修改的代码部分确定所述目标检测特征。
15.在一种可能的实现方式,所述会被修改的代码部分包括页面内容的加载地址;
16.所述根据所述会被修改的代码部分确定所述目标检测特征,包括:将所述目标网页的源代码中包括的页面内容的加载地址,确定为所述目标检测特征。
17.在一种可能的实现方式,所述根据所述目标检测特征生成检测代码,包括:
18.将所述目标检测特征添加到预设功能代码的指定位置,得到检测代码。
19.在一种可能的实现方式,还包括:
20.对所述检测代码进行综合加密,以在所述目标网页所对应的源代码中加入综合加密后的检测代码。
21.在一种可能的实现方式,所述根据比对结果确定该网页是否为克隆网页,包括:若比对结果为当前所属源代码的检测特征与所述目标检测特征不相同时,则确定该网页为克
隆网页;
22.和/或,
23.还包括:当确定该网页为克隆网页时,提示用户。
24.第二方面,本发明实施例还提供了一种克隆网页检测装置,包括:
25.特征确定单元,用于确定目标网页的源代码所对应的目标检测特征;
26.代码生成单元,用于根据所述目标检测特征生成检测代码;
27.代码更新单元,用于在所述目标网页的源代码中加入所述检测代码,以使用户端在加载网页之前读取该网页的源代码时,若读取的源代码中包含所述检测代码,则执行所述检测代码;
28.其中,所述检测代码在被执行时用于:将当前所属源代码的检测特征与所述目标检测特征进行比对,并根据比对结果确定该网页是否为克隆网页。
29.第三方面,本发明实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现本说明书任一实施例所述的方法。
30.第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书任一实施例所述的方法。
31.本发明实施例提供了一种克隆网页检测方法及装置,基于目标网页的源代码所对应的目标检测特征来生成检测代码,并在目标网页的源代码中加入该检测代码,用户端在加载网页之前需要读取该网页的源代码,若读取的源代码中包含该检测代码,则会执行该检测代码,且该检测代码用于对当前所属源代码的检测特征与目标检测特征进行比对,根据比对结果可以确定出用户端加载的网页是否为克隆网页。本方案,只需在原有网页的源代码中增加检测代码即可,不仅成本低,且检测准确率高。
附图说明
32.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
33.图1是本发明一实施例提供的一种克隆网页检测方法流程图;
34.图2是本发明一实施例提供的一种电子设备的硬件架构图;
35.图3是本发明一实施例提供的一种克隆网页检测装置结构图;
36.图4是本发明一实施例提供的另一种克隆网页检测装置结构图;
37.图5是本发明一实施例提供的再一种克隆网页检测装置结构图。
具体实施方式
38.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员
在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
39.基于前述中现有克隆网页检测方法的缺点,亟需提供一种新的思路来进行克隆网页的检测。
40.克隆网页对他人网站页面进行模仿复制时,一般是基于被克隆网页的源代码来实现的,通过拷贝源代码,并将源代码中页面内容加载服务器的网址替换成克隆网站搭建的服务器网址,从而使得克隆网页的页面内容与被克隆网页相同或相似。
41.基于此,本发明的发明构思在于:考虑到用户端访问某个网页时,在加载该网页的页面内容之前会读取网页的源代码,因此,可以在被克隆网页的源代码中加入检测代码,检测代码中包括有对应源代码的检测特征,当用户读取网页的源代码时可以读取并执行该检测代码,利用该检测代码实现克隆网页的检测。
42.下面描述以上构思的具体实现方式。
43.请参考图1,本发明实施例提供了一种克隆网页检测方法,该方法包括:
44.步骤100,确定目标网页所对应的源代码的目标检测特征;
45.步骤102,根据所述目标检测特征生成检测代码;
46.步骤104,在所述目标网页所对应的源代码中加入所述检测代码,以使用户端在加载网页之前读取该网页所对应的源代码时,若读取的源代码中包含所述检测代码,则执行所述检测代码;
47.其中,所述检测代码在被执行时用于:将当前所属源代码的检测特征与所述目标检测特征进行比对,根据比对结果确定该网页是否为克隆网页。
48.该方法可以由网页的源代码生成端来执行,也可以由其他服务端为提供服务的客户网页一一对应生成检测代码后,将检测代码发送给客户,由客户将检测代码一一对应的加入源代码中。
49.本发明实施例中,基于目标网页所对应的源代码的目标检测特征来生成检测代码,并在目标网页所对应的源代码中加入该检测代码,用户端在加载网页之前需要读取该网页所对应的源代码,若读取的该源代码中包含该检测代码,则会执行该检测代码,且该检测代码用于对当前所属源代码的检测特征与目标检测特征进行比对,根据比对结果可以确定出用户端加载的网页是否为克隆网页。本方案,只需在原有网页的源代码中增加检测代码即可,不仅成本低,且检测准确率高。
50.下面描述图1所示的各个步骤的执行方式。
51.首先,针对步骤100,确定目标网页的源代码所对应的目标检测特征。
52.网页的源代码是指未编译的文本代码或一个网站的全部源码文件,是一系列可读的计算机语言指令,通过浏览器或服务器翻译后呈现出网页的页面内容。不同网页具有不完全相同的源代码,因此,不同网页的源代码的检测特征不同。
53.一个实现方式中,本步骤可以包括:将所述目标网页所对应源代码的哈希值确定为所述目标检测特征。
54.当源代码不相同时,计算出的哈希值也不相同,可见哈希值具有唯一性。若目标网页被克隆,那么基于目标网页的源代码生成克隆网页时,源代码的部分内容会被修改,而修改后的源代码的哈希值也会发生变化,因此,利用哈希值作为检测特征,能够准确的确定源代码是否被修改,以此来确定网页是否为克隆网页。
55.另一个实现方式中,本步骤可以包括:确定在基于网页的源代码进行网页克隆时该源代码中会被修改的代码部分;根据所述会被修改的代码部分确定所述目标检测特征。
56.基于上述描述也可获知,基于目标网页的源代码生成克隆网页时,源代码的部分内容会被修改,因此会被修改的这部分内容可以作为网页是否被克隆的检测特征。
57.本发明实施例中,若克隆网页制作者利用克隆网页的生成工具生成克隆网页,那么可以针对若干个生成工具收集相应的特征,以确定生成工具对被克隆网页的源代码所修改的代码部分。
58.一般情况下,生成工具的原理是输入被克隆网页的源代码,至少会将源代码中页面内容的加载地址替换为克隆网站搭建的服务器地址。因此,可以确定该会被修改的代码部分包括页面内容的加载地址。
59.相应地,根据会被修改的代码部分确定所述目标检测特征,包括:将所述目标网页的源代码中包括的页面内容的加载地址,确定为所述目标检测特征。
60.本发明实施例中,若目标网页的源代码中包括多个页面内容的加载地址,则可以将任意一个或多个页面内容的加载地址确定为目标检测特征。
61.可见,若目标网页被克隆成克隆网页,那么源代码中页面内容的加载地址会被修改,因此,利用页面内容的加载地址作为检测特征,能够检测出网页是否为克隆网页。
62.然后,针对步骤102,根据所述目标检测特征生成检测代码。
63.本发明实施例中,目标检测特征需要作为比对阈值进行比对的,因此,生成检测代码后,目标检测特征是位于检测代码中的。比如,目标检测特征位于检测代码的指定位置上。
64.一种实现方式中,本步骤可以包括:将所述目标检测特征添加到预设功能代码的指定位置,得到检测代码。
65.其中,该预设功能代码是用于实现检测功能的框架代码,预设功能代码的指定位置处设置为代码留白或变量参数,当确定了目标检测特征之后,可以将目标检测特征添加到该代码留白处或替换变量参数,以得到检测代码。当为不同网页生成对应的检测代码时,均可以使用该预设功能代码,以提高检测代码生成效率。
66.在本发明一个实施例中,该检测代码可以使用脚本语言来实现,以更好的适配源代码。该脚本语言可以优选为javascript。
67.最后,针对步骤104,在所述目标网页的源代码中加入所述检测代码,以使用户端在加载网页之前读取该网页的源代码时,若读取的源代码中包含所述检测代码,则执行所述检测代码。
68.由于检测代码加入到了源代码中,需要保证基于源代码进行克隆时该检测代码不被修改。尤其是当目标检测特征为页面内容的加载地址时,需要保证检测代码中的目标检测特征不被修改。基于该目的,本发明一个实施例中,在本步骤之前还包括:对检测代码进行综合加密。然后执行本步骤时,在目标网页的源代码中加入综合加密后的检测代码。
69.综合加密是指多方法混合加密,比如,将多行js代码进行代码压缩变成简短式代码,将js代码中的变量进行不规则命名,将js代码中的中文转换为unicode或十六进制代码,将js代码转换成eval方式等。
70.在对检测代码进行综合加密时,可以仅对目标检测特征进行综合加密,也可以对
包含目标检测特征在内的部分代码进行综合加密,还可以对整个检测代码进行综合加密。
71.检测代码进行综合加密后,可以对检测代码中的目标检测特征进行隐藏,使得克隆后该目标检测特征不被修改。另外,检测代码进行综合加密后,还可以对检测代码的功能进行隐藏,以使克隆网页制作者无法确定该部分代码的执行意义。
72.本发明实施例中,检测代码在被执行时可以用于实现检测功能,具体地,该检测功能包括:将当前所属源代码的检测特征与所述目标检测特征进行比对,根据比对结果确定该网页是否为克隆网页。
73.其中,该当前所属源代码的检测特征可以通过步骤100的确定方式来确定,首先获取当前所属源代码,然后确定除检测代码之外的源代码所对应的检测特征,最后与目标检测特征进行比对。
74.若目标检测特征为页面内容的加载地址,还可以通过另一种方式确定当前所属源代码的检测特征:接收加载服务器针对当前网页发送的页面内容,确定加载服务器的加载地址,将该地址与目标检测特征中的加载地址进行比对。
75.本步骤在根据比对结果确定该网页是否为克隆网页时,具体地,若比对结果为当前所属源代码的检测特征与所述目标检测特征不相同时,则确定该网页为克隆网页。
76.进一步地,当确定该网页为克隆网页时,提示用户。提示语可是“该网页为克隆网页,请确定是否继续访问”等字样。
77.通过将检测代码加入到网页的源代码中,相当于给原网页加上了一把锁,当用户访问基于原网页的源代码生成的克隆网页时,可以有效提升用户对克隆网页的判断能力,进而保护用户的重要数据。
78.本方案至少可以应用在网站防篡改、网站安全检测、网络业务安全系统中,阻止网站被恶意攻击者攻击导致的篡改、数据泄露等。
79.如图2、图3所示,本发明实施例提供了一种克隆网页检测装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图2所示,为本发明实施例提供的一种克隆网页检测装置所在电子设备的一种硬件架构图,除了图2所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的电子设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图3所示,作为一个逻辑意义上的装置,是通过其所在电子设备的cpu将非易失性存储器中对应的计算机程序读取到内存中运行形成的。本实施例提供的一种克隆网页检测装置,包括:
80.特征确定单元301,用于确定目标网页的源代码所对应的目标检测特征;
81.代码生成单元302,用于根据所述目标检测特征生成检测代码;
82.代码更新单元303,用于在所述目标网页的源代码中加入所述检测代码,以使用户端在加载网页之前读取该网页的源代码时,若读取的源代码中包含所述检测代码,则执行所述检测代码;
83.其中,所述检测代码在被执行时用于:将当前所属源代码的检测特征与所述目标检测特征进行比对,并根据比对结果确定该网页是否为克隆网页。
84.在本发明一个实施例中,所述特征确定单元在确定目标网页的源代码所对应的目标检测特征时,具体用于:将所述目标网页的源代码的哈希值确定为所述目标检测特征。
85.在本发明一个实施例中,所述特征确定单元在确定目标网页的源代码所对应的目
标检测特征时,具体用于:确定在基于网页的源代码进行网页克隆时该源代码中会被修改的代码部分;根据所述会被修改的代码部分确定所述目标检测特征。
86.在本发明一个实施例中,所述会被修改的代码部分包括页面内容的加载地址;
87.所述特征确定单元在根据所述会被修改的代码部分确定所述目标检测特征时,具体用于:将所述目标网页的源代码中包括的页面内容的加载地址,确定为所述目标检测特征。
88.在本发明一个实施例中,所述代码生成单元在根据所述目标检测特征生成检测代码时,具体用于:将所述目标检测特征添加到预设功能代码的指定位置,得到检测代码。
89.在本发明一个实施例中,请参考图4,克隆网页检测装置还包括:
90.加密单元304,用于对所述检测代码进行综合加密,以触发代码更新单元在所述目标网页所对应的源代码中加入综合加密后的检测代码。
91.在本发明一个实施例中,所述根据比对结果确定该网页是否为克隆网页,包括:若比对结果为当前所属源代码的检测特征与所述目标检测特征不相同时,则确定该网页为克隆网页。
92.在本发明一个实施例中,请参考图5,克隆网页检测装置还包括:
93.提示单元305,当确定该网页为克隆网页时,提示用户。
94.可以理解的是,本发明实施例示意的结构并不构成对一种克隆网页检测装置的具体限定。在本发明的另一些实施例中,一种克隆网页检测装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
95.上述装置内的各模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
96.本发明实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现本发明任一实施例中的一种克隆网页检测方法。
97.本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被处理器执行时,使所述处理器执行本发明任一实施例中的一种克隆网页检测方法。
98.具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或cpu或mpu)读出并执行存储在存储介质中的程序代码。
99.在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
100.用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如cd-rom、cd-r、cd-rw、dvd-rom、dvd-ram、dvd-rw、dvd+rw)、磁带、非易失性存储卡和rom。可选择地,可以由通信网络从服务器计算机上下载程序代码。
101.此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
102.此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展模块中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展模块上的cpu等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
103.需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
…”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
104.本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质中。
105.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征:


1.一种克隆网页检测方法,其特征在于,包括:确定目标网页的源代码所对应的目标检测特征;根据所述目标检测特征生成检测代码;在所述目标网页的源代码中加入所述检测代码,以使用户端在加载网页之前读取该网页的源代码时,若读取的源代码中包含所述检测代码,则执行所述检测代码;其中,所述检测代码在被执行时用于:将当前所属源代码的检测特征与所述目标检测特征进行比对,并根据比对结果确定该网页是否为克隆网页。2.根据权利要求1所述的方法,其特征在于,所述确定目标网页的源代码所对应的目标检测特征,包括:将所述目标网页的源代码的哈希值确定为所述目标检测特征。3.根据权利要求1所述的方法,其特征在于,所述确定目标网页的源代码所对应的目标检测特征,包括:确定在基于网页的源代码进行网页克隆时该源代码中会被修改的代码部分;根据所述会被修改的代码部分确定所述目标检测特征。4.根据权利要求3所述的方法,其特征在于,所述会被修改的代码部分包括页面内容的加载地址;所述根据所述会被修改的代码部分确定所述目标检测特征,包括:将所述目标网页的源代码中包括的页面内容的加载地址,确定为所述目标检测特征。5.根据权利要求1所述的方法,其特征在于,所述根据所述目标检测特征生成检测代码,包括:将所述目标检测特征添加到预设功能代码的指定位置,得到检测代码。6.根据权利要求1所述的方法,其特征在于,还包括:对所述检测代码进行综合加密,以在所述目标网页所对应的源代码中加入综合加密后的检测代码。7.根据权利要求1-6中任一所述的方法,其特征在于,所述根据比对结果确定该网页是否为克隆网页,包括:若比对结果为当前所属源代码的检测特征与所述目标检测特征不相同时,则确定该网页为克隆网页;和/或,还包括:当确定该网页为克隆网页时,提示用户。8.一种克隆网页检测装置,其特征在于,包括:特征确定单元,用于确定目标网页的源代码所对应的目标检测特征;代码生成单元,用于根据所述目标检测特征生成检测代码;代码更新单元,用于在所述目标网页的源代码中加入所述检测代码,以使用户端在加载网页之前读取该网页的源代码时,若读取的源代码中包含所述检测代码,则执行所述检测代码;其中,所述检测代码在被执行时用于:将当前所属源代码的检测特征与所述目标检测特征进行比对,并根据比对结果确定该网页是否为克隆网页。9.一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-7中任一项所述的方法。

技术总结


本发明提供了一种克隆网页检测方法及装置,其中方法包括:确定目标网页的源代码所对应的目标检测特征;根据所述目标检测特征生成检测代码;在所述目标网页的源代码中加入所述检测代码,以使用户端在加载网页之前读取该网页的源代码时,若读取的源代码中包含所述检测代码,则执行所述检测代码;其中,所述检测代码在被执行时用于:将当前所属源代码的检测特征与所述目标检测特征进行比对,并根据比对结果确定该网页是否为克隆网页。本方案,只需在原有网页的源代码中增加检测代码即可,不仅成本低,且检测准确率高。且检测准确率高。且检测准确率高。


技术研发人员:

刘福龙 尹尚书 肖新光

受保护的技术使用者:

安天科技集团股份有限公司

技术研发日:

2022.08.19

技术公布日:

2022/11/22

本文发布于:2024-09-20 13:34:05,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/20883.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   网页   源代码   代码
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议