IP的提取方法、装置、存储介质及电子装置与流程


ip的提取方法、装置、存储介质及电子装置
技术领域
1.本技术涉及虚拟网络领域,具体而言,涉及一种ip的提取方法、装置、存储介质及电子装置。


背景技术:



2.cdn全称content delivery network,即内容分发网络。cdn是构建在现有网络基础之上的智能虚拟网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近浏览网上所需内容,降低网络拥塞,提高用户关联响应速度和命中率。cdn域名也叫子域名,是指cdn厂家运营的用于cdn加速的相对独立的有相同cname后缀的域名。
3.在网络安全领域经常需要拦截恶意ip,相关技术人员会拦截与恶意ip处在同一域名下的多个ip,部分cdn域名属于安全服务厂商,cdn域名下的大部分ip并非恶意ip,相关技术人员由于不确定待判定ip是否为cdn ip,直接拦截cdn ip会造成一定程度的误报。cdn的服务用于协助分发网络内容,提高关联速度,由cdn厂商提供,本身不具有恶意行为倾向,因此在威胁情报相关任务中,需要对cdn服务器进行标记,为相关研究人员查询、溯源等工作提供可靠的参考信息。
4.相关技术中,通过获取网络中的数据,依据获取到的信息构建cdn的ip地址基础知识库,从而为cdn服务器进行ip标记,但是该方式进行ip标记的准确度不高,存在误报普通ip为cdn的ip的情况,不适用于安全服务厂商的ip标签标记。另外,相关技术中通过判定url中的域名是否为cdn域名,来确定cdn的ip。主要基于域名是否在固定时间内对应多个ip。从域名对应的ip位置、数量等角度进行cdn服务器判定,对多个域名分别进行计算ip的相关属性。
5.针对相关技术中确定内容分发网络ip不精确的问题,目前尚未提出有效的解决方案。


技术实现要素:



6.本技术提供一种ip的提取方法,以解决相关技术中确定内容分发网络ip不精确的问题。
7.根据本技术的一个方面,提供了一种ip的提取方法。该方法包括:在第一预设时间段内获取多个域名及关联每个所述域名的ip,得到多个ip,并判断每个域名是否具有别名;在域名具有别名的情况下,根据别名的字段从多个ip中确定关联域名的ip,得到至少一个第一ip;在域名不具有别名的情况下,根据ip关联域名的情况从多个ip中确定第二ip;将第一ip和第二ip确定为目标ip,得到目标ip的集合。
8.可选地,根据别名的字段从多个ip中确定关联域名的ip,得到至少一个第一ip包括:将存在相同字段的别名进行组合,得到多组别名,并确定每组别名中别名的数量,得到多个第一数量;分别判断每个第一数量是否大于等于别名数量阈值;在第一数量大于等于
别名数量阈值的情况下,将多个ip中关联每组别名对应域名的ip确定为第一ip。
9.可选地,根据别名的字段从多个ip中确定关联域名的ip,得到至少一个第一ip包括:判断别名中是否包含目标字段,其中,目标字段为内容分发网络字段;在别名包含目标字段的情况下,确定每个ip关联包含目标字段的别名对应的域名的第二数量,得到多个第二数量;分别判断每个第二数量是否大于等于域名的第一数量阈值;在第二数量大于等于域名的第一数量阈值的情况下,将第二数量对应的ip确定为第一ip,并将包含目标字段的别名对应的域名添加至白名单内,其中,白名单包含多个预设域名。
10.可选地,根据ip关联域名的情况从多个ip中确定第二ip包括:确定第二预设时间段内每个ip关联的白名单中的域名的数量,得到第三数量,并判断第三数量是否大于等于域名的第二数量阈值;在第三数量大于等于域名的第二数量阈值的情况下,将第三数量对应的ip确定为第二ip。
11.可选地,白名单通过以下方式得到:获取多个内容分发网络厂商的域名,并根据内容分发网络厂商的域名确定白名单。
12.可选地,在将第一ip和第二ip确定为目标ip,得到目标ip的集合之后,方法还包括:获取第三方平台存储的多个第三方ip,其中,每个第三方ip对应一个内容分发网络厂商;将同一个内容分发网络厂商对应的第三方ip与目标ip进行对比;在第三方ip与目标ip不相同的情况下,将目标ip从集合中剔除。
13.可选地,在将第一ip和第二ip确定为目标ip,得到目标ip的集合之后,方法还包括:将存在相同字段的目标ip进行组合,得到多组目标ip;分别判断每组目标ip中ip的数量是否小于ip数量阈值;在该组目标ip中ip的数量小于ip数量阈值的情况下,将该组目标ip从集合中剔除。
14.根据本技术的另一方面,提供了一种ip的提取装置,该装置包括:获取单元,用于在第一预设时间段内获取多个域名及关联每个所述域名的ip,得到多个ip,并判断每个域名是否具有别名;第一确定单元,用于在域名具有别名的情况下,根据别名的字段从多个ip中确定关联域名的ip,得到至少一个第一ip;第二确定单元,用于在域名不具有别名的情况下,根据ip关联域名的情况从多个ip中确定第二ip;第三确定单元,用于将第一ip和第二ip确定为目标ip,得到目标ip的集合。
15.根据本发明实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,程序运行时控制非易失性存储介质所在的设备执行一种ip的提取方法。
16.根据本发明实施例的另一方面,还提供了一种电子装置,包含处理器和存储器;存储器中存储有计算机可读指令,处理器用于运行计算机可读指令,其中,计算机可读指令运行时执行一种ip的提取方法。
17.通过本技术,采用以下步骤:在第一预设时间段内获取多个域名及关联每个所述域名的ip,得到多个ip,并判断每个域名是否具有别名;在域名具有别名的情况下,根据别名的字段从多个ip中确定关联域名的ip,得到至少一个第一ip;在域名不具有别名的情况下,根据ip关联域名的情况从多个ip中确定第二ip;将第一ip和第二ip确定为目标ip,得到目标ip的集合,解决了相关技术中确定内容分发网络ip不精确的问题。通过对域名本身自带内容分发网络字段的域名以及内容分发网络厂商对应的域名构建内容分发网络白名单,
另外对域名的别名筛选重复字段确定内容分发网络对应的ip,进而达到了精准确定内容分发网络ip的效果。
附图说明
18.构成本技术的一部分的附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
19.图1是根据本技术实施例提供的ip的提取方法的流程图;
20.图2是根据本技术实施例提供的一种可选地ip的提取方法的流程图;
21.图3是根据本技术实施例提供的ip的提取装置的示意图。
具体实施方式
22.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
23.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
24.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
25.根据本技术的实施例,提供了一种ip的提取方法。
26.图1是根据本技术实施例的ip的提取方法的流程图。如图1所示,该方法包括以下步骤:
27.步骤s102,在第一预设时间段内获取多个域名及关联每个域名的ip,得到多个ip,并判断每个域名是否具有别名。
28.需要说明的是,同一个ip(internet protocol address,互联网协议地址)关联的域名在一定时间段内存在较大的关联性,因此获取第一预设时间段内的域名历史解析记录来确定cdn的ip。例如,第一预设时间段可以为一个月,按照固定一个月为一个周期获取域名历史解析记录,从域名历史解析记录中获取多个ip,并获取每个ip关联的多个域名。每个域名可以被多个ip关联,每个ip可以关联多个域名。
29.需要说明的是,cdn的域名加速需要用到cname记录,在配置完成cdn加速后,会得到一个加速后的域名,称之为cname域名,也即别名,用户需要将自己的ip指向这个别名后,域名解析的工作就正式转向cdn服务商,各ip关联该域名的所有请求都将转向cdn的节点。通过向各域名对应的网域请求查询cname(别名记录),根据各域名的返回结果来判断每个域名是否具有别名。若域名返回数据,则该域名具有别名,若未返回数据则该域名可能没有
域名或者拒绝返回数据。
30.步骤s104,在域名具有别名的情况下,根据别名的字段从多个ip中确定关联域名的ip,得到至少一个第一ip。
31.具体地,别名中包含多个字段,根据别名的字段从多个ip中确定关联域名的ip,例如,部分cdn厂商的别名中会包含cdn字段,部分cdn厂商的别名中会包含厂商名,a厂商的别名为10.12.a.3,b厂商的别名为20.45.1.3.cdn。从多个ip中确定关联别名中会包含cdn字段或者别名中会包含自家公司名对于的域名的ip,得到第一ip。
32.步骤s106,在域名不具有别名的情况下,根据ip关联域名的情况从多个ip中确定第二ip。
33.具体地,在域名不具有别名的情况下,则通过各ip关联的域名的具体情况来确定第二ip,例如,每个ip关联的域名中若在白名单中的域名的数量超过阈值,则确定该ip为第二ip。白名单中包含已知cdn厂商的域名以及通过别名中包含cdn字段筛选出的域名。
34.步骤s108,将第一ip和第二ip确定为目标ip,得到目标ip的集合。
35.具体地,目标ip即为初步确定为cdn的ip,第一ip和第二ip集合在一起,获得目标ip的集合。
36.本技术实施例提供的ip的提取方法,在第一预设时间段内获取多个域名及关联每个所述域名的ip,得到多个ip,并判断每个域名是否具有别名;在域名具有别名的情况下,根据别名的字段从多个ip中确定关联域名的ip,得到至少一个第一ip;在域名不具有别名的情况下,根据ip关联域名的情况从多个ip中确定第二ip;将第一ip和第二ip确定为目标ip,得到目标ip的集合。通过本技术,解决了相关技术中确定内容分发网络ip不精确的问题。通过对域名本身自带内容分发网络字段的域名以及内容分发网络厂商对应的域名构建内容分发网络白名单,另外对域名的别名筛选重复字段确定内容分发网络对应的ip,进而达到了精准确定内容分发网络ip的效果。
37.通过筛选别名中包含相同字段的域名,确定关联该域名的ip作为第一ip,可选地,在本技术实施例提供的ip的提取方法中,根据别名的字段从多个ip中确定关联域名的ip,得到至少一个第一ip包括:将存在相同字段的别名进行组合,得到多组别名,并确定每组别名中别名的数量,得到多个第一数量;分别判断每个第一数量是否大于等于别名数量阈值;在第一数量大于等于别名数量阈值的情况下,将多个ip中关联每组别名对应域名的ip确定为第一ip。
38.具体地,由于cdn厂商的不同节点的域名一般会有相同字段,例如a厂商在a城市的节点别名为10.2.5.a,a厂商在b城市的节点别名为10.2.3.a,在这两个别名中均拥有相同字段a,因此在确定第一ip时,筛选所有别名中包含相同字段的多组别名,每组别名对应的多个域名可能是cdn节点的域名,通过判断每组别名中的数量是否超过别名数量阈值,来确定该组别名对应的域名是否为cdn节点的域名,例如,将别名数量阈值设置为10,当一组别名中的别名数量大于等于10个,并且相同字段位于别名中的同一个网段的时候,就认为该组别名对应的域名为cdn节点的域名,并将关联该组域名的ip确定为第一ip。也即,本实施例通过筛选相同字段的别名来确定cdn节点的域名,从而确定第一ip。
39.除了确定相同字段的别名,还可以直接判断别名中是否包含目标字段来确定第一ip,可选地,在本技术实施例提供的ip的提取方法中,根据别名的字段从多个ip中确定关联
域名的ip,得到至少一个第一ip包括:判断别名中是否包含目标字段,其中,目标字段为内容分发网络字段;在别名包含目标字段的情况下,确定每个ip关联包含目标字段的别名对应的域名的第二数量,得到多个第二数量;分别判断每个第二数量是否大于等于域名的第一数量阈值;在第二数量大于等于域名的第一数量阈值的情况下,将第二数量对应的ip确定为第一ip,并将包含目标字段的别名对应的域名添加至白名单内,其中,白名单包含多个预设域名。
40.具体地,目标字段可以为cdn,例如某个别名为10.25.31.cdn,则该别名对应的域名为cdn的域名,确定每个ip关联的别名中包含cdn字段的别名对应的域名的第二数量,域名的第一数量阈值可以设置为5,在一个ip的第二数量大于等于5的情况下,确定该ip为第一ip。同时将别名中包含cdn字段的别名对应的域名加入白名单,白名单中包含的多个预设域名也即已知的cdn厂商的域名以及筛选出来的包含cdn字段的别名对应的域名。也即,本实施例通过判断ip关联的域名对应的别名中包含目标字段的数量来确定第一ip。
41.对没有别名的域名通过ip关联的域名中包含白名单中的域名的数量确定第二ip,可选地,在本技术实施例提供的ip的提取方法中,根据ip关联域名的情况从多个ip中确定第二ip包括:确定第二预设时间段内每个ip关联的白名单中的域名的数量,得到第三数量,并判断第三数量是否大于等于域名的第二数量阈值;在第三数量大于等于域名的第二数量阈值的情况下,将第三数量对应的ip确定为第二ip。
42.具体地,第二预设时间段可以设置为1天,若ip关联的多个域名中属于白名单中的域名的数量大于等于域名的第二数量阈值,也即第三数量大于等于域名的第二数量阈值时,该ip为第二ip。例如,第二数量阈值为5,一个ip关联了8个域名,其中5个域名为白名单中的域名,则该ip为第二ip。也即,本实施例通过ip关联的白名单中的域名的数量来确定第二ip。
43.白名单通过cdn厂商的域名确定,可选地,在本技术实施例提供的ip的提取方法中,白名单通过以下方式得到:获取多个内容分发网络厂商的域名,并根据内容分发网络厂商的域名确定白名单。
44.具体地,大部分cdn厂商的域名会有固定的后缀格式,如cloudflare的cdn域名为xx.xx.cloudflare,通过爬取部分cdn服务商记录平台的cdn服务商信息、确定为cdn服务器ip的域名解析记录,人工收集cdn厂商域名后缀构建白名单。
45.为了避免筛选出的cdn的ip不准确,通过对比第三方平台收集的cdn的ip来进一步筛选目标ip,可选地,在本技术实施例提供的ip的提取方法中,在将第一ip和第二ip确定为目标ip,得到目标ip的集合之后,方法还包括:获取第三方平台存储的多个第三方ip,其中,每个第三方ip对应一个内容分发网络厂商;将同一个内容分发网络厂商对应的第三方ip与目标ip进行对比;在第三方ip与目标ip不相同的情况下,将目标ip从集合中剔除。
46.具体地,内容分发网络厂商也即cdn厂商,第三方平台可以为网络上对cdn的ip有记录的平台,通过爬取第三方平台记录cdn服务器ip的网站,获取第三方ip作为参考,将同一个cdn厂商的第三方ip与目标ip进行对比,若二者不同,则存在目标ip不准确的情况,但是第三方ip也存在不准确的情况,因此在目标ip的集合中剔除不准确的目标ip。本实施例通过进一步筛选目标ip,保证提取出的cdn的ip更精准。
47.部分目标ip存在并非是cdn的ip的情况,可选地,在本技术实施例提供的ip的提取
方法中,在将第一ip和第二ip确定为目标ip,得到目标ip的集合之后,方法还包括:将存在相同字段的目标ip进行组合,得到多组目标ip;分别判断每组目标ip中ip的数量是否小于ip数量阈值;在该组目标ip中ip的数量小于ip数量阈值的情况下,将该组目标ip从集合中剔除。
48.具体地,由于cdn的ip通常由多个不同节点的ip构成,同一cdn厂商下的各节点的ip拥有相同字段,部分目标ip由于恰好包含了cdn字段也被提取到目标ip的集合中,但这类目标ip与其他目标ip间没有相同字段,通过筛选无相同字段的孤立目标ip并将其从集合中剔除,从而保障提取的cdn的ip更精确。
49.根据本技术的另一实施例,还提供了一种可选地ip的提取方法,图2是根据本技术实施例提供的一种可选地ip的提取方法的流程图。如图2所示,首先获取域名解析记录,确定域名及每个域名对应的ip,去除内网ip。
50.然后对于有别名的域名,判断别名中具有相同字段的别名数量,在别名数量大于10个的情况下,将该组别名数量大于10的别名对应的ip确定为第一ip,第一ip初步确定为cdn服务器ip。
51.同时,对于有别名的域名,统计ip关联的别名中包含cdn字段的域名的数量,若大于5则将该ip初步确定为cdn服务器ip,这些别名中包含cdn字段的域名加入白名单。白名单中还包括已知cdn厂商的cdn域名。
52.对于无别名的域名,统计指定时间段每个ip关联的域名,若ip关联的域名中属于白名单的域名的数量大于5个,初步确定该ip为cdn服务器ip。
53.对于初步确定为cdn服务器ip的ip,对比第三方cdn数据,若同一cdn厂商的初步确定的ip与第三方cdn数据中的ip不同,则将初步确定的ip剔除。然后剔除同属于c字段的孤立的cdn服务器ip。
54.最后,确定cdn服务器ip对应的域名,将cdn服务器ip与对应的域名组合在一起。
55.通过本实施例提供的可选地ip的提取方法,加入了对别名的筛选机制,能够更精准的确定cdn服务器ip。
56.需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
57.本技术实施例还提供了一种ip的提取装置,需要说明的是,本技术实施例的ip的提取装置可以用于执行本技术实施例所提供的用于ip的提取方法。以下对本技术实施例提供的ip的提取装置进行介绍。
58.图3是根据本技术实施例提供的ip的提取装置的示意图。如图3所示,该装置包括:
59.获取单元10,用于在第一预设时间段内获取多个域名及关联每个所述域名的ip,得到多个ip,并判断每个域名是否具有别名;
60.第一确定单元20,用于在域名具有别名的情况下,根据别名的字段从多个ip中确定关联域名的ip,得到至少一个第一ip;
61.第二确定单元30,用于在域名不具有别名的情况下,根据ip关联域名的情况从多个ip中确定第二ip;
62.第三确定单元40,用于将第一ip和第二ip确定为目标ip,得到目标ip的集合。
63.本技术实施例提供的ip的提取装置,通过获取单元10,在第一预设时间段内获取多个域名及关联每个所述域名的ip,得到多个ip,并判断每个域名是否具有别名;第一确定单元20,在域名具有别名的情况下,根据别名的字段从多个ip中确定关联域名的ip,得到至少一个第一ip;第二确定单元30,在域名不具有别名的情况下,根据ip关联域名的情况从多个ip中确定第二ip;第三确定单元40,将第一ip和第二ip确定为目标ip,得到目标ip的集合。解决了相关技术中确定内容分发网络ip不精确的问题。通过对域名本身自带内容分发网络字段的域名以及内容分发网络厂商对应的域名构建内容分发网络白名单,另外对域名的别名筛选重复字段确定内容分发网络对应的ip,进而达到了精准确定内容分发网络ip的效果。
64.可选地,在本技术实施例提供的ip的提取装置中,第一确定单元20包括:组合模块,用于将存在相同字段的别名进行组合,得到多组别名,并确定每组别名中别名的数量,得到多个第一数量;第一判断模块,用于分别判断每个第一数量是否大于等于别名数量阈值;第一确定模块,用于在第一数量大于等于别名数量阈值的情况下,将多个ip中关联每组别名对应域名的ip确定为第一ip。
65.可选地,在本技术实施例提供的ip的提取装置中,第一确定单元20包括:第二判断模块,用于判断别名中是否包含目标字段,其中,目标字段为内容分发网络字段;第二确定模块,用于在别名包含目标字段的情况下,确定每个ip关联包含目标字段的别名对应的域名的第二数量,得到多个第二数量;第三判断模块,用于分别判断每个第二数量是否大于等于域名的第一数量阈值;第三确定模块,用于在第二数量大于等于域名的第一数量阈值的情况下,将第二数量对应的ip确定为第一ip,并将包含目标字段的别名对应的域名添加至白名单内,其中,白名单包含多个预设域名。
66.可选地,在本技术实施例提供的ip的提取装置中,第二确定单元30包括:第四确定模块,用于确定第二预设时间段内每个ip关联的白名单中的域名的数量,得到第三数量,并判断第三数量是否大于等于域名的第二数量阈值;第五确定模块,用于在第三数量大于等于域名的第二数量阈值的情况下,将第三数量对应的ip确定为第二ip。
67.可选地,在本技术实施例提供的ip的提取装置中,白名单通过以下方式得到:获取多个内容分发网络厂商的域名,并根据内容分发网络厂商的域名确定白名单。
68.可选地,在本技术实施例提供的ip的提取装置中,该装置还包括:第三方ip获取单元,用于获取第三方平台存储的多个第三方ip,其中,每个第三方ip对应一个内容分发网络厂商;对比单元,用于将同一个内容分发网络厂商对应的第三方ip与目标ip进行对比;第一剔除单元,用于在第三方ip与目标ip不相同的情况下,将目标ip从集合中剔除。
69.可选地,在本技术实施例提供的ip的提取装置中,该装置还包括:组合单元,用于将存在相同字段的目标ip进行组合,得到多组目标ip;判断单元,用于分别判断每组目标ip中ip的数量是否小于ip数量阈值;第二剔除单元,用于在该组目标ip中ip的数量小于ip数量阈值的情况下,将该组目标ip从集合中剔除。
70.上述ip的提取装置包括处理器和存储器,上述获取单元10、第一确定单元20、第二确定单元30和第三确定单元40等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
71.处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个
或以上,通过调整内核参数来精准确定内容分发网络ip。
72.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。
73.本技术实施例还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,程序运行时控制非易失性存储介质所在的设备执行一种ip的提取方法。
74.本技术实施例还提供了一种电子装置,包含处理器和存储器;存储器中存储有计算机可读指令,处理器用于运行计算机可读指令,其中,计算机可读指令运行时执行一种ip的提取方法。本文中的电子装置可以是服务器、pc、pad、手机等。
75.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
76.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
77.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
78.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
79.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
80.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介质的示例。
81.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备
或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
82.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
83.以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。

技术特征:


1.一种ip的提取方法,其特征在于,包括:在第一预设时间段内获取多个域名及关联每个所述域名的ip,得到多个ip,并判断每个所述域名是否具有别名;在所述域名具有所述别名的情况下,根据所述别名的字段从所述多个ip中确定关联所述域名的ip,得到至少一个第一ip;在所述域名不具有所述别名的情况下,根据所述ip关联所述域名的情况从所述多个ip中确定第二ip;将所述第一ip和所述第二ip确定为目标ip,得到所述目标ip的集合。2.根据权利要求1所述的方法,其特征在于,根据所述别名的字段从所述多个ip中确定关联所述域名的ip,得到至少一个第一ip包括:将存在相同字段的别名进行组合,得到多组别名,并确定每组别名中所述别名的数量,得到多个第一数量;分别判断每个所述第一数量是否大于等于别名数量阈值;在所述第一数量大于等于所述别名数量阈值的情况下,将所述多个ip中关联所述每组别名对应域名的ip确定为所述第一ip。3.根据权利要求1所述的方法,其特征在于,根据所述别名的字段从所述多个ip中确定关联所述域名的ip,得到至少一个第一ip包括:判断所述别名中是否包含目标字段,其中,所述目标字段为内容分发网络字段;在所述别名包含所述目标字段的情况下,确定每个所述ip关联包含所述目标字段的别名对应的域名的第二数量,得到多个第二数量;分别判断每个所述第二数量是否大于等于域名的第一数量阈值;在所述第二数量大于等于所述域名的第一数量阈值的情况下,将所述第二数量对应的ip确定为所述第一ip,并将所述包含目标字段的别名对应的域名添加至白名单内,其中,所述白名单包含多个预设域名。4.根据权利要求1所述的方法,其特征在于,根据ip关联域名的情况从所述多个ip中确定第二ip包括:确定第二预设时间段内每个所述ip关联的白名单中的域名的数量,得到第三数量,并判断所述第三数量是否大于等于域名的第二数量阈值;在所述第三数量大于等于所述域名的第二数量阈值的情况下,将所述第三数量对应的ip确定为所述第二ip。5.根据权利要求3或4中任意一项所述的方法,其特征在于,所述白名单通过以下方式得到:获取多个内容分发网络厂商的域名,并根据所述内容分发网络厂商的域名确定所述白名单。6.根据权利要求1所述的方法,其特征在于,在将所述第一ip和所述第二ip确定为目标ip,得到所述目标ip的集合之后,所述方法还包括:获取第三方平台存储的多个第三方ip,其中,每个所述第三方ip对应一个内容分发网络厂商;将同一个所述内容分发网络厂商对应的所述第三方ip与所述目标ip进行对比;
在所述第三方ip与所述目标ip不相同的情况下,将所述目标ip从所述集合中剔除。7.根据权利要求1所述的方法,其特征在于,在将所述第一ip和所述第二ip确定为目标ip,得到所述目标ip的集合之后,所述方法还包括:将存在相同字段的所述目标ip进行组合,得到多组目标ip;分别判断每组所述目标ip中ip的数量是否小于ip数量阈值;在该组目标ip中ip的数量小于所述ip数量阈值的情况下,将该组所述目标ip从所述集合中剔除。8.一种ip的提取装置,其特征在于,包括:获取单元,用于从在第一预设时间段内获取多个域名及关联每个所述域名的ip,并判断每个所述域名是否具有别名;第一确定单元,用于在所述域名具有所述别名的情况下,根据所述别名的字段从所述多个ip中确定关联所述域名的ip,得到至少一个第一ip;第二确定单元,用于在所述域名不具有所述别名的情况下,根据所述ip关联所述域名的情况从所述多个ip中确定第二ip;第三确定单元,用于将所述第一ip和所述第二ip确定为目标ip,得到所述目标ip的集合。9.一种非易失性存储介质,其特征在于,所述非易失性存储介质用于存储程序,其中,所述程序运行时控制所述非易失性存储介质所在的设备执行权利要求1至7中任意一项所述的ip的提取方法。10.一种电子装置,其特征在于,包含处理器和存储器,所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行权利要求1至7中任意一项所述的ip的提取方法。

技术总结


本申请公开了一种IP的提取方法、装置、存储介质及电子装置。该方法包括:在第一预设时间段内获取多个域名及关联每个所述域名的IP,得到多个IP,并判断每个域名是否具有别名;在域名具有别名的情况下,根据别名的字段从多个IP中确定关联域名的IP,得到至少一个第一IP;在域名不具有别名的情况下,根据IP关联域名的情况从多个IP中确定第二IP;将第一IP和第二IP确定为目标IP,得到目标IP的集合。通过本申请,解决了相关技术中确定内容分发网络IP不精确的问题。的问题。的问题。


技术研发人员:

陈健 黄冲 陈攀 唐殊瑶 祁海珍

受保护的技术使用者:

山石网科通信技术股份有限公司

技术研发日:

2022.08.19

技术公布日:

2022/11/18

本文发布于:2024-09-22 11:21:22,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/8553.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:域名   别名   多个   所述
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议