基于仿真网络的故障检测方法及系统与流程



1.本说明书实施例涉及计算机技术领域,特别涉及一种基于仿真网络故障检测方法。


背景技术:



2.网络是一种包括网络设备、网络自动化以及网络风控等各个组件组成了一个庞大的网络分布式系统。在这个庞大的系统中,尽管有充分的监控告警和故障应急处理等处理机制,能够对网络中出现的故障进行检测,但是这些处理机制的缺点在于:都是事后响应和被动应对,只有当网络故障发生之后才能够检测到网络故障。
3.随着网络规模不断扩大以及服务类型的急剧增长,发生网络故障的频率也随之增长,而采用现有处理机制进行网络故障检测的过程中,由于现有处理机制存在的事后响应等缺点,必然无法避免网络故障所造成的损失;因此,如何在网络故障没有发生之前就能够预先检测出网络存在的故障,成为亟需解决的问题。


技术实现要素:



4.有鉴于此,本说明书实施例提供了基于仿真网络的故障检测方法。本说明书一个或者多个实施例同时涉及一种基于仿真网络的故障检测系统、基于仿真网络的故障检测装置,一种计算设备,一种计算机可读存储介质,一种计算机程序,以解决现有技术中存在的技术缺陷。
5.根据本说明书实施例的第一方面,提供了一种基于仿真网络的故障检测方法,包括:
6.接收针对仿真网络的网络故障参数,基于所述网络故障参数对当前运行的所述仿真网络进行调整,其中,所述仿真网络基于物理网络的网络配置参数生成;
7.监测所述仿真网络的当前运行状态,在确定所述当前运行状态与所述网络故障参数对应的预设故障状态不一致的情况下,从所述仿真网络中确定对所述物理网络进行调整的故障参数。
8.根据本说明书实施例的第二方面,提供了一种基于仿真网络的故障检测系统,所述系统包括故障处理节点、仿真网络节点以及故障检测节点,其中,
9.所述故障处理节点,被配置为接收针对仿真网络的网络故障参数,基于所述网络故障参数对所述仿真网络节点中当前运行的所述仿真网络进行调整,其中,所述仿真网络基于物理网络的网络配置参数生成;
10.所述故障检测节点,被配置为监测所述仿真网络的当前运行状态,在确定所述当前运行状态与所述网络故障参数对应的预设故障状态不一致的情况下,从所述仿真网络中确定对所述物理网络进行调整的故障参数。
11.根据本说明书实施例的第三方面,提供了基于仿真网络的故障检测方法,应用于检测管理节点,包括:
12.接收用户基于检测管理界面发送的、且携带有网络故障参数和预设故障状态的故障检测请求,其中,所述检测管理界面为所述检测管理节点向所述用户提供的、对所述网络故障参数和所述预设故障状态进行编辑的界面;
13.基于所述网络故障参数以及所述预设故障状态,指示基于仿真网络的故障检测系统包括的故障处理节点、仿真网络节点以及故障检测节点,执行网络故障检测步骤;
14.接收所述故障检测节点发送的故障参数,并通过所述检测管理界面将所述故障参数向所述用户展示。
15.根据本说明书实施例的第四方面,提供了一种基于仿真网络的故障检测装置,包括:
16.调整模块,被配置为接收针对仿真网络的网络故障参数,基于所述网络故障参数对当前运行的所述仿真网络进行调整,其中,所述仿真网络基于物理网络的网络配置参数生成;
17.确定模块,被配置为监测所述仿真网络的当前运行状态,在确定所述当前运行状态与所述网络故障参数对应的预设故障状态不一致的情况下,从所述仿真网络中确定对所述物理网络进行调整的故障参数。
18.根据本说明书实施例的第五方面,提供了一种基于仿真网络的故障检测装置,应用于检测管理节点,包括:
19.接收模块,被配置为接收用户基于检测管理界面发送的、且携带有网络故障参数和预设故障状态的故障检测请求,其中,所述检测管理界面为所述检测管理节点向所述用户提供的、对所述网络故障参数和所述预设故障状态进行编辑的界面;
20.检测模块,被配置为基于所述网络故障参数以及所述预设故障状态,指示基于仿真网络的故障检测系统包括的故障处理节点、仿真网络节点以及故障检测节点,执行网络故障检测步骤;
21.展示模块,被配置为接收所述故障检测节点发送的故障参数,并通过所述检测管理界面将所述故障参数向所述用户展示。
22.根据本说明书实施例的第六方面,提供了一种计算设备,包括:
23.存储器和处理器;
24.所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现基于仿真网络的故障检测方法的步骤。
25.根据本说明书实施例的第七方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现所述基于仿真网络的故障检测方法的步骤。
26.根据本说明书实施例的第八方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行所述基于仿真网络的故障检测方法的步骤。
27.本说明书提供的基于仿真网络的故障检测方法,包括:接收针对仿真网络的网络故障参数,基于所述网络故障参数对当前运行的所述仿真网络进行调整,其中,所述仿真网络基于物理网络的网络配置参数生成;监测所述仿真网络的当前运行状态,在确定所述当前运行状态与所述网络故障参数对应的预设故障状态不一致的情况下,从所述仿真网络中确定对所述物理网络进行调整的故障参数。
28.具体的,该方法基于物理网络的网络配置参数生成一个仿真网络,再利用网络故障参数对当前运行的仿真网络进行调整,从而模拟物理网络发生的网络故障;之后再确定该仿真网络的当前运行状态,出现了预设故障状态之外的其他情况时,从仿真网络中确定引起网络故障的故障参数,后续能够基于该故障参数对物理网络进行调整,从而实现了物理网络在没有发生网络故障之前,就能够预先检测出网络存在的故障,从而进一步避免了网络故障所造成的损失。
附图说明
29.图1是本说明书一个实施例提供的一种基于仿真网络的故障检测方法的应用场景示意图;
30.图2是本说明书一个实施例提供的一种基于仿真网络的故障检测方法的流程图;
31.图3是本说明书一个实施例提供的一种基于仿真网络的故障检测方法中的网络混沌工程系统的结构示意图;
32.图4是本说明书一个实施例提供的一种基于仿真网络的故障检测方法中的仿真网络系统的结构示意图;
33.图5是本说明书一个实施例提供的一种基于仿真网络的故障检测方法的处理过程流程图;
34.图6是本说明书一个实施例提供的一种基于仿真网络的故障检测系统的结构示意图;
35.图7是本说明书一个实施例提供的另一种基于仿真网络的故障检测方法的流程图;
36.图8是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
37.在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
38.在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
39.应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
40.首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
41.混沌工程:是指在分布式系统上进行实验的学科,混沌工程的目的是建立对系统
抵御生产环境中失控条件的能力以及信心;是一种通过主动向系统中引入故障,并根据系统在各种故障下的表现,从而确定系统异常情况的方法或手段,其中,混沌工程的原则包括:建立稳定状态的假设、真实世界的事件、在生产中试验、持续的自动化实验、最小影响范围等五大原则。
42.网络仿真:是指通过网络虚拟技术(如kvm,docker等技术),仿真出和物理组网近似1:1的仿真组网的技术。
43.立体雷达:是一种各类非预期告警的监控系统,该系统包括ip地址存活探测、互联网流量监测、高风险事件告警、延迟告警、路由异常告警等,在发生告警的情况下,该系统使用立体雷达下跌表示进行告警。
44.linux tc:是指linux内核中用于进行流量控制的命令。
45.kvm:是kernel-based virtual machine的简称,是一个开源的系统虚拟化模块,能够创建虚拟化环境。
46.docker:是一个开源的应用容器引擎。
47.cicd流程:又称为ci/cd流程,其中,ci(持续集成)是构建软件并完成初始测试的过程。cd(持续部署)是将代码与基础设施结合起来的过程。
48.cv流程:进行持续验证的流程。
49.网络包括网络设备本身、网络自动化以及网络风控等各个组件组成了一个庞大的网络分布式系统。在这个庞大的分布式网络系统中,尽管有充分的监控告警和故障应急处理等处理机制,能够对网络中出现的故障进行检测,但是这些处理机制的缺点在于:都是事后的响应与被动应对。随着网络规模不断扩大以及服务类型的急剧增长,发生网络故障的频率也随之增长,而采用上述处理机制会具有较高的系统性风险,例如,在实际应用中,一些互联网企业的网络在运行的过程中,由于边界网关协议(bgp)撤销了托管该互联网企业的域名系统(dns)的ip地址前缀;从而使得该互联网企业的用户无法解析、访问和相关域名。因此,导致该互联网企业开发的多种应用服务发生全球性宕机,逾6-7小时无法使用,致使该其他股价下跌近5%,市值蒸发约473亿美元,至少损失了6000万美元的广告收入。
50.因此,尤其在网络规模不断扩大以及服务类型急剧增长的今天,这种风险趋势越来越明显。既然风险不可避免,那是否可以提前发现、暴露这些风险,而不是等风险出现的时候才去忙于应对呢?为了解决这个问题,混沌工程技术应运而生。而混沌工程也给出了防范系统性风险一种可能的答案。但是,由于网络设备的特殊性(承载了大量稳定性要求非常高的上层服务),在线上设备进行混沌工程实验风险非常高,一旦发生意外,会对网络设备的稳定性造成严重的影响,进一步影响网络设备所承载的上层服务。例如,本说明书提供的一种进行混沌工程实验的混沌工程系统,但是该系统是在线上环境进行混沌实验。如果混沌工程实验本身触发了故障,该系统无法保证可以及时解决(例如,类似上述例子中的没有预案的故障,如果是现网混沌测试触发的,其耗时有可能会超出预期规划验证时间窗口),另外这些系统对于基础网络相关的混沌工程比较局限。主要缺点体现在:
51.1.使用linux tc做一些简单的网络操作,没有系统化完整的注入手段。
52.2.主要操作是针对服务器,而没有针对网络设备,比如交换机、路由器。
53.3.规模上只能处理有限范围,无法覆盖全网所有设备。
54.因此,如何在基础网络系统中进行混沌测试,并且保证网络设备的稳定性,成为需
要解决的问题。
55.在本说明书中,提供了基于仿真网络的故障检测方法,本说明书同时涉及一种基于仿真网络的故障检测系统、基于仿真网络的故障检测装置、一种网络故障检测装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,在下面的实施例中逐一进行详细说明。
56.图1示出了根据本说明书一个实施例提供的一种基于仿真网络的故障检测的应用场景示意图,其中,本说明书提供的基于仿真网络的故障检测方法,可以应用于基于仿真网络的故障检测系统,参见图1可知,该仿真网络的故障检测系统包括:故障处理节点102、仿真网络节点106以及故障检测节点104,具体的,该仿真网络节点106,基于物理网络的网络配置参数生成一个模拟真实物理网络的仿真网络,并运行该仿真网络,再利用故障处理节点102,通过网络故障参数对当前运行的仿真网络进行调整,从而模拟物理网络发生的网络故障;之后利用该故障检测节点104,在确定该仿真网络的当前运行状态,出现了预设故障状态之外的其他情况时,从仿真网络中确定引起网络故障的故障参数,后续能够基于该故障参数对物理网络进行调整,从而实现了物理网络在没有发生网络故障之前,就能够预先检测出网络存在的故障,从而进一步避免了网络故障所造成的损失。
57.图2示出了根据本说明书一个实施例提供的一种基于仿真网络的故障检测方法的流程图,具体包括以下步骤。
58.步骤202:接收针对仿真网络的网络故障参数,基于所述网络故障参数对当前运行的所述仿真网络进行调整,其中,所述仿真网络基于物理网络的网络配置参数生成。
59.需要说明的是,本说明书提供的基于仿真网络的故障检测方法,可以应用于基于仿真网络的故障检测系统,该基于仿真网络的故障检测系统包括故障处理节点、仿真网络节点以及故障检测节点。
60.其中,该基于仿真网络的故障检测系统,可以理解为一种进行混沌工程实验的混沌工程系统,并且,该混沌工程系统为了避免影响网络设备的稳定性,通过引入网络虚拟技术构架一个模拟真实物理网络的仿真网络。
61.该仿真网络节点可以理解为能够基于物理网络的网络配置参数,生成一个仿真网络的节点,需要说明的是,该仿真网络是通过网络虚拟技术模拟出与真实物理网络对应的仿真网络。
62.该网络配置参数可以理解为真实物理网络中各种配置参数,包括但不限于服务器型号、服务器的磁盘型号、磁盘容量等信息、服务器cpu型号、服务器端口信息、路由器数量以及配置信息、ip地址等。
63.该故障处理节点可以理解为能够基于该网络故障参数对该仿真网络进行调整的节点,例如,网络混沌工程系统中的故障注入平台。
64.该网络故障参数可以理解为真实物理网络中可能发生的、或者已经发生的网络故障事件,例如,该网络故障参数可以为服务器、交换机或路由器宕机、网络中断、基础资源异常等等。
65.其中,基于网络故障参数对该仿真网络进行调整可以理解为,该故障处理节点对该仿真网络中得仿真网络设备进行调整,或者模拟仿真网络中出现的异常通知等。例如,该基于网络故障参数对该仿真网络进行调整,包括但不限于:
66.1、构造立体雷达下跌异常,保证变更方案的应急达标正常。
67.2、构造各类软硬件故障,比如模拟板卡异常、设备重启、端口down(失效)、设备隔离、端口隔离等。
68.3、构造cpu满、内存满等基础资源异常。
69.4、通过api(一种借口)调用修改仿真连线,构造各类数据转发异常,比如网络拥塞、控制发包延时、按比例丢包、修改包结构等。
70.5、构造与仿真环境对接的各种自动化管控系统的异常,比如自动化通道异常、立体雷达系统异常等。
71.6、构造网络应用系统调用异常,比如grpc(一种远程过程调用(rpc)技术)调用异常。
72.7、构造各类代码异常注入,比如c/c++/go/python/java等各种代码异常。
73.需要说明的是,上述对该仿真网络进行调整的方式,可以理解为该网络混沌工程系统中的故障注入平台(即故障处理节点)所具备的能力。
74.该故障检测节点可以理解为用于对该仿真网络的当前运行状态进行监测,且能够自动快速定位故障节点(即导致网络故障产生的仿真网络设备),从而获得故障信息的节点。在本说明书提供的一实施例中,该故障检测节点包括状态监测子节点以及故障确定子节点。
75.需要说明的是,在该基于网络虚拟技术的网络故障检测系统为网络混沌工程系统的情况下,该仿真网络节点可以为网络仿真系统,该故障处理节点可以为故障注入平台、该状态监测子节点可以为稳态系统,该故障确定子节点可以为风险快速定位以及根因分析系统。具体的,参见图3,图3是本说明书一个实施例提供的一种基于仿真网络的故障检测方法中的网络混沌工程系统的结构示意图。
76.基于图3可知,本说明书提供的网络混沌工程系统,包括:网络仿真系统、故障注入平台、稳态系统、网络混沌自动化平台以及根因分析系统。
77.其中,该网络仿真系统是一个能够基于虚拟网络技术模拟出与真实物理网络对应的仿真网络的系统,具体可参见图4,图4是本说明书一个实施例提供的一种基于仿真网络的故障检测方法中的仿真网络系统的结构示意图。
78.具体的,混沌工程原则一是“在生产环境中进行实验”,但是,本说明书提供的基于仿真网络的故障检测方法考虑到,并非必须要在生产环境中执行,只是越接近线上环境,混沌工程价值越高;并且,考虑到在真实生产环境进行混沌工程会对网络设备所造成的影响,对于基础网络而言,在生产环境中进行实验的风险非常高,因为爆炸半径非常不好控制,经常出现隔山打牛的网络问题。
79.因此,本说明书提供的基于仿真网络的故障检测方法采用仿真环境+混沌工程的方式,能够比较好的来解决上述问题,并且能够对网络系统性风险进行预防。并且,在采用仿真环境的情况下,爆炸半径可以有效控制在仿真环境内部,不会对生产环境产生影响,这个与混沌工程原则二“最小影响范围”,也即是最小化爆炸半径保持一致。而且仿真环境与线上环境也是可以做到高度一致。
80.具体的,参见图4,本说明书提供的仿真环境(即图4中的网络仿真系统)是利用仿真互联技术,将不同宿主机上的仿真镜像根据现网的连线和配置进行模拟组网,仿真镜像
的种类包括但不限于仿真交换机、仿真路由器、仿真服务器和仿真打流测试仪等。如果有些仿真镜像存在,可以采用多协议逻辑等效替换技术用已有的镜像替换缺失的镜像,保证控制面仿真的完整性。在仿真环境搭建完成后,将现网实际路由信息采样注入到系统中,并通过仿真环境特有的地址探测算法探测路由地址的可达性。最后采用健康检查机制、分层监控机制以及集中log输出定位来保证仿真环境的可靠性。从而完成仿真网络的构建。
81.其中,故障注入平台,是一种能够将真实物理网络中的故障事件注入至该仿真网络中,从而使得仿真网络能够模拟真实物理网络发生的网络故障的平台。需要说明的是,本说明书提供的基于仿真网络的故障检测方法,考虑到混沌工程的原则三是“真实世界的事件”,也即是用多样的现实世界事件做验证,即模拟生产环境中真实存在且有理论依据的故障,为此在网络混沌工程系统中搭建了故障注入平台。
82.其中,稳态系统,是一种能够实现建立稳定的状态假设的节点。该混沌工程的原则四是建立稳定的状态假设,定义能直接反映服务的监控指标以及预期变化,为此在网络混沌工程系统中搭建稳态系统,该稳态系统具备但不限于以下功能:
83.1、监控网络服务功能,如流量端到端,延时,抖动jitter(时钟抖动)等。
84.2、异常情况下具备冗余逃生通道。
85.具体的,该步骤是指,在仿真网络出现重大异常情况下,能够及时对该仿真网络进行管理,避免爆炸半径进一步扩大的能力,具体可以为:在仿真网络出现重大故障的情况下,暂停该网络仿真系统中运行的仿真网络。
86.3、应急处理的实效性预期,即应急处理需要在规定时间内发现、规定时间内回滚。
87.4、关键告警信息100%上报。
88.5、确保任何情况下网络设备流量hash(哈希)均匀。
89.其中,风险快速定位以及根因分析系统,能够结合稳态系统的结果(即网络运行情况)进行自动判断混沌结果,并且通过根因分析系统自动快速定位故障节点。最后将发现的风险作为新的故障反馈给该网络混沌自动化平台,由该网络混沌自动化平台将该新的故障下发至故障注入平台,完成自动化闭环。
90.其中,网络混沌自动化平台,是网络混沌工程系统中面向用户的一个平台,用户通过该网络混沌自动化平台,能够对故障注入能力(即网络故障参数)进行编辑和管理、以及对该故障注入能力对应的预设故障状态进行编辑和管理。需要说明的是,考虑到混沌工程的原则五是持续自动化运行实验,为此本说明书提供的基于仿真网络的故障检测方法,在网络混沌工程系统中搭建混沌工程自动化平台,可以将故障注入能力有效管理和编排,自动化下发,并结合ci\cd流程,构建基于自动化混沌工程测试的cv流程。
91.基于上述内容可知,本说明书中基于仿真网络的故障检测方法,提供了一种低成本高可用的网络仿真混沌工程系统;与已有的混沌工程系统相比,本说明书提供的、结合网络仿真和混沌工程进行网络混沌工程实验的系统,能够系统化地进行仿真混沌工程实验,虽然仿真环境并不能和生产环境完全一致,但是仿真环境是与线上环境最接近的一种低成本高保真环境,它的最大优势是在保证网络控制面一致的基础上保证爆炸半径可以有效控制,不会对生产环境和实时服务产生影响;并且即使混沌工程过程中出现预期之外的异常情况,在仿真环境中其修复验证时间也是可控,而这些在生产环境中都是无法有效控制的,从而以较低的成本,解决基础网络的系统性风险。
92.基于上述内容,在本说明书提供的一实施例中,所述基于所述网络故障参数对当前运行的所述仿真网络进行调整,包括:
93.确定当前运行的所述仿真网络,并从所述仿真网络的仿真网络设备中,确定与所述网络故障参数对应的待调整设备;
94.基于所述网络故障参数对所述待调整设备进行调整。
95.其中,该仿真网络设备可以理解为用于构建该仿真网络的仿真设备,该仿真网络设备包括但不限于仿真服务器、仿真路由器等等。
96.具体的,该故障处理节点,确定仿真网络节点中当前运行的仿真网络,并从仿真网络的仿真网络设备中,确定与网络故障参数对应的待调整设备;之后基于该网络故障参数对所述待调整设备进行调整,从而模拟物理网络发生的网络故障,避免在物理网络中进行混沌工程实验所导致的无法控制爆炸半径、会导致真实物理网络瘫痪、对真实物理网络所运行的服务造成影响等问题。并且避免了搭建一个真实物理网络进行混沌工程,所导致的造价成本过高,大量资金的浪费等问题。
97.沿用上例,该网络故障参数为网络故障事件,基于此,在网络故障事件为cpu满的情况下,故障注入平台基于该网络故障事件确定该仿真网络中的所有仿真服务器cpu,并将该仿真服务器cpu的当前算力调整为负载状态。
98.进一步的,在本说明书提供的一实施例中,本说明书提供的基于仿真网络的故障检测方法考虑到持续自动化运行实验的问题,因此,在网络混沌工程系统中搭建混沌工程自动化平台,从而实现用户能够基于该混沌工程自动化平台,对故障注入能力有效管理和编排,并且自动化下发;具体的,所述接收针对仿真网络的网络故障参数,包括:
99.接收用户发送的故障检测请求,其中,所述故障检测请求中携带有针对仿真网络的网络故障参数,以及所述网络故障参数对应的预设故障状态。
100.其中,该故障处理请求可以理解为指示该故障处理节点对该仿真网络进行调整的请求,例如,该故障处理请求可以为自动化流程、cv流程、ci/cd流程等。
101.具体的,接收用户基于该混沌工程自动化平台所生成的故障处理请求,该故障处理请求中包括对故障注入能力有效管理和编排所生成的网络故障参数,以及该网络故障参数对应的预设故障状态。
102.进一步的,在本说明书提供的实施例中,为了避免在物理网络中进行混沌工程实现所导致的成本较高、以及会导致物理网络设备不稳定的问题,本说明书提供的基于仿真网络的故障检测方法,在网络混沌工程系统中引入仿真网络技术,并基于该仿真网络技术模拟出与该物理网络对应的仿真网络,后续通过对该仿真网络进行混沌工程试验,避免了上述使用物理网络所造成的较高、以及会导致物理网络设备不稳定的问题,具体的,所述基于所述网络故障参数对当前运行的所述仿真网络进行调整之前,还包括:
103.获取所述物理网络的网络配置参数,并基于所述网络配置参数生成的仿真网络设备,构建仿真网络。
104.沿用上例,该网络仿真系统接收该用户发送的网络构建请求,该网络构建请求中携带有网络配置参数;响应于该网络构建请求,基于该网络配置参数生成的仿真网络设备,并通过该仿真网络设备构建仿真网络。
105.进一步的,为了保证仿真网络的真实性,在构建该仿真网络的过程中,不仅需要生
成仿真网络设备,还需要基于真实物理网络中网络设备的路由信息、连线、ip地址、端口地址、通信协议等配置参数,对该仿真网络进行配置,从而进一步保证了该仿真网络与真实物理网络的一致性,避免由于两者不一致所导致故障检测出错的问题,具体的,所述基于所述网络配置参数生成的仿真网络设备,构建仿真网络,包括:
106.从所述网络配置参数中确定网络设备参数,以及对应的网络设备配置参数;
107.基于所述网络设备参数生成仿真网络设备,并基于所述网络设备配置参数,对所述仿真网络设备进行配置,获得仿真网络。
108.其中,该网络设备参数可以理解为真实物理网络中物理设备的cpu型号、端口数量等硬件设备参数;该网络设备配置参数可以理解为真实物理网络中的路由信息、连线、ip地址、通信协议等信息。
109.沿用上例,该网络仿真系统从网络配置参数中确定网络设备参数以及对应的网络设备配置参数,基于该网络设备参数生成仿真服务器、仿真路由器等仿真网络设备,并基于该真实物理网络中的路由信息、连线、ip地址、通信协议,对该仿真网络设备对应的路由信息、连线、ip地址、通信协议进行配置,从而获得一个与真实物理网络一致性较高的仿真网络
110.在本说明书提供的一实施例中,为了提高仿真网络设备的生成效率,该仿真网络节点中会预先存储有用于生成不同类型的仿真网络设备的参数,例如,生成仿真服务器的参数、生成仿真路由器的参数;因此,当需要基于该网络设备参数生成对应的仿真网络设备的情况下,能够直接确定该网络设备参数对应的、用于生成该仿真网络设备的参数,然后基于该参数生成该仿真网络设备,避免通过该网络设备参数生成仿真网络设备过程中,需要耗费大量的时间对该网络设备参数进行解析的问题。
111.或者,本说明书提供的一实施例中,由于物理网络所包含的物理网络设备过多且更新速度较快、或者设备厂商对物理网络设备进行保密等问题,导致仿真网络节点中预先存储的、用于生成不同类型的仿真网络设备的参数存在一定的滞后性,在此情况下,为了保证仿真网络与真实物理网络的一致性,本说明书中的仿真网络节点会利用已有的仿真网络设备以及网络设备参数,创建网络设备参数对应的仿真网络设备,从而保证仿真网络的顺利构建。具体的,所述基于所述网络设备参数生成仿真网络设备,包括:
112.在确定所述网络设备参数不存在对应的仿真网络设备参数的情况下,根据所述网络设备参数生成对应的仿真网络设备;或者
113.在确定所述网络设备参数存在对应的仿真网络设备参数的情况下,基于所述仿真网络设备参数生成仿真网络设备。
114.其中,仿真网络设备参数可以理解为用于生成该仿真网络设备的参数,例如设备镜像。
115.沿用上例,网络仿真系统中的仿真交换机/路由器的端口数目以及端口名,与真实物理设备中交换机/路由器的端口数目以及端口名会存在不一致的问题,比如,真实物理设备上是gigabit1/0/0/2,仿真设备上是ethernet0/0/1;因此,在网络仿真系统构建该仿真网络的过程中,会采用仿真技术,基于现有的仿真设备,以及真实物理设备的端口名gigabit1/0/0/2,模拟出实际需要的仿真设备,并实现设备命令下发时,物理端口和仿真端口的自动转换,从而解决了配置故障注入和稳态数据采集涉及的端口不一致问题。
116.而在网络仿真系统中仿真设备的设备参数,与真实物理设备的设备参数为一致的情况下,则直接生成该真实物理设备对应的仿真设备。
117.步骤204:监测所述仿真网络的当前运行状态,在确定所述当前运行状态与所述网络故障参数对应的预设故障状态不一致的情况下,从所述仿真网络中确定对所述物理网络进行调整的故障参数。
118.其中,对物理网络进行调整的故障参数可以理解为表征该仿真网络中发生的网络故障的、且能够用于对物理网络进行调整的参数,例如,引起网络故障的故障仿真网络设备的标识、或者故障仿真网络设备的故障信息(例如,设备端口名错误、网络端口无法通信等)。
119.具体的,本说明书提供的基于仿真网络的故障检测方法,在根据网络故障参数对该仿真网络进行调整之后,能够对该仿真网络的当前运行状态进行实时监测,在确定该仿真网络的当前运行状态,出现了与网络故障参数对应的预设故障状态之外的其他情况时,则从仿真网络中确定引起网络故障的故障参数,后续能够基于该故障参数对物理网络进行调整。
120.其中,该当前运行状态可以理解为该仿真网络中网络的运行状态,例如,该仿真网络包括仿真路由器a以及与该仿真路由器a通信连接的仿真路由器b;当通过故障注入平台中断仿真路由器a和仿真路由器b之间通信的情况下,该仿真网络的当前运行状态为仿真路由器a与仿真路由器b之间无法通信。
121.具体的,本说明书提供的基于仿真网络的故障检测方法,在通过网络故障参数对该仿真网络进行调整之后,能够实时的对仿真网络的当前运行状态进行监测,当确定该当前运行状态与该网络故障参数对应的预设故障状态不一致的情况下,则确定该仿真网络中出现了意料之外的故障情况,因此,能够将该仿真网络的当前运行状态发送该故障确定子节点进行故障检测,从仿真网络中获得对所述物理网络进行调整的故障参数。
122.进一步的,在实际应用中,考虑到进行混沌工程实验的过程中,需要对爆炸半径进行一定的限制,从而避免构建的仿真网络由于故障注入平台的调整,导致大规模瘫痪的问题,从而保证仿真网络的稳定性,具体的,所述基于仿真网络的故障检测方法,还包括:
123.监测所述仿真网络的当前运行状态,在确定所述当前运行状态满足预设异常条件的情况下,暂停运行所述仿真网络,并从所述仿真网络中确定对所述物理网络进行调整的故障参数。
124.其中,该预设异常条件可以根据实际应用场景进行设置,例如,该预设异常条件为该仿真网络中仿真网络设备的宕机比率大于70%;该仿真网络的爆炸半径大于预设半径阈值等。
125.沿用上例,为了避免在基于该仿真网络进行混沌工程实验的过程中,该仿真网络出现较大意外故障,会预先设定一些异常条件,比如仿真网络中仿真网络设备的宕机比率大于70%;当进行混沌工程实验的过程中,该仿真网络的当前运行状态满足该异常条件,则确定该仿真网络出现较大故障,为了保证该仿真网络的问题,会暂停该仿真网络的运行,并将对当前运行状态进行故障分析,从仿真网络中获得对所述物理网络进行调整的故障参数。
126.进一步的,所述从所述仿真网络中确定对所述物理网络进行调整的故障参数,包
括:
127.基于所述当前运行状态对应的所述网络故障参数,确定所述当前运行状态对应的预设故障状态;
128.基于所述当前运行状态、所述网络故障参数以及所述预设故障状态,从所述仿真网络的仿真网络设备中确定故障网络设备,以及所述故障网络设备的故障信息;
129.将所述故障网络设备以及对应的所述故障信息,确定为对所述物理网络进行调整的故障参数。
130.沿用上例,在确定该仿真网络中出现了意料之外的故障情况的情况下,会确定该仿真网络的当前运行状态所对应的网络故障事件,该网络故障事件是指本轮混沌工作实现中对该仿真网络进行调整的事件,也即是,导致该仿真网络产生该当前运行状态的网络故障事件;
131.之后,确定该网络故障事件对应的预设故障状态,并基于该网络故障事件、预设故障状态以及该当前运行状态信息,对该仿真网络进行分析,从该仿真网络的多个仿真网络设备中,确定导致该当前运行状态与预设故障状态不一致的仿真网络设备。
132.例如,仿真网络中存在仿真路由器a,以及和仿真路由器a进行通信的仿真路由器b,并且仿真路由器a和仿真路由器b各存在一个对应的备份仿真路由器;如果利用故障注入平台,根据路由器a宕机的网络故障事件,当把仿真路由器a执行宕机操作之后,理论上来说,仿真路由器a的备份仿真路由器应该会主动接替仿真路由器a的工作,与仿真路由器b进行通信,在此情况下,该仿真网络的当前运行状态,就与该路由器a宕机的网络故障事件所对应的预设故障状态相吻合。
133.但是,稳态系统监测到两者不吻合的情况下,也即是,仿真路由器a的备份仿真路由器,没有与仿真路由器b建立通信的情况下,该稳态系统将该仿真网络的当前运行状态发送至分析系统;
134.该分析系统基于该当前运行状态、该路由器a宕机的网络故障事件、以及该网络故障事件对应的预设故障状态,对该仿真网络进行分析,确定导致到异常问题的原因在于:该仿真路由器a的备份路由器无法正常启动,从而确定了该仿真网络中出现的故障设备为仿真路由器a的备份仿真路由器,对应的备份仿真路由器的故障信息。
135.然后,该分析系统将该备份仿真路由器,以及对应的故障信息发送给网络混沌自动化平台,从而向用户展示导致该异常问题的仿真设备以及原因,从而使得后续能够基于该仿真设备以及原因,对真实物理网络中对应的物理设备进行调整。
136.本说明书提供的基于仿真网络的故障检测方法,基于物理网络的网络配置参数生成一个仿真网络,再利用网络故障参数对当前运行的仿真网络进行调整,从而模拟物理网络发生的网络故障;之后再确定该仿真网络的当前运行状态,出现了预设故障状态之外的其他情况时,从仿真网络中确定引起网络故障的故障参数,后续能够基于该故障参数对物理网络进行调整,从而实现了物理网络在没有发生网络故障之前,就能够预先检测出网络存在的故障,从而进一步避免了网络故障所造成的损失。
137.下述结合附图5,以本说明书提供的基于仿真网络的故障检测方法在基于网络仿真混沌工程场景下的应用为例,对所述基于仿真网络的故障检测方法进行进一步说明。其中,图5示出了本说明书一个实施例提供的一种基于仿真网络的故障检测方法的处理过程
流程图,该基于仿真网络的故障检测方法应用于网络混沌工程系统,该系统包括:网络仿真系统、故障注入平台、稳态系统、网络混沌自动化平台、风险快速定位以及根因分析系统(以下简称为分析系统),该方法具体包括以下步骤。
138.步骤502:网络混沌自动化平台,在用户终端上展示混沌实验编排界面。
139.步骤504:用户基于该混沌实验编排界面对网络故障和恢复事件,以及对应的预设稳定状态进行编排,并选择故障注入的对象。
140.其中,该恢复事件用于在本次混沌工程结束后将仿真网络恢复为初始状态,该初始状态是指仿真网络在没有进行故障注入时的状态。
141.步骤506:用户在编排完成后,通过实验编排界面向网络混沌自动化平台发送混沌工程实验执行请求。
142.步骤508:网络混沌自动化平台,响应于该混沌工程实验执行请求,并将该网络故障事件发送至故障注入平台,并指示该故障注入平台对仿真网络进行故障注入。
143.步骤510:故障注入平台,响应于网络混沌自动化平台的指示,对网络仿真系统中运行的仿真网络进行故障注入。
144.其中,该仿真网络基于真实物理网络的网络配置、连线以及路由信息构建而成。
145.步骤512:稳态系统,在进行混沌工程实验的过程中,基于网络混沌自动化平台的指示,对仿真网络的当前运行状态进行实时监测;在确定该当前运行状态与预设状态不一致的情况下,将该仿真网络的当前运行状态发送至分析系统。
146.例如,仿真网络中存在仿真路由器a,以及和仿真路由器a进行通信的仿真路由器b,并且仿真路由器a和仿真路由器b各存在一个对应的备份仿真路由器;如果利用故障注入平台,根据路由器a宕机的网络故障事件,当把仿真路由器a执行宕机操作之后,理论上来说,仿真路由器a的备份仿真路由器应该会主动接替仿真路由器a的工作,与仿真路由器b进行通信,在此情况下,该仿真网络的当前运行状态,就与该仿真路由器a宕机的网络故障事件所对应的预设状态相吻合。
147.但是,稳态系统监测到两者不吻合的情况下,也即是,仿真路由器a的备份仿真路由器,没有与仿真路由器b建立通信的情况下,该稳态系统确定出现意料之外的异常情况,因此,将该仿真网络的当前运行状态发送至分析系统;
148.步骤514:分析系统,在进行混沌工程实验的过程中,基于网络混沌自动化平台的指示,根据用户编辑的网络故障事件、预设状态以及该仿真网络的当前运行状态,分析出该仿真网络中的故障仿真网络设备,以及对应的故障原因。
149.例如,分析系统基于该当前运行状态、该仿真路由器a宕机的网络故障事件、以及该网络故障事件对应的预设故障状态,对该仿真网络进行分析,确定导致到异常问题的原因在于:该仿真路由器a的备份仿真路由器无法正常启动,从而确定了该仿真网络中出现的故障设备为仿真路由器a的备份仿真路由器,以及备份仿真路由器对应的故障信息。
150.步骤516:分析系统,将故障仿真网络设备以及对应的故障原因发送至网络混沌自动化平台。
151.步骤518:网络混沌自动化平台,通过用户终端上的混沌实验编排界面,将故障仿真网络设备以及对应的故障原因,展示给用户,便于后续用户对真实物理网络进行调整。最后网络混沌自动化平台将故障注入恢复到之前的状态,便于后续继续其它实验。
152.该分析系统将该备份仿真路由器,以及对应的故障信息发送给网络混沌自动化平台,从而向用户展示导致该异常问题的仿真设备以及原因,从而使得后续能够基于该仿真设备以及原因,对真实物理网络中对应的物理设备进行调整。
153.本说明书提供的基于仿真网络的故障检测方法,提出了在网络仿真环境结合混沌工程实验的解决方案,通过构造与现网设备控制面1:1的仿真环境,对接监管控系统,保证了覆盖的全面性,并且有效了控制了爆炸半径,可以有效防止混沌工程本身可能给线上网络带来的风险。
154.并且,提供更丰富的网络异常注入能力,包括针对网络设备(交换机、路由器)、服务器以及网络控制器等进行各类故障注入,包括通过api调用修改仿真连线构造各类数据转发异常、构造与仿真环境对接的各种自动化系统的异常等等;从而解决基础网络的系统性风险。
155.图6是本说明书一个实施例提供的一种基于仿真网络的故障检测系统的结构示意图,所述系统包括故障处理节点602、仿真网络节点604以及故障检测节点606,其中,
156.所述故障处理节点602,被配置为接收针对仿真网络的网络故障参数,基于所述网络故障参数对所述仿真网络节点604中当前运行的所述仿真网络进行调整,其中,所述仿真网络基于物理网络的网络配置参数生成;
157.所述故障检测节点606,被配置为监测所述仿真网络的当前运行状态,在确定所述当前运行状态与所述网络故障参数对应的预设故障状态不一致的情况下,从所述仿真网络中确定对所述物理网络进行调整的故障参数。
158.针对该基于仿真网络的故障检测系统中包含的故障处理节点602、仿真网络节点604以及故障检测节点606的解释,可参见上述基于仿真网络的故障检测方法中对应或相应地内容,本说明书对此不作赘述。
159.具体的,本说明书提供的基于仿真网络的故障检测系统中的故障处理节点602,能够接收针对仿真网络的网络故障参数,基于网络故障参数对仿真网络节点604中当前运行的仿真网络进行调整。
160.在通过故障处理节点602根据网络故障参数对该仿真网络进行调整之后,能够利用该故障检测节点606,对该仿真网络的当前运行状态进行实时监测,在确定该仿真网络的当前运行状态,出现了与网络故障参数对应的预设故障状态之外的其他情况时,则从仿真网络中确定引起网络故障的故障参数,后续能够基于该故障参数对物理网络进行调整。
161.在本说明书提供的一实施例中,本说明书提供的基于仿真网络的故障检测系统考虑到持续自动化运行实验的问题,因此,在网络混沌工程系统中搭建混沌工程自动化平台,从而实现用户能够基于该混沌工程自动化平台,对故障注入能力有效管理和编排,并且自动化下发。具体的,所述系统还包括检测管理节点;
162.所述检测管理节点,被配置为接收用户发送的故障检测请求,其中,所述故障检测请求中携带有针对仿真网络的网络故障参数,以及所述网络故障参数对应的预设故障状态;
163.响应于所述故障检测请求,将基于所述网络故障参数生成的故障处理指令发送至所述故障处理节点602;以及
164.将所述基于所述网络故障参数以及所述预设故障状态生成的故障检测指令发送
至所述故障检测节点606。
165.其中,该故障处理指令可以理解为指示该故障处理节点602对该仿真网络进行调整的指令;该故障检测指令可以理解为指示该故障检测节点606对该仿真网络进行检测,并确定故障参数的指令。
166.具体的,该检测管理节点能够为用户提供的一个检测管理界面(例如,混沌实验编排界面),并将该检测管理界面在用户终端上向用户展示,该检测管理界面中包含的各种检测管理单元(例如,检测管理界面中用于对网络故障参数以及预设故障状态进行编辑和编排的控件、按钮、选项等)。例如,在本说明书基于仿真网络的故障检测方法应用在混沌工程实验场景时,该检测管理结构可以为在用户终端上展示混沌实验编排界面。
167.而用户则可以通过对该检测管理界面中的各种检测管理单元进行点击、输入、选择等操作,对网络故障参数进行编辑和编排,从而向该检测管理节点发送故障检测请求。例如,用户基于用户终端上展示实验编排界面对网络故障和恢复事件,以及对应的预设稳定状态进行编排,并选择故障注入的对象(即仿真网络)。需要说明的是,本说明书提供的基于仿真网络的故障检测方法会构建多个仿真网络,因此,进行混沌工程实验的过程中,用户需要选择故障注入的仿真网络。
168.之后,该检测管理节点响应于所述故障检测请求,基于该网络故障参数生成的故障处理指令,并将该故障处理指令发送至故障处理节点602;
169.该故障处理节点602能够接收该检测管理节点发送的故障处理指令,并从故障处理指令中获得网络故障参数;后续能够响应于该故障处理指令,利用该网络故障参数对该仿真网络进行调整。该故障检测节点606能够接收该检测管理节点发送的故障检测指令,并从故障检测指令中获得网络故障参数以及对应的预设故障状态;后续能够响应于该故障检测指令,对该仿真网络进行检测并确定故障参数。
170.在本说明书提供的一实施例中,所述故障检测节点606包括状态监测子节点以及故障确定子节点;其中,所述状态监测子节点,被配置为监测所述仿真网络的当前运行状态,在确定所述当前运行状态与所述网络故障参数对应的预设故障状态不一致的情况下,将所述当前运行状态发送至所述故障确定子节点。
171.具体的,本说明书提供的基于仿真网络的故障检测系统,在通过网络故障参数对该仿真网络进行调整之后,能够通过该状态监测子节点实时的对仿真网络的当前运行状态进行监测,当确定该当前运行状态与该网络故障参数对应的预设故障状态不一致的情况下,则确定该仿真网络中出现了意料之外的故障情况,因此,该状态监测子节点能够将该仿真网络的当前运行状态发送该故障确定子节点进行故障检测。
172.进一步的,在实际应用中,考虑到进行混沌工程实验的过程中,需要对爆炸半径进行一定的限制,从而避免构建的仿真网络由于故障注入平台的调整,导致大规模瘫痪的问题,从而保证仿真网络的稳定性,具体的,所述基于仿真网络的故障检测方法,还包括:
173.所述状态监测子节点,监测所述仿真网络的当前运行状态,在确定所述当前运行状态满足预设异常条件的情况下,暂停运行所述仿真网络节点604中的仿真网络,并将所述仿真网络的当前运行状态发送至所述故障确定子节点。具体针对该状态监测子节点的解释,可参见上述基于仿真网络的故障检测方法中对应或相应的解释,在此不过多赘述。
174.其中,所述故障确定子节点,被配置为基于所述当前运行状态,从所述仿真网络中
确定对所述物理网络进行调整的故障参数。
175.具体的,所述故障确定子节点,基于所述当前运行状态对应的所述网络故障参数,确定所述当前运行状态对应的预设故障状态;基于所述当前运行状态、所述网络故障参数以及所述预设故障状态,从所述仿真网络的仿真网络设备中确定故障网络设备,以及所述故障网络设备的故障信息;将所述故障网络设备以及对应的所述故障信息,确定为对所述物理网络进行调整的故障参数。具体针对该故障确定子节点的解释,可参见上述基于仿真网络的故障检测方法中对应或相应的解释,在此不过多赘述。
176.在本说明书提供的基于仿真网络的故障检测系统,基于物理网络的网络配置参数在仿真网络节点604中生成一个仿真网络,再利用故障处理节点602,通过网络故障参数对当前运行的仿真网络进行调整,从而模拟物理网络发生的网络故障;之后利用该故障检测节点606,在确定该仿真网络的当前运行状态,出现了预设故障状态之外的其他情况时,从仿真网络中确定引起网络故障的故障参数,后续能够基于该故障参数对物理网络进行调整,从而实现了物理网络在没有发生网络故障之前,就能够预先检测出网络存在的故障,从而进一步避免了网络故障所造成的损失。
177.图7示出了根据本说明书一个实施例提供的另一种基于仿真网络的故障检测方法的流程图,该方法应用于检测管理节点,该方法具体包括以下步骤。
178.步骤702:接收用户基于检测管理界面发送的、且携带有网络故障参数和预设故障状态的故障检测请求。
179.其中,所述检测管理界面为所述检测管理节点向所述用户提供的、对所述网络故障参数和所述预设故障状态进行编辑的界面。
180.步骤704:基于所述网络故障参数以及所述预设故障状态,指示基于仿真网络的故障检测系统包括的故障处理节点、仿真网络节点以及故障检测节点,执行网络故障检测步骤。
181.其中,该基于仿真网络的故障检测系统为上述实施例中的基于仿真网络的故障检测系统,因此,指示基于仿真网络的故障检测系统包括的故障处理节点、仿真网络节点以及故障检测节点,执行网络故障检测步骤,可以参见上述实施例中的解释,在此不过多赘述。
182.步骤706:接收所述故障检测节点发送的故障参数,并通过所述检测管理界面将所述故障参数向所述用户展示。
183.在本说明书提供的另一种基于仿真网络的故障检测方法中,该检测管理节点能够向用户提供一种,在用户终端上展示的、且能够使用户对网络故障参数和预设故障状态进行编辑的检测管理界面。而用户能够基于该检测管理界面对网络故障参数和预设故障状态进行编辑,并向该检测管理节点发送携带有网络故障参数和预设故障状态的故障检测请求。
184.而该检测管理节点,能够接收用户发送的故障检测请求,并响应于该故障检测请求,基于该网络故障参数以及预设故障状态,指示基于网络虚拟技术的网络故障检测系统包括的故障处理节点、仿真网络节点以及故障检测节点,执行上述一种基于仿真网络的故障检测方法中的网络故障检测步骤。
185.最后,在网络故障检测执行完毕之后,该检测管理节点能够接收到该故障检测节点发送的故障参数,并通过该检测管理界面将故障参数向用户展示。
186.需要说明的是,针对该另一种基于仿真网络的故障检测方法的解释可以参考上述一种基于仿真网络的故障检测方法中,对应或相应的内容,本说明书对此不作具体限制。
187.本说明书提供的另一种基于仿真网络的故障检测方法,响应于用户基于检测管理界面发送的故障检测请求,基于该故障检测请求中携带的网络故障参数以及预设故障状态,指示基于网络虚拟技术的网络故障检测系统包括的故障处理节点、仿真网络节点以及故障检测节点,执行网络故障检测步骤;从而实现了物理网络在没有发生网络故障之前,就能够预先检测出网络存在的故障,并且,在网络故障检测完毕之后,通过检测管理界面,将故障检测节点发送的故障参数向用户展示,从而便于后续用户基于该故障参数对物理网络进行调整,从而进一步避免了网络故障所造成的损失。
188.上述为本实施例的另一种基于仿真网络的故障检测方法的示意性方案。需要说明的是,该另一种基于仿真网络的故障检测方法的技术方案与上述的一种网络故障检测的技术方案属于同一构思,另一种基于仿真网络的故障检测方法的技术方案未详细描述的细节内容,均可以参见上述一种网络故障检测的技术方案的描述。
189.与上述方法实施例相对应,本说明书还提供了一种基于仿真网络的故障检测装置实施例,该装置包括:
190.调整模块,被配置为接收针对仿真网络的网络故障参数,基于所述网络故障参数对当前运行的所述仿真网络进行调整,其中,所述仿真网络基于物理网络的网络配置参数生成;
191.确定模块,被配置为监测所述仿真网络的当前运行状态,在确定所述当前运行状态与所述网络故障参数对应的预设故障状态不一致的情况下,从所述仿真网络中确定对所述物理网络进行调整的故障参数。
192.可选地,所述基于仿真网络的故障检测装置,还包括网络构建模块,被配置为:
193.获取所述物理网络的网络配置参数,并基于所述网络配置参数生成的仿真网络设备,构建仿真网络。
194.可选地,所述网络构建模块,还被配置为:
195.从所述网络配置参数中确定网络设备参数,以及对应的网络设备配置参数;
196.基于所述网络设备参数生成仿真网络设备,并基于所述网络设备配置参数,对所述仿真网络设备进行配置,获得仿真网络。
197.可选地,所述网络构建模块,还被配置为:
198.在确定所述网络设备参数不存在对应的仿真网络设备参数的情况下,根据所述网络设备参数生成对应的仿真网络设备;或者
199.在确定所述网络设备参数存在对应的仿真网络设备参数的情况下,基于所述仿真网络设备参数生成仿真网络设备。
200.可选地,所述调整模块,还被配置为:
201.确定当前运行的所述仿真网络,并从所述仿真网络的仿真网络设备中,确定与所述网络故障参数对应的待调整设备;
202.基于所述网络故障参数对所述待调整设备进行调整。
203.可选地,所述调整模块,还被配置为:
204.接收用户发送的故障检测请求,其中,所述故障检测请求中携带有针对仿真网络
的网络故障参数,以及所述网络故障参数对应的预设故障状态。
205.可选地,所述基于仿真网络的故障检测装置,还包括暂停运行模块,被配置为:
206.监测所述仿真网络的当前运行状态,在确定所述当前运行状态满足预设异常条件的情况下,暂停运行所述仿真网络,并从所述仿真网络中确定对所述物理网络进行调整的故障参数。
207.可选地,所述确定模块,还被配置为:
208.基于所述当前运行状态对应的所述网络故障参数,确定所述当前运行状态对应的预设故障状态;
209.基于所述当前运行状态、所述网络故障参数以及所述预设故障状态,从所述仿真网络的仿真网络设备中确定故障网络设备,以及所述故障网络设备的故障信息;
210.将所述故障网络设备以及对应的所述故障信息,确定为对所述物理网络进行调整的故障参数。
211.本说明书提供的一种基于仿真网络的故障检测装置,基于物理网络的网络配置参数生成一个仿真网络,再利用网络故障参数对当前运行的仿真网络进行调整,从而模拟物理网络发生的网络故障;之后再确定该仿真网络的当前运行状态,出现了预设故障状态之外的其他情况时,从仿真网络中确定引起网络故障的故障参数,后续能够基于该故障参数对物理网络进行调整,从而实现了物理网络在没有发生网络故障之前,就能够预先检测出网络存在的故障,从而进一步避免了网络故障所造成的损失。
212.上述为本实施例的一种基于仿真网络的故障检测装置。需要说明的是,该一种基于仿真网络的故障检测装置的技术方案与上述的一种基于仿真网络的故障检测方法的技术方案属于同一构思,一种基于仿真网络的故障检测装置的技术方案未详细描述的细节内容,均可以参见上述一种基于仿真网络的故障检测方法的技术方案的描述。
213.与上述方法实施例相对应,本说明书还提供了另一种基于仿真网络的故障检测装置实施例,该装置应用于检测管理模块,包括:
214.接收模块,被配置为接收用户基于检测管理界面发送的、且携带有网络故障参数和预设故障状态的故障检测请求,其中,所述检测管理界面为所述检测管理节点向所述用户提供的、对所述网络故障参数和所述预设故障状态进行编辑的界面;
215.检测模块,被配置为基于所述网络故障参数以及所述预设故障状态,指示基于仿真网络的故障检测系统包括的故障处理节点、仿真网络节点以及故障检测节点,执行网络故障检测步骤;
216.展示模块,被配置为接收所述故障检测节点发送的故障参数,并通过所述检测管理界面将所述故障参数向所述用户展示。
217.本说明书提供的另一种基于仿真网络的故障检测装置,响应于用户基于检测管理界面发送的故障检测请求,基于该故障检测请求中携带的网络故障参数以及预设故障状态,指示基于网络虚拟技术的网络故障检测系统包括的故障处理模块、仿真网络模块以及故障检测模块,执行上述一种基于仿真网络的故障检测方法中的网络故障检测步骤;从而实现了物理网络在没有发生网络故障之前,就能够预先检测出网络存在的故障,并且,在网络故障检测完毕之后,通过检测管理界面,将故障检测模块发送的故障参数向用户展示,从而便于后续用户基于该故障参数对物理网络进行调整,从而进一步避免了网络故障所造成
的损失。
218.上述为本实施例的另一种基于仿真网络的故障检测装置。需要说明的是,该另一种基于仿真网络的故障检测装置的技术方案与上述的另一种基于仿真网络的故障检测方法的技术方案属于同一构思,另一种基于仿真网络的故障检测装置的技术方案未详细描述的细节内容,均可以参见上述另一种基于仿真网络的故障检测方法的技术方案的描述。
219.图8示出了根据本说明书一个实施例提供的一种计算设备800的结构框图。该计算设备800的部件包括但不限于存储器810和处理器820。处理器820与存储器810通过总线830相连接,数据库850用于保存数据。
220.计算设备800还包括接入设备840,接入设备840使得计算设备800能够经由一个或多个网络860通信。这些网络的示例包括公用交换电话网(pstn)、局域网(lan)、广域网(wan)、个域网(pan)或诸如因特网的通信网络的组合。接入设备840可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(nic))中的一个或多个,诸如ieee802.11无线局域网(wlan)无线接口、全球微波互联接入(wi-max)接口、以太网接口、通用串行总线(usb)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc)接口,等等。
221.在本说明书的一个实施例中,计算设备800的上述部件以及图8中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图8所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
222.计算设备800可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或pc的静止计算设备。计算设备800还可以是移动式或静止式的服务器。
223.其中,处理器820用于执行如下计算机可执行指令,该计算机可执行指令被处理器820执行时实现上述基于仿真网络的故障检测方法的步骤。
224.上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的基于仿真网络的故障检测方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述基于仿真网络的故障检测方法的技术方案的描述。
225.本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述基于仿真网络的故障检测方法的步骤。
226.上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的基于仿真网络的故障检测方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述基于仿真网络的故障检测方法的技术方案的描述。
227.本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述基于仿真网络的故障检测方法的步骤。
228.上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的基于仿真网络的故障检测方法的技术方案属于同一构思,计算机程序
的技术方案未详细描述的细节内容,均可以参见上述基于仿真网络的故障检测方法的技术方案的描述。
229.上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
230.所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
231.需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
232.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
233.以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

技术特征:


1.一种基于仿真网络的故障检测方法,包括:接收针对仿真网络的网络故障参数,基于所述网络故障参数对当前运行的所述仿真网络进行调整,其中,所述仿真网络基于物理网络的网络配置参数生成;监测所述仿真网络的当前运行状态,在确定所述当前运行状态与所述网络故障参数对应的预设故障状态不一致的情况下,从所述仿真网络中确定对所述物理网络进行调整的故障参数。2.根据权利要求1所述的基于仿真网络的故障检测方法,所述基于所述网络故障参数对当前运行的所述仿真网络进行调整之前,还包括:获取所述物理网络的网络配置参数,并基于所述网络配置参数生成的仿真网络设备,构建仿真网络。3.根据权利要求2所述的基于仿真网络的故障检测方法,所述基于所述网络配置参数生成的仿真网络设备,构建仿真网络,包括:从所述网络配置参数中确定网络设备参数,以及对应的网络设备配置参数;基于所述网络设备参数生成仿真网络设备,并基于所述网络设备配置参数,对所述仿真网络设备进行配置,获得仿真网络。4.根据权利要求3所述的基于仿真网络的故障检测方法,所述基于所述网络设备参数生成仿真网络设备,包括:在确定所述网络设备参数不存在对应的仿真网络设备参数的情况下,根据所述网络设备参数生成对应的仿真网络设备;或者在确定所述网络设备参数存在对应的仿真网络设备参数的情况下,基于所述仿真网络设备参数生成仿真网络设备。5.根据权利要求1所述的基于仿真网络的故障检测方法,所述基于所述网络故障参数对当前运行的所述仿真网络进行调整,包括:确定当前运行的所述仿真网络,并从所述仿真网络的仿真网络设备中,确定与所述网络故障参数对应的待调整设备;基于所述网络故障参数对所述待调整设备进行调整。6.根据权利要求1所述的基于仿真网络的故障检测方法,所述接收针对仿真网络的网络故障参数,包括:接收用户发送的故障检测请求,其中,所述故障检测请求中携带有针对仿真网络的网络故障参数,以及所述网络故障参数对应的预设故障状态。7.根据权利要求1所述的基于仿真网络的故障检测方法,还包括:监测所述仿真网络的当前运行状态,在确定所述当前运行状态满足预设异常条件的情况下,暂停运行所述仿真网络,并从所述仿真网络中确定对所述物理网络进行调整的故障参数。8.根据权利要求1所述的基于仿真网络的故障检测方法,所述从所述仿真网络中确定对所述物理网络进行调整的故障参数,包括:基于所述当前运行状态对应的所述网络故障参数,确定所述当前运行状态对应的预设故障状态;基于所述当前运行状态、所述网络故障参数以及所述预设故障状态,从所述仿真网络
的仿真网络设备中确定故障网络设备,以及所述故障网络设备的故障信息;将所述故障网络设备以及对应的所述故障信息,确定为对所述物理网络进行调整的故障参数。9.一种基于仿真网络的故障检测系统,所述系统包括故障处理节点、仿真网络节点以及故障检测节点,其中,所述故障处理节点,被配置为接收针对仿真网络的网络故障参数,基于所述网络故障参数对所述仿真网络节点中当前运行的所述仿真网络进行调整,其中,所述仿真网络基于物理网络的网络配置参数生成;所述故障检测节点,被配置为监测所述仿真网络的当前运行状态,在确定所述当前运行状态与所述网络故障参数对应的预设故障状态不一致的情况下,从所述仿真网络中确定对所述物理网络进行调整的故障参数。10.根据权利要求9所述的基于仿真网络的故障检测系统,所述系统还包括检测管理节点;所述检测管理节点,被配置为接收用户发送的故障检测请求,其中,所述故障检测请求中携带有针对仿真网络的网络故障参数,以及所述网络故障参数对应的预设故障状态;响应于所述故障检测请求,将基于所述网络故障参数生成的故障处理指令发送至所述故障处理节点;以及将所述基于所述网络故障参数以及所述预设故障状态生成的故障检测指令发送至所述故障检测节点。11.根据权利要求9所述的基于仿真网络的故障检测系统,所述故障检测节点包括状态监测子节点以及故障确定子节点;所述状态监测子节点,被配置为监测所述仿真网络的当前运行状态,在确定所述当前运行状态与所述网络故障参数对应的预设故障状态不一致的情况下,将所述当前运行状态发送至所述故障确定子节点;所述故障确定子节点,被配置为基于所述当前运行状态,从所述仿真网络中确定对所述物理网络进行调整的故障参数。12.一种基于仿真网络的故障检测方法,应用于检测管理节点,包括:接收用户基于检测管理界面发送的、且携带有网络故障参数和预设故障状态的故障检测请求,其中,所述检测管理界面为所述检测管理节点向所述用户提供的、对所述网络故障参数和所述预设故障状态进行编辑的界面;基于所述网络故障参数以及所述预设故障状态,指示基于仿真网络的故障检测系统包括的故障处理节点、仿真网络节点以及故障检测节点,执行网络故障检测步骤;接收所述故障检测节点发送的故障参数,并通过所述检测管理界面将所述故障参数向所述用户展示。13.一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至8任意一项所述的基于仿真网络的故障检测方法、或者权利要求12所述的基于仿真网络的故障检测方法的步骤。
14.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至8任意一项所述的基于仿真网络的故障检测方法、或者权利要求12所述的基于仿真网络的故障检测方法的步骤。

技术总结


本说明书实施例提供基于仿真网络的故障检测方法及系统,其中所述基于仿真网络的故障检测方法,包括:接收针对仿真网络的网络故障参数,基于所述网络故障参数对当前运行的所述仿真网络进行调整,其中,所述仿真网络基于物理网络的网络配置参数生成;监测所述仿真网络的当前运行状态,在确定所述当前运行状态与所述网络故障参数对应的预设故障状态不一致的情况下,从所述仿真网络中确定对所述物理网络进行调整的故障参数;实现了物理网络在没有发生网络故障之前,就能够预先检测出网络存在的故障,从而进一步避免了网络故障所造成的损失。失。失。


技术研发人员:

吴功伟 林涛

受保护的技术使用者:

阿里巴巴(中国)有限公司

技术研发日:

2022.08.18

技术公布日:

2022/12/12

本文发布于:2024-09-21 20:32:12,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/32738.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   网络   故障   参数
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议