设备运维方法、网络设备及存储介质与流程



1.本技术涉及通信技术领域,尤其涉及一种设备运维方法、网络设备及存储介质。


背景技术:



2.在传统网管技术中,针对网络设备的运维方式通常为:网管平台在网络设备发送的协议信息中捕获异常信息,管理人员根据异常信息对网络设备进行维护,示例性的,网络设备向网管平台发送netconf(network configuration protocol,网络配置协议)信息或snmp(simple network management protocol)信息,当网管平台捕获到异常信息时可以以人机交互的方式告知管理人员,管理人员根据异常信息进行分析,并根据分析结果对网络设备进行维护。由此可知,传统技术并不具备智能性,因此存在一定的局限性,例如,传统技术对网络设备的故障感知存在一定的滞后性,从而使得运维存在滞后性;又例如,传统技术需要花费较大的人力物力,从而导致运维成本过高等等。


技术实现要素:



3.基于此,本技术实施例提供了一种设备运维方法、网络设备及存储介质,以解决传统技术中针对网络设备的运维方式存在局限性的问题。
4.第一方面,本技术实施例提供了一种设备运维方法,应用于网络设备,所述网络设备配置有两个管理模块以及若干监测模块,所述两个管理模块互为主备关系,所述方法包括:
5.所述监测模块对目标对象进行监测,并在满足预设条件时向所述两个管理模块中的主管理模块发送反馈信息,所述反馈信息用于指示所述两个管理模块中的主管理模块实施预设的运维动作;
6.所述两个管理模块中的备用管理模块在确定所述两个管理模块中的主管理模块发生异常时,切换为主管理模块。
7.第二方面,本技术实施例提供了一种网络设备,包括处理器与存储器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如第一方面所述的设备运维方法。
8.第三方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如第一方面所述的设备运维方法。
9.本技术实施例提供的一种设备运维方法、网络设备及存储介质,该网络设备配置有两个管理模块和若干个监测模块,其中,两个管理模块互为主备关系,基于此,该方法包括:监测模块对目标对象进行监测,并在满足预设条件时向两个管理模块中的主管理模块发送反馈信息,其中,反馈信息用于指示主管理模块实施预设的运维动作;两个管理模块中的备用管理模块在确定当前主管理模块发生异常时,切换为主管理模块。可以理解,网络设备通过配置的管理模块和监测模块能够实现自动运维,使得网络设备具备智能性,解决了
传统技术中针对网络设备的运维方式存在局限性的问题,例如,传统技术中存在滞后性和运维成本过高的问题,而本实施例通过管理模块和监测模块,不仅能够及时感知故障并进行运维,且可以有效减少人力物力成本。
附图说明
10.图1为本技术实施例中网络设备的一种配置示意图;
11.图2为本技术实施例中设备运维方法的一种流程示意图;
12.图3为本技术实施例中两个管理模块共用一个通信接口的示意图;
13.图4为本技术实施例中一种应用场景示意图;
14.图5为本技术实施例中本技术实施例中另一种应用场景示意图;
15.图6为本技术实施例中备用管理模块确定主管理模是否发生异常的一种流程示意图;
16.图7为本技术实施例中的网络设备的一种结构示意性框图。
具体实施方式
17.下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
18.附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
19.下面结合附图,对本说明书的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
20.本技术实施例提供的一种设备运维方法,可以应用于网络设备,该网络设备可以包括交换机、路由器等等,例如,网络设备可以是业务交换机、业务路由器、接入路由器等等。如图1所示,网络设备配置有两个管理模块和若干个监测模块,其中,两个管理模块互为主备关系,即一主一备,且在一些实施方式中,管理模块可以包括在设备系统上运行的进程;监测模块也可以包括在设备系统上运行的进程,但在一些实施方式中,监测模块还可以包括网络设备所配备的一些硬件,例如传感器等等。
21.基于此,本技术实施例中的设备运维方法,如图2所示,可以包括但不限于步骤s10至步骤s20。
22.步骤s10、监测模块对目标对象进行监测,并在满足预设条件时向两个管理模块中的主管理模块发送反馈信息,其中,反馈信息用于指示主管理模块实施预设的运维动作。
23.步骤s20、两个管理模块中的备用管理模块在确定当前主管理模块发生异常时,切换为主管理模块。
24.设备运维可以理解为当设备的运行状况不符合预期时管理人员对设备做出一系列操作,以使设备运行能够符合预期。因此在本实施例中,监测模块可以实时对目标对象进行监测,并在监测到满足预设条件时向主管理模块发送反馈信息,从而使得主管理模块可
以根据接收到的反馈信息实施预设的运维动作。其中,目标对象指的是与网络设备运行相关的对象,例如,目标对象可以包括但不限于以下至少一种:与网络设备通信连接的其他设备、网络设备自身所具有的硬件、以及在网络设备系统上运行的应用和进程;预设条件指的是预先设置好的触发条件,而预设的运维动作指的是预先设置好的一系列具体操作,也就是说,在满足预设条件时需实施运维动作。此外,需要说明的是,一个目标对象可以由一个或多个监测模块监测,或者一个监测模块可以对一个或多个目标对象进行检测,本实施例对此并不做限制。
25.可以理解,网络设备通过配置的管理模块和监测模块能够实现自动运维,使得网络设备具备智能性,解决了传统技术中针对网络设备的运维方式存在局限性的问题,例如,传统技术中存在滞后性和运维成本过高的问题,而本实施例通过管理模块和监测模块,不仅能够及时感知故障并进行运维,且可以有效减少人力物力成本。
26.由前文论述可知,两个管理模块互为主备关系,即它们互相作为对方的冗余备份,基于此,备用管理模块在确定主管理模块发生异常时可以切换为主管理模块,继续执行主管理模块所需执行的任务,在一实施方式中,备用管理模块可以实时监控主管理模块是否发生异常,若确定发生异常则切换为主管理模块,或者由其他模块实时监测主管理模块是否发生异常,若确定发生异常则由该模块告知备用管理模块,以使备用管理模块切换为主管理模块。因此,与仅设置一个管理模块的实施方式相比,本实施例可以有效提高了网络设备的可靠性,即使得网络设备具备健壮性,例如,两个管理模块分别为第一管理模块和第二管理模块,此时第一管理模块和第二管理模块分别为主管理模块和备用管理模块,则在监测模块的监测过程中以及第一管理模块实施运维动作的过程中,第二管理模块在确定第一管理模块发生异常时切换为主管理模块,如此可以避免由于第一管理模块发生异常而导致的设备异常。
27.在一实施例中,如图3所示,两个管理模块通过同一个通信接口与监测模块通信,其中,通信接口用于实现管理模块和监测模块两者之间的数据交互,其可以包括在设备系统上运行的进程等等。如此,备用管理模块在切换为主管理模块之后,由于两个管理模块共用同一个通信接口,因此切换后的管理模块仍能够通过原先建立的通信链路继续接收监测模块发送的反馈信息,其中,原先建立的通信链路为发生异常的管理模块与监测模块之间基于通信接口建立的通信链路。例如,两个管理模块分别为第一管理模块和第二管理模块,此时第一管理模块和第二管理模块分别为主管理模块和备用管理模块,可以理解,第一管理模块已经通过通信接口建立了通信链路,则当第一管理模块发生异常时,第二管理模块可以直接通过该通信链路继续接收监测模块发送的反馈信息。
28.因此可以理解,备用管理模块在切换时不需要重新建立通信链路,通过已建立的通信链接即可与监测模块进行交互,跟两个管理模块通过不同的通信接口与监测模块通信的实施方式相比,本实施例可以有效节省备用管理模块的切换时长,从而提高了网络设备的可靠性。具体而言,两个管理模块分别为第一管理模块和第二管理模块,此时第一管理模块和第二管理模块分别为主管理模块和备用管理模块,并且,第一管理模块通过第一通信接口与监测模块通信,第二管理模块通过第二通信接口与监测模块通信,则第一管理模块在发生异常时,第二管理模块在切换时需要与监测模块基于第二通信接口建立通信链路,这会导致切换时长过长,而本实施例中的两个管理模块共用同一个通信接口,不需要重新
建立通信链路,因此可以有效节省切换时长。
29.在一实施例中,步骤s10可以包括如下内容:监测模块基于主管理模块下发的预设监测策略对目标对象进行监测,并在监测到目标对象的运行状况满足预设监测策略所设置的触发条件时,向主管理模块发送反馈信息。
30.主管理模块可以预先将预设的监测策略发送给监测模块,从而使得监测模块可以根据预设监测策略实时对目标对象进行监测,如此监测模块在监测到满足预设监测策略所设置的触发条件时向主管理模块发送反馈信息,反馈信息用于指示主管理模块实施运维动作。
31.在一实施方式中,预设监测策略可以包括第一监测策略、第二监测策略以及第三监测策略中的至少一种。
32.第一监测策略用于指示监测模块对与网络设备连接的目标设备进行监测,并在监测到目标设备与网络设备之间发生连接震荡时,向主管理模块发送第一反馈信息,其中,第一反馈信息用于指示主管理模块断开网络设备与目标设备之间的连接,以及在第一预设时长后重新建立网络设备与目标设备之间的连接。具体而言,目标设备与网络设备之间发生连接震荡指的是在一定时长内两个设备之间反复建立和断开连接,例如,在10分钟之内建立和断开连接的次数大于3(即反复建立和断开连接),可以理解,长时间的连接震荡可能会导致整个网络路由发生震荡,因此为了避免这种情况发生,监测模块在监测到目标设备与网络设备之间发生连接震荡时可以向主管理模块发送第一反馈信息,从而使得主管理模块可以断开网络设备与目标设备之间的连接,避免整个网络路由发生震荡,另外,在一定时长后,主管理模块可以重新建立网络设备与目标设备之间的连接,以恢复网络设备的正常运行。示例性的,如图4所示,网络设备分别与第一设备和第二设备通信,三者组成了一个网络路由,基于此,监测模块可以基于第一监测策略实时对第一设备(即目标设备)进行监测,并在监测到连接震荡时向主管理模块发送第一反馈信息(可以根据实际情况合理设置),因此主管理模块可以断开网络设备与第一设备之间的连接,从而避免了整个网络路由发生震荡(例如避免了网络设备与第二设备发生连接震荡),另外在预设时长后(例如60分钟后)重新建立两者之间的连接,网络设备正常运行。
33.第二监测策略用于指示监测模块对目标业务进行监测,并在监测到目标业务的接收流量超过第一预设阈值时,向主管理模块发送第二反馈信息,第二反馈信息用于指示主管理模块限制其他业务的带宽和/或增大目标业务的带宽。具体而言,若目标业务的接收流量增大而目标业务的带宽不变,则会对目标业务的服务质量(quality of service,qos)造成影响,因此为了避免这种情况发生,监测模块在检测到目标业务的接收流量超过第一预设阈值时可以向主管理模块发送第二反馈信息,从而使得主管理模块可以限制其他业务的带宽和/或增大目标业务的带宽,以确保目标业务的服务质量。在一实施方式中,目标业务可以包括视频会议业务,示例性的,如图5所示,此时网络设备与远方设备正在进行视频会议,则为了确保视频会议的服务质量,则监测模块可以对视频会议业务(即目标业务)进行监测,当监测到视频会议业务的接收流量超过第一预设阈值(可以根据实际情况合理设置)时向主管理模块发送第二反馈信息(可以根据实际情况合理设置),因此主管理模块可以限制其他业务的带宽和/或增大目标业务的带宽。
34.第三监测策略用于指示监测模块对目标硬件进行监控,并在监控到目标硬件的利
用率超过第二预设阈值时,向主管理模块发送第三反馈信息,其中,第三反馈信息用于指示主管理模块调整目标硬件和/或其他硬件的运行状态。在一实施方式中,目标硬件可以包括网络设备的cpu,当监测模块监测到cpu的利用率超过第二预设阈值(可以根据实际情况合理设置)时向主管理模块发送第三反馈信息(可以根据实际情况合理设置),因此主管理模块可以调整目标硬件的运行状态(例如增大cpu的工作频率)和/或其他硬件的运行状态(例如增大风扇的输出功率),以确保网络设备的正常运行。
35.需要说明的是,在其他实施方式中预设监测策略还可以包括其他策略,例如业务进程状态监测、业务质量监控等等,本实施例并不作限制。
36.在一实施例中,该方法还可以包括:预先在两个管理模块中确定一个作为主管理模块。具体而言,在监测模块开始监测前,网络设备需要在两个管理模块中确定一个作为主管理模块,在一实施方式中,网络设备可以基于预设的选定策略,根据两个管理模块各自的id值在两个管理模块中确定一个作为主管理模块,例如,基于预设的选定策略,在两个管理模块中确定id值较小的管理模块作为主管理模块。
37.在一实施例中,该方法还可以包括:对两个管理模块做数据同步处理。可以理解,由于两个管理模块互为主备关系,因此需要做数据同步处理。在一实施方式中,可以定时对两个管理模块做数据同步处理,例如,每5分钟做一次数据同步处理;在其他实施方式中,可以在主管理模块发生数据变更时,备用管理模块同步变更。
38.在一实施例中,备用管理模块确定主管理模块发生异常,可以包括如下内容:备用管理模块周期性地向主管理模块发送预设的探测报文;备用管理模块在每次发送探测报文之后,若在第二预设时长之内没有接收到主管理模块返回的回应报文,则确定主管理模块发生异常。如图5所示,备用管理模块在发送探测报文之后,若有接收到回应报文,则确定主管理模块没有发生异常,备用管理模块可以继续向主管理模块发送探测报文;若在第二预设时长之内没有接收到回应报文,则可以确定主管理模块发生异常,备用管理模块切换为主管理模块,例如,在三倍时间周期之内没有接收到回应报文,则确定主管理模块发生异常。
39.在一实施例中,备用管理模块在切换为主管理模块之后,该方法还可以包括:主管理模块重启发生异常的管理模块,并指示发生异常的管理模块在重启后切换为备用管理模块。示例性的,两个管理模块分别为第一管理模块和第二管理模块,此时第一管理模块和第二管理模块分别为主管理模块和备用管理模块,若第一管理模块发生异常,则第二管理模块切换为主管理模块。在切换完成之后,第二管理模块将第一管理模块进行重启,并指示第一管理模块在重启后切换为备用管理模块,以恢复第一管理模块的正常运行。
40.本技术实施例还提供一种网络设备,如图6所示,包括处理器与存储器,该存储器用于存储计算机程序;该处理器用于执行计算机程序并在执行计算机程序时实现本技术实施例提供的任一项设备运维方法。
41.应当理解的是,处理器可以是中央处理单元(central processing unit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常
规的处理器等。
42.本技术实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时,使处理器实现本技术实施例提供的任一项设备运维方法。
43.本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读存储介质上,计算机可读存储介质可以包括计算机可读存储介质(或非暂时性介质)和通信介质(或暂时性介质)。
44.如本领域普通技术人员公知的,术语计算机可读存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机可读存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
45.示例性的,计算机可读存储介质可以是前述实施例所述的网络设备的内部存储单元,例如网络设备的硬盘或内存。计算机可读存储介质也可以是网络设备的外部存储设备,例如网络设备上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。
46.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。

技术特征:


1.一种设备运维方法,其特征在于,应用于网络设备,所述网络设备配置有两个管理模块以及若干监测模块,所述两个管理模块互为主备关系,所述方法包括:所述监测模块对目标对象进行监测,并在满足预设条件时向所述两个管理模块中的主管理模块发送反馈信息,所述反馈信息用于指示所述两个管理模块中的主管理模块实施预设的运维动作;所述两个管理模块中的备用管理模块在确定所述两个管理模块中的主管理模块发生异常时,切换为主管理模块。2.根据权利要求1所述的方法,所述两个管理模块通过同一个通信接口与所述监测模块通信,以使所述两个管理模块中的备用管理模块在切换为主管理模块之后能够通过原先建立的通信链路继续接收所述监测模块发送的反馈信息,其中,所述原先建立的通信链路为发生异常的管理模块与所述监测模块之间基于所述通信接口建立的通信链路。3.根据权利要求1所述的方法,其特征在于,所述监测模块对目标对象进行监测,并在满足预设条件时向所述两个管理模块中的主管理模块发送反馈信息,包括:所述监测模块基于所述主管理模块下发的预设监测策略对目标对象进行监测,并在监测到所述目标对象的运行状况满足所述预设监测策略所设置的触发条件时,向所述主管理模块发送反馈信息。4.根据权利要求3所述的方法,其特征在于,所述预设监测策略包括第一监测策略、第二监测策略以及第三监测策略中的至少一种;所述第一监测策略用于指示所述监测模块对与所述网络设备连接的目标设备进行监测,并在监测到所述目标设备与所述网络设备之间发生连接震荡时,向所述主管理模块发送第一反馈信息;所述第一反馈信息用于指示所述主管理模块断开所述网络设备与所述目标设备之间的连接,以及在第一预设时长后重新建立所述网络设备与所述目标设备之间的连接;所述第二监测策略用于指示所述监测模块对目标业务进行监测,并在监测到所述目标业务的接收流量超过第一预设阈值时,向所述主管理模块发送第二反馈信息,其中,所述目标业务包括视频会议业务;所述第二反馈信息用于指示所述主管理模块限制其他业务的带宽和/或增大所述目标业务的带宽;所述第三监测策略用于指示所述监测模块对目标硬件进行监测,并在监测到所述目标硬件的利用率超过第二预设阈值时,向所述主管理模块发送第三反馈信息,其中,所述目标硬件包括cpu;所述第三反馈信息用于指示所述主管理模块调整所述目标硬件的运行状态和/或其他硬件的运行状态。5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:预先在所述两个管理模块中确定一个作为主管理模块;和/或对所述两个管理模块做数据同步处理。6.根据权利要求5所述的方法,其特征在于,所述在所述两个管理模块中确定一个作为主管理模块,包括:基于预设的选定策略,根据所述两个管理模块各自的id值在所述两个管理模块中确定一个作为主管理模块。7.根据权利要求1-4任一项所述的方法,其特征在于,所述两个管理模块中的备用管理
模块确定所述两个管理模块中的主管理模块发生异常,包括:所述备用管理模块周期性地向所述主管理模块发送预设的探测报文;所述备用管理模块在每次发送所述探测报文之后,若在第二预设时长之内没有接收到所述主管理模块返回的回应报文,则确定主管理模块发生异常。8.根据权利要求1-4任一项所述的方法,其特征在于,所述两个管理模块中的备用管理模块在切换为主管理模块之后,所述方法还包括:所述主管理模块重启发生异常的管理模块,并指示所述发生异常的管理模块在重启后切换为备用管理模块。9.一种网络设备,其特征在于,包括处理器与存储器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至8中任一项所述的设备运维方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至8中任一项所述的设备运维方法。

技术总结


本申请实施例提供的一种设备运维方法、网络设备及存储介质,该网络设备配置有两个管理模块和若干个监测模块,其中,两个管理模块互为主备关系,基于此,该方法包括:监测模块对目标对象进行监测,并在满足预设条件时向两个管理模块中的主管理模块发送反馈信息,其中,反馈信息用于指示主管理模块实施预设的运维动作;两个管理模块中的备用管理模块在确定当前主管理模块发生异常时,切换为主管理模块。可以理解,网络设备通过配置的管理模块和监测模块能够实现自动运维,使得网络设备具备智能性,解决了传统技术中针对网络设备的运维方式存在局限性的问题。存在局限性的问题。存在局限性的问题。


技术研发人员:

张洁

受保护的技术使用者:

中兴通讯股份有限公司

技术研发日:

2021.05.24

技术公布日:

2022/11/24

本文发布于:2024-09-20 17:19:54,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/4600.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议