提高网络设备的可靠性需要从设备的硬件系统和软件系统两方面考虑。在硬件系统上,提高设备可靠性的方法包括在关键部件上采用大量的冗余设计方式和降额设计方式,对硬件系统的关键部件进行备份,使用正确的制造工艺,对出厂设备进行老化试验;一般情况下,这样的措施能够保证产品的可靠性,但是不排除因为个别器件异常或环境因素的影响,导致产品出现故障,因此需要使用冗余措施来进一步增强设备的可靠性。在使用1+1备份的情况下,设备的可靠性增加50%,因为备份措施比其它措施更能够有效的保证设备的可靠性,所以在传统网络设备中,广泛的使用了备份机制来提高可靠性。 在软件系统上,提高可靠性的技术要复杂得多,它包括提高软件代码的质量,备份关键数据和状态,增加网络冗余协议的支持,提高基本网络协议的冗余特性。从根本上讲,软件代码的质量是软件系统高可靠性的基础,使用规范的软件开发模式,加强软件质量的监督机制,包括进行软件成熟度模型的认证都是提高软件代码质量的方法。对于复杂的软件系统,其对数据和状态的备份要求很高,需要建立良好的软件系统结构,根据不同数据和状态的要求,提供实时和定时的备份机制,在备份中的同步也是要着重考虑的因素之一。
网络设备的快速维护特性是提高网络可用性的另一个思路,缩短故障维护时间,提供业务不中断情况下的设备维护能力。缩短故障维护时间的方法主要是热插拔的单板设计,它需要硬件系统和软件系统协同工作,其主要的思路是将不同的功能单元放置在不同的单板上,使每个功能块都自成为一个子系统,再辅之以硬件的热插拔特性,来达到不同功能块间的充分隔离,做到单板故障不影响设备其余部分的正常工作,因此,当一个单板有故障时,可以在不中断整机业务的情况下,单独对故障单板进行替换。另外一个能够缩短维护时间的方法是软件补丁机制,在传统交换机中,为了不中断业务,提供了对软件Bug进行在线补丁的高级软件特性,此时不影响整机的正常运行,就能够将软件的Bug通过补丁的方式进行修正。
卓越信通公司的TSC Pt3610D、TSC Pt3552D-A在设计之初就充分考虑了设备的可靠性,通过多方面来保证设备稳定,包括严格的硬件和软件开发流程,总结公司多年的工业级设备可靠性设计经验,设计的所有关键部件都是冗余备份的,包括主控板、交换网、电源、风扇等都有冗余部件,同时支持热插拔、热备份,管理总线和数据交换网物理分离,确保了可靠性,同时还提供了各种链路保护技术,包括链路聚合、STP/RSTP/MSTP、VRRP、等价路由等,实现二、三层链路负载分担和备份。
1、网络设备的可靠性计算方法
元器件故障率计算公式为:
其中:
λSSi = 第i个器件的稳态失效率
λGi = 第i个器件的类稳态失效率
πQi = 第i个器件的质量因子
πSi =第i个器件的应力因子
πTi =第i个器件在正常工作温度下,稳态的温度因子
在40℃,50%额定电应力下,所有类型的器件πS =πT = 1.0,因此上式可简化为:
单板故障率是该单板上所有器件故障率的累加:
其中:
n=单元中不同设备类型的种类数
Ni=第i个设备类型的数量
πE=单元环境因子。对于地面受控确定环境,πE=1.0。
根据公式MTBF=1/λSS,可以计算出各单元的MTBF值。
串联结构的故障率是各单元故障率的累加。
MTBF为故障率的倒数:MTBF=1/故障率
可用度A=MTBF/(MTBF+MTTR)
景观水处理技术
停机时间Downtime=525600×(1-A) mins/yr.
核心交换机TSC Pt3610D的可靠性:
关于MTBF和MTTR当前业界其实没有统一的标准定义,卓越信通公司的MTBF和MTTR的计算时,一方面依赖于每个系统部件的可靠性性指标,就是首先知道每个部件的MTBF和MTTR,然后根据系统设计的冗余程度,对系统进行可靠性计算,比如有冗余的部件可以使用类似并联模型,比如没有冗余保护的串联器件可以使用串联模型,这样我们知道如果使用了冗余设计,可靠性会大大提高,另外各种电容/电阻/逻辑器件都有典型的可靠性失效模型,这样,我们有了这些数据和一套计算方法后,我们计算出了各个产品的MTBF。
采用上述计算方法可以得出网络设备各板卡的MTBF值。
TSC Pt3610D本次可能配置的各板卡的MTBF值如下表所示:
型号 | 描述 | Failure Rate(FIT) | 花儿与少年百科 全高清视频直播系统MTBF(年) |
Pt3610D-Chassis | TSC Pt3610D 以太网交换机主机 | 65 | 1756.24 |
Pt36D-PSU-AC | Pt36D系列220VAC交流电源模块 | 620 | 184.12 |
Pt36D-CPM-II | Pt36D系列主控模块II型,适用于PT3610D | 905 | 141.81 硅谷期刊 |
Pt3610-4GX20GT | 24口千兆以太网电接口模块(24个10/100/1000M电口+4个千兆SFP复用光口) | 622 | 183.53 |
Pt3610-12GX | 12口千兆光电复用以太网接口模块(12个10/100/1000M电口+12个千兆SFP复用光口) | 600 | 190.26 |
| | 马兰士cd6003 | |
本项目中控制中心的Pt3610D配置了冗余引擎和冗余电源,其MTBF值为:
MTBF=1/(1/1756.24+0.5/184.12+0.5/141.81+1/183.53+1/190.26)=57.09年
根据MIL-HDBK-472,美军标维修性预计手册的原则,以及工程经验和现场数据确定Pt3610D各单元及设备的平均修复时间MTTR为0.43小时,因此,利用公式:
可以得出核心交换机Pt3610D的可靠性为99.9999%
中心交换机Pt3610D的MTBF值为57.09年。
TSC Pt3552D-A本次可能配置的各板卡的MTBF值如下表所示:
型号 | 描述 | Failure Rate(FIT) | MTBF(年) |
Pt3552D-A | 符跃兰 TSC Pt3552D-A 以太网交换机主机 | 1910 | 59.77 |
TSC-SFP-GS-20 | 1口千兆SFP接插件,单模,1310nm,20公里 | 580 | 196.8 |
| | | |
本项目中车站交换机采用TSC Pt3552D-A,其MTBF值为:
MTBF=1/(1/59.77)=59.77年
车站交换机Pt3552D-A的MTBF值为59.77年