ERX700-ERX1400软件升级学习笔记

ERX700/ERX1400软件升级学习笔记
1. ERX模块工作状态描述

ERX的模块主要有SRPline modulei/o module组成,工作状态描述的是SRPline module的运行情况。正常情况下除了备用的SRP状态是standby以外,所有模块的工作状态应为online。通过show version 可以得到各个模块的工作状态:
ERX-1400-CN#show version
Juniper Edge Routing Switch ERX-1400
Copyright (c) 1999-2003 Juniper Networks, Inc.  All rights reserved.
System Release: l
        Version: 5.0.3 release-0.0 [BuildId 1625]   (December 30, 2003  17:41)
System running for: 6 days, 16 hours, 16 minutes, 18 seconds
        (since WED JUL 07 2004 18:40:26 UTC)
 running                 
slot     state            type        admin  spare    release     slot uptime
---- -------------- ---------------- ------- ----- ------------- -------------
0         ---             ---          ---    ---       ---           ---     
1        inactive    GE               enabled  ---  l 6d16h:11m:16s
2         ---             ---          ---    ---       ---           ---     
3        online     FE-8             enabled  ---  l 6d16h:11m:17s
4    hardware error OC3/OC12/DS3-ATM enabled  ---  l      ---     
5         ---             ---          ---    ---       ---           ---     
6        online     SRP-10Ge         enabled  ---  l 6d16h:14m:48s
7       standby     SRP-10Ge         enabled  ---  l      ---     
8    not present OC3-4A           enabled  ---  l      ---     
9         ---             ---          ---    ---       ---           ---     
10        ---             ---          ---    ---       ---           ---     
11   not responding OC3/OC12/DS3-ATM enabled  ---  l      ---     
12        ---             ---          ---    ---       ---           ---     
13       online     GE               enabled  ---  l 6d16h:11m:17s
以下是对各个工作状态的描述:
Ø Inactive,通常是由于该槽位的i/o module 未连接引起的。
Ø Hardware error ,这表明该line module 没有通过上电自检,一般是该模块有硬件问题,通过硬件诊断可以得到log申请case(步骤见下节)。
Ø Not present ,如果原先正常工作的line module 被拔离该槽位会出现该状态。通过配置模式下的slot erase x 可以将该信息清除。(操作前需确认板卡是否在槽位上)
Ø Not responding,通常是SRP无法与该line card 建立控制连接通道,可能是line card 有故障,可以通过 操作模式下的reload slot  x 对该模块重启,如果故障依旧,需要通过硬件诊断确认。   
需要注意的是slot erase x 会同时清空相关槽位的所有配置,应用之前需要确认。而reload slot x 只是将某个line card 进行重启操作,不会影响配置文件。
2.如何对LINE MODULE 实施硬件诊断

板卡在工作时出现异常,如果无法通过重启/更换槽位等方法恢复工作时,只有通过更换新
的模块。通过硬件诊断可以得到模块的故障信息。
在所有line cardSRP上都有一个RJ45的接口,诊断时需要将console线连接到该接口上。ERX console线由一根直通网线以及两个DB-9 RJ45的转换接头(cross overstrait through 各一个)组成。进行硬件诊断用的console线需要一根直通网线及一个crossover DB-9 RJ45的转换接头。

首先将terminal调整到19.2kbps,打开termial的日志功能,将需要诊断的模块重机框中拔出,连接console线后将模块插回机框。此时该linecard 进行上电自检,当出现倒计数时键入空格键,terminal会提示:2/1/0? 选择0,该line card 将刷新板卡上的flash(内含系统软件)。正常情况下,linecard 会启动到 boot##提示,同时linecard上的online等点亮,表明该linecard通过诊断已经恢复工作。该过程需要耗时3分钟左右。

如果linecard通过上述诊断最终出现fail灯常亮,表明该模块有硬件故障,取得日志文件后申请返修。


除了对板卡进行硬件诊断外,我们还可以通过show reboot-history可以迅速了解模块故障或重启的原因:
ERX-1400-CN#sh reboot
*** Entry  1 ***
time of reset: THU JUL 08 2004 16:47:18 UTC
run state: unknown
image type: boot
location: slot (4)
build date: 0x3ff1aed1 TUE DEC 30 2003 16:58:57 UTC
reset type: user reboot, task "scheduler", reason "not specified"
*** Entry  2 ***
time of reset: THU JUL 08 2004 16:45:36 UTC
run state: unknown
image type: boot
location: slot (4)
build date: 0x3ff1aed1 TUE DEC 30 2003 16:58:57 UTC
reset type: power cycle
观察某个linemodule reset type,如果出现反复重启并且是“power cyclye” 那么可能是该linecard 与机框接触不良,或者是由于该linecard上的DC-DC模块出现故障。前者可以通过更换槽位,如果更换之后同样出现类似的log表明该模块的电源模块有问题,直接提起返修即可。
3 软件升级问题及系统配置的恢复

ERX的系统软件是存放在内部flash上的一个单一的.rel文件。该文件通过ftp方式从ftp server上拷贝后生成。在ftp server上的升级文件由一个l文件(例如l)和多个.exe文件组成,该.rel文件是一个索引文件,内部描述了所有模块软件(subsystem)的名称和大小,通常情况下我们不能对该文件修改。
默认情况下我们得到的升级文件包含支持各个类型linecard的模块文件,同时在ftp 拷贝生成
ERX flash上的.rel系统软件也包含了所有subsystem,该.rel就是一个full 版本的系统软件。
通常在进行ftp拷贝时会得到如下提示:copy source not valid,一种可能是由于ftp server 的帐号设置和erx上的host 配置不匹配引起的,另外如果需要拷贝的subsystem文件在ftp server上不存在也可能引起该现象。
如果ERX上有两个SRP,在reload 之前必须进行同步操作:
ERX-1400-CN#synchronize
Please wait…………………….
ERX-1400-CN#
虽然此时ERX提示同步完成,我们必须通过show utilization进行确认。当standbySRP的利用率为0%时才表明同步操作真正完成,可以进行重启了
为了确保新软件的正常运行,一般建议通过reload slot x standbySRP先进行重启(不影响业务,耗时3分钟左右),此后如果show version 显示新的软件已经被备用SRP运行,说明软机没有问题,此时可以重启主用的SRP
升级失败的对策:


主要现象是SRP一直在启动状态,且业务中断。如果有两块SRP可以尝试将有问题的SRP拔出机框,即强行切换到备用SRP的方式进行恢复。如果只有一块SRP那么只能通过如下方式和顺序进行恢复:
Ø 重启SRP(关电/插拔均可)
Ø console出现倒计数时键入mb,强行进入boot 模式
Ø 用出厂配置尝试重启:
boot##boot configure factory-defaults
然后
boot##reload
Ø 如果系统启动成功并且是新的软件版本说明配置文件有问题,此时可以通过配置恢复方式(见以下相关配置)进行配置恢复。
Ø 如果出厂配置时系统仍启动失败表明新的系统软件有问题或者flash有故障。
Ø 尝试恢复到以前的软件版本:
boot## boot system  l 然后重启。
Ø 如果启动失败则我们不得不需要对flash进行初始化操作:
boot##flash-disk initilize 格式化flash
boot##ip   配置以太口(SRP I/O )ip
boot##host ftp 配置host
需要重启设备
boot##copy test:/l  l  重传系统软件
Ø 然后重启后恢复配置。
系统配置的恢复:

方法一、将f拷贝到flash上,在配置模式下
boot f once 然后重启。


方法二、将backup.scr拷贝到flash上,在操作模式下,通过
configure file backup.scr恢复系统配置。

方法一速度较快但需要重启系统,方法二不需重启系统但是需要确保所有模块已经处于online状态才可以进行恢复。
软件升级的步骤:
Ø 备份配置:
host ftp  xxx   xxx   配置 host
copy f
show config >backup.scr
f   ftpserver:/f
copy backup.scr  ftpserver:/backup.scr
Ø ftp server拷贝系统软件到erxflash
copy ftpserver:/l  l
Ø 在配置模式下指定新软件
boot l
Ø 在操作模式下进行配置同步
synchronize
Ø 重启备用SRP
reload slot x   x 是备用SRP的所在的槽位
Ø 重启主用SRP(此时业务中断,时间在515分钟)
reload slot x  x是主用SRP的所在的槽位

本文发布于:2024-09-23 12:21:09,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/95490.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:模块   重启   需要   配置   进行   诊断   硬件
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议