系统运维管理_IT基础设施运维管理规范标准[详]

系统运维管理_IT基础设施运维管理规范标准[详]
IT 基础设施运维管理规范⽂件编号:运维-002-V1.0
⽬录
运维管理规范-------------------------------------------------- 4
1. ⽬的--------------------------------------------------------- 4
2. 适⽤范围----------------------------------------------------- 4
3. 规范性引⽤及参考--------------------------------------------- 4
4. 本⽂术语,定义和缩略语--------------------------------------- 5
5. 基本要求----------------------------------------------------- 5
5.1运维管理原则-------------------------------------------- 5
5.2制度和流程管理------------------------------------------ 6
5.3 ⽂档管理------------------------------------------------ 6
5.4设备和软件管理------------------------------------------ 6
5.5供应商管理---------------------------------------------- 6
5.6督促检查------------------------------------------------ 7
6. 运⾏维护----------------------------------------------------- 7
6.1⽇常操作及监控分析-------------------------------------- 7
6.2 数据与介质管理------------------------------------------ 8
6.3机房管理------------------------------------------------ 8
6.4 ⽹络管理------------------------------------------------ 9
6.5 弱电管理------------------------------------------------ 9
6.6桌⾯维护----------------------------------------------- 10
6.7服务器及系统变更--------------------------------------- 10
6.8 配置管理----------------------------------------------- 11
6.9 事件与问题管理----------------------------------------- 11
7. 应急管理---------------------------------------------------- 12
7.1应急准备----------------------------------------------- 12
7.2应急处置----------------------------------------------- 12
运维管理规范
1. ⽬的
为规范公司运维⼯作,使相关⼯作具有持续改善及相互协作性,同时加强计算机设备的管理及维护,确保维修⼯作的及时性,降低计算机设备的报修率,实现业务与技术的融合,将业务部门与IT 部门紧密结合在⼀起,根据公司管理要求及计算机应⽤的需要,由运维部制定。
2. 适⽤范围
本规范规定了运维管理⼯作的要求。
本规范适⽤于维信理财集团(中国) 总部,包括全国各分部及门店。
3. 规范性引⽤及参考
◆ IT 服务管理国际标准ISO/IEC 20000
◆企业获得ISO/IEC 20000认证的权威指南
◆全球著名IT 服务管理书库(ITSM Library)
◆ IT 服务质量管理原则
◆理解ISO/IEC 20000在IT 服务中的地位
◆ ISO/IEC 20000规范和实践准则
◆ IT 服务管理国际标准ISO/IEC 20000
◆ GB/T 20269—2006 信息安全技术信息系统安全管理要求
◆ ISO 31000:2009 风险管理原则和指南(Risk management -- Principles and guidelines)
◆ JR-T 0060—2010 ⾦融信息系统安全等级保护基本要求
◆ JR/T 0074-2012 ⾦融IT 服务管理基本规范
◆中国⾦融标准化报告(2011)
4. 本⽂术语,定义和缩略语
1、 IT: Information Technology 信息技术
2、 DNS: Domain Name Service 域名服务
3、 DHCP: Dynamic Host Configuration Protocol 动态主机配置协议
4、 VPN: Virtual Private Network 虚拟专⽤⽹
5、 OA: Office Automation 办公⾃动化系统
6、 ISO: International Organization for Standardization 国际标准化组织
编订⽇期:30.7.2014 批准⽇期: ⽣效⽇期:
7、故障: IT设备或系统丧失规定的功能,导致服务中断或降质,或对正常运⾏造成潜在威胁。
8、异常: IT设备或系统的状态发⽣超出预期的变化或性能指标参数超出正常范围,有可能引发或已经引发故障,需要引起运维⼈员关注或处理。
9、资料: IT设备或系统的运⾏记录,包括IT 设备或系统的配置、故障历史记录、软硬件扩容或调整记录、权限变更申请记录等。
10、运⾏维护:本规范中的运⾏维护包括IT 基础设施维护、IT 应⽤系统运维维护、安全管理、⽹络接⼊、内容信息以及综合管理等。
5. 基本要求
5.1运维管理原则
公司按集中与分散相结合的原则,设⽴机房、各部门配备电脑。计算机系统本着“总体规划、分步建设”的⽅式实施建⽴。
计算机系统建设应综合考虑成本、费⽤、效率、效果、先进性及适⽤性,选择最优技术、经济⽅案。
5.2制度和流程管理
运维管理制度应包括但不限于机房管理、⽹络与系统管理、数据和介质管理、配置管理、安全管理、监控管理、⽂档管理、设备和软件管理、供应商管理等制度。
运维操作流程应包括但不限于⽇常操作、事件处理、问题处理、系统变更、应急处置等流程。
5.3 ⽂档管理
对运维过程中涉及的各类⽂档进⾏管理,可按照制度⽂档、技术⽂档、合同⽂档、审批记录、⽇志记录等进⾏分类,并妥善保存。 5.3.2 对⽂档的版本应当进⾏控制。
⽂档在使⽤时应能读取、使⽤较新版本,防⽌作废⽂件的逾期使⽤。
5.4设备和软件管理
建⽴计算机相关设备和软件管理制度,对设备和软件的使⽤、安装、维修(升级)等进⾏规范。明确设备和软件管理责任⼈。对设备进⾏标识,标识应放在设备明显位置。
规定设备和软件的使⽤年限,定期进⾏盘点,并对设备状态进⾏评估和更新。对外送设备的维修进⾏严格管理,防⽌数据泄露。
对拟下线和拟报废设备的存储介质中的全部信息进⾏清除或销毁。对正式下线设备和软件交指定部门统⼀管理、保存或处置,并保留相应记录。设备和软件报废应符合公司现⾏资产管理规定。
5.5供应商管理
对供应商⽀持运维服务的相关活动进⾏统⼀管理。
在与供应商签订的合同中明确其应承担的责任、义务,并约定服务要求和范围等内容。
应定期收集、更新供应商信息,组织对供应商的服务质量、履约情况、⼈员⼯作情况等内容进⾏评价,并跟踪和记录供应商改进情况。加强运维外包服务管理,主要包括:
a) 明确外包公司应当承担的责任及追究⽅式;
b) 明确界定外包⼈员的⼯作职责、活动范围、操作权限;
c) 对外包⼈员⼯作情况进⾏监督和检查,并留存相应记录;
d) 对驻场外包⼈员的⼊场和离场进⾏管理;
e) 定期评估外包的服务质量;
f) 制定外包服务意外终⽌的应急措施。
5.6督促检查
定期检查审计,对运维制度的执⾏情况和运维⼯作开展情况定期进⾏检查和审计,以督促运维⼯作持续改进。
指定⼈员负责对⽇常操作执⾏情况进⾏检查,确保运维管理制度和操作流程的有效执⾏。对检查和审计结果采取纠正、预防措施。
6. 运⾏维护
6.1⽇常操作及监控分析
未经许可,任何⼈不得随便使⽤电脑及相关设备。不得更换电脑硬件和软件,拒绝使⽤来历不明的软件和移动设备。
电脑发⽣故障时,使⽤者作简易处理仍不能排除的,应⽴即报告IT ,⾮专业管理⼈员不得擅⾃拆开机箱或调换设备配件。
计算机及其相关设备的报废需经过IT 部门或专职⼈员鉴定,确认不符合使⽤要求后⽅可申请报废。
运维应采取各种监控措施,配备视频、语⾳、系统监控和报警⼯具,对影响信息系统正常运⾏的关键对象,包括机房环境、⽹络、通信线路、主机、存储、数据库、核⼼交易业务相关的应⽤系统、安全设备等进⾏监控。
主要监控指标具体如下:
a) 机房:电⼒状态、空调运⾏状态、消防设施状态、温湿度、漏⽔、⼈员及设备进出等;
b) ⽹络与通信:设备运⾏状态、中央处理器使⽤率、通信连接状态、⽹络流量、核⼼节点间⽹络
延时、丢包率等;
c) 主机:设备运⾏状态、中央处理器使⽤率、内存利⽤率、磁盘空间利⽤率、通信端⼝状态等;
d) 存储:设备运⾏状态、数据交换延时、存储电池状态等;
e) 安全设备:设备运⾏状态、中央处理器使⽤率、内存利⽤率、端⼝状态、数据流量、并发连接数、安全事件记录情况等;
6.2 数据与介质管理
配合数据应⽤部,对核⼼业务数据进⾏周备份,并每季度进⾏恢复性测试。对设备和⼈员出⼊进⾏管理。进⼊机房应限制和监控其活动范围,并有专⼈陪同;未经批准不得接⼊⽣产环境。
6.3机房管理
对机房环境、供电、空调、消防、安防等基础设施的运⾏维护、设备和⼈员出⼊、机房⼯作⼈员等进⾏规范管理。
应指定机房管理负责⼈。
确保机房环境整洁和安全,包括:
a) 应定期检查防⽔、防雷、防⽕、防潮、防尘、防⿏、防静电等措施的有效性;
b) 应保持机房环境卫⽣,设备摆放合理,归类;
c) 不得随意出⼊机房。
d) 未经审批不得接⼊其它⽤电设备。
6.4 ⽹络管理
确保⽹络、系统的正常运⾏。⽹络管理应包括:
a) 绘制⽹络拓扑图,并保持更新;
b) 应保持⽹络设备的可⽤性,及时维修、更换故障设备;
c) 应负责⽹络系统的参数配置、调优;
d) 应定期对系统容量进⾏检查和评估;
e) 应定期检查⽹络设备的⽤户、⼝令及权限设置的正确性;
f) 应定期对整个⽹络连接进⾏检查,确保所有交换机端⼝处于受控状态;
g) 应对⽹络信息点进⾏管理,编制信息点使⽤表,并及时维护和更新,确保与实际情况⼀致。计
算机⽹络跳线应整齐⼲净,跳线标识清晰;
h) 应制定⽹络访问控制策略,应合理设置⽹络隔离设施上的访问控制列表,关闭与业务⽆关的端⼝;编制⽂档并保持更新;访问控制策略的变更应履⾏审批⼿续。
权限管理应包括如下要求:
a) 权限分配应履⾏审批⼿续,权限设置后应复核;
b) 应按照最⼩安全访问原则分配⽤户权限;
c) 应在⽤户账户变化时,同时变更或撤销其权限;
d) 应定期检查权限设置的有效性。
6.5 弱电管理
严格按图纸施⼯,在保证系统功能质量的前提下,提⾼⼯艺标准要求,确保施⼯质量。质量检查制度,现场管理⼈员将定期进⾏质量检查并贯穿到整个施⼯过程中。统运⾏验收:当设备安装完毕并调试运⾏⽆误后,由公司派现场调试⼈员进⾏系统联调,并向上级汇报调试结果。运维对弱电设备的综合管理,包括技术资料、档案的收集。同时,每⽉⼀次对弱电设备运⾏状况进⾏检查,并及时处理汇报问题。
6.6桌⾯维护
⽇常数据注意事项:
a. 个⼈⽂件(Excel 、Word 、PDF 等)建议员⼯不要存放在系统盘(通常为C 盘),可以存放在其它盘符。
b. ⼯程师可通过多种⽅式或途径来告知员⼯如何进⾏⽇常⽂件的备份,如:⼝述、邮件、培训等。
c. 未经许可,禁⽌使⽤U 盘,移动硬盘,⼿机或其它外设,如:⽹盘、邮箱等,盗取公司内部⽂件。
重装系统前注意事项:
a. 询问⽤户有哪些相关数据需要备份,如桌⾯、我的⽂档、收藏夹、邮件等。
b. ⽤户Email 的备份:如客户端为Outlook 则导出相关OST 或PST ⽂件;硬件损坏需更换或维修时,运维⼈员进⾏测试,明确是否真实异常,不可随意更换。
关于账号、权限、密码
a. 必须严格按照公司制定的IT 策略进⾏管理,不可私⾃制定规范。
b. 禁⽌私⾃把个⼈管理员权限借给他⼈或告知他⼈。
c. 禁⽌为他⼈开设规定以外的权限,如:本地管理员、其他部门⽬录访问权限、上⽹权限、电话权限
等。
d. 更改任何类型⽤户权限时需得到相关审批层级确认才可执⾏。
e. 如电脑⽆特殊应⽤需求,则⼀律为“user”普通权限。
f. ⼈员离职时,总部和分部应及时通过OA 确认,删除离职⼈员的相关账号与信息。
g. 妥善保管⾃⼰所知的密码。
6.7服务器及系统变更
不得在服务器上使⽤带有病毒和⽊马的软件、光盘和可移动存贮设备,使⽤上述设备前⼀定要先做好病毒检测;不得利⽤服务器从事⼯作以外的事情,⽆⼯作需要不得擅⾃拆卸服务器零部件,严禁更换服务器配套设备。不得擅⾃删除、
移动、更改服务器数据;不得故意破坏服务器系统;不得擅⾃修改服务器系统时间。
使⽤空闲主机,对服务器系统补丁进⾏升级测试,运⾏平稳后,各服务器升级安装补丁,弥补系统漏洞;为服务器系统做好病毒及⽊马的实时监测,及时升级病毒库。自动化运维系统
管理员对管理员账户与⼝令严格保密、重要数据库,⽹站,APP 等服务器由研发配合定期修改密码,以保证系统安全,防⽌对系统的⾮法⼊侵。
任何⽆关⼈员不得擅⾃进⼊主机房,需要进⼊的须征得服务器管理⼈员同意。应注意保护机房内的设备和物品,未经允许的⾮管理⼈员不得擅⾃操作机房内设备。
严禁携带易燃易爆和强磁物品及其它与机房⼯作⽆关的物品进⼊机房,机房内严禁吸咽。除管理员外,任何⼈不得随意改动服务器内系统及环境配置。
除系统管理员或授权参加系统管理的⼈员外,任何⽤户不得以任何⽅式获取(或企图获取)超级⽤户权限。
6.8 配置管理
明确配置管理负责⼈。
建⽴配置⽂档库,对服务器、存储、⽹络、安全设备,操作系统、应⽤软件、数据库等进⾏管理。
定期对配置进⾏备份及⽂档库归类。
及时检查并定期审计,对发现的不⼀致情况及时纠正修改。
6.9 事件与问题管理
对运维事件的处理进⾏规范,对发⽣的所有事件,根据事件的影响程度和影响范围评估事件处理优先级并及时处理。
对所有事件响应、处理、结束等过程进⾏跟踪、监督及检查。对问题进⾏分析、提出解决⽅案,通过变更管理审批后部署实施。
7. 应急管理

本文发布于:2024-09-22 19:27:06,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/357162.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:管理   设备   运维   系统
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议