服务器宕机排查思路及解决方法

服务器宕机排查思路及解决⽅法
⽹站崩溃的原因
1.访问量过⾼,超出系统承载能⼒
2.这个访问量,不仅包括正常访问,也有异常访问的,包括攻击在内。(⿊客攻击,⿊客领⽤软件请求服务器所有端⼝,但是不释放端⼝,就导致其他⽤户进不了这个⽹站。)
3.服务器配置过低,低于预期⽹站发展的设想,虽然是超负载,但是因为配置太低了。
4.服务器配置不低,但是存在多个⽹站,为某⼀个⽹站个体,划分的资源不⾜以承载⽹站运转。
宝商集团陕西辰济药业有限公司5.⽹站本⾝,存在代码循环等冲突性错误,或者不断地查询导致资源耗尽。
怎么减⼩⽹站崩溃的可能徐山泉
可以更换内存、磁盘空间⼤⼀点,稳定⼀点的服务器,也可以升级维护数据库,完善代码,定期维护⽹站。适时引流分散⼀下来访⼈员的时间点。
第⼀,内存泄漏
C/C++程序还可能产⽣另⼀个指针问题:丢失对已分配内存的引⽤。当内存是在⼦程序中被分配时,通常会出现这种问题,其结果是程序从⼦程序中返回时不会释放内存。如此⼀来,对已分配的内存的引⽤就会丢失,只要操作系统还在运⾏中,则进程就会⼀直使⽤该内存。这样的结果是,曾占⽤更多的内存的程序会降低系统性能,直到机器完全停⽌⼯作,才会完全清空内存。
第⼆,C指针错误
⽤C或C++编写的程序,如Web服务器API模块,有可能导致系统的崩溃,因为只要间接引⽤指针(即访问指向的内存)中出现⼀个错误,就会导致操作系统终⽌所有程序。另外,使⽤了糟糕的C指针的Java模拟量(analog)将访问⼀个空的对象引⽤。Java中的空引⽤通常不会导致⽴刻退出JVM,但是前提是程序员能够使⽤异常处理⽅法恰当地处理错误。
第三,数据库中的临时表不够⽤
许多数据库的临时表(cursor)数⽬都是固定的,临时表即保留查询结果的内存区域。在临时表中的数据都被读取后,临时表便会被释放,但⼤量同时进⾏的查询可能耗尽数⽬固定的所有临时表。这时,其他的查询就需要列队等候,直到有临时表被释放时才能再继续运⾏。
第四,线程死锁
由多线程带来的性能改善是以可靠性为代价的,主要是因为这样有可能产⽣线程死锁。线程死锁时,第⼀个线程等待第⼆个线程释放资源,⽽同时第⼆个线程⼜在等待第⼀个线程释放资源。我们来想像这样⼀种情形:在⼈⾏道上两个⼈迎⾯相遇,为了给对⽅让道,两⼈同时向⼀侧迈出⼀步,双⽅⽆法通过,⼜同时向另⼀侧迈出⼀步,这样还是⽆法通过。双⽅都以同样的迈步⽅式堵住了对⽅的去路。假设这种情况⼀直持续下去,这样就不难理解为何会发⽣死锁现象了。
第五,磁盘已满
导致系统⽆法正常运⾏的最可能的原因是磁盘已满。⼀个好的⽹络管理员会密切关注磁盘的使⽤情况,隔⼀定的时间,就需要将磁盘上的⼀些负载转存到备份存储介质中(例如磁带)。
⽇志⽂件会很快⽤光所有的磁盘空间。Web服务器的⽇志⽂件、SQL*Net的⽇志⽂件、 JDBC⽇志⽂件,以及应⽤程序服务器⽇志⽂件均与内存泄漏有同等的危害。可以采取措施将⽇志⽂件保存在与操作系统不同的⽂件系统中。⽇志⽂件系统空间已满时Web服务器也会被挂起,但机器⾃⾝被挂起的⼏率已⼤⼤减低。
第六,服务器超载
Netscape Web服务器的每个连接都使⽤⼀个线程。Netscape Enterprise Web服务器会在线程⽤完后
挂起,⽽不为已存在的连接提供任何服务。如果有⼀种负载分布机制可以检测到服务器没有响应,则该服务器上的负载就可以分布到其它的Web服务器上,这可能会致使这些服务器⼀个接⼀个地⽤光所有的线程。这样⼀来,整个服务器组都会被挂起。操作系统级别可能还在不断地接收新的连接,⽽应⽤程序(Web 服务器)却⽆法为这些连接提供服务。⽤户可以在浏览器状态⾏上看到connected(已连接)的提⽰消息,但这以后什么也不会发⽣。
总之,还有许多因素也极有可能导致服务器租⽤或服务器托管站点⽆法⼯作。有许多种原因可能导致Web站点⽆法正常⼯作,这使得系统地检查所有问题变得很困难。
服务器宕机原因及解决办法
什么是服务器宕机?
服务器宕机指的是服务器由于某些原因导致服务器⽆法正常运转,造成⽹络⽆法使⽤,对于⽹站来说,服务器宕机带来的影响很⼤,他不但造成访客对⽹站⽆法访问,甚⾄影响到⽹站在搜索引擎上的排名。
在服务器的使⽤过程中,服务器的宕机随时都有可能出现,⾸先我们要到服务器宕机的原因,才能到对应的解决⽅案。
服务器宕机可能分为两种情况,服务器的假死机和死机
假死机(⾮蓝屏死机)是由于硬件资源暂时性的被消耗殆尽,因为⽆法对外部指令进⾏相应的现象,通常是⽹站处于访问⾼峰期,带宽等资源跑满,通常只需要等待⼀段时间,等待服务器腾出更多的资源即可恢复正常
⽽死机,如果通过ping测试服务器,键盘切换数字键和⼤写字母键功能,显⽰器⽆画⾯输出,或者⿏标光标没有任何反应,则表⽰服务器硬件出现故障
旋转倒立摆服务器出现故障的常见原因
1.服务器性能的原因
性能问题中,最常见的服务器宕机原因是运⾏很糟糕的SQL,但也不能确定⼀定是这样的,还有其他的可能,⽐如也有些问题是由于服务器Bug或错误的⾏为导致的。
此外,较差的Schema和索引设计是第⼆⼤影响性能的问题。
2.运⾏环境的原因
如果是运⾏环境问题,那么最常见的就是磁盘空间耗尽。
3.数据丢失或损坏的原因胶黏剂搅拌机
数据丢失,⼀般情况下是由于droptable的错误操作导致,并总是便随着缺少可⽤备份的问题。
自动钎焊设备4.复制的原因
如果是复制问题,那么⼀般是由于主备数据不⼀致导致的。
既然了解了服务器宕机的原因,那么如何判断或查看服务器宕机的原因呢?
(1)查看是否是误操作导致
(2)查看是否是应⽤程序异常导致
(3)查看是否是应⽤程序导致内存溢出或者泄露,outofmemory导致
(4)查看是否是流量负载过⼤导致
(5)查看是否是遭受⿊客⼊侵攻击导致
确定取消当查出造成服务器宕机的原因后,我们⼜该如何进⾏解决呢?
以上介绍了关于服务器宕机的原因、判断、解决,当然你也可以选择万变云的云主机,因为其中⼀个服务器出问题时,会启⽤其他服务器,以保障你⽹站安全的运⾏,可以⼤⼤降低⽹站⽆法访问的⼏率。
如何查看服务器宕机的原因?
1.是否是应⽤程序导致内存溢出或者泄露导致,out of memory导致?
2.是否是进程过多或不断创建,导致资源耗尽导致?
3.是否是数据库程序死锁,或者连接数过多导致?
4.是否是应⽤程序异常导致?
5.是否是流量负载过⼤导致?
6.是否是遭到⿊客⼊侵导致?
7.是否是操作有误导致?
服务器宕机如何解决?
1、发现服务器宕机后,及时联系服务器商解决相关问题,因为也许短暂的宕机,会给你带来重⼤损失。
2.做好防范准备。可以准备两个⽹站空间,他们存放的内容相同,⽽ip地址不相同,并且机房的地理位置不同,这样两个主机,同时出现宕机的可能性就⼤⼤降低了。第⼀时间发现服务器宕机问题后,可以迅速的通过修改dnspod中的域名记录,指向⽬前正常的⽹站空间,dnspod解析⽣效的时间是实时的,⽽⼀般的dns服务器刷新时间⽐较长,对外声称24⼩时⽣效,但是按照实际经验来看,差不多30分钟内⽣效,否则就要检查域名绑定是否正确了。
阿⾥云云服务器如何进⾏宕机排查?
1.启动机器,看是否能登录。
2.看以下⼏个⽅⾯:连接数过多,应⽤程序异常,流量负载过⼤,遭受⿊客⼊侵攻击误操作,如果⽆法查看故障现场,请检查以下可能的原因: 应⽤程序导致内存溢出或泄露,进程过多或者不断创建,资源耗尽,数据库程序死锁,如果能登陆,可以查询系统⽇志查看是否有异常记录。
将近百万访问量,每天上午9点左右和晚上10点左右必定会宕机。每次重启服务器后问题都没有了,没法知道具体是那块所造成。开始仔细想问题在那边,H5新闻站点基本上都是使⽤搜索引擎运⾏的,
包括后来我开发的PC站点全部采⽤搜索引擎运⾏,不会有任何数据库操作。以为是mysql配置需要优化,所以就开始做起了服务器优化。
1、第⼀看见就是服务器IO过⾼造成了宕机,经过排查是mysql所占⽤,开始调整H5项⽬把直接操作数据库的部分都改成搜索引擎。重启后通过mysql命令⾏ show processlist; 查看正常,怀疑这个时候是脚本没运⾏,所以查不到问题了。
2、为了不影响业务运作,把线上有收益的业务迁移到其它服务器。磁盘重新分布,图⽚,数据库,搜索引擎全部分开,发现mysql磁盘过⾼,由此可以完全定位IO过⾼和mysql脱不了⼀点⼲系。
3、开始做mysql配置优化,不能让服务器宕机,经过两天的调试,服务器不宕机了,IO还是能够达到80%以上。平时偶尔也发现IO也不⼩。开始头疼了应⽤程序和服务器都优化了还是不见有个好的效果。
4、持续观察IO状况,在IO⾼的时候排查mysql,发现有部分sql运⾏时间都是在30秒以上,IO都是读的负载过⾼,肯定是这个原因导致的,这条sql所使⽤的字段没有索引,加上索引后,IO明显下降到5%左右。
5、当时⼼⾥⾮常激动,花了两天调试服务器各种配置优化。结果发现饶了这么⼤⼀个弯。最终还是
因为mysql索引优化问题,最终问题还是出现在爬⾍上⾯,每次爬⾍跑的时候都会⽐对数据,再数据表越来越⼤的时候,字段没有索引就慢如蜗⽜。虽然绕弯了还是有很⼤的收获的,在各种配置优化上也更明⽩的认识到了很多场景的优化⽅式。
6、很多时候都是本地开发好的项⽬,怎么玩都正常,只要上线都会有点问题,运营⼀段时间后问题也越来越多,这都是没有考虑到很多因素的问题。

本文发布于:2024-09-22 15:48:32,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/314980.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:服务器   导致   问题   原因   程序   内存
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议