IBM X3650服务器BMC安装系统

如何运营服务器 服务器运营注意事项

服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。服务器上线以后,基本是不间断,7*24小时运行,否则会影响业务及用户体验。那么如何运营服务器呢?下面就随薇晓兰博客(blog.weixiaoline.com)一起来了解服务器运营注意事项吧!

  • 一、服务器怎么运营?

检查磁盘使用率,当磁盘使用率超过80%,可以清除一些日志文件;检查内存使用情况,当内存使用过多时,需要检查是哪个进程占用,是否合理;检查CPU使用情况,负载大小;当CPU使用过多,负载过大时,需要检查是哪个进程占用,是否合理。检查服务器网卡接口的数据统计和每秒收发包的个数和流量。还需要结合服务器的业务,当然,这些可用使用监控软件自动检查,故障报警等,实时掌握服务器的运行情况。

  • 二、服务器运营注意事项

1、提前检查服务器和网站漏洞检测,对Web漏洞、弱口令、潜在的恶意行为、违法信息等进行定期扫描。代码的定期检查,安全检查,漏洞检查。服务器安全加固,安全基线设置,安全基线检查。数据库执行的命令,添加字段、加索引等,必须是经过测试检查的命令,才能在正式环境运行。

2、数据备份服务器数据备份,包括网站程序文件备份,数据库文件备份、配置文件备份,如有资源最好每小时备份和异地备份。建立五重备份机制:常规备份、自动同步、LVM快照、Azure备份、S3备份。定期检查备份文件是否可用,避免出故障后,备份数据不可用。重要数据多重加密算法加密处理。程序文件版本控制,测试,发布,故障回滚。

3、安全监控nagios监控服务器常规状态CPU负载、内存、磁盘、流量,超过阈值告警。zabbix或cacti监控服务器常规状态CPU负载、内存、磁盘、流量等状态,可以显示历史曲线,方便排查问题。监控服务器SSH登录记录、iptables状态、进程状态,有异常记录告警。监控网站WEB日志(包括nginx日志php日志等),可以采用EKL来收集管理,有异常日志告警。运维人员都要接收告警邮件和短信,至少所负责的业务告警邮件和短信必须接收,运维经理接收重要业务告警邮件和短信。(除非是专职运维开发)除服务器内部监控外,最好使用第三方监控,从外部监控业务是否正常(监控URL、端口等),比如:监控宝

4、故障避免预防

网站WEB增加WAF,避免XSS跨站脚本、SQL注入、网页挂马等漏洞威胁。

程序代码连接数据库、memcache、redis等,可以使用域名(域名HOSTS指定IP),当出问题,有备用的服务器,就可以通过修改DNS或者HOSTS,恢复服务。

建立应急预案机制,定期演练事故场景,估算修复时间。

部署蜜罐系统,防范企业和服务器内网APT攻击。

建立双活集群,包括业务服务的高可用,避免业务服务单点。

服务器集群采用跳板机或堡垒机登录,避免服务器集群每台服务器可以远程连接管理。

操作重要业务升级、迁移、扩容……之前,列一下操作步骤,越详细越好,实际操作按步骤操作,操作完做好记录。

5、事中操作

网站WEB增加WAF,发现XSS、SQL注入、网页挂马等攻击,会自动拦截,并记录日志。

检查服务器数据备份是否可用。

在处理需求和故障时,执行风险命令(比如rm、restart、reboot等)需再三确认,执行命令前,检查所在服务器,所在服务器路径,再执行!

不要疲劳驾驶,喝酒不上机,上机不喝酒,尤其别动数据库,避免在不清醒的状态下,在服务器上执行了错误命令,导致数据丢失或业务故障。

在处理事故时,一定要考虑处理措施是否会引发连锁故障,重要操作三思而行。

6、事后检查分析

实现网络安全可视化管理,可以看到每天有那些异常IP和异常URL请求,服务器集群开放端口列表等。能对全网进行安全策略集中管理。统一日志收集和分析。

备份及篡改恢复功能,程序文件、图片、数据文件、配置文件的备份,故障回滚机制。

对攻击日志进行深度分析,展现攻击路径、攻击源,协助管理员溯源。

践行DevOps的无指责文化,尤其是在做事故分析时。事故分析重在定位原因,制定改进措施。

转载请注明本文链接:https://blog.weixiaoline.com/2984.html