自学内容网 自学内容网

精细化运维待处理工作

1、基础监控:需梳理所有物理子系统以及设备是否均已纳入基础监控,近期需持续汇总各告警信息,通过 CPU、内存、存储空间等判断目前现有资源是否满足业务需求,是否需要扩啊。2、统一事件平台:需设置各系统维护期,后续投产发布、变更尽量在维护期内完成。3、日志平台:梳理各系统日志同步情况,如发现未完全同步,需尽快完成治理。确定日志己同步,需梳理系统本身的日志清理策略是否生效。4、应用监控:交易类型、监控指标等经常误告警需开始进行调整,不同时间段不同指标需要进行细化。5、知识库: 以三大件为基础,结合实际操作步骤,进行运维知识库制作,内容要求:服务启停、技术验证、业务验证、业务联系人、关键日志路径《或查询方案)、批处理查询方案数据库配置方案《 虚机)、数据库操作方案。6、批处理指标细化:各系统批处理渠道《鲁班、百川、自服务、定时任务),批处理开始时间、结束时间、批处理步骤《内容)、状态、异常时是否可跳过,影响范围。7、数据流梳理,以物理子系统为单元,梳理组内组外数据流向,纵向排列系统。8、业务流梳理,以主管业务部门为单元,梳理组内系统归属,横向排列系统。9、前期工作收尾:三大件、只读用户权限梳理、日志路径挂载 NAS 等


原文地址:https://blog.csdn.net/qq_44912603/article/details/137794121

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!