如果你在一家互联网公司的IT部门工作,公司刚刚上线了新项目,那么下面的情景你可能会很熟悉:
半夜,你突然接到了一个电话,或许是某位怒气冲冲的客户,又或许是由于系统崩溃而打过来找你的老板,这时候你立即去打开笔记本电脑,查看日志管理系统,然后你会看到在设定的时间范围内,已经有成千上万条消息被记录下来了,但你一个人是不可能将这些数据逐条检查完的......
遇到这样的情形你会怎样做呢?
要知道,这可能是每一位IT运维都会面临的情景,很多人因此度过了许多个不眠之夜,寻找着触发突发事件的关键点。
传统IT运维工作中的痛点分析
1.无法筛选重要告警
随着公司的发展,业务量急剧增长。当重大故障发生,各种信息、蜂拥而至的警报同时到达时,怎样从成千上万条信息中发现有用的,过滤掉重复的信息,或者从中找出问题根源,这些从来都不是一件容易的事情。
2.IT运维压力及效率问题
庞大的数据流,导致运维人员的工作量急剧增加,甚至7*24小时的监控都无法排查出问题的根源所在,从而影响业务增长及用户体验。
3.缺乏统一管理平台
业务系统涉及众多的服务器、服务、应用、数据库和网络设备,缺乏统一的综合运维管控平台,运维难度大,成本高;缺乏统一的业务、应用、网络及基础设施性能监控可视化平台。
随着公司越做越大,运维的场景也将会变得越来越复杂。仅仅依靠传统人工经验的运维工作将会变得捉襟见肘。
点击查看更多内容
为 TA 点赞
评论
共同学习,写下你的评论
评论加载中...
作者其他优质文章
正在加载中
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦