1.服务内容
1.1 日常监控
服务器监控:
服务器监控是为了确保服务器稳定运行,并及时发现并解决潜在的问题,以提高系统可靠性和稳定性。
监控对象
- 硬件状态:包括CPU、内存、磁盘空间、网络带宽等。
- 系统运行状态:检查服务是否正常运行,负载情况,响应时间、https证书等。
监控策略
- 安装Agent程序, 实时采集 CPU 内存 硬盘网络等获得数据. 将监控数据集中管理. 提供立体化数据监控、智能化数据分析、近实时化异常告警和可视化数据展示,有效提升运维效率,减少人力运维成本。
- 对应用与中间件监控, 精细化业务瓶颈问题, 针对性
业务监控:
企业的业务系统和中间件进行全面有效地监控
监控对象
- 指标选择:请求响应时间、错误率、吞吐量等。
- 数据采集:通过安装代理或远程访问请求方式进行数据采集,将关键指标发送至监控系统。
日志和异常检测
- 设置日志服务系统(ELK),对日志中出现次数进行统计分类 并给予有针对性处理
- 安全性信息:包括登录失败次数、异常操作记录等。
- 错误日志:收集并分析系统产生的错误消息和警告。
1.2 告警
- 告警设置:针对每个指标设置合适的阈值,并建立相应告警机制,及时通知相关人员处理问题。
- 告警收敛: 针对底层引发问题,影响业务层整个链路故障进行收敛. 只会针对底层问题发送告警, 防止告警风暴
1.3 监控可视化
适用于多种监控场景的明细数据、实时 / 历史数据展示、相似指标对比展示、图表联动等灵活个性化的视图功能。
1.4 管理
网络安全管理
访问控制
- 在网络边界或区域之间根据访问控制策略设置访问控制规则,默认情况下除允许通信外受控接口拒绝所有通信。
- 删除多余或无效的访问控制规则,优化访问控制列表,并保证访问控制规则最小化。
- 对源地址、目的地址、源端口、目的端口和协议等进行检查,以允许/拒绝数据包进出。
- 能根据会话状态信息为进出数据流提供明确的允许/拒绝访问的能力。
- 对进出网络的数据流实现基于应用协议和应用内容的访问控制。
防范攻击与入侵
提供接入流量安全与web应用防火墙建议. 可以满足您网站从流量管理角度来防御业务风险
服务器管理
通过监控数据, 接入运维平台实现基础自动修复,自动自愈功能.(如简单的自动启动等等) 利用运维平台, 高效处理程序更新持续集成(CICD)过程. 高效实现业务部署.
通过数据分析提早预测磁盘容量紧张、内存、cpu资源紧张、证书时效性等等问题.提前计划解决方案,避免简单问题严重化.
应对客户活动需求, 提前准备活动需求,预估基础架构支撑度. 改变基础架构应对大流量、高并发场景.
定时升级系统内核和系统工具, 修复漏洞与提供系统稳定性, 提升系统性能.
1.5 维护工作
- 通过运维管理平台的CMDB模块为基石.
- 任务管理模块调用部署任务实现业务部署.
- 计划任务实现对服务器的数据进行定时备份的统一管理(备份包含数据库, 网站).(需要客户购买备份需要的数据盘, 否则无法实现这点.). 华为云还需要购买备份服务实现双保险备份机制, 腾讯云、阿里云不需要
- 利用监控系统做巡检工作,及时发现问题. 把损失减到最低
- 每天对备份数据进行检查
2.系统应急
为了更及时及有效的解决系统使用过程中出现的问题,更合理的分配系统运维支撑的资源,将根据问题的性质及其严重程度提供 5*8服务
3.服务水平协议SLA
根据SLA 90%标准提供服务。
4.服务收费
单机 6800/年
集群 请联系商务