2024年6月8日发(作者:)

IT基础监控要求

Prepared on 24 November 2020

3.2.1.1 IT基础监控要求

1、 硬件监控管理

1) 硬件监控实施范围包括现有环境的PCServer、刀片服务器、小型机、

存储设备和网络设备的硬件监控。总体分为存储硬件监控、服务器硬件监控、

网络设备硬件监控三个部分。

存储硬件监控管理功能可以在现有的存储系统(IBM,EMC和HP)中,通过

Snmp Trap 实现告警转发功能,可将系统中出现的各种类型的告警通过Trap的

方式向外转发。光纤交换机除了进行Snmp Trap监控方式以外,还可通过监控

其Syslog的方式,实现对设备告警信息的采集。

在服务器硬件监控中,主要是以Errlog日志记录系统所检测到的软硬件故

障和错误。AIX Error log 目前支持的类别有: H: 硬件 、S:软件、O:

Informational 、U:无法确定事件的类别。

网络设备的硬件管理包括两种模式:Syslog 和Trap模式。通过这两种模

式实现网络设备的硬件管理功能。

2) 硬件监控的实施内容包括监控数据的采集、监控阀值、告警动作设定、

报表展现。监控的内容包括:前置面板的状态、FAN状态、电池状态、电源状

态、硬盘状态、RAID卡状态、CMOS电池状态、主板状态、内存状态、CPU状

态、温度、FAN转速、IO模块状态。

3) 硬件监控的事件处理与一期项目的事件处理模块结合,完成硬件监控事

件管理。

2、 中间件监控管理

1)总体需求:

① 中间件监控的实施范围包括各种主流中间件和J2EE应用服务器,如

Weblogic、WebSphere、Tomcat、IIS等。

② 中间件性能收集:提供收集性能数据和中间件状态等信息。部署的应

用状态,java虚拟机性能数据,垃圾回收的数据和数据库连接等信息。同时提

供历史性能数据收集和入库策略配置的功能。

③ 中间件监控的事件处理与一期项目的事件处理模块结合,完成中间件

监控事件管理。