共济IT一体化集中监控系统方案建议书Word格式.doc

上传人:wj 文档编号:1465488 上传时间:2023-04-30 格式:DOC 页数:74 大小:7.79MB
下载 相关 举报
共济IT一体化集中监控系统方案建议书Word格式.doc_第1页
第1页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第2页
第2页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第3页
第3页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第4页
第4页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第5页
第5页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第6页
第6页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第7页
第7页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第8页
第8页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第9页
第9页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第10页
第10页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第11页
第11页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第12页
第12页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第13页
第13页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第14页
第14页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第15页
第15页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第16页
第16页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第17页
第17页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第18页
第18页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第19页
第19页 / 共74页
共济IT一体化集中监控系统方案建议书Word格式.doc_第20页
第20页 / 共74页
亲,该文档总共74页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

共济IT一体化集中监控系统方案建议书Word格式.doc

《共济IT一体化集中监控系统方案建议书Word格式.doc》由会员分享,可在线阅读,更多相关《共济IT一体化集中监控系统方案建议书Word格式.doc(74页珍藏版)》请在冰点文库上搜索。

共济IT一体化集中监控系统方案建议书Word格式.doc

4.6. 应用软件 34

4.6.1. 监控指标 34

第5章 实时监控—设备监控 35

5.1. 设备监控列表 35

5.2. 监控指标列表 37

5.3. 列表导出 37

第6章 实时监控—监控仪表板 38

第7章 实时监控—IP冲突监控 39

7.1. 实时IP冲突管理 39

7.2. IP历史变更记录 40

7.3. IP验证管理 40

第8章 事件告警 41

8.1. 实时事件和告警查看 41

8.2. 告警管理 41

8.3. 事件管理 42

第9章 工单管理 43

9.1. 产生工单 43

9.2. 派发工单 44

9.3. 处理工单 45

9.4. 工单汇总 48

9.5. 工单地址管理 48

9.6. 工单故障类型管理 49

第10章 知识库 50

10.1. 工单归档 50

10.2. 历史故障经验库 50

10.3. 预案库管理 51

第11章 值班管理 53

11.1. 机房进出登记 53

11.2. 交接班登记 54

11.3. 班次管理 56

11.4. 计划作业 58

第12章 统计报表 60

12.1. 性能统计报表 60

12.2. 事件统计报表 61

12.3. 工单统计报表 61

12.4. 服务器资源统计报表 62

第13章 系统管理 63

13.1. WEB端的系统管理 63

13.2. 监控应用服务器的系统管理 64

第14章 系统特点 67

14.1. 以高效服务业务为目的 67

14.2. 全面集中监控 67

14.3. 轻量级的产品,完成监控管一体化 67

14.4. 安全可信 67

14.5. 实施快,见效快,容易上手 68

14.6. 维护容易 68

第15章 运行环境 69

15.1. 一体化集中监控服务器的配置要求 69

15.2. 数据库服务器的配置要求 69

15.3. 告警网关的配置要求 69

第16章 典型案例 70

第1章背景和需求

1.1.项目背景

保障数据中心核心业务系统安全高效可靠地运行,是信息系统管理部门的重要职责和伟大目标,也是IT人的使命所在。

IT人拥有不可推卸的权责。

数据中心核心业务系统,从逻辑上看包含多个不同的应用组件,从物理上看运行在多个不同的物理服务器上,数据在不同的设备或系统间流动。

要实现上述目标需要对数据中心进行全方位、多层次的综合监控,需要对问题处置和应急指挥进行科学管理。

1.2.项目建设目标

本项目主要针对解决数据中心管理和运行工作中的实际问题,主要作用表现在以下三个方面:

监控对象一体化

实现机房动力、环境、安保、小型机、服务器、网络、安全、存储设备、数据库、中间件、应用软件等跨平台一体化的实时状态、性能、事件、配置等数据的采集、正则化汇聚和保存。

监控展示一体化

所有监控对象的状态、性能、事件都集中的以三维效果图的方式展示出来,更方便、直观、高效的让数据中心工作人员准确的定位故障发生位置并处理所发生的紧急情况。

监控管理一体化

一体化集中监控系统实现7X24小时实时监控和报警、知识库支持的实时事件故障处理,自动化管理报表生成,资产管理、知识管理、机房管理等日常管理功能,让工作人员在日常数据中心管理维护上更加轻松,以避免在不必要的环节浪费大量人力、物力,让工作人员将主要精力放在数据中心内核心业务上来,提高数据中心的整体业务效率。

一体化集中监控系统的实施,将保障数据中心核心业务系统的安全、高效、可靠地运行,极大的提高数据中心管理工作的自动化、信息化工作效率,为更好的服务于社会提供强有力的保障。

1.3.需求概述

通过需求调研,本建设项目的需求包括三个方面,一是监控管理系统的功能需求;

二是监控范围的需求,包括具体的监控对象,监控指标;

三是监控系统扩展性的需求。

从功能上讲,本项目需要实现监测、控制和管理的一体化。

具体包括:

实时数据及状态展示、事件告警统一管理、知识库管理、资产管理、机房值班管理、统计报表等。

从监控范围上讲,本项目需要实现的监控类别包括:

动力、环境、安保、小型机、服务器、网络、安全、存储设备、数据库、中间件、应用软件等,从而实现一体化集中监控的目标。

从系统扩展上讲,系统支持各网管系统和其他系统的集成,提供数据、事件的提取和发送接口,实现各集成系统状态、数据及事件的一体化集中监控展示。

第2章系统设计

2.1.功能模块

从应用软件的层面看,IT一体化集中监控系统共由六大子系统构成,包括Web客户端、管理客户端、Web服务、监控服务器、后台服务进程和监控代理。

各子系统具体功能及相互关系如下图:

系统上线运行之后,使用最多的就是Web客户端。

它提供了监控管所需要的一切。

管理客户端是增减监控对象、调整监控策略、优化监控代理部署和监控策略的强大工具。

Web服务包括工程文件、数据中转、自身监控、备份恢复、升级许可等诸多服务。

除了数据中转服务外,Web服务不依赖后台的其它任何服务。

它能够对系统的其它组件进行起、停操作和状态检测,从而实现IT一体化集中监控系统的持续运行。

监控服务器是IT一体化集中监控系统中最核心的子系统。

除Web客户端外,其它四个子系统都与监控服务器子系统直接交互。

它内嵌强大的实时数据库,拥有侦听器、数据匹配、事件生成、数据保存、数据访问、连通检查和SNMP轮询在内的高性能的内核服务。

例如,它的数据匹配引擎,可以同时快速匹配出几乎任何代理发送过来的任何格式的数据;

它的事件生成引擎按事件生成规则快速生成事件;

它的数据保存服务按照保存策略快速地将监控指标的实时数据保存到关系数据库。

后台服务是由一组可以独立安装在不同机器上的程序组成,包括告警服务、策略执行、协议执行、级联服务、业务监控接口、动环监控接口等。

监控服务器加后台服务的设计,即保持了监控服务器的微内核又拥有了各种后台服务安装部署的灵活性。

共济IT一体化集中监控系统监控协议即支持由标准协议支持的监控对象,也包括非标准的监控对象。

标准协议包括:

SNMP、IPMI、WMI、SYSLOG等。

非标准监控对象通过由各类脚本(例如perl)写成的监理代理来完成。

这些脚本化的监控代理(我们简称“脚本代理”)即安全又高效,即可以本地部署,也可以远程部署,一切按需求灵活设置。

2.2.系统部署架构

根据不同的监控需求,现提出两种系统架构:

²

单个中心机房IT监控:

IT一体化集中监控系统部署之后,分为客户层、服务层、业务层和采集层,通过四个层的实施,来实现综合监控和科学管理。

系统部署的一个例子如下图所示:

经过部署后,四个层需要实施的内容有:

1. 客户层。

客户层包含报警服务器(报警网关)、管理客户端和Web客户端。

报警服务器部署报警网关,负责对外的电话、短信和邮件报警,需要单独部署一台服务器;

管理客户端安装C/S客户端软件,主要负责监控应用服务器的配置和使用,需要单独为管理员配置一台服务器。

Web客户端可以通过Web查看,只要网络连通,任何工作机都可以根据权限进行查看。

2. 服务层;

服务层包含综合监控应用服务器和综合监控数据库服务器。

综合监控服务器需要高性能服务器主机和Liunx操作系统,可保证更高的稳定性和性能,负责部署综合监控平台、工单管理子系统、报表子系统、系统管理服务、联动服务、Web服务、数据配置、存储和事件日志查询服务。

综合监控数据库服务器需要高性能服务器主机和数据库服务,用于存储监控的历史数据和事件、配置信息等数据。

3. 业务层;

业务层包含监控的各种业务系统,包括税收征管业务系统、网上报税业务系统和货运发票业务系统等。

这些业务系统的运行状态是监控的核心,其它方面的监控都是辅助于业务系统监控。

业务层监控的功能是综合监控系统与各个业务系统通讯,获取业务系统状态。

4. 采集层;

采集层包含各种硬件、系统和动力与环境。

通过对本层的监控,可以更加准备的分析出业务出现故障的原因和实现预警功能。

本层采用分布式设计,能够灵活增减监控设备,而无需在软件上修改代码,只需要配置即可。

多机房联网型的IT监控:

对于联网型的监控,可利用IT一体化集中监控系统的级联功能,实现各前端机房内设备的集中监控管理。

部署同样分为四层:

客户层、中心服务层、本地服务层和现场采集层。

部署图如下:

1. 客户层:

2. 中心服务层:

中心服务层包含中心应用服务器和数据库服务器。

中心应用服务器需要高性能服务器主机和Liunx操作系统,可保证更高的稳定性和性能,负责部署针对所有前端站点机房的综合监控平台、工单管理子系统、报表子系统、系统管理服务、联动服务、Web服务、数据配置、存储和事件日志查询服务。

综合监控数据库服务器需要高性能服务器主机和数据库服务,用于存储所有前端站点机房监控的历史数据和事件、配置信息等数据。

3. 本地服务层:

本地服务层包含一台前端应用服务器。

前端应用服务器负责部署本机房内设备、操作系统、业务系统以及动环系统的综合监控,并把监控信息即时传递给中心服务层。

本层采用分布式结构,增减所监控前端机房数量时,只需增加或减少相应数量的前端应用服务器。

4. 现场采集层:

现场采集层包含各种硬件、系统和动力与环境。

2.3.软件架构

一体化集中监控系统分为四个层次结构,

系统四层结构如下图所示:

软件架构中每个层次的作用是:

1.显示层;

本层主要是提供给用户图形交互界面,将大量的复杂的监控数据通过图形化的方式分层次和优先级地展现给管理员,使一体化集中监控系统的监控更加简单和易用。

显示层主要实现了客户端功能,具有C/S和B/S双重架构,包括管理客户端和Web客户端。

管理客户端具有系统管理功能;

Web客户端通过友好的页面展示监控内容,显示故障报警,用户可以通过Web浏览获知整个系统的运行状态。

2.应用层;

本层是核心服务程序,负责维护采集层的数据、提供显示层浏览服务和报警功能。

应用层包含业务管理模块和报警网关模块。

业务管理模块负责从采集层获取监控数据,经过处理,将报警数据进行显示和发送给报警网关模块,并对数据进行记录,以便报表分析处理。

报警网关模块接收到报警后,通过电话、短信或Email发送给管理员。

应用层各个服务都是监察的核心模块,系统设计了软件看门狗服务,自动监测各个服务的运行状态,当运行状态下一体化集中监控相关服务出现异常,将由软件看门狗服务自动重启异常服务,恢复监察业务。

3.采集层;

本层负责采集监控数据。

采集层根据前端不同的监控对象采用不同的采集方式。

针对动力与环境监控,采集方式多采用串口方式;

针对业务监控、服务器、网络、存储和通讯的监控,多采用网络方式。

4.设备层;

包括被监控的设备和系统,也包括各类专门的监控工具。

2.4.系统流程

2.4.1.主要流程

一体化集中监控系统提供完整的、一体化的监控流程。

主要的流程包括事件、告警、工单、一体化集中监控展示、实时分析、统计报表和系统配置。

配套的流程包括:

值班管理、知识管理和资产管理。

如下图所示:

我们以工单流程为例来加以说明。

工单的主线流程包括:

监控代理、集中监控、事件、工单、知识库;

工单的内部流程包括创建、派发、处理、延时、记录、关闭等环节;

工单处理的关联活动包括值班管理、知识管理和资产管理。

2.4.2.数据流程

一体化集中监控系统是针对各种对象管理监控数据,从数据的采集到监控的展示,通过各种服务完成数据处理,实现数据中心整体的集中监控管理。

下图为一体化集中监控系统的数据流程图:

l外部实体

在一体化集中监控系统的数据流程中,涉及的外部实体对象包括监察对象和用户,本系统主要将不同监察对象的监察数据处理分析后发送展现给用户。

l处理

在一体化集中监控系统的数据流程中,涉及的处理主要有以下内容:

1.数据采集:

针对不同的监察对象,采用相应的监控接口和方法,获取到监控数据;

2.数据匹配:

接收监控数据,通过数据匹配引擎将关键数据进行提取,形成监控指标,发送给监控服务;

3.监控服务:

是数据的交互中心,接收和管理所有监控指标,向告警服务、Web服务和数据存储服务发送需要的监控指标;

4.指标报警服务:

负责接收监控指标的实时数值,通过报警引擎判断监控指标是否正常,当判断报警时,将报警事件送到Web服务和告警管理服务;

5.数据存储:

负责将需要保存的监控指标数据按照保存策略保存到数据库中,供数据报表服务查询;

6.数据报表服务:

负责提取历史数据,并通过定义的不同样式的模板进行展示,供分析趋势、历史汇总和辅助决策使用;

7.告警管理服务:

负责接收的报警事件,通过告警管理引擎(具有告警分组、告警过滤、排班告警和告警升级)以短信、电话或邮件的方式发送给用户。

8.Web服务:

负责将监控数据、报警事件和数据报表进行集中处理,并且以图形化方式展示给用户;

通过以上数据处理流程,完成了一体化集中监控系统主流程。

第3章主要功能及监控范围

3.1.主要功能

IT一体化集中监控系统由以下功能模块构成:

1.实时监控

实时监控包括监控页面、设备监控、监控仪表板和IP冲突监控等实时监控类别,将监控对象用不同的展示方式进行实时监控。

监控页面是将业务监控、数据中心设施监控和动环监控的指标和内容通过图形化方式展示,便于用户查看管理。

监控页面可实现总分结构展示,可查看系统的整体状态,也可查看模块和设备的详细监控信息。

所有的监控页面都可根据用户的风格和特点灵活定制。

设备监控显示所有被监控的设备,包括设备的状态、具体监控指标、产生的事件、生成的工单以及相关的资产信息。

监控仪表板以一个9宫格的形式即时展示需要显示的测点,支持多种控件的显示方式,包括表格、饼图、柱状图(横)、柱状图(竖)、曲线、点图。

IP冲突监控包括实时IP冲突监控、实时网络设备扫描、设备IP验证、设备资产关联以及IP变更记录查询等内容。

2.事件告警

监控系统发现的故障报警将通过事件告警子系统进行展示。

通过本子系统可以获取最新的故障报警,也可查询历史的故障报警,并且可将故障实时地以短信、电话或邮件发送给值班人员。

3.工单管理

当获知故障发生后,系统会自动生成工单。

值班人员可根据工单内容分派给专业人员进行解决。

在处理过程中,有知识库支撑解决问题。

4.知识库

知识库的作用是将处理故障的经验进行整理总结,归纳录入知识库,支持以后遇到相关问题的处理。

5.值班管理

值班管理子系统协助值班人员管理机房,包括来访登记、交接班登记、班次管理和计划作业。

6.统计报表

报表展示可统计分析历史数据,供决策分析使用。

包括性能报表、事件报表、工单报表、服务器统计报表和日志报表。

7.系统管理

系统管理包括WEB客户和管理客户端的系统管理。

WEB客户端系统管理是进行一体化集中监控系统软件的配置工作,包括权限分配、备份还原、服务管理等;

管理客户端的系统管理是管理员管理监控对象、设置指标各种规则,查看数据、事件、代理消息的强大工具。

3.2.监控范围

本系统可监控的IT设备类别如下表所示:

设备型号

数量

单位

服务器

Windows服务器

Linux服务器

逻辑分区

Unix服务器

HPUX服务器

Solaries服务器

AIX服务器

网络、安全、存储设备监控

 

交换机

路由器

防火墙

安全网闸

IPS

IDS

存储设备

负载均衡设备

数据库监控

Oracle

SQLServer

Informix

MySQL

Sybase

DB2

Domino

中间件监控

WebSphere

CICS

MQ

Tuxedo

SNA

TONGLINK

WebLogic

MS-EXCHANGE

LotusDomino

Apache-WEB

IIS-WEB

应用软件监控

应用软件1

……

应用软件n

第4章实时监控

4.1.服务器

4.1.1.监控指标

服务器监控主要监控服务器的操作系统,硬件监控与设备型号和厂家提供的应用接口有关。

各种业务系统都依赖于操作系统的稳定运行,监控系统对不同的操作系统实现性能监测和故障报警。

一体化集中监控系统监控的操作系统有Windows操作系统、Linux操作系统、Solaries服务器、Unix服务器、AIX操作系统等所有类别的操作系统。

服务器监控指标示例如下所示:

设备名称:

UNIX服务器

类别

名称

系统

系统时间

运行时间

操作系统名称

核心版本

操作系统版本

机器名称

主机类型

主机处理器类型

IP地址

文件系统(/dev/sda1)

文件系统设备

挂载点

已用空间百分比(%)

剩余空间(MB)

总容量(MB)

已用空间(MB)

文件系统(/dev/sdb)

装配点

交换空间

总交换空间(MB)

已用交换空间(MB)

空闲交换空间(MB)

已用百分比(%)

空闲百分比(%)

CPU负荷

系统负荷

用户CPU占用率(%)

系统CPU占用率(%)

I/O等待CPU占用率(%)

CPU空闲率(%)

CPU使用率(%)

内存负荷

总物理内存(MB)

已用物理内存(MB)

空闲物理内存(MB)

内存使用率(%)

换入(MB)

换出(MB)

I/O负荷

磁盘使用率(%)

磁盘等待队列

平均服务时间(ms)

平均等待时间(ms)

接收错误数

网络负荷(eth1)

冲突数

冲突率(%)

发送错误数

接收数据包数

发送数据包数

关键进程状态

关键进程1状态

关键进程1内存

关键进程1CPU

关键进程n状态

关键进程n内存

关键进程nCPU

4.1.2.界面展示

4.2.网络安全设备

4.2.1.监控指标

一体化集中监控系统支持各种网络安全设备的监控,包括交换机、路由器、防火墙、IPS、IDS、安全网闸等。

网络设备监控指标示例如下所示:

设备

温度

CPU

5秒cpu平均负载

1分钟cpu平均负载

5分钟cpu平均负载

内存

总内存大小(MB)

已用内存(MB)

空闲内存(MB)

端口1

端口名称

端口状态

传入流量(MB)

传出流量(MB)

传入丢包率(%)

传出丢包率(%)

传入错误率(%)

传出错误率(%)

MAC地址

端口n

设备名称

当前时间

用户占用率

系统占用率

空闲率

平均负载

1分钟平均负载

5分钟平均负载

15分钟平均负载

空闲内存(KB)

memBuffer(KB)

memCached(KB)

总内存(KB)

dummy0

eth0

eth1

eth2

eth3

eth4

eth5

eth6

eth7

ipsec0

br1

端口流进量

端口流出量

4.2.2.界面展示

4.3.存储设备

4.3.1.监控指标

一体化集中监控系统支持各种存储和负载均衡设备的监控包括EMC存储、磁盘阵列、光纤交换机、磁带机、磁带库、负载均衡设备等。

硬件监控与设备型号和厂家提供的应用接口有关。

具体监控指标如下所示:

IBM磁盘阵列存储设备

ECC控制台

状态

通道卡

控制器

盘包

Cache

电源

电池

风扇

光纤交换机

电源模块

通道板

端口

链路

温度值

IBM磁带库

机械臂

磁带机

磁带

4.3.2.界面展示

4.4.数据库

4.4.1.监控指标

一体化集中监控系统支持Oracle、Sql-server、MySql、Informix、domino、Sybase、DB2等多种数据库的监

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > PPT模板 > 商务科技

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2