APEX-IT运维管理平台建设方案(监控和运维流程).docx

上传人:聆听****声音 文档编号:737730 上传时间:2023-04-29 格式:DOCX 页数:243 大小:17.15MB
下载 相关 举报
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第1页
第1页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第2页
第2页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第3页
第3页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第4页
第4页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第5页
第5页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第6页
第6页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第7页
第7页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第8页
第8页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第9页
第9页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第10页
第10页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第11页
第11页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第12页
第12页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第13页
第13页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第14页
第14页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第15页
第15页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第16页
第16页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第17页
第17页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第18页
第18页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第19页
第19页 / 共243页
APEX-IT运维管理平台建设方案(监控和运维流程).docx_第20页
第20页 / 共243页
亲,该文档总共243页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

APEX-IT运维管理平台建设方案(监控和运维流程).docx

《APEX-IT运维管理平台建设方案(监控和运维流程).docx》由会员分享,可在线阅读,更多相关《APEX-IT运维管理平台建设方案(监控和运维流程).docx(243页珍藏版)》请在冰点文库上搜索。

APEX-IT运维管理平台建设方案(监控和运维流程).docx

APEX IT运维管理平台建设方案

2015-3

目录

1.APEX解决方案概述 5

2.系统架构及实现原理 9

2.1.系统架构 9

2.1.1.管理实体 10

2.1.2.数据层 10

2.1.3.功能层 10

2.1.4.接入展现层 11

2.2.系统集成 12

2.2.1.第三方集成 12

2.2.2.短信猫集成 13

2.2.3.短信网关集成 13

2.2.4.门户/界面集成 13

2.3.开发工具及技术介绍 13

2.3.1.标准的通信协议 14

2.3.2.TWaver拓扑图组件 16

2.3.3.JBPM流程引擎 16

2.3.4.成熟的J2EE开发标准技术 17

2.3.5.分布式任务调度 17

2.3.6.Lucene搜索引擎 18

2.3.7.JBOSS应用服务器 18

3.APEX运维管理平台功能详细介绍 19

3.1.IT综合监控系统 19

3.1.1.网络管理 19

3.1.1.1设备管理 19

3.1.1.2网络可用性监控 22

3.1.1.3网络拓扑监控 24

3.1.1.3网络性能监控 31

3.1.2.服务器管理 32

3.1.2.1Windows监控 32

3.1.2.2Linux监控 35

3.1.2.3AIX监控 40

3.1.2.4UNIX监控 43

3.1.3.应用服务器监视 47

3.1.3.1Tomcat监视 47

3.1.3.2JBoss监视 51

3.1.3.3Weblogic监视 54

3.1.3.4WebSphere监视 56

3.1.3.5IBMMQ监视 60

3.1.3.6自定义脚本监视 62

3.1.4.应用系统及日志监视 64

3.1.5.数据库监控 67

3.1.5.1Oracle监控 68

3.1.5.2SQLServer监控 72

3.1.5.3MYSQL监控 76

3.1.5.4DB2监控 78

3.1.5.5Sybase监视 81

3.1.5.6Informix监视 83

3.1.6.WEB监控 85

3.1.6.1Apache监控 86

3.1.6.2IIS监视 88

3.1.6.3URL网页监视 90

3.1.7.虚拟化监控 91

3.1.8.存储监控 95

3.1.9.告警管理 97

3.1.10.资源与配置管理 106

3.1.10.1资源管理 106

3.1.10.2网络配置管理 109

3.1.11.自动巡检管理 112

3.1.12.机房环境监控 114

3.1.13.业务服务管理 115

3.1.14.报表管理 118

3.1.15.安全管理 124

3.1.16.自身监控管理 128

3.1.17.大屏展示 129

3.1.18.系统部署方案 130

3.2.IT服务管理流程系统 131

3.2.1.自助式服务台 132

3.2.2. 服务台 133

3.2.3.个人工作台 135

3.2.4.值班管理 137

3.2.5.事件管理 143

3.2.6.问题管理 145

3.2.7.变更管理 149

3.2.8.发布管理 150

3.2.9.知识库管理 152

3.2.10.配置管理 156

3.2.11.配置管理库建设建议 162

3.2.12.服务级别管理 163

3.2.13.自定义工作流 168

3.2.14.通告管理 174

3.2.15.项目管理 175

3.2.16.资产管理 181

3.2.17.运维报表统计 187

3.2.18.运维系统内的角色/权限管理 191

3.2.19.通知提醒功能 193

3.2.20.数据安全和备份 193

3.2.21.统一运维门户 193

4.ITIL咨询方案 199

4.1.专业培训及理念导入 199

4.2.结合理论与实际进行专业化服务管理现状评估 201

4.2.1.IT业务战略模式的四种模式 201

4.2.2.ITIL流程成熟度测评 202

4.2.3.IT服务管理成熟度评估分析模型 205

5.实施的相关案例介绍 211

5.1.新疆公安厅 211

5.2.包商银行 218

5.3.青牛软件-联通呼叫中心基地项目 221

5.4.上海政务网 235

5.5.河北移动 239

1.APEX解决方案概述

APEXIT运维和服务管理系统是在分析了中国IT管理现状和需求后,基于

ITIL理念自主研发而成。

秉承以客户为中心、流程为导向的理念,实现对IT资源的全面管理,完美整合了人员、技术和流程三大要素,帮助用户以较低的成本提供稳定、优质的服务,共同实现IT服务的目标。

APEXIT运维和服务管理系统提供了“无缝式IT监控系统”功能,其系统架构清晰,采用模块化的设计理念,各功能模块既可独立运行、松散耦合;亦可整体功能无缝衔接覆盖整个业务系统,灵活的自由组合真正实现个性化的IT无忧运维。

APEXIT运维和服务管理系统主要由综合运维管理平台OSSWorks、网络和应用管理IntegrationManager组成。

lOSSWorks:

遵循ITIL标准规范,结合国内管理模式,提供服务台、个人桌面管理、事件管理、问题管理、IT资产配置管理、变更与发布管理、知识库等功能,实现了一体化的IT运维支撑平台。

lAPEX IntegrationtManager:

实现了对交换机、路由器、防火墙等设备的全方位管理,提供了丰富的拓扑、配置、资产、故障、性能、事件、流量、报表等网络管理功能,同时实现对多种系统及上层应用的监控管理功能,包括服务器、数据库、邮件服务器、WEB服务器、应用服务器、操作系统、

网站监控等。

APEXIT运维和服务管理系统提供一个图形化、可定制、统一的监控管理平台。

通过它实现对IT基础架构性能和告警数据的直接监控与展示(网络设备、主机、操作系统、数据库、中间件和应用等),实现对用户环境的整体运行状态的监控管理。

此运维监控平台包括以下功能:

l故障预警和管理

前瞻性地发现系统的故障和性能问题,能够快速识别、隔离、诊断和修复生产中出现的问题。

1)前瞻性发现基础设施和应用系统的故障。

2)前瞻性检测复杂的应用性能问题。

3)基于业务的性能影响分析报告

4)快速识别、隔离和诊断问题的起因,事故根本原因分析。

5)对一些简单的故障问题,提供自动化修复故障的功能;对复杂的故障和性能问题,尽可能提供修复故障和改善性能的建议。

6)提供的丰富的事件通知功能,事件通知方式包括:

-Mail 自动向指定邮箱发送告警邮件。

-短信自动向指定手机发送告警短信。

-声音自动产生声音告警。

-图像自动以图标形式显示告警事件。

-其它通过二次开发可实现特殊要求的告警方式。

7)提供监控参数化配置管理,参数超过设定阀值,产生报警信息。

l多层次的视图展示

直观、准确地体现各层面的系统和业务运行状态,分别展示不同管理层次和范围的系统运行状态。

根据企业的业务特点和管理习惯,可将展示视图分成根视图、一级视图、二级视图和三级视图,分别展示不同管理层次和范围的系统运行状态(如下图所示)。

l集中统一的管理界面

用户在统一监控管理平台上可查看所有视图,提供直观的图形用户界面。

1)基于上下文环境和组合视图,降低用户诊断问题的时间。

2)基于角色和权限的控制,增强管理的安全性。

3)提供可定制化的工作区和视图,提高操作的灵活性。

l开放的接口

能够集成第三方监控工具,实现将第三方监控(例如空调、门禁、UPS、机房动力或特定应用管理工具等)完全变为监控系统的一部分。

l丰富的报表展示功能

提供统一的报表界面,具备强大的数据展现能力:

1)提供网络、系统、数据库、网络、中间件、应用和业务运转状况的集中统一报表

2)提供实时与历史性能报表

3)提供数据分析、展现和用户报表定制功能

4)预制报表模板

5)自动周期性报表,如日报、周报、月报、季报、年报等

6)支持PDF、HTML、Excel等报表格式

l基于ITIL的运维流程管理功能

Apex系统定位于一个稳定、开放的综合IT运维服务管理平台,遵循ITIL

规范。

在架构上采用了

Java/J2EE、XML、JSP、Hibernate、RMI、JPBM、JETSPEED2等成熟技术。

系统基于ITIL的最佳实践经验,为用户提供运维服务管理流程,定义了包括事件管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、作

业计划、知识库等在内的服务管理流程,通过各流程环节的工单形成IT服务的闭环管理,将人员、流程和技术有机地结合起来,将管理、监控和考核有机地结合起来,提升整体的运维管理水平。

最终实现运行维护的规范化、流程化和标准化。

2.系统架构及实现原理

2.1.系统架构

本次提供给XXXX的IT运维管理系统涵盖较多被监控的对象,覆盖面较广,功能复杂,系统设计遵循模块式开发、部署,系统从底层到最上层的图形用户接口共分为4层,每一层实现不同的功能,系统整体的架构如下图所示:

整个IT系统管理架构分为管理实体、数据、功能和功能展现四个层次。

2.1.1.管理实体

包括XXXXIT环境中的各类网络设备、服务器、存储、数据库、中间件等被管理实体,是需要被实时监控的对象,是原始信息的来源。

所有的被管理对象通过SNMP、WMI、TELNET、SSH、ICMP、JDBC、ODBC、JMX及私有协议等方式向管理端提供各种性能和事件数据。

2.1.2.数据层

包含两个功能,一是对管理实体中的数据进行数据采集;二是根据要求对数据进行必要的整合。

除了采集到的数据外,还可能包括各种管理数据,系统汇总后的数据、文档数据等。

IT系统管理的数据采集方式支持以下几种:

Ø采用定时轮循机制获取被管实体的数据;

Ø监听代理端的TRAP消息实时获取数据;

Ø通过设备厂家提供的监控工具获取数据;

Ø通过读取日志文件获取数据;

Ø通过其他厂商网管平台获取数据。

对于XXXX的业务系统,若纳入到IT系统管理的管理体系中,则应支持以下的管理接口方式:

Ø数据库接口;

Ø文件接口(日志文件等);

ØSNMP;

Ø其它API接口,需业务软件厂商提供有关接口的详细信息。

2.1.3.功能层

IT运维管理系统所使用的各种业务逻辑,集中管理和协调各子系统之间的服务调用,是IT网络系统管理的核心管理平台,主要有如下功能要点:

1.拓扑发现,自动发现网络设备,包括交换机、路由器、防火墙等支持

snmp的设备

2.性能管理,对网络设备、服务器、数据库、XXXX的交易系统实时监控,采集各种指标数据,并与告警模块关联,在产生异常时及时发出警告

3.告警管理,提供告警主动通知、告警统计、告警相关性分析等功能

4.设备配置管理,对网络设备的配置进行自动周期性的备份,实时监控网络设备的配置是否发生变化并在发生变化后及时发出警告,提供批量配置功能能够批量修改网络设备的配置

5.统一事件处理,集中收集网络设备、服务器、数据库、交易系统的事件与告警,并提供告警相关性分析,辅助管理员排除故障

6.业务视图,从业务的角度进行建模,提供可视化的业务运行状态拓扑图,实时呈现业务的运行状态,在业务出现故障后,能够从业务视图上分析出

故障的根源。

7.按需定制的portal,根据XXXX的要求,定制开发多种不同功能的portlet,并提供自定义portalweb界面功能,能够根据不同用户的需要呈现不同的软件功能和数据。

8.IT服务管理则实现运维管理功能,包括服务台、事件管理、问题管理、变更管理、配置管理、发布管理、知识库管理、SLA管理等模块。

2.1.4.接入展现层

展现层是IT运维系统与IT管理人员之间的人机交互接口,本次IT运维系统采用全WEB化的客户端界面,运维人员只需使用浏览器即可在网络中任意一台电脑上随时接入系统,系统支持portal功能,可以根据用户的需要呈现不同的功能和数据。

此外,运维系统支持email、短信、声光等多种方式的事件通知形式。

2.2.系统集成

2.2.1.第三方集成

APEX IT运维系统在设计之初,充分考虑了开发性和可扩展性的需求,可以有效地容纳和支持IT规模的不断扩大和复杂、业务种类的增多,能够在应用体系结构和软件模块划分两个方面支持整个应用的良好扩展性。

系统预留业界较通用的接口,可以方便地实现与XXXX现有业务系统、机房环境监控等第三方监控工具的集成。

APEX IT运维管理系统与第三方工具集成接口可以通过以下方式进行对接和整合:

(1)Trap:

APEX系统可以接受第三方监控平台产生的trap,前提是双方确定

好trap的报文格式,由APEX内置的trap解析器进行解析和处理。

如工单的自动生成,告警消息的上报,确认和清除等等。

(2)Webservice接口:

为了实现数据共享,可以通过webservice接口将监

控平台的数据在APEX运维管理平台进行展示或汇总分析。

如监控平台的topN数据展示,告警信息,与CI关联的设备信息,实时CPU,内存,磁盘信息、链路流量等信息。

(3)HTTP接口:

功能与

(1),

(2)基本相同,是另一种数据交互方式,优

点是调用方便,可以穿越防火墙,并且无需对引入第三方jar包,无需做侵入式修改。

(4)JMS:

为了达到高实时性的要求,通过JMS推送机制,APEX作为订阅客

户端,可以接受推送过来的实时告警信息并在APEX平台上进行展示,比如展示在业务视图上或工作区/服务台首页。

(5)SOCKET:

可以支持socket双向通讯,由第三方监控平台开放socket监

听端口,APEX进行socket连接后进行数据通讯。

可以满足一些实时性要求比较高的需求。

(6)API接口

2.2.2.短信猫集成

短信猫直接接在网管系统所在服务器的串口上,并给短信猫配置一张SIM卡,当需要发送短信时,网管系统直接通过串口通信协议与短信猫通信,将短信的收信人手机号码,短信内容发送给短信猫,由短信猫负责通过运营商的网络发送到指定接收人。

2.2.3.短信网关集成

对于客户已经购买过相应的短信网关系统的情况下,APEXIT运维管理系统支持与短信网关对接,通过数据库访问协议(JDBC、ODBC)访问短信网关的后台短信数据库,将短信的收信人,短信内容插入数据库,由短信网关软件负责将数据库中的短信发送到指定接收人,目前支持与SQL Server2000、SQLServer2005、Oracle9i/10g数据库的短信网关集成。

2.2.4.门户/界面集成

APEXIT运维管理软件采用遵循JSR168Portal规范的Portal技术,在多个

Portal界面上提供多样化的Portlet部件,不同的Portlet部件实现不同的功能,同时如果需要在系统客户端界面上提供跳转到其它系统的超链接,可以很方面的添加,添加后如果这些第三方的业务系统支持单点登录,则用户并不需要在多个系统之间切换时重复登录。

2.3.开发工具及技术介绍

APEX系列产品均采用JAVA技术开发,实际情况证明,JAVA技术是一项成熟可靠的技术,在全世界各个行业,有数不清的核心业务系统使用JAVA语言开发,大到银行核心业务系统小到各个论坛网站,JAVA平台提供了多种多样的特定技术来解决软件开发中遇到的各种问题。

目前APEX系列产品主要使用到了如下开发工具和技术:

2.3.1.标准的通信协议

APEXIT运维管理系统使用业界主流的通信协议与被管对象进行通信,主要的通信协议如下:

1.SNMP:

SNMP(SimpleNetworkManagementProtocol,简单网络管理协议)的前身是简单网关监控协议(SGMP),用来对通信线路进行管理。

随后,人们对SGMP进行了很大的修改,特别是加入了符合Internet定义的SMI和MIB:

体系结构,改进后的协议就是著名的SNMP。

SNMP的目标是管理互联网Internet上众多厂家生产的软硬件平台,因此SNMP受Internet标准网络管理框架的影响也很大。

现在SNMP已经出到第三个版本的协议,其功能较以前已经大大地加强和改进了。

2.WMI

WMI,是Windows2K/XP/2003/2008管理系统的核心;对于其他的Win32操作系统,WMI是一个有用的插件。

WMI以CIMOM为基础,CIMOM即公共信息模型对象管理器(CommonInformationModelObjectManager),是一个描述操作系统构成单元的对象数据库,为MMC和脚本程序提供了一个访问操作系统构成单元的公共接口。

有了WMI,工具软件和脚本程序访问操作系统的不同部分时不需要使用不同的API;相反,操作系统的不同部分都可以插入WMI。

3.SSH

SSH是英文Secure Shell的简写形式。

通过使用SSH,你可以把所有传输的数据进行加密,这样"中间人"这种攻击方式就不可能实现了,而且也能够防止DNS欺骗和IP欺骗。

使用SSH,还有一个额外的好处就是传输的数据是经过压缩的,所以可以加快传输的速度。

SSH有很多功能,它既可以代替Telnet,又可以为FTP、Pop、甚至为PPP提供一个安全的"通道"。

SSH协议是建立在应用层和传输层基础上的安全协议,它主要由以下三部分组成,共同实现SSH的安全保密机制。

传输层协议,它提供诸如认证、信任和完整性检验等安全措施,此外它还

可以任意地提供数据压缩功能。

通常情况下,这些传输层协议都建立在面向连接的TCP数据流之上。

用户认证协议层,用来实现服务器的跟客户端用户之间的身份认证,它运行在传输层协议之上。

连接协议层,分配多个加密通道至一些逻辑通道上,它运行在用户认证层协议之上。

当安全的传输层连接建立之后,客户端将发送一个服务请求。

当用户认证层连接建立之后将发送第二个服务请求。

这就允许新定义的协议可以和以前的协议共存。

连接协议提供可用作多种目的通道,为设置安全交互Shell会话和传输任意的TCP/IP端口和X11连接提供标准方法。

4.Telnet

Telnet协议是TCP/IP协议族中的一员,是Internet远程登陆服务的标准协议和主要方式。

它为用户提供了在本地计算机上完成远程主机工作的能力。

在终端使用者的电脑上使用telnet程序,用它连接到服务器。

终端使用者可以在telnet程序中输入命令,这些命令会在服务器上运行,就像直接在服务器的控制台上输入一样。

可以在本地就能控制服务器。

要开始一个telnet会话,必须输入用户名和密码来登录服务器。

Telnet是常用的远程控制Web服务器的方法。

5.ICMP

ICMP是(InternetControlMessageProtocol)Internet控制报文协议。

它是TCP/IP协议族的一个子协议,用于在IP主机、路由器之间传递控制消息。

控制消息是指网络通不通、主机是否可达、路由是否可用等网络本身的消息。

这些控制消息虽然并不传输用户数据,但是对于用户数据的传递起着重要的作用。

6.Syslog

Syslogprotocol是一种工业标准的协议,允许一个设备通过IP网络把通告信息传递给事件信息接收者(也称之为“syslogd”,“syslogdaemon”或“日

志服务器”)。

术语“syslog”一般用作真正的syslogprotocol,或者也用作应用程序或库发送syslog信息。

Syslog是一个简单协议,常用来管理计算机系统和安全审计。

虽然存在大量不 足,Syslog获得了大量设备和接收者跨越多个平台和操作系统的支持。

因此,Syslog可用来将日志数据从多种不同类型的系统整合到一个存贮中心。

7.JMX

Java管理扩展(也叫做JMX规范)在Java编程语言中定义了应用程序以及网络管理和监控的体系结构、设计模式、应用程序接口以及服务。

通常使用

JMX来监控系统的运行状态或管理系统的某些方面,比如清空缓存、重新加载配置文件等

JMX--JavaManagementExtensions,即Java管理扩展,是一个为应用程序、设备、系统等植入管理功能的框架。

JMX可以跨越一系列异构操作系统平台、

系统体系结构和网络传输协议,灵活的开发无缝集成的系统、网络和服务管理应用。

2.3.2.TWaver拓扑图组件

基于TWaver提供的强大的基于SVG技术的拓扑组件,APEX-

IntegrationManager能够在浏览器中显示拓扑图,SVG技术是业界通用标准技术,其提供的可伸缩矢量图形技术能够很好的在浏览器中展示图形,而无需客户端浏览器安装其它笨重的插件。

TWaver是面向电信行业的专业图形用户界面(GUI)组件产品,在全球电信行业有广泛的应用。

TWaver组件产品涵盖各种主流客户端技术,提供专业的拓扑组件、地图组件、设备图组件,以及表格、树图、属性表、图表等丰富的通用图形界面组件,为电信运营支撑系统(OSS)的开发提供“一站式”的组件产品和解决方案,是快速设计、开发和部署OSS的利器。

2.3.3.JBPM流程引擎

业内成熟、功能强大、性能稳定的流程引擎产品,通过使用流程引擎,可

以使得企业业务人员和软件开发人员统一沟通的语言,使用流程建模工具即可完成交流,规避了业务人员不懂软件开发技术、软件开发人员不懂业务所带来的困扰;通过对流程的建模(结果以XML格式呈现),方便我们根据企业多变的业务情况灵活修改,流程引擎帮助我们管理各个流程实例的状态,软件开发商只需要在此基础上加入业务特定要求的表单数据即可,大大简化了开发企业流程管理软件的复杂度、降低了开发时间和财务成本,提高了软件交付的时间,也提高了软件的稳定性。

2.3.4.成熟的J2EE开发标准技术

APEX IT运维管理软件基于JAVA企业版本技术规范开发,为浏览器/服务器模型软件系统,系统严格遵守JAVA企业版本规范,采用了成熟可靠的

JSP/Servlet、Struts、多线程、异步IO、Hibernate、线程池、AJAX等可靠技术,确保APEXIT运维管理系统稳定、可靠、系统资源占用低,能够长时间稳定运行。

2.3.5.分

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2