虚拟化平台设计方案.docx

上传人:b****1 文档编号:1149211 上传时间:2023-04-30 格式:DOCX 页数:17 大小:325.11KB
下载 相关 举报
虚拟化平台设计方案.docx_第1页
第1页 / 共17页
虚拟化平台设计方案.docx_第2页
第2页 / 共17页
虚拟化平台设计方案.docx_第3页
第3页 / 共17页
虚拟化平台设计方案.docx_第4页
第4页 / 共17页
虚拟化平台设计方案.docx_第5页
第5页 / 共17页
虚拟化平台设计方案.docx_第6页
第6页 / 共17页
虚拟化平台设计方案.docx_第7页
第7页 / 共17页
虚拟化平台设计方案.docx_第8页
第8页 / 共17页
虚拟化平台设计方案.docx_第9页
第9页 / 共17页
虚拟化平台设计方案.docx_第10页
第10页 / 共17页
虚拟化平台设计方案.docx_第11页
第11页 / 共17页
虚拟化平台设计方案.docx_第12页
第12页 / 共17页
虚拟化平台设计方案.docx_第13页
第13页 / 共17页
虚拟化平台设计方案.docx_第14页
第14页 / 共17页
虚拟化平台设计方案.docx_第15页
第15页 / 共17页
虚拟化平台设计方案.docx_第16页
第16页 / 共17页
虚拟化平台设计方案.docx_第17页
第17页 / 共17页
亲,该文档总共17页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

虚拟化平台设计方案.docx

《虚拟化平台设计方案.docx》由会员分享,可在线阅读,更多相关《虚拟化平台设计方案.docx(17页珍藏版)》请在冰点文库上搜索。

虚拟化平台设计方案.docx

虚拟化平台设计方案

虚拟化平台设计方案

1建设要求

虚拟机之间可以做到隔离保护,单台虚拟机故障不会影响同一个物理机上的其他虚拟机运行,每个虚拟机上的用户权限只限于本虚拟机之内,以保障系统平台的安全性。

每个虚拟机可以安装操作系统,并且操作系统可以异构。

支持完整的虚拟机生命周期管理,提供虚拟机的创建、修改、删除、启动、关闭、重启、暂停、休眠、恢复、下电、查询等功能。

虚拟化管理系统支持动态资源调度,保证物理服务器的负载处于均衡状态。

2建设原则

●实现物理资源、虚拟资源的池化管理,按需、动态使用;实现IT资源即时申请,快速提供;

●当前已有的业务系统尽可能平滑迁移到云平台上,迁移后业务逻辑关系和业务能力保持不变,不需要对业务系统进行软件改造;

●云平台自身应该具备良好的可靠性,所有软、硬件应该冗余部署;同时,云平台必须对业务系统虚拟机提供良好的可靠性保障,支持虚拟机HA功能,尽可能减少故障情况下业务系统的中断时间,并快速自动恢复业务系统;

●云平台必须具备多重安全保障措施,从硬件层、虚拟化层、网络层、传输层等各个层面为业务系统提供安全保障;

●云平台必须具备统一的维护管理系统,实现对物理资源、虚拟资源的统一管理,简化管理流程,提升管理效率,降低维护管理开支;

●云数据中心必须具备关键业务数据备份功能,保障关键业务系统出现故障后业务数据不丢失,并且可以快速恢复业务;

●云数据中心需要具备容灾功能;

●云平台必须能平滑扩缩(扩容、减容)、平滑升级。

3虚拟化平台设计

数据中心虚拟化,是基于传统的硬件基础设施,采用虚拟化的软件技术和统一的数据中心管理平台,构建和传统数据中心不一样的云数据中心。

数据中心虚拟化之后,对外提供的能力比传统数据中心更多,管理更加聚焦,而数据中心运行的用户应用不会发生业务逻辑变化,应用系统会平滑迁移到云平台。

对于众多应用系统,提供整体的数据中心虚拟化解决方案,将上述部分应用服务部署到虚拟化的高性能物理服务器上,达到高可靠、自动化运维的目标。

众多物理服务器虚拟化成计算资源池(集群),保障云平台上的业务在出现计划外和计划内停机的情况下能够持续运行。

在整个项目建设过程中,还可以提供相关的专业咨询和迁移应用迁移服务。

数据中心虚拟化解决方案整体的整体逻辑架构如下图:

数据中心虚拟化解决方案从逻辑上分为产品解决方案和专业服务解决方案,其中产品解决方案又分为硬件部分和软件部分,硬件部分是指可以提供从数据中心基础层的机房建设、供电、散热方案到数据中心使用的服务器(刀片式或机架式,本次采用机架式服务器)、存储、网络设备、安全设备等全套硬件产品。

当然,基于客户提供的机房现有可用硬件设施建设虚拟化数据中心,同时兼容客户指定的业界主流的硬件产品。

软件部分以业界领先的虚拟化软件系统为主体来构建云平台及管理系统,主要包括如下几个逻辑模块:

Ø虚拟基础架构层:

基于服务器、存储、网络、安全等硬件设备,分别构建出虚拟计算资源池、虚拟存储资源池、虚拟网络资源池、虚拟安全资源池,实现对各类资源的池化管理,由虚拟化软件按用户所需给虚拟机分配资源,释放后的虚拟资源会被重新纳入资源池管理;同时,虚拟化软件基于资源池的统一管理,还实现了虚拟资源基于用户策略的调度管理,提高资源利用率,节能减排。

该层还对外提供了开放API接口,将虚拟基础架构层提供的对资源的各种操作、能力开放出来,用户可以引入第三方厂家进行二次开发对接,构建能对外开放运营的公有云系统,或者面向内部用户提供云服务的私有云系统。

该API接口还兼容业界主流的AWSAPI(AmazonWebService)。

Ø数据中心管理

数据中心管理是云数据中心必不可少的功能,主要提供如下功能:

(1)资源统一管理:

实现对云数据中心中虚拟资源、物理资源的统一管理,包括资源的生命周期管理、资源分配等。

(2)云监控、告警:

提供物理服务器、虚拟机、存储、交换机、物理集群等各个维度各种性能指标的监控功能;提供各种软、硬件设备的不同级别的告警界面呈现、邮件转发、告警短信提示功能;各类物理资源、虚拟资源的拓扑呈现。

(3)开放API/SDK:

对外提供开放API接口,并提供SDK开发包,方便用户或第三方进行二次开发,对系统进行进一步集成。

(4)VPC、VDC功能:

为满足企业内部总部和多个分支机构之间、或者多个业务部门之间对数据中心资源自主使用、自主管理的需求,VPC功能可以从网络上对不同分支机构或不同部门的物理资源、虚拟资源进行隔离,保证不同分支机构或不同部门的资源在各自子网内访问;VDC是从组织的角度设置的逻辑概念,可以是一个部门或一个分支机构,每个VDC可以被管理员划分一定的物理资源或虚拟资源,VDC管理员可以管理该VDC下的资源,从资源管理、使用的角度进行了隔离。

(5)应用弹性伸缩:

系统按照管理员设置的应用的资源使用的变更策略,根据应用的负载轻重自动调整应用所需要的虚拟机数量,达到资源按需使用,弹性伸缩。

(6)异构资源池管理:

云管理平台可以管理VMwarevSphere和CitrixXenServer构建的虚拟化资源池,并且实现管理流程和操作的完全统一。

(7)基础设施管理:

主要包括物理服务器、交换机、存储设备的接入、监控、告警,物理服务器的上、下电控制。

(8)虚拟负载均衡:

用户可以在管理平台上申请负载均衡器,将业务虚拟机关联到负载均衡器。

负载均衡器根据用户设定的负载均衡策略,将业务请求均匀分发到与之关联的虚拟主机上,使得每个业务虚拟机的负载基本均衡,保证业务运行的稳定性和可靠性。

(9)报表管理:

支持将监控数据导出为报表,便于用户进行进一步分析和管理。

(10)系统管理:

包括用户管理、系统配置、定时器设置、设置密码规则等功能。

(11)桌面管理:

管理平台中集成了桌面云系统的管理入口,可以支持桌面云、云主机的统一管理。

Ø应用层

应用层不属于范畴,是指运行在虚拟机上的用户应用系统,使用统一分配的计算、存储、网络资源,由虚拟化平台提供必要的安全保障。

3.1多层次安全防护设计

3.1.1虚拟化安全

虚拟机隔离设计

虚拟机隔离指同一物理机上不同虚拟机之间的资源隔离,是虚拟化能够实际应用的基本特征之一。

隔离包括CPU、内存、内部网络隔离和磁盘I/O等的隔离。

操作维护账号管理、认证和授权

虚拟化管理平台支持操作管理员账户周期管理。

提供一个缺省的超级管理员账户(admin),使用该账户可创建其他账户并授予相应的权限。

支持角色管理功能和基于角色的授权功能,目前云管理系统支持三种角色定义:

超级管理员、操作维护管理员、游客,分别对应不同的权限控制。

虚拟化平台操作系统的裁剪和加固

各虚拟化服务器的操作系统均进行针对性的了模块裁剪、安全加固和安全设置,只安装业务需要的组件,其它无关组件一律不安装,尽可能减少HostOS的安全漏洞。

安全配置

各虚拟化服务器的操作系统(HostOS)参考CIS(CenterforInternetSecurity)Linux操作系统安全benchmark进行了安全配置:

如关闭不安全的服务,设置账号密码复杂度策略、合理设置文件和目录的权限等等。

安全补丁管理

具有严格的安全补丁管理流程,定期在网站上发布经过测试的操作系统补丁包,由维护管理人员定期下载和安装操作系统补丁。

恶意虚拟机防护

防止恶意虚拟机的地址欺骗:

Hypervisor的vSwitch中将虚拟机的IP地址和MAC地址绑定,限制虚拟机只能发送本机地址的报文,防止虚拟机IP地址欺骗和ARP地址欺骗。

虚拟机的恶意嗅探:

Hypervisor中的vSwitch为交换型以太网(非Hub的共享型广播型),不同虚拟机的数据包被转发到指定的虚拟端口,即使在同一台物理宿主机上的虚拟机上也接收不到其他虚拟机的数据包,防止虚拟机的恶意嗅探。

3.1.2数据安全

数据安全是保障数据中心安全的重点。

为了保障用户的数据安全,虚拟化平台从数据隔离、访问控制等多个方面采取措施。

用户卷访问控制

系统对每个卷定义不同的访问策略,没有访问该卷权限的用户不能访问该卷,只有卷的真正使用者(或者有该卷的访问权限)才可以访问该卷,每个卷之间是互相隔离的。

存储节点接入认证

存储节点是采用标准的iSCSI进行访问,并且支持CHAP(ChallengeHandshakeAuthenticationProtocol)认证功能,CHAP认证功能可以提高应用服务器访问存储系统的安全性。

存储系统启用CHAP认证以后,应用服务器侧也必须启用CHAP认证,同时在存储系统中把应用服务器的信息加入到存储系统的合法CHAP用户,只有经过CHAP认证通过以后才能连接到存储系统并存取数据。

剩余数据彻底擦除

当用户把卷卸载释放后,系统在把该卷进行重新分配之前,可以选择对该卷进行彻底的数据格式化,以保证该卷上的用户数据的安全性。

存储的用户文件/对象删除后,对应的存储区进行完整的数据擦除,并标识为只写(只能被新的数据覆写),保证不被非法恢复。

数据多重备份

云数据中心的数据存储采用多重备份机制,每一份数据都可以有一个或者多个备份,当数据因存储载体(如硬盘)出现故障的时候,不会引起数据的丢失,也不会影响系统的正常使用。

系统同时对存储数据按位或字节的方式进行数据校验,并把校验的信息均匀的分散到的阵列的各个磁盘上。

阵列的磁盘上既有数据,也有数据校验信息,数据块和对应的校验信息会存储于不同的磁盘上,当一个数据盘损坏时,系统可以根据同一带区的其他数据块和对应的校验信息来重构损坏的数据。

SAN设备数据保险箱技术

SAN存储设备遭遇意外全部掉电时,可以采用数据保险箱技术保证数据的安全和完整性。

数据保险箱技术介绍:

从系统中的某几块硬盘上划分出一定区域,用来专门存放因突然掉电而尚未及时写入硬盘的Cache数据和一些系统配置信息。

当系统外部供电全部中断时,则可以通过内置电池或外置UPS供电,使得Cache中的数据能够写入数据保险箱中。

当外部电力恢复时,控制器再将数据从数据保险箱中读回到Cache中,继续完成对数据的处理。

3.1.3管理安全

虚拟化带来了成本降低、效率提高等一系列好处的同时,由于计算、存储的集中,对管理维护提出了更高的安全要求,以保障基础设施的安全运行。

虚拟化平台从管理流程的角度对安全性做了多重保护:

管理员账号分权分域管理

的系统管理员都支持“分权分域”管理:

(1)分权:

即区分不同管理员的操作权限,管理员的权限由“角色”定义。

一个“角色”可拥有一个或多个不同的系统操作权限,一个管理员可拥有一个或多个不同的“角色”。

通过绑定管理员和“角色”,实现管理员和系统操作权限的绑定。

如果一个管理员拥有多个“角色”,其拥有的系统操作权限是多个“角色”拥有的系统操作权限的并集。

平台支持灵活的角色设置,并灵活赋予角色拥有的权限。

(2)分域:

即系统最高管理员对低级别管理员划分各自负责的“数据和资源的管理范围”。

通过对管理员设置“分权分域”限制,使不同级别、不同企业、不同部门的管理员只负责各自管理范围内的业务,避免了越权操作,保护了系统数据的安全。

日志管理

平台支持集中的日志收集和存储,同时通过部署日志审计系统,满足客户的安全审计需求,如SOX要求。

虚拟化平台支持以下三类日志:

(1)操作日志:

操作日志记录管理员实施的管理维护操作,包括用户名、操作类型、客户端IP、关键参数、操作时间、操作结果等内容,存放在管理节点的数据库中。

审计人员可通过界面操作导出和查看操作日志,定期审计管理员实施过的操作,及时发现不当或恶意的操作。

管理员是无法删除操作日志的,所以操作日志也可作为抗抵赖的证据。

(2)运行日志:

运行日志记录系统各节点的运行情况,可由日志级别参数来控制不同级别日志的输出。

运行日志包括日志级别、线程名称、运行信息等内容,系统维护人员可通过查看运行日志,了解和分析系统的运行状况,及时发现和处理异常情况。

(3)黑匣子日志:

黑匣子日志记录系统宕机的定位信息,主要用于故障定位和故障处理,便于快速恢复业务。

其中计算节点产生的黑匣子日志通过TFTP协议汇总到日志服务器统一存放,而管理节点、存储节点产生的黑匣子日志本地存放。

系统支持集中的日志收集和存储,如下图所示:

集中日志管理

在各节点部署有日志收集代理,实时收集本地产生的运行日志、黑匣子日志,通过配置日志收集代理实现将日志数据过滤成高级别日志和完整日志。

高级别日志定期汇总到集中日志服务器。

完整日志通常存在节点本地,可通过脚本把指定节点、指定时间段的完整日志汇总到日志服务器。

平台的配套提供了一键式日志获取工具,可以在系统故障后快速获取黑匣子日志,快速定位问题,快速恢复。

安全告警管理

安全告警是指当系统侦测到违背安全策略的事件行为发生时,将安全事件相关的一些信息通过安全告警上报给管理平台,管理员根据这些信息对违背安全策略的行为进行及时处理,排除安全隐患。

安全告警上报的内容包含了告警的来源、告警产生的时间、告警产生的原因、服务提供者、服务使用者、告警级别、事件类型等信息。

3.2可靠性设计

数据中心虚拟化项目从整体、服务器、存储、网络、虚拟化多个层面综合考虑系统可靠性,保障业务的续性。

3.2.1虚拟化可靠性

虚拟化是数据中心的核心机制,数据中心进行采用虚拟化后,支持虚拟机热迁移,虚拟机HA功能,保障业务系统的连续性。

支持对虚拟机的快照功能,系统提供虚拟机、卷快照功能,便于在系统出现故障的时候还原系统。

3.2.2管理可靠性

管理模块均采用1+1备份或负载均衡的方式运行,保障系统运行的可靠性。

支持对物理服务器、软件和资源的监控。

系统可以收集服务器的核心指标如CPU使用情况、基础网络流量和内存数据等,检测到诸如进程异常、管理和存储链路异常,节点异常、系统资源过载等各种故障并上报告警,此类告警一般可由系统自行恢复或者由管理员及时处理,使系统保持完善的故障检测能力和故障恢复能力。

所有的物理服务器管理上都引入了电信领域“黑匣子”技术,在系统出现异常时自动存储内核日志、系统快照、内核诊断信息及临终遗言,并保存至非易失性存储设备(计算节点)或自动传送至网络服务器(例如日志服务器),以便系统故障后,导出分析黑匣子日志,快速定位故障问题,恢复系统正常运行。

3.2.3服务器可靠性

虚拟化服务器支持对CPU,内存,风扇,电源,硬盘等热关键器件的温度实时监控,设备故障时会产生告警。

配合智能的风扇调速和监控,确保服务器硬件系统运行的可靠性。

虚拟化服务器一般都支持硬盘热插拔和RAID功能,提供硬盘在线故障检测和预警。

支持电源1+1冗余和热插拔。

这些措施都可以保证服务器的可靠性。

3.2.4存储可靠性设计

数据中心虚拟化一般采用集中共享式SAN存储设备,虚拟化平台支持存储冷迁移、支持根据存储访问IO进行存储动态资源调度(DRS:

DynamicResourceScheduler)。

支持存储多路径,每个计算节点与存储集群之间,至少配置两个完全冗余的物理路径,一般从虚拟机到存储设备有8条访问路径,保障存储网络的可靠性。

SAN存储设备采用双控制器以保证物理链路的可靠性,在SAN高可靠性的基础之上,配置热备盘做冗余备份,保证数据不丢失和故障快速恢复。

3.2.5网络可靠性设计

虚拟化中心的组网中,所有的网络链路都是物理上冗余配置的。

通过使用交换机堆叠技术,保证物理服务器对外与汇聚层交换设备和对内虚拟网络层连接的冗余。

虚拟网络层通过采用多网卡绑定等技术避免单个网卡故障引发的业务中断。

对于各通信平面(业务、存储、管理)均采用双网卡,双网卡采用了Bonding模式,两网卡被绑定成逻辑上的“一块网卡”后,同步一起工作。

既能对服务器的访问流量进行负荷分担,又能保证网卡的可靠性。

3.3云数据中心管理

虚拟化管理平台聚焦于数据中心虚拟化资源管理、自动化运维发放、并对企业IT管理提供开放的管理接口。

云管理系统将整个数据中心云化,并对系统中用户可见的资源抽取出来纳入统一的资源池管理,为用户提供一体化的资源管理,自动资源发放,同时为用户提供了方便的获取资源的途径。

用户可以通过在服务目录自动化的获取资源并在资源上部署用户需要的应用。

虚拟化平台系统架构如下图:

虚拟化平台系统架构参考

方框内是虚拟化平台的功能模块。

“虚拟化管理”可以是虚拟化软件建成的资源池,也可以管理其他厂家的虚拟化资源池,如VMware的vCenter+vSphere或Citrix的XenServer。

虚拟化管理软件从软件层面拉通统一各资源管理。

虚拟化平台负责全系统硬件和软件资源的操作维护管理,用户业务的自动化运维。

从功能上划分,可以分为统一资源管理、自动化运维、用户权限管理、开放API接口、监控管理、告警管理、拓扑管理、日志管理、客户二次开发几个功能模块。

3.3.1统一资源管理

虚拟化平台,通过对各种物理资源、虚拟化资源数据统一建模,将资源以用户可见的资源池形式提供给系统用户即上层应用。

统一资源管理可以屏蔽不同硬件和虚拟化的差异,资源的更换升级对用户零感知。

实现对所有硬件资源进行统一管理,包括设备自动发现、自动配置和故障监控等,实现资源快速发放,缩短业务上线时间。

虚拟化平台支持对资源分集群管理,支持集群的创建、删除、扩容、减容,对集群进行性能监控,配置基于集群的资源调度策略(DRS),调度策略可以设置为手动和自动,实现虚拟机根据业务负荷在不同服务器上自动迁移。

虚拟化平台支持对虚拟机生命周期管理:

业务管理员可以进行虚拟机的创建、销毁操作,对虚拟机的日常维护包括:

启动、重启、迁移、关闭、快照、休眠、唤醒、虚拟机资源调整和监控等。

虚拟化平台支持虚拟化网络资源的管理:

对子网、WLAN、端口组、分布式交换机的相关配置进行管理。

虚拟化平台支持虚拟存储资源的管理:

可以管理IPSAN、FCSAN、NAS等存储资源,支持向存储资源池中增加、删除数据存储,对已经存在的数据存储可以进行扩容。

3.3.2自动化运维

自动化运维是虚拟化平台提供的主要功能之一。

管理员可以实现物理服务器的自动发现,虚拟机、操作系统和应用软件自动化部署,提高管理平台的管理维护效率。

自动化运维功能主要体现在以下几点:

(1)、物理服务器自动发现、自动发放

通过单个输入或批量导入物理机服务器信息,系统解析输入信息并自动化发现已上电服务器详细信息,包括服务器电源、风扇、CPU、内存、磁盘网卡等信息,将物理服务器纳入系统管理范围

最终用户从系统申请物理机时,云管理系统会根据用户要求自动选择特定型号、规格、操作系统类型和版本等信息,自动化选择合适的物理机、自动化安装和配置操作系统,实现自动化发放物理机。

(2)、应用自动化部署

系统支持按预创建的应用模板,自动化的完成应用所需要的虚拟机、软件包、以及依赖配置关系的自动创建和分发,从而完成模板所描述的应用实例的自动化创建,实现应用自动化部署,将应用实例的创建时间从数天、数小时,缩短到数分钟。

(3)、应用弹性伸缩

管理员通过配置不同的调度策略,可以实现智能资源调度,提升设备利用率,满足虚拟机应用对资源弹性伸缩的需求。

华为云管理系统集中管理和维护管理员设置的调度策略,保证资源的合理分配,实现资源最大化利用或实现节能目标等。

根据应用场景,可以分为三种策略类型:

组内自动伸缩策略、组间资源回收策略和时间计划策略。

组内自动伸缩策略

针对单独的应用而言,系统根据应用的当前负载情况动态的调整应用实际使用的资源,当一个应用资源负载较高时,系统自动启动该应用备用虚拟机或添加虚拟机并安装应用软件,分担当前应用的负荷;当应用的资源负载很低时,系统自动关闭或删除虚拟机,释放相应的资源。

通过启动、添加、关闭、删除虚拟机等动作,实现应用所需的资源自动伸缩。

组间资源回收策略

当整个虚拟化系统资源不足的情况下,云管理系统可以根据管理员设置的应用组间的资源复用策略,使优先级高的应用优先获取资源,使优先级低的应用释放资源,以供优先级高的应用使用。

时间计划策略

时间计划策略允许用户对于不同的应用实现资源的分时复用。

用户可以设置时间计划策略,使得不同的应用分时段的使用系统资源,比如说白天让办公用户的虚拟机使用系统资源,到了晚间可以让一些公共的虚拟机占用资源。

智能负载调度

智能节能调度策略

根据应用系统的CPU、内存负荷的策略,实现轻载虚拟机合并到某台服务器,将空闲服务器下电,实现节能降耗;重载情况下,将未上电的服务器上电并投入系统使用,将重载服务器上的虚拟机通过热迁移方式分离到新上电的其它服务器,实现服务器的负载均衡,保证应用的性能和用户感受。

3.3.3用户权限管理

云管理系统提供基于角色的用户权限控制功能,包括用户管理、角色管理、角色授权、登陆认证、鉴权等功能,实现全系统的安全功能。

角色和操作权限管理,不同角色对应不同的操作权限,不同的操作用户对应于不同的角色。

云管理系统可以为不同的管理员或用户进行“分权分域”管理,即不同管理员分配不同管理范围和业务访问权限,方便不同部门、不同组织的管理员的业务分工。

在鉴权过程中,云管理系统还可以和用户自己的鉴权机制进行对接进行权限认证。

3.3.4开放API接口

华为云平台对外屏蔽了各种资源的来源,对外提供开放API接口。

外部第三方系统可以获取到云计算系统的各种资源信息,比如集群信息,服务器资源,虚拟机信息,虚拟网络信息,监控、告警数据,网元拓扑数据等。

同时,外部第三方系统还可以通过API对系统资源进行操作维护。

比如支持对虚拟机的生命周期管理,包括启动,停止,重启,迁移等操作,支持对服务器的上电,下电,重启等操作。

只要是云平台支持的操作功能,都有对应的开放API接口对外提供。

3.3.5监控管理

云管理系统监控的对象主要针集群、物理服务器、虚拟机、网络交换机、存储设备等进行监控。

对集群的监控指标包括:

Ø告警统计;

Ø虚拟机运行情况;

Ø平均CPU趋势对比;

Ø平均内存趋势对比;

Ø平均网络流量趋势对比(网络流出);

Ø平均网络流量趋势对比(网络流入)

对物理服务器的监控指标包括:

Ø告警统计;

Ø该服务器上运行虚拟机运行状态;

ØCPU占用率;

Ø内存占用率;

Ø网络流入流出速率;

Ø磁盘I/O,磁盘占用率

对存储设备的监控指标包括:

Ø告警统计;

Ø挂载情况;

Ø总容量;

Ø总分配、总剩余

对网络交换机的监控指标包括:

Ø流入流出速率;

Ø端口信息状态;

Ø端口数据流量

对虚拟机的监控指标包括:

Ø告警统计;

Ø虚拟机状态;

ØCPU占用率;

Ø内存占用率;

Ø网络流入流出速率;

Ø磁盘I/O,磁盘占用率

3.3.6告警管理

在物理资源与虚拟资源出现故障时,告警管理模块会及时发出告警信息,提醒管理员处理故障。

对于可自动恢复的告警,如各种阈值告警,在系统负载下降后,告警状况解除,系统会自动发出告警解除信息,此类告警管理员不用特别对待,只需要了解告警产生及解除的过程,在业务部署时尽可能避免即可。

云平台支持对物理设备、虚拟化设备和虚拟机的故障检测,如服务器的RAID、配件检测、交换机、存储设备的检测,虚拟机HA、虚拟机快照、虚拟机迁移、存储迁移的故障检测等。

故障检测后如果发现故障,系统会进行分级上报,分为紧急、重要、次要和提示四种告警级别,标识不同严重程度的系统故障,便于管理员分类处理。

虚拟化平台界面可通过不同的声音、颜色标识不同级别的告警,呈现给管理维护人员。

管理员可配置告警处理Email和短信通知告警功能:

告警产生和恢复时,系统会自动给运维人员发Email和短信,及时告知。

通过订阅重要的告警,管理员可实现在无人值守的环境下,仍能实时掌握云数据中心全网节点的运行状态。

3.3.7拓扑管理

拓扑管理提供一个可视化界面,自动呈现云平台全系统的所有资源的拓扑信息,无需管理员手动配

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 人文社科 > 法律资料

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2