VMware虚拟化平台巡检手册.docx

上传人:b****3 文档编号:5060889 上传时间:2023-05-08 格式:DOCX 页数:20 大小:6.18MB
下载 相关 举报
VMware虚拟化平台巡检手册.docx_第1页
第1页 / 共20页
VMware虚拟化平台巡检手册.docx_第2页
第2页 / 共20页
VMware虚拟化平台巡检手册.docx_第3页
第3页 / 共20页
VMware虚拟化平台巡检手册.docx_第4页
第4页 / 共20页
VMware虚拟化平台巡检手册.docx_第5页
第5页 / 共20页
VMware虚拟化平台巡检手册.docx_第6页
第6页 / 共20页
VMware虚拟化平台巡检手册.docx_第7页
第7页 / 共20页
VMware虚拟化平台巡检手册.docx_第8页
第8页 / 共20页
VMware虚拟化平台巡检手册.docx_第9页
第9页 / 共20页
VMware虚拟化平台巡检手册.docx_第10页
第10页 / 共20页
VMware虚拟化平台巡检手册.docx_第11页
第11页 / 共20页
VMware虚拟化平台巡检手册.docx_第12页
第12页 / 共20页
VMware虚拟化平台巡检手册.docx_第13页
第13页 / 共20页
VMware虚拟化平台巡检手册.docx_第14页
第14页 / 共20页
VMware虚拟化平台巡检手册.docx_第15页
第15页 / 共20页
VMware虚拟化平台巡检手册.docx_第16页
第16页 / 共20页
VMware虚拟化平台巡检手册.docx_第17页
第17页 / 共20页
VMware虚拟化平台巡检手册.docx_第18页
第18页 / 共20页
VMware虚拟化平台巡检手册.docx_第19页
第19页 / 共20页
VMware虚拟化平台巡检手册.docx_第20页
第20页 / 共20页
亲,该文档总共20页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

VMware虚拟化平台巡检手册.docx

《VMware虚拟化平台巡检手册.docx》由会员分享,可在线阅读,更多相关《VMware虚拟化平台巡检手册.docx(20页珍藏版)》请在冰点文库上搜索。

VMware虚拟化平台巡检手册.docx

VMware虚拟化平台巡检手册

 

VMware云平台巡检手册

 

 

第一章系统拓扑图

一.1物理连接图

一.2整体拓扑图

一.3拓扑结构说明

由上图可以看到,物理层面,我们用户采用了两台IBMX3850X5的X86服务器作为虚拟化的物理服务器。

用1台IBMDS5020作为虚拟化存储,同时该存储中划分了众多LUN,部分LUN用于别的系统使用(如小型机系统)。

存储和主机之间通过SAN交换机连接。

整个虚拟化服务器通过LAN网络对外提供服务。

在虚拟层面,我们用户虚拟化采用HA机制来保护虚拟机的高可用。

第二章物理硬件检查报告

二.1172.16.12.75硬件状态报告

二.1.1CPU状态报告

在虚拟平台上,所有物理硬件都被视为物理资源,在虚拟平台上CPU的状态参考值必须为Normal,表示处于正常状态。

在用户vmware虚拟平台上,这台IP地址为172.16.12.75的IBMX3850,物理CPU型号为IntelXeonE7-48202.00GHz;目前状态正常。

二.1.2内存状态报告

内存状态参考值也必须是Normal,从上图我们看到用户这台IP地址为172.16.12.75的IBMX3850配置了32G内存,存在告警,告警内存的状态无法识别。

建议检查停机检查内存。

二.1.3其他硬件状态报告

由上图可以看到,其他硬件状态全部处于Normal状态。

属于正常状态。

二.2172.16.12.76硬件状态报告

二.2.1CPU状态报告

在虚拟平台上,所有物理硬件都被视为物理资源,在虚拟平台上CPU的状态参考值必须为Normal,表示处于正常状态。

在用户vmware虚拟平台上,这台IP地址为172.16.12.76的IBMX3850,物理CPU型号为IntelXeonE7-48202.00GHz;目前状态正常。

二.2.2内存状态报告

内存状态参考值也必须是Normal,从上图我们看到用户这台IP地址为172.16.12.75的IBMX3850配置了64G内存,状态正常。

二.2.3其他硬件状态报告

由上图可以看到,其他硬件状态全部处于Normal状态。

属于正常状态。

第三章虚拟平台检查报告

三.1虚拟平台基本状态检查

三.1.1172.16.12.75基本状态检查

三.1.1.1网络状态检查报告

 

在虚拟平台上,网络基本建议必须有冗余设计,不存在单点故障。

同时根据虚拟化平台高可用性的特性,我们设计规划中,对于网络必须拥有多张网卡,建议每台主机有8张千兆网卡为佳。

对于虚拟交换机,如果无特殊业务需求,建议每台ESXI主机仅有一个标准虚拟交换机或者分布式交换机。

从上面两图来看,我们用户虚拟平台首先管理网络存在单点故障,没有冗余。

同时我们当前有3台虚拟交换机,这3台虚拟交换机,实际情况只有vswitch0挂载有虚拟机,其他2台,没有挂载虚拟交换机。

Vswitch1预计是做链接NAS存储用,vswitch2配置了管理地址,做管理用。

对于vmotion,FT等高可用的网络确没有做任何配置。

这种配置模式不合理。

所有网络都处于单点故障状态,对于虚拟平台的高可用也存在严重问题。

建议修正配置。

三.1.1.2存储状态检查报告

在虚拟平台上,存储基本建议必须有冗余设计,不存在单点故障。

同时根据虚拟化平台性能的要求,我们设计规划中,对于存储规划上,我们要求存储的LUN划分要合理,使得运行性能最佳。

从上图来看,我们用户虚拟平台存储存在两个存储,1个为性能较高的SAN存储。

另外一个为性能较低的NAS存储。

然而这两个存储属于各自运行,性能相差较大,无法进行冗余设计。

建议配置一台同样性能SAN存储,作为冗余。

NAS存储仍然作为备份使用。

同时对存储里面的LUN进行重新划分,以优化性能。

由于用户虚拟平台配置了SSD存储。

SSD存储可以作为主机缓存。

这里主机缓存配置把所有SSD盘当作主机缓存。

建议重新配置,按照实际情况配置。

三.1.1.3虚拟机状态检查报告

虚拟机良好运行状态,应该保障无告警,无性能问题,有高可用保障。

由上图我们可以看到,用户虚拟化平台上的虚拟机已经处于HA群集状态,但同时有很多VM处于告警状态,该告警,经过初步分析,有可能以下原因引起:

●VMtools异常引起;

●GuestOS异常引起;

●目前存在内存错误引起;

●软件授权异常引起某些模块无法正常工作引起;

我们建议,首先消除底层的内存错误,然后检查GuestOS和VMtools工作情况,其次对vmwarevsphere升级到最新的5.1。

三.1.2172.16.12.76基本状态检查

三.1.2.1网络状态检查报告

在虚拟平台上,网络基本建议必须有冗余设计,不存在单点故障。

同时根据虚拟化平台高可用性的特性,我们设计规划中,对于网络必须拥有多张网卡,建议每台主机有8张千兆网卡为佳。

对于虚拟交换机,如果无特殊业务需求,建议每台ESXI主机仅有一个标准虚拟交换机或者分布式交换机。

从上面两图来看,我们用户虚拟平台首先管理网络存在单点故障,没有冗余。

同时我们当前有3台虚拟交换机,这3台虚拟交换机,实际情况只有vswitch0挂载有虚拟机,其他2台,没有挂载虚拟交换机。

Vswitch1预计是做链接NAS存储用,vswitch2配置了管理地址,做管理用。

对于vmotion,FT等高可用的网络确没有做任何配置。

这种配置模式不合理。

所有网络都处于单点故障状态,对于虚拟平台的高可用也存在严重问题。

建议修正配置。

三.1.2.2存储状态检查报告

在虚拟平台上,存储基本建议必须有冗余设计,不存在单点故障。

同时根据虚拟化平台性能的要求,我们设计规划中,对于存储规划上,我们要求存储的LUN划分要合理,使得运行性能最佳。

从上图来看,我们用户虚拟平台存储存在两个存储,1个为性能较高的SAN存储。

另外一个为性能较低的NAS存储。

然而这两个存储属于各自运行,性能相差较大,无法进行冗余设计。

建议配置一台同样性能SAN存储,作为冗余。

NAS存储仍然作为备份使用。

同时对存储里面的LUN进行重新划分,以优化性能。

由于用户虚拟平台配置了SSD存储。

SSD存储可以作为主机缓存。

这里主机缓存配置把所有SSD盘当作主机缓存。

建议重新配置,按照实际情况配置。

三.1.2.3虚拟机状态检查报告

虚拟机良好运行状态,应该保障无告警,无性能问题,有高可用保障。

由上图我们可以看到,用户虚拟化平台上的虚拟机已经处于HA群集状态,但同时有很多VM处于告警状态,该告警,经过初步分析,有可能以下原因引起:

●VMtools异常引起;

●GuestOS异常引起;

●目前存在内存错误引起;

●软件授权异常引起某些模块无法正常工作引起;

我们建议,首先消除底层的内存错误,然后检查GuestOS和VMtools工作情况,其次对vmwarevsphere升级到最新的5.1。

三.1.3系统授权检查报告

由上图可以看到,我们用户的虚拟平台输入的license为vsphereenterpriseplus5.0的license。

经过了解得知,我们用户目前购买的为4.x版本的vsphere。

上述的使用方式适用于测试使用。

正式生产平台建议购买vsphere5.1最新版本license。

由于之前已经购买过4.x版本,可以选择升级或者新购。

三.2虚拟平台安全检查报告

三.2.1172.16.12.75安全检查报告

安全配置的参考准则:

没有必要开的服务必须关闭,只是偶尔需要通讯的,我们可以通过防火墙限制。

防火墙默认只开需要对外提供服务的端口。

由上图可以看到,我们的安全配置属于正常状态。

没有开放多余的服务和端口。

三.2.2172.16.12.76安全检查报告

安全配置的参考准则:

没有必要开的服务必须关闭,只是偶尔需要通讯的,我们可以通过防火墙限制。

防火墙默认只开需要对外提供服务的端口。

由上图可以看到,我们的安全配置属于正常状态。

没有开放多余的服务和端口。

三.3系统性能检查报告

三.3.1172.16.12.75性能检查报告

三.3.1.1CPU性能报告

CPU性能参考值:

其中1%~30%属于比较空闲,31%~80%属于资源合理利用。

80%~99%属于繁忙;(这里数值不包含HA切换需要预留的资源,如果HA切换需要预留资源则应该扣除)

我们用户虚拟平台开启了HA,HA至少需要保留25%的资源;那么只要CPU保持在55%以下都是正常范围。

由上图可以看到,我们的月平均CPU使用率才2.5%;属于比较空闲状态。

三.3.1.2内存性能报告

内存性能参考值:

1%~30%属于资源富余状态,31%~90%属于资源合理利用;90%~99%属于资源繁忙;(这里数值不包含HA切换需要预留的资源,如果HA切换需要预留资源则应该扣除)

我们用户虚拟平台开启了HA,HA至少需要保留25%的资源;那么只要内存使用率保持在65%以下都是正常范围。

由上图可以看到,我们的月平均内存使用率才62.5%;属于比较空闲,接近繁忙状态;这里需要特别注意的是,虚拟化平台的内存管理的气球技术统计无数据。

这和软件授权和底层内存状态识别有关系。

需要及时修正。

三.3.1.3磁盘性能报告

磁盘性能参考值:

空间方面80%以下为可用,81%以上为空间不足;I/O方面,占总I/O性能的70%以下为优良状态。

70%以上为繁忙状态;

我们用户虚拟平台磁盘空间容量目前充足,磁盘I/O目前平均在1134.83kBps,属于正常范围。

三.3.1.4网络性能报告

网络性能参考值:

使用率1%~50%均属于空闲状态;51%~80%属于合理利用状态;81%~99%属于繁忙状态。

我们用户虚拟平台,网络平均流量97.622KBps,属于空闲状态;然而综合观察,网卡之间负载很不平衡,只有vmnic0有流量,其他均为0。

需要改进配置,使得多网卡可以负载平衡且合理利用。

三.3.2172.16.12.76性能检查报告

三.3.2.1CPU性能报告

CPU性能参考值:

其中1%~30%属于比较空闲,31%~80%属于资源合理利用。

80%~99%属于繁忙;(这里数值不包含HA切换需要预留的资源,如果HA切换需要预留资源则应该扣除)

我们用户虚拟平台开启了HA,HA至少需要保留25%的资源;那么只要CPU保持在55%以下都是正常范围。

由上图可以看到,我们的月平均CPU使用率才2.5%;属于比较空闲状态。

三.3.2.2内存性能报告

内存性能参考值:

1%~30%属于资源富余状态,31%~90%属于资源合理利用;90%~99%属于资源繁忙;(这里数值不包含HA切换需要预留的资源,如果HA切换需要预留资源则应该扣除)。

我们用户虚拟平台开启了HA,HA至少需要保留25%的资源;那么只要内存使用率保持在65%以下都是正常范围。

由上图可以看到,我们的月平均内存使用率才73%;属于超额且繁忙状态,需要增加内存以备HA切换和虚拟机使用;这里还需要特别注意的是,虚拟化平台的内存管理的气球技术统计无数据。

这和软件授权和底层内存状态识别有关系。

需要及时修正。

三.3.2.3磁盘性能报告

磁盘性能参考值:

空间方面80%以下为可用,81%以上为空间不足;I/O方面,占总I/O性能的70%以下为优良状态。

70%以上为繁忙状态;

我们用户虚拟平台磁盘空间容量目前充足,磁盘I/O目前平均在808.83kBps,属于正常范围。

三.3.2.4网络性能报告

网络性能参考值:

使用率1%~50%均属于空闲状态;51%~80%属于合理利用状态;81%~99%属于繁忙状态。

我们用户虚拟平台,网络平均流量355KBps,属于空闲状态;然而综合观察,网卡之间负载很不平衡,只有vmnic0有流量,其他均为0(这里是月视图,没有实时显示各网卡数据,但配置和75一样,各网卡流量负载平衡同样是失衡的)。

需要改进配置,使得多网卡可以负载平衡且合理利用。

三.4系统告警检查报告

三.4.1172.16.12.75系统告警报告

系统告警参考值:

无红色告警,需关注黄色告警。

我们用户虚拟化平台,12.75这台机器目前提示Alarm功能已经被禁用。

这是非常危险的操作。

一旦Alarm禁用,意味着机器哪怕是有故障隐患,我们管理员也无法知道。

直到故障爆发影响业务才能知道。

我们建议立即打开Alarm功能。

三.4.2172.16.12.76系统告警报告

系统告警参考值:

无红色告警,需关注黄色告警。

我们用户虚拟化平台,12.76这台机器目前提示Alarm功能正常。

目前提示的告警即前面我们提到的:

内存,虚拟机等等告警。

我们建议全面解决前面的隐患故障。

然后清楚告警。

重新进入稳定状态。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 考试认证 > 其它考试

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2