机房环境监控预警解决方案设计.docx
《机房环境监控预警解决方案设计.docx》由会员分享,可在线阅读,更多相关《机房环境监控预警解决方案设计.docx(19页珍藏版)》请在冰点文库上搜索。
机房环境监控预警解决方案设计
机房预警系统
设
计
方
案
吉林省萱庆科技有限公司
2009年10月
一、前言
随着计算机技术的发展和普及,计算机数量与日俱增,其配套的环境设备也日益增多,计算机房已成为各单位的重要组成部分。
因此机房的环境设备必须时刻为计算机系统及相关工作人员提供安全、可靠的工作环境,一旦机房环境设备出现故障又得不到及时的处理,就会影响到计算机系统的地运行并对数据传输、存储及系统运行的可靠性构成威胁,尤其是对于需要实施交换数据单位的机房,其机房管理就显得更为重要,一旦发生系统故障,造成的影响和经济损失将是不可估量的。
此外,对于大型复杂的计算机和网络设备,大多有设备生产商提供专用的网管系统来监控设备的运行。
但对于机房环境设备,由于设备种类多、同类设备的型号也很多,每一家设备生产商都只提供本厂设备的监控软件,将这些软件拼凑起来作为机房的监控系统显然是不合适的。
目前许多机房不得不采用24小时专人值守兵定时巡检机房环境设备,这样不仅耗费了大量的人力财力,而且不能准确高效的实时监测环境设备,不能及时发现故障、排除故障,单位主管部门及有关领导,也不能及时掌握机房的日常管理情况,及对事故发生的时间及责任业务科学的管理;更缺乏对已发生故障全面的分析数据,使得问题不能得到完善的解决。
正是意识到这样的问题,我公司本着“安全第一、用户至上、预防为主”的原则,为客户量身定做了一套可以对机房环境设备及基础子系统进行实时监测、预警和有效管理的“机房预警系统”,以便为各方数据应用系统保驾护航。
机房预警系统是一套综合利用了计算机网络技术、数据库技术、通信技术、自动控制技术、新型传感技术等构成的计算机网络设备。
该系统提供了一种以计算机技术为基础、基于集中管理监测模式的自动化、智能化和高效率的技术手段。
该系统可有效的保障设备稳定运行和机房安全,实现机房从有人值守到无人或少人值守,提高劳动生产率和网络维护水平,促进电源设备维护现代化具有积极的促进作用。
二、系统的设计方案
2.1系统组成
中心控制平台
配电监测子系统
UPS监测子系统
空调监测子系统
新风监测子系统
漏水监测子系统
温湿度监测子系统
门禁子系统
消防子系统
安防视频子系统
噪音监测子系统
空气质量监测子系统
告警子系统
2.2系统设计原则
♦通用性:
系统的设计符合国际工业监控与开放式设计标准。
♦可靠性:
系统具有良好的电磁兼容性和电气隔离性能,不影响被监测设备正常工作。
♦兼容性:
支持世界各著名厂家提供的智能设备,并可与之实现完美的监控。
♦安全性:
严格的权限管理,对设备的浏览权限和控制权限进行细分。
对各种设备的报警提供专家处理提示和电话语音系统。
处于无人值守时,一旦有严重事件发生,系统会自动通过指定方式发送告警信息到指定人员手中。
♦可维护性:
系统运行进行在线运行状态诊断和监测,能及时发现系统各功能单元故障情况,便于系统故障的维护处理。
♦扩充性:
系统软硬件设计采用模块化可扩充结构及标准化模块结构,便于系统适应不同规范和功能要求的监控网络系统。
2.3设计依据
本系统设计本着实用、性能可靠、经济的原则
中华人民共和国信息产业部《通信局(站)电源、空调及环境集中监控管理系统(第1-4部分)》
中国电信集团公司《中国电信集团通信电源、空调及环境集中监控系统应用技术规范》
《通信局(站)电源、空调及环境集中监控管理系统前端智能设备通信协议》
《通信局(站)电源系统总技术要求》邮电部编号XT005-95
《通信电源机房空调集中监控系统技术要求》电信总局(1996)105号
《通信电源、机房空调集中监控管理系统暂行规定》电信总局(1997年6月11日)
《通信电源计算机集中监控系统通信协议》
G.703建议、H.261建议、H.263建议、MPEG4标准、IEEE802.3建议、H.221建议、H.230建议、H.242建议
电气制图GB6988-86
电气图用图形符号GB4728
电信工程制图与图形符号YT/T5015-95
中国移动B接口规范
系统设计考虑了系统的可扩容性,多媒体联网,监视的功能
电信总局通信电源、空调及环境集中监控系统技术要求(暂行规定)
电信总局通信电源、空调及环境集中监控系统选型(暂行规定)
XT005-95《通信局(站)电源系统及技术要求》
国标GB4064《电气设备安全设计导则》
国标GB4889《电气设备抗干扰特性》
系统依据《工业电视系统工程设计规范》设计
系统符合《中华人民共和国公共安全行业标准》
公安部安全行业标准GA/T75-94安全防范工程程序与要求
三、系统功能说明
系统以TCP/IP协议为基础,构成统一和便捷的信息交换平台,各个子系统的实时运行信息可通过网关上传到监控中心的监控管理主机。
各监控管理人员均可以在授权下通过WEB方式进行远程浏览、管理。
系统整体结构图如下:
图3-1系统整体结构图
3.1中心控制平台
图3-2机房预警系统首页界面
基本特点
●数据采集响应时间:
前端设备数据采控时间<1S;
远程监控数据刷新时间<3S;
短信、电话报警发出响应时间<5S
●系统界面:
全中文、图形化、支持3D电子地图;界面结构层次清晰,实时反映数据状态,场景仿真;可独立查看不同子系统的监控界面,操作方便。
●权限管理:
支持10级以上的权限级别,可根据用户的不同自由组合权限,整体过程支持由用户自定义完成;具有用户操作日志记录功能;具有登录后自动注销功能,注销等待时间可以由用户自由设置。
●数据管理:
支持自定义报表功能,可根据需要的报表格式生成详细的数据记录报表和数据分析报表,存储格式必须是EXCEL;具有曲线趋势图记录、分析工具;数据存储时间需大于1年,数据需具有防篡改保障。
●报警管理:
具备多媒体语音报警、声光报警器报警、短消息报警、电话语音报警等多种方式;报警级别至少10级,可根据级别设定报警方式;报警发生时系统界面可自动跟踪;特殊报警可人工屏蔽;报警具有详细的检索查询器及报表生成工具;具有确认过程,可录入处理意见和结果;具有精确定位能力。
●联网集中/远程管理:
预留联网集中监控的接口,日后可方便的扩展其它分机房监控进行联网集中监控;支持WEB浏览功能,不需安装软件,WEB浏览页面与监控服务器页面自动同步;可远程维护、远程升级机房监控系统;远程监控具有权限验证。
3.2配电监测系统
机房系统是由计算机设备、场地设备、辅助设备等几部分组成,因此机房的供配电系统就是为满足各部分的要求,以保证获得稳定、可靠的电源服务。
机房的建设必须要建立一个良好的、综合性强的、安全、稳定、可靠的供配电系统,在这个系统中不仅要解决计算机设备的用电问题,还要解决保障计算机设备正常运行的其它附属设备的供配电问题。
系统功能:
各重要供电回路供电参数在线监测:
系统采用专业电网电量仪监控仪实时采集相电压、相电流、线电压、线电流、有功、无功、视在功率、频率、功率因数、电度等参数。
系统一旦报警,会自动切换到相应地开关画面,颜色由绿色变成红色,系统自动播放多媒体语音报警、拨打所设置的电话号码报警,通知有关人员处理。
主要回路开关状态的在线监测。
监视各级的主要配电开关(进线柜开关、母联柜开关、出线柜及其他配电柜的开关)状态。
当开关跳闸或断电时,系统自动切换到相应的运行画面,同时发出多媒体语音和电话语音或短信报警,通知管理员尽快处理,并把事件记录到系统中。
通过系统总线将监测结果上报中心控制平台。
系统管理员和操作员可以通过历史曲线图中查看每天的电压、频率、有功、无功的最大值、最小值、当前值及电压、电流峰值,能清楚地知道三相电压、电流是否均衡。
可设定电压、电流的上限值与下限值,当监测的电压或电流超过设定的允许值时,系统诊断为有故障(报警)事件发生,监控主系统发出报警。
3.3UPS监测系统
对于机房内的设备而言,干净、不间断的电源供应是极端重要的。
因为公用电网常会遭受自发的电压变化或甚至是严重的供电中断。
可靠的解决办法是采用不间断电源,UPS不仅保证可靠的连续供电,而且UPS输出比较稳定,没有瞬变和谐波。
我公司采用厂家提供的通讯协议和智能通讯接口,提供专业的实时监视UPS工作状态与参数监测系统。
系统功能:
对机房内供电UPS的运行状态进行实时监测管理。
模拟量:
输入相电压,输出相电压,旁路相电压,输入相电流,输出相电流,旁路相电流,电池电压,电池电流,输出频率,系统负载,电池后备时间等。
数字量:
输入电压越限,输出电压越限,输出频率越限,过载,电池工作模式,旁路工作模式,电池电压高,电池电压低,系统报警,镇流器报警,逆变器报警,系统关机,电池电压低报警,旁路电压超限等。
所有模拟量与数字量的具体情况依据UPS厂家提供的通信协议略有变化。
通过系统总线将监测结果上报中心控制平台。
中心控制平台实时显示并保存各UPS通讯协议所提供的能远程监测的运行参数和各部件状态。
能用直观的图形来指示UPS的运行状态。
实时判断UPS的部件是否发生报警,当UPS的某部件发生故障或越限时,监控主系统发出报警。
通过由UPS厂家提供的通讯协议及智能通讯接口,对UPS进行监控,对UPS内部整流器、逆变器、电池、旁路、负载等各部件的运行状态进行实时监视,一旦有部件发生故障,系统会自动报警。
并且实时监视UPS的各种电压、电流、频率、功率等参数,并有直观的图形界面显示。
中心控制平台可全面诊断UPS状况,监视UPS的各种参数。
一旦UPS报警,将自动切换到相关画面。
越限参数将变色,并伴随有报警声音,有相应的处理提示。
可根据用户需要设置电话语音或短信通知。
对于重要的参数,可作曲线记录,可查询一年内的曲线,并可显示选定某天的最大值,最小值,使管理人员对UPS的状况有全面的了解。
3.4空调监测系统
机房精密空调系统的使用功能是为保证机房设备能够连续、稳定、可靠地运行,需要排出机房内设备及其它热源所散发的热量,维持机房内恒温恒湿状态,并控制机房的空气含尘量。
为此要求机房精密空调系统具有送风、回风、加热、加湿、冷却、减湿和空气净化的能力。
机房精密空调系统是保证良好机房环境的最重要设备,应采用恒温恒湿精密空调系统。
监测系统可支持德国STULZ、美国LIEBERT、意大利HIROSS、英国AIRETRON、加拿大CANATAL、EMERSON、RC等世界各大品牌的机房精密空调,采用厂家提供的通讯协议和智能通讯接口,实时监视机房精密空调的工作状态与参数监测。
图3-3空调监测系统界面
系统功能:
通过空调自带智能通讯接口及通讯协议,系统可实时、全面诊断空调运行状况,监控空调各部件(如压缩机、风机、加热器、加湿器、去湿器、滤网等)的运行状态与参数,并可通过软件在系统上或通过网络远程修改空调设置参数(温度、湿度、温度上下限、湿度上下限等)。
系统一旦监测到有报警或参数越限,将自动切换到相关的运行画面。
越限参数将变色,并伴随有报警声音,有相应的处理提示,及相关处理提示。
对重要参数,可作曲线记录,用户可通过曲线记录直观地看到空调机组的运行品质。
空调机组即使有微小的故障,也可以通过系统检测出来,及时采取步骤防止空调机组进一步损坏。
对严重的故障,可按用户要求加设电话语音报警。
本机房组态监控系统可实时监控空调的状态,也可远程修改空调的运行模式和开关空调。
3.5新风监测系统
机房新风换气系统主要有两个作用:
其一给机房提供足够的新鲜空气,为工作人员创造良好的工作环境;其二维持机房对外的正压差,避免灰尘进入,保证机房有更好的洁净度。
图3-4新风监测系统界面
机房内的气流组织形式应结合计算机系统要求和建筑条件综合考虑。
新排风系统的风管及风口位置应配合空调系统和室内结构来合理布局。
其风量根据空调送风量大小和机房操作人员数量而定,一半取值为每人新风量为:
50m3/h,新风换气系统可采用吊定式安装或柜式机组,通过风管进行新风与污风的双向独立循环。
新风换气系统中应加装防火阀并能与消防系统联动,一旦发生火灾事故,便能自动切断新风进风。
如果机房是无人值守机房则没必要设置新风换气系统。
我公司根据用户实际情况为用户提供高性价比的新风系统解决方案,同时为客户量身定制相应的监测系统。
3.6漏水监测系统
对于计算机机房,漏水是不容忽视的安全防护主要内容之一。
现代化的机房安置众多精密电子设备,如程控交换、网络服务器以及为其提供恒温恒湿环境的专用空调等,而空调的运行要求要有加湿的上水、排水及空调的冷凝水。
空调的水系统对在地板下面众多传输线缆及电源插头及接线盒构成极大的危害,即便是一个很小的泄漏,也可能造成机房设备的运行瘫痪,带来不可估量的经济损失。
为保证机房网络设备的正常运行,安装于地板下的漏水检测对机房设备的保护非常重要。
能够精确及时的发现泄漏位置,及时处理,对保证整个系统的安全。
本系统可为用户提供节点式和现实两种检测方式。
节点式:
采用在指定位置安装节点的方式,当该位置出现漏水现象,相应控制器会产生报警信号。
线缆式:
配置漏水报警控制器和测漏感应线缆,安装在机房适当位置,对机房内的精密空调及其进出水管沿线(机房内)的漏水检测报警。
图3-5漏水监测系统界面
系统功能:
实时检测并记录漏水报警变化情况。
以电子地图方式实时显示并记录漏水线缆感应到的漏水状态、漏水控制器的状态和漏水发生的位置。
当空调或其它漏水感应绳所在区域漏水时,监控主系统发出报警,并有相应的图示和文本框显示具体漏水位置,并播放漏水报警的语音提示,及时通知有关人员排除。
3.7温湿度监测系统
计算机设备中,使用了大批的半导体器件、电阻器、电容器等。
在计算机加电工作时,环境温度的升高都会对它们的正常工作造成影响。
当温度过高时,可能会使某些元器件不能正常工作甚至完全失去作用,从而导致计算机设备的故障。
因此,必须按各设备的要求,把温度控制在设备要求的范围之内。
本系统温湿度传感器是本公司独立研制的一种环境温湿度的数字式传感器;可配合本系统使用,也可独立组网进行多点环境温湿度检测,产品包括IC总线式及以太网接口方式两大类温湿度传感器,可广泛应用于机房、基站厂房、办公楼等不同场合,用户可根据不同的应用环境灵活选择。
系统功能:
系统能对机房温湿度实时监视,显示并记录其运行数据。
系统支持机房电子地图加载;
根据预先的设定,系统可以对机房温湿度参数和状态异常设定自动报警;
系统支持通过短信实时查询机房各监测点的温度和湿度情况;
系统可以将机房温湿度数据生成报警报表,并可按需求查询或打印;
系统可以对机房温湿度参数进行历史曲线记录,并可随时查看任意一天的曲线记录;
提供将历史数据导入Excel表格的功能,便于在Excel中作各种分析比较;
可通过IE浏览器全面监视机房温湿度实时情况,及其报警事件。
3.8门禁子系统
目前,门禁系统已成为安全防范系统中极其重要的一部分,在一些发达国家中,门禁系统正以远远高于其它类安防产品的进度迅猛发展;门禁系统之所以能在众多安防产品中脱颖而出,根本原因是因为其改变了以往安防产品如闭路监控,防盗报警等被动的安防方式,以主动地控制替代了被动监视的方式,通过对主要通道的控制大大地防止了罪犯从正常通道的侵入,并且可以在罪案发生时通过对通道门的控制限制罪犯的活动范围制止犯罪或减少损失。
系统功能:
门禁系统可实现按子阶段流行的各种门禁读取方式(智能卡、指纹、虹膜、掌纹识别等)。
通过这套系统,可以实现对人员权限的明确限定,无论是内部人员或外部人员,都可以通过对权限的设置清楚地界定可以自由出入的范围,并对人员的进出情况进行纪录,以备查询,极大的解放了人员管理的压力,并可达到在提高安全度的情况下节约人力的效果。
我们可以结合考勤,巡更等功能,更可以通过联动来实现对其他设备的的控制。
这套系统具有性能稳定功能强大的特点,在以往的众多工程项目中多有体现。
3.9消防监测系统
一般机房的消防设备都是由专业的消防设备提供商提供,但都存在着不可视、联动能力差的问题。
我公司结合实际,开发的消防监测子系统,通过采集客户现有的消防控制器提供的区域或火警的接点信号,实现消防系统的可视、可查、远程告警等功能。
并可与其它系统联动,实现完善的消防监控功能。
3.10安防视频系统
本系统完成对数字视频矩阵以及多种视频服务器的支持,可以对分散布置的数字视频录像机进行集中控制,可以为客户提供灵活丰富的硬件接口,可以在接收到联动系统发来的联动信号,对于其他系统发生的紧急事件联动请求,进行紧急联动,完成强请监视器画面和大屏幕信号源的切换。
本系统亦可支持与硬盘录像机连接,统一管理系统中全部的硬盘录像机。
管理人员可以根据日期或对象索引查询历史图像记录,并选择下载至本地播放或者直接在网络上观看。
在系统的页面中,视频实时窗口、录像回放窗口、远程接受窗口、控制窗口都作为控件无缝嵌入在组态页面中,用户可自行定义视频窗口的数目、摆放位置、窗口大小、播放器界面等,满足不同用户的个性化需要。
系统要求具有丰富的报警联动功能,视频系统可由外部的输入信号触发录像,如双鉴探头、门磁,或者由本身支持的“移动报警”功能触发。
视频系统完全的Web化,在系统的Web端,用户在浏览器中看到的是与本地监控系统完全一样的组态界面,实现完全一样的监控功能。
3.11噪音监测系统
噪音是一类引起人烦躁、或音量过强而危害人体健康的声音。
机房内噪音污染主要来源于空调、电源、设备风扇、人的大声说话等。
本系统通过噪音传感器对机房内噪音情况进行在线检测,通过后台计算得出最科学的现场工作时间,并在相应位置显示出来,为进入机房的工作人员提供切实的自身保护机制。
3.12空气颗粒监测系统
机房(交换机房、发射机房、计算机房、移动机站、监控机房、IDC数据中心等)中的粉尘污染是主要的空气污染源之一。
较高的粉尘污染不但能影响人体的健康状况,还会造成对室内电器不必要的损害,尤其是计算机类的电子产品,长期处于高粉尘污染的环境中,粉尘会通过电器的散热口进入其内部,沉积在每一个角落。
不但给设备带来烦琐的清洁问题,同时还会影响电器的正常工作和散热,严重的有可能造成故障,缩短工作寿命。
根据电子计算机机房设计规范规定,主机房内的空气含尘浓度,在静态条件下测试,每升空气中,大于或等于0.5μm的颗粒数,应少于18000粒。
我公司根据用户实际情况为用户设计了具有高性价比的空气颗粒在线监测解决方案。
采用先进检测设备,为机房工作人员的人身安全保驾护航。
3.13告警子系统
系统功能:
♦具备多媒体语音报警、声光报警器报警、短消息报警、电话语音报警等多种方式;
♦报警级别多至999级,可根据级别设定报警方式;
♦报警发生时系统界面可自动跟踪;
♦特殊报警可人工屏蔽;
♦报警具有详细的检索查询器及报表生成工具;
♦具有确认过程,可录入处理意见和结果;具有精确定位能力。
系统一旦发现异常事件,系统即自动执行预定的控制策略,同时启动报警,报警可以有几种方式,如报警窗口、实时打印、语音提示、电话语音、电子邮件、短信等。
使用时,可以选择其中一种或多种报警;当有多个报警同时发生时,系统通过事件等级,排队报警事件,并逐一报警,其中的电话号码、手机号码、电子邮件等由用户设置。
可以分别设置设备的报警方式以及相关管理人员,比如可以设定以下报警方式:
UPS故障通过电话语音方式通知UPS管理人员并发送电子邮件给主管人员,而空调故障通过手机短信方式通知空调管理人员并发送电子邮件给主管人员。
这种方式大大增加管理的灵活度。
本系统通为用户提供一套全面立体的报警方式。
使故障情况能够实时准确的传递给指定人员。
四、项目实施方案
4.1项目实施的周期安排
合同签订后30个工作日供货,60个工作日内完成设备安装调试及验收工作。
具体时间也可双方协商后确认。
4.2施工组织
针对本系统工程,我公司将成立专门的工程领导小组。
正副组长分别由公司工程部经理、市场部区域经理担任,职能是进行该工程方案审定、公司部门间的支持配合、组织协调、工程监督、材料核算及监督等工作。
该领导小组下设项目部,具体负责该工程的施工组织、技术支持、安全文明施工、工程协调、质量监督及评定、施工材料的管理、施工资料整理、工期及施工定额、系统调试及自检等工作。
组织结构图:
4.3施工计划
现场勘察:
确定设备安装位置和敷设管路的走向、汇集位置和架设方式,根据现场情况做出施工准备。
依照设计施工方案进行管线安装。
设备安装及各系统接线。
各系统调试。
交工资料整理及验收。
组织甲方人员培训。
具体工期可根据甲方实际要求进行。
4.4施工步骤
工程的施工主要分以下几步进行:
4.5主要质量保证措施
为了顺利快速完成系统工程,我公司对该工程施工实行现场施工责任制及技术、质检一票否决制,工程进场施工后:
委派1名施工管理员,其责任是全面负责材料组织、人员分配、各方协调、工程施工、安全监督、质量检查工作。
要求施工员要严格按图纸及施工规范在保证安全、保证工期的情况下组织施工。
同时,明晰各施工人员的责任,做到工程施工有据可查,使每个人的利益与工期及质量挂钩。
指派1名监理工程师,其责任是定期和不定期的对工地进行检查,对出现的技术、质量问题他们具有决定权,杜绝弄虚作假现象的发生。
通过这样的双重保证体制,可使该工程的施工万无一失。
4.6可能发生的问题及对策
(1)施工配合
施工前期或在工程施工中途,施工将不可避免与其它单位发生矛盾,关键是善于沟通。
我们认为,不管因何种原因出现此类问题,我司都会以大局为重,抱着合作的态度与相关方面配合,找到各方均可接受的办法解决难题。
(2)方案变更
施工中可能会出现方案变更,如甲方提出方案变更要求,我司会积极配合。
若我司在施工中发现有合理符合现场的实际方案,我司会立即向甲方提出建议,并将方案变更的理由向甲方呈报,共同讨论变更的可行性,在征得同意支持后再进行方案变更,双方达成共识确认后按新方案进行施工。
(3)监督管理
在施工中,我司会积极配合相关单位,接受甲方的监督管理,对发现的问题及时纠正,并提出处理办法,对产生的误会,耐心解释,求得谅解。
(4)工作支持
我司在工作中本着互相尊重、主动沟通的原则,支持相关单位共同圆满完成项目,不隐瞒问题、不推卸责任。
(5)工期保证
我司根据甲方工程实际要求,保证接到开工通知后开始施工,保质、保量、按期顺利完成项目各子系统工程。
4.7项目工程范围
工程施工中:
负责各系统内设备材料的采购和生产;
负责信号线的穿线工作。
负责各系统设备的安装工作;
负责系统的软件设计工作;
负责系统内设备的调试工作;
负责管理人员的培训工作;
4.8培训计划
工程施工结束后,由我方为甲方相关人员提供系统操作培训。
培训内容包括:
系统软件的操作使用。
日常维护的方法步骤。
简单故障的检查、排除方法。
系统的改建、扩建。
由专业维护工程师讲解,主要使被培训人员掌握对日后该项目在扩充、修改和维护上所要做的工作内容,掌握系统文档的管存和修改。