机房环境监控系统.docx
《机房环境监控系统.docx》由会员分享,可在线阅读,更多相关《机房环境监控系统.docx(24页珍藏版)》请在冰豆网上搜索。
机房环境监控系统
府谷电厂机房环境监控解决方案
矩阵机房环境综合管理系统(CEIMS)V3.0的设计及建设是结合机房结构、设备内容、使用功能、操作对象和管理要求等综合因素进行考虑的,并完全能够作出合理的、适应特定工程使用和管理需要的设计。
本系统集成了机房动力环境、场地环境、安全环境监控等功能,是我公司结合多年从事机房环境监控系统和集成管理系统建设经验而进行设计的。
1.1系统平台
本系统建立统一的监控管理平台,将动力环境及场地环境监控系统、安全保障系统在监控平台上进行统一管理,管理人员通过监控平台实现对各设备和子系统的监控和管理。
●监控平台是各子系统管理界面的高度集成。
可通过对各功能模组的点击访问进入相应的管理界面。
在管理界面上应能直观显示各监控设备详细工作状态界面。
当子系统及任何监控单元有报警发生,系统服务管理平台应自动切换到对应功能模组,显示报警的监控设备及报警状态。
●系统提供报警登录客户端,在用户名和密码输入正确的情况下,最小化到系统托盘,当系统出现报警时会通过消息推送的方式将报警信息推送到客户端,由客户端弹出报警提示框(类似QQ新闻弹出框),点击查看按钮可转到详细信息页面,报警同时系统会向该设备的负责人员发送报警短信,使客户及时了解环境设备的运行情况。
这样客户不用时刻关注系统的运行情况,也能当设备发生异常时及时地发现并掌握具体情况。
●系统提供手机web浏览,短信控制等功能。
系统提供手机客户端访问方式,用户可通过VPN连接到内网并打开系统手机WEB页面,通过手机页面用户可详细了解系统的运行情况,查看各设备的现行指标,并可对系统进行相应的简单操作,包括起停服务,处理报警设备等。
在系统运行的同时客户可通过短信对系统进行相应的操作,如客户可发送相应设备的ID并搭配固定的短信格式到服务器短信猫,系统接收后会将该设备的重要运行数据通过短信的方式进行返回,使客户可及时的了解设备的运行情况。
另外用户也可发送相应短信对系统的服务进行起停,不用再登入系统进行操作,使系统操作更加方便灵活。
●监控平台承担着集中管理的任务,管理人员的权限控制、各子系统的数据管理、报表管理等均在机房环境监控管理系统服务器上完成。
●系统平台具有远程管理,通过在监控平台上设置相应的关联按钮实现对各子系统的灵活调用。
●监控平台和各子系统之间应相对独立(一个子系统发生故障,不影响其他子系统的正常运作),同时各子系统之间又可通过联动策略发生关联。
1.2系统架构
矩阵机房环境综合管理系统(CEIMS)V3.0将按设备内容分为三个部分,并结合其监控范围和职能划分为如下的功能模组。
1.2.1机房动力监控部分
●UPS设备:
UPS、蓄电池。
●供配电设备:
配电开关、市电进线、精密配电柜、发电机。
1.2.2机房场地环境监控部分
●空调及通风设备:
精密空调、新风机。
●场地环境监控设备:
温湿度传感器、漏水、防雷器。
1.2.3机房安全保障部分
●门禁系统:
对重要区域安装门禁控制器进行人员进出的管理。
●消防报警系统:
对机房内的消防火警信号进行监测。
●防盗入侵报警系统:
对机房内的重要区域安装红外感应探测器进行人体入侵的监测。
●语音、声光报警:
监控对象出现问题时,系统可通过电话、音响、警灯等方式报警。
●视频监控系统:
对机房内的重要区域安装摄像机,可实现对这些区域的的实时监控,起到对突发事件及时预警和处理。
并可通过网络对音视频的传输,可起到使远程专家对本地的技术人员视频加语音的实时指导等的作用。
1.3系统结构
1.3.1嵌入式采集仪
嵌入式机房环境监控采集仪JF-011是矩阵软件密切结合各种类型计算机机房具体需求开发设计的机房环境综合控制产品。
它是针机房设备控制的多串口双显示低功耗嵌入式整机,按照工业等级标准化设计,适用于各种恶劣的工业环境,体积小,能耗低,设备集成度高,实现了机房动力环境监控、场地环境监控及安全保障系统的信息采集、处理与报警的完美结合。
嵌入式机房环境监控采集仪JF-011可以外接温湿度探测、烟感探测器、UPS、智能空调、漏水检测、电量检测、开关检测、门禁控制等多种外部设备。
嵌入式机房环境监控采集仪JF-011采用linux嵌入式操作系统,一方面采集各种外设的实时运行信息,并把这些信息发布到系统数据库进行存储处理;另一方面对设备本身以及各类外设设备状态进行实时监控,一旦某一设备出现问题,就会自动向监控人员报警。
1.3.2
体系结构
CEIMS3.0系统采用B/S三层模块化架构,软件及硬件的安装与维护集中于监控服务器端,实现了零客户机管理,易于实施和维护,降低了系统的总拥有成本。
同时,采用三层结构,客户端只负责用户界面,业务规则的处理放在应用服务器端;当业务处理需求增加时,只需要对应用服务器进行升级或扩展成多个应用服务器,系统的可伸缩性大大地加强了。
系统现场输入输出设备及通讯接口设备为星型模块化结构,输入输出点通过I/O模块,组合完成对监控系统中需要被监控设备和控制点的匹配。
1.3.3系统特点
高可靠性:
系统采用模块化设计,充分保证系统在扩容、升级时系统可无间断安全运行,即在系统运行状态下进行修改与维护。
集中监控:
系统不仅能够对单个机房内各种动力设备、环境设备及系统的状态信息、报警信息、控制命令、图像信息等进行完整地集中监控,并能够对分布在各地的多个机房实现跨区域集中监控管理。
值班管理:
考虑到职守人员不一定二十四小时实施监控管理,为防止意外的发生。
当有异常情况时,系统自动通过发送报警短信等方式通知值班人员,为无人或少人值守的现代化机房管理提供可能。
远程管理:
管理者可通过任意终端方便地远程查看各机房内设备、系统的运行状况,如果权限允许也可对系统进行控制管理。
日志管理:
系统自动对操作人员、操作内容、操作时间、故障点、故障内容、故障处理、时间等信息进行完整地记录,并可对这些记录进行多条件查询,为管理者提供完备的系统操作维护资料。
安全管理:
系统可对管理和使用者分配不同的操作使用权限,并对所有管理和使用者根据职能进行分组管理,防止系统信息泄露和被非授权人员所干扰。
辅助分析:
系统可根据需要对各设备、系统的运行状态提供实时曲线和历史曲线,方便管理者借助图形手段,直观分析系统运行状况。
报表输出:
系统内嵌强大报表系统,不仅能满足基本、常用的日报表、周报表、月报表还支持用户自由订制图形化(如饼图、直方图、折线图等)、个性化报表,还可与通用报表软件实现报表的导入导出。
动态编辑:
系统处于运行状态下,允许用户直接在界面上对各管理站、子系统或设备进行添加、修改、删除等操作,并实时上传,保证所有的修改都能即时生效,最大限度保证整个系统数据完整和高效运行。
超强兼容:
系统具备兼容各种品牌、型号设备和子系统的功能。
操作简易:
图形化的全中文操作界面,使得用户的学习和使用极为简易。
报警功能:
●报警机制:
没有盲点,系统对报警事件按优先级的高低进行处理。
例如:
在例行检查时,当有问题发生,可能引起一系列的报警事件,系统以优先级的高低对报警信息进行处理。
●报警方式:
灵活多样,可以根据报警事件的报警级别提供不同的报警方式:
短信、语音多媒体等告警模式,同时告警信息可以限次播放,而且在两次告警间的停顿时间可以设置。
●报警客户端:
系统提供报警登录客户端,在用户名和密码输入正确的情况下,最小化到系统托盘,如果出现报警信息,右下角弹出提示框(类似于QQ新闻弹出框),点击查看按钮可转到详细信息页面。
●报警级别:
报警信息可分级管理,至少分五级,用户可以根据实际发生的报警情况的紧急程度,选择不同的报警级别,对不同的报警级别,系统会以不同的报警方式对外报警。
●智能报警:
在系统提供丰富的报警级别及报警方式的同时,用户可以根据实际使用情况进行灵活的报警方式的组合。
而且系统会根据现场的实际报警情况,进行智能的组合。
●报警积累:
系统维护使用人员,对系统使用过程中常见问题的处理方法可以积累下来,在系统报警时,相应的处理意见也同时提示给用户,与其他维护使用人员共享。
●报警事件的查询:
对报警事件的查看的方式灵活多样,允许用户根据不同的条件组合对报警事件的进行查询。
WEB功能:
●浏览功能:
系统具有WEB浏览功能,无须安装软件和任何配置,实现“零安装”,通过浏览器方式在局域网内监视各监控数据,浏览器界面与客户端保持一致。
●系统管理与维护:
拥有一定权限的用户,通过WEB可以对各子系统的设备进行远程的管理。
系统技术参数:
●系统最大监控点数:
100,000
●系统实时数据传送时间<=1秒
●系统控制命令传送时间<=1秒
●系统最大接入用户数(并发):
不限
1.3.4系统部署
随着客户自身业务的多方面、地域性的扩张发展,CEIMS3.0在机房环境监控的整体架构和实现方式上,提供集中式和分布式的两种部署方式,有效稳定地实现客户对机房环境监控所要实现的需求。
●
(异地)多机房集中式部署
从以上系统拓扑图可以看出,中心机房的两台配置相同的机房环境综合管理系统服务器采用了一主一备、互为冗余、互为备份的部署方案。
两台服务器上同时运行机房环境综合管理系统,执行同一操作,在其中一台服务器出现故障的情况下,另一台自动接替工作,完全不需人为干预。
该结构着重考虑的是机房平时监控数据的冗余性,一主一备的两台服务器所运行的机房环境综合管理系统正常情况下互相进行监控,并保持两台主机上的数据一致性。
当发现一方系统运行不正常或者停止运行等异常情况下,另一方系统继续工作的同时对运行不正常或者停止运行的系统故障进行报警,提示工作人员进行处理。
当故障恢复之后会继续保持互为监控、数据一致的运行状态。
各异地机房外设数据首先经过本地的串口服务器进行集中采集,然后通过网络全部上传至中心机房服务器上进行处理、分析及备份。
系统可下设多个客户端(1到255个),由系统管理员对用户分配权限,登录监控软件平台后,中心行管理员可实时查看所有机房环境监控数据,分机房管理员只可查看本机房监控数据。
支持10级以上的权限级别,可根据用户的不同自由组合权限,整体过程支持由用户自定义完成;具有用户操作日志记录功能;具有登录后自动注销功能,注销等待时间需可以由用户自由设置。
●
(异地)多机房分布式部署
各分机房外设数据首先经过串口服务器进行集中采集,然后以分机房为单位安装环境监控服务器,并对各分机房外设数据进行分析处理。
当有异常情况出现时,可通过网络把相应的报警信息传输至总机房的报警处理中心服务器上进行报警处理。
这样的模式下,各分机房的外设监控数据保存在自己所属的分机房监控服务器上,所有的报警信息则集中在总机房的报警处理中心服务器上进行存储和报警警示。
1.4系统功能
1.4.1功能模块
系统主要的功能模块划分为三大块:
设备信息展示、系统设置、统计查询。
●设备信息展示主要有拓扑展示和页面展示两部分;
●系统设置功能分为:
用户管理、参数管理、监控项配置、历史数据清理、系统服务管理、短信邮件设置、数据库管理及系统维护功能;
●统计查询功能分为监控日志查询、短信发送查询、日志管理及报表定制四部分。
1.4.2系统界面
CEIMS3.0系统整体界面分为上下两部分,右上角为独具特色的“天气预报”做背景的CEIMS3.0报警信息展示栏,并可根据需要进行缩放,下面是系统的主体展示界面;下面又分为左右两部分,左侧是系统菜单,右侧为详细信息展示部分,多个同类设备以选项卡的形式进行展示。
在系统窗口打开的情况下,如果出现报警信息,右下角弹出提示框(类似于QQ新闻弹出框),点击查看按钮可转到详细信息页面。
系统提供C/S登陆客户端,在用户名和密码输入正确的情况下,最小化到系统托盘,当系统中出现报警信息时会在任务栏的上方展示。
这样客户不用时刻关注系统的运行情况,着手解决其他问题,而当设备发生异常时又能做到及时地发现并掌握。
1.4.3系统设置
●
权限管理
本功能用于设置系统用户,“查询”功能用于查询系统中满足某些条件的所有用户;“添加”功能用于向系统添加新用户;用户权限用来区分用户是否问管理员用户,已判断用户能否查看某些页面或功能。
●参数管理
用于维护系统参数。
系统参数是被系统各功能调用的可变参数,通过在前台的修改来改变系统的运行效果。
“参数编码”是对一个系统参数的唯一标示,不要随意填写或修改此项值。
参数字典中的所有参数是被系统各功能使用的,所以不要随意删除某个参数。
●监控项配置
本功能是实现系统对设备监控的关键,通过本功能可以实例化一个监控对象,并添加到系统中,已采集到改设备的详细数据信息。
并且可以对监控对象进行增加、删除、修改及查询等操作。
●历史数据清理
历史数据清理功能主要是对系统运行产生的历史数据进行清理。
包括监控日志、短信记录、报表记录等,即可全部进行清理,也可单独对某一项进行清理。
●
系统服务管理
服务管理是对系统所有的各种服务进行手动的启停操作和启动类型的修改。
系统中的主要服务有:
数据采集、自反连接、数据转移、短信服务、报表定制、声光报警、电话报警、缓存服务。
数据采集服务是系统进行数据采集的服务,必需启动才能进行监控。
短信服务、报表定制、声光报警、电话报警是相应的报警方式启用的标志。
缓存服务是为了加快页面显示速度对设备数据的缓冲服务。
●
短信邮件设置
短信邮件设置是对系统进行报警时的短信及邮件发送方式进行配置,如短信猫、短信平台及邮件设置等,一般不需要改动。
●
数据库管理
对系统中的配置进行数据库的备份,当操作时造成系统无法恢复的情况下通过恢复数据库,将系统恢复到备份时的状态。
备份时点击“备份当前数据库”按钮,系统开始自动备份,完成后在左上角给予提示信息
。
备份成功后系统会将备份的数据库文件放在默认的D:
\CEIMS3.0\DB下,用户可以在系统参数中进行修改系统“数据库备份文件路径“参数将备份的数据库文件保存到其他路径下。
想要对系统进行数据库恢复时,点击相应数据库恢复右边的回复选项。
删除备份文件时,点击相应数据库恢复右边的删除选项,即可删除所选的备份文件,同时给予提示信息。
●
菜单管理
对系统左侧的导航菜单的定制功能,系统设计阶段已对所有可能用到的菜单项进行了初始化,可根据实际需求,添加或删除需要显示的菜单。
1.4.4统计查询
●监控日志查询
此功能是对监控日志的查询功能,可以根据查询条件,查询出监控树中某节点在某一段时间内的状态日志情况,非中断情况可以查看当时的状态数值。
用户可根据不同的查询条件查询不同的监控日志内容。
除查看日志外,还可以点击状态统计按钮,定制报表。
此功能是对某个区域的设备(一个分组或一台设备)的运行状况按时间段进行统计,并以饼图和表格的形式展现。
用户可以在左侧树形菜单中选择某些实例,并在右侧的‘从当前时间向前’中选择一个时间段,系统就会在右下侧区域中将你选中的每一台设备的报警情况展示出来,包括报警、正常、中断、报警的次数。
在提供设备常规运行状态报表的情况下系统还提供更加专业的设备运行数据报表,如UPS三项电压某段时间内最高值,最低值,以及平均值,温湿度某段时间内最高值,最低值和平均值,同时提供设备具体指标数据趋势图,如机房内某段时间内的温湿度趋势,以便客户更加准确的把握机房环境的运行情况,部分设备参数报表举例如下:
设备名称
参数
温湿度
某段时间内最高值、最低值、平均值;
某段时间内温湿度趋势图。
UPS
某段时间内三项电压最高值最低值平均值;
某段时间内电压变化趋势图;
某段时间内负载最高值、最低值、平均值;
某段时间内负载变化趋势图。
电量检测仪
某段时间内三项电压最高值、最低值、平均值;
某段时间内电压变化趋势图;
某段时间内功率最高值、最低值、平均值;
某段时间内功率变化趋势图。
用户还可以将统计信息导出,我们的系统支持execl、word、pdf格式的导出。
●
短信发送查询
该处是对短信发送的一个查询功能,用户可通过日期、号码、级别、状态、内容等条件进行查询。
除短信发送查询外,用户还可手动发送短信。
点击页面的发送短信按钮,打开发送短信页面。
1.5报警方式
当监控对象出现问题时,系统可提供多样的丰富灵活的报警方式,即可在系统缺省页面下做到报警信息滚动提示、拓扑图中不同颜色的分类提示,亦可通过外接其他报警设备做到多媒体声光、短信、电话语音、远程等形式的报警。
系统中监控对象的状态包括:
暂停监控、正常、预警、异常、中断五种,监控对象的具体指标的状态包括:
暂停监控、正常、预警、异常、中断、处理中六种。
六种状态在系统中的级别是:
处理中、暂停监控、正常、预警、异常、中断依次递增。
暂停监控:
不对该对象监控,通常是不重要的对象或某一对象的指标。
正常:
设备运行正常。
预警:
设备运行正常,但是系统状态有变为异常的迹象。
异常:
设备运行不正常。
中断:
从服务器到监控对象之间线路不通或设备无返回值。
处理中:
对象运行不正常,目前正在处理中。
1.5.1状态条件
对于监控对象的状态条件,可通过简单操作,由客户根据实际需要自己定义各种状态的阀值,例如可以定义某块逻辑分区在使用率高于某个值的时候报警。
1.5.2屏幕图像报警
系统将所有监控的对象的状态以不同的颜色反映在页面右上角的报警栏中,灰色表示暂停监控,绿色表示正常,黄色表示预警,红色表示异常,红色叉号表示中断,灰色扳手表示处理中,用户可以通过查看报警栏或者对象分组视图及拓扑图,很轻松的了解当前有没有出现问题的监控对象。
1.5.3声光多媒体报警
当监控对象出现问题时,系统同时在服务器端和客户端发出报警提示声音,客户端页面会通过真人语音的方式对报警设备进行播报,用户可通过声音报警直接确定报警设备,客户端报警同时触发警灯,给予灯光报警。
不同状态引发的报警可以发出不同的声音,每种状态对应的报警声音可以由系统管理员定制。
用户听到声音报警后,可以设定一个时间屏蔽声音报警,然后进行处理,如果在设定的时间内未能解决问题,系统会继续发出声光报警。
1.5.4手机短信报警
系统提供分等级的短信报警功能。
即当发生问题时,通过短信发送设备(一般为短信锚或者短息平台服务器),为客户提供及时的短信报警功能。
系统首先会把短信发送给当前的值班人员,如果值班人员在一定时间内没有将问题解决,系统将会给设备的负责人发送短信,如果在设定的时间仍未解决,系统将给更高一级的负责人发送短信。
通过设置也可以实现不给值班人员发送短信,直接给负责人发送短信。
短信发送的内容及发送规则都可以简单灵活的定义。
1.5.5电话语音报警
当监控对象出现问题时,系统通过专线进行自动拨号,触发电话语音报警。
不同状态引发的报警可以提示不同的语音,每种状态对应的语音可以有系统管理员定制。
用户听到电话铃响后,可以设定一个时间屏蔽系统的继续拨号功能,然后进行处理,如果在设定的时间内未能解决问题,系统会继续进行自动拨号,触发电话响铃。
1.5.6远程报警
在值班人员及其他相关人员的电脑上安装一个“C/S登陆客户端”,平时在用户名和密码输入正确的情况下,最小化到系统托盘。
当出现报警事件时,监控主机通过网络将报警信息传给“C/S登陆客户端”,然后“C/S登陆客户端”将报警信息显示在电脑屏幕的右下角。
这样客户不用时刻关注系统的运行情况,着手解决其他问题,而当设备发生异常时又能做到及时地发现并掌握。
1.6监控项子功能
CEIMS3.0系统是一个以信息流监控为核心的综合应用平台,将功能各异的设备及子系统有机地组合成一个既相互关连又统一协调的整体,实现各设备及子系统的优化运行;通过Internet/Intranet技术集成监控信息流,提供对设备及子系统的的管理职能,监视其实时信息,报告各种异常状况,确保所有设备及子系统的安全、可靠、高效运行。
1.6.1配电柜监控
●
开关柜
监视各支路的开关状态(进线柜、出线柜及其他配电柜的开关状态)。
对于机房内重要的配电开关,其状态监控是十分必要的,一旦开关跳闸,计算机系统可能会立即崩溃,需要尽快报警处理。
通过开关量转换模块对强电信号进行处理、隔离,处理后的信号经开关量采集模块采集后传递给现场监控服务器。
●
输入/输出配电柜
进线柜在运行中有很多重要的参数,例如电压、电流、功率(有功、无功、视在)功率因数、频率电度(有功、无功)。
通常的做法是采用在配电柜上安装仪表,由人工监视,柜内的自动空气断路器,过流保护的工作状态,以及总开关的状态也是由人工在现场监视。
现在,进线柜的供电参数通过智能电量仪表把市电的运行状态以数据的形式传输给监控系统,对其进行监视,使现场达到无人值守的目的。
(1)通过配置智能电量检测仪,实时监视机房市电的三相电压、电流、频率、功率因数、有功功率、无功功率。
系统管理员和操作员可以通过历史曲线图看到每天的电压、频率、有功、无功的最大值、最小值、当前值及电压、电流峰值,从而能清楚地知道三相电压、电流是否均衡。
(2)系统一旦报警,会自动切换到相应地开关画面,颜色随着改变,由绿色变成了红色,系统自动播放多媒体语音报警。
并可通过发送手机短信通知有关人员处理。
1.6.2UPS监控
对UPS的监控,实际上是对UPS的内部整流器、逆变器、电池、旁路、负载等各部件的运行状态进行实时监控,一旦有部件发生故障,系统会以各种方式报警。
此外,还实时监视UPS的各种电压、电流、频率、功率等参数,并有直观的图形界面显示。
利用UPS的智能通讯接口(RS485或RS232),通过手牵手的总线方式将多台UPS的监控数据直接接入现场监控服务器进行统一监测。
CEIMS3.0系统可全面诊断UPS状况,监视UPS的各种参数。
一旦UPS报警,越限参数将变色,并伴随有报警声音,有相应的专家处理提示。
并可根据用户需求设置手机短信等方式通知有关人员。
对于重要的参数,可作曲线记录,查询一年内某些测点的曲线(如电压、电流),并可显示选定某天的最大值,最小值,使管理人员对UPS的状况有全面的了解。
具体而言,可对UPS的整流器、逆变器、电池、旁路、负载等五部分的运行状态与参数进行实时监控。
根据机房实际情况,本系统需实现如下几方面功能:
适时监控输入、输出电压、输出电流、输出频率、整流器状态、逆变器状态、电池状态、旁路状态、负载状态等部分的工作状态、参数。
1.6.3电池组的监控
对UPS电池组的监控实际上是对UPS电池组的单体电压、单体内阻、电流、温度、总电压、失效电池预测、后备容量预测等电池性能的全面监控和管理,准确地预测电池组的运行状况,把电池组的潜在危险排除在萌芽状态,有效地保证了不间断电源系统的安全性。
并且可实现对电池组的远程充放电进行操作。
1.6.4发电机组监测
CEIMS3.0系统通过发电机组的智能通讯接口和通讯协议与发电机组进行数据通讯,并获得发电机组的启停状态。
当监控系统检测到发电机的启停操作时,将启动多媒体语音系统,以提醒管理人员,确定操作,避免造成更大的损失。
1.6.5
精密空调监控
CEIMS3.0系统通过精密空调的智能通讯接口和通讯协议与精密空调进行数据通讯,全面监控精密空调的运行参数。
系统一旦有报警,将自动切换到相关画面。
越限参数将变色,并伴随有报警声音和相应的专家处理提示。
对重要参数,可作曲线记录,用户可通过曲线记录直观地看到精密空调的运行品质。
这样,精密空调即使有微小的故障,也可以通过系统检测出来,及时采取相应的措施防止精密空调进一步损坏。
对严重故障的报警,可根据用户需求加设电话语音报警。
本系统可实时监控世界各厂家的精密智能空调,实时监控空调各部件(压缩机、风机、加热器、抽湿器、加湿器、滤网等)的