智能电源管理解决方案

上海聚祥 by 13764994834
2020-03-16

1.          需求分析

目前无法对的业务节点设备及网络节点设备进行有效的电源检测与控制,无法精确检测被控设备的电流、电压、功率等运行参数,无法精确检测设备运行环境的温、湿度。

目前机柜内为服务器等设备配电采用的是普通民用插线板,而且大部分插座的类型为国标万用型,没有用设备电负载的测量,机柜负载通过外接电流表的方式实现,没有负载数据输出和告警功能,因此在用电的安全性和可靠性方面无法得到保证,从而造成了数据中心用电的潜在故障隐患,具体的用电故障隐患有:

1)        数据中心规模庞大,部署分散;

           由于业务增长而引起的设备采购,机房扩容、导致机房用电增长过快,电不够用;


           机柜数量多,设备负载跨度大,配电复杂,须要一套灵活的配电系统。


           想要改进机房设备的用电效率却无从下手;


2)        设备用电管理缺乏有效控制手段

         由于无法得到服务器等设备的实时用电负载,当新加设备时容易造成过载挑闸,引起设备宕机,生产系统无法对外提供服务。

         由于机柜插线板没有加电延时功能,多台设备同时加电会产生瞬间峰值电流(外接电流表也无法设置阀值告警)造成挑闸,引起设备宕机。

         由于国标万用插座可以插入多种规格插头,插座缝隙相对较大有设备电源线脱落掉电的隐患,引起设备宕机。

       
民用插线板只是插座的简单分配,根本无法管理和平衡各插座的电流,内联线不分主干线和分配线,其材料耐热性和负载能力都不适用于机柜环境,有高温发热,融化短路的隐患,从而引起跳闸,设备宕机甚至火灾(后果:机房火灾重大安全事故)。

3)        人工对设备用电定期巡检,缺乏实时性及专业性。

目前管理方式是值班人员每小时巡检机房一次,手工为机房内的设备运行状态,机柜耗电,温湿度等参数建立档案,如遇某机柜电容量接近阈值,需要在机柜上端贴黄、红牌示警;

4)        机房各子系统随着扩容改造要求集中监控告警

为了保障良好的数据中心设备运行环境,有效预防设备停机、电源烧毁等严重故障,改善容量不足,低效高耗的电源利用状态,现急需建立一套精细化的机房管理控制系统。该系统可以快速、高效的通过远程操作达到对设备的电源控制;通过集中的用电状况监控和数据分析能够实现对数据中心安全、高效和精细化的管理。

2.          解决方案

智能远程电源管理系统采用美国Raritan公司的解决方案,主要组成如下:

Raritan安全、智能电源管理系统

Raritan的电源管理解决方案有两部分组成:

PX:智能PDU,它主要有三个大功能:

          PDU插座级的用电状况测量及阀值告警

          PDU插座级的远程开关(包括插座的来电延时功能)

          机柜级微环境监控(温度湿度)及阀值告警(结合传感器探头实现)

Power IQ:智能电源集中管理软件,它的主要功能有:

         对IT设备和微环境的实时监测数据的汇总和分析

         智能PDU(PX)的集中配置和管理

         与第三方系统的接口

3.          集中远程电源管理的主要特点

         数据中心机电力运行环境的统一监视,如基于数据中心级,部门级,机架级,设备级的电力状态监测等;

        监控PDU插座一级的用电量(电流,有效功率…) ;

        监控机柜的温度和湿度(每个PX最多可同时采集16个温度和湿度数据);

         对机柜内的服务器等设备进行远程的加电、断电、重启等电源管理;

         设置阀值并通过SNMP和E-mail来接收告警;

         高安全的电源管理:256-bit AES加密;强密码;支持用户认证;

         支持开发接口,可整合到统一的网管或OA系统;

4.          集中远程电源管理的实际作用

1)        运营维护

         通过对设备用电状况的监控,并定义阀值告警,及时获取设备的运行状态信息,在故障发生之前进行预防;

        可以在远程像亲临现场一样对设备进行电源开、关、重启等操作,及时修复故障,保障系统持续运行;

         设备端供电的管理,将PDU空闲插座设为无电状态,消除因人为失误插入设备导致PDU的过载跳闸及设备宕机;

         通过对PDU插座的来电延时配置,避免因设备同时加电引起的瞬间电流峰值导致的断电挑闸;

         对设备所处微环境的温度和湿度监控,并进行统计趋势分析,根据微环境变化及时检查设备健康状况,避免计划外宕机。

2)        统一管理

Raritan智能电源管理系统,提供丰富的第三方调用接口,可以被数据中心的网管系统去集成管理,例如:

         集成到网管系统中,直观的发现智能PDU的拓扑、访问量,支持设备故障告警。

         通过Syslog集成到数据中心的日志系统,基于区域、机架、设备生成自定义的电源参数报表,对用电安全进行监督管理。

       
集成到数据中心的IPMS(智能平台管理系统)系统,可以基于组太方式监测电源状态,根据Raritan提供的数据,通过模糊控制方式实现各自动化系统的自动化运行。

3)        降低能耗

         通过机柜级和设备端的用电监控管理,精确统计设备一级的耗电量,为数据中心的用电容量控制和估计提供了准确的数据依据。

       
通过对机柜内的温度进行监控统计分析,避免温度过低,降低制冷的能耗。同时绘成动态的机房气流组织图,找出热点,来确定机房布局的优化,提高制冷送风的效率,降低能耗从而节省电费。

       
通过对数据中心设备用电测量和机柜温湿度监测,可以绘制出数据中心的能耗图和温/湿度热点图,并精确定义出能耗和温湿度的基于时间的动态基线,实现数据中心的动态精确制冷,降低能耗从而节省费用;

5.          解决方案价值

1)       真正实现无人机房

         设备运行状态(性能、供电)可视、可控

         运行稳定故障修复及时

         纳入统一管理,集中监控告警

2)       适应机房扩展与人力资源投入的平衡

          减少现场作业

          全新高效的工作方式

       
通过远程集中监控系统管理,数据中心将无需在机房投入大量的专业维护人员,机房的系统维护工作将不再受地点、时间限制,所有的工作都可以通过互联网来实现,大大节约了人力资源。

3)       提高数据中心管理安全级别

         通过智能电源监控系统实现用电安全预警机制,减少系统宕机时间

         通过KVM系统实现远程安全管理

         减少人员现场作业,提高数据中心物理安全性

         全部操作实现事前审计、实时记录、事后追溯安全日志记录

4)       节能降耗,实现绿色环保机房建设

         通过对数据中心用电状况的诊断,优化和调整数据中心的布局、送风  

         和制冷,节能降耗;

         通过对数据中心设备用电状况的诊断,优化、合并和淘汰低效高能耗设备

        节能降耗;

         通过获取实时设备级的用电及环境信息,与其它智能系统的联动(如制冷系统),达到按需定点制冷、除湿和送风,实现数据中心运维自动化,节能降耗;

分享