北京创意银河总裁张春阳:解读“数据中心测试验证技术规范”

2017/8/22 18:38:06 来源:DTDATA 作者: 分类:企业声音

我来自创意银河,主要做数据中心测试验证,大概做了150个数据中心测试验证,其中超过1万平米以上的大概有40个。测试验证背景是随着这几年数据中心高速发展,今年我们估计全国新建数据中心机架数量大概20万架左右,其中50%的项目会经过测试验证,也就是说,今年会有10万架左右的新建数据中心会经历测试验证,这个需求量是越来越大。刚才阿里闫总和施耐德专家都提到了,在实际数据中心运维过程中,会出现这样那样的问题,如何在数据中心业务系统上线之前,最大可能发现这些问题,排除这些问题,其实测试验证给了大家一个选择,可以在业务上线之前发现问题并整改问题。但目前国内缺少相关测试验证的标准和规范,也就是各个单位会推出自己的标准,ODCC开放数据中心委员会主要的成员单位像百度、腾讯、阿里,他们也是这几年在国内从用户的角度去出发,进行测试验证的主要用户。在这个基础上,我们逐渐规范的测试验证内容,无论是测试方法、测试工具、所需要达到的相应的目标。



在这个基础上,2016年启动了测试验证技术规范的编写工作。完成了三个主要方面的任务,一是发现数据中心的各类潜在的风险隐患,这个既包括设备级的产品缺陷,也包括施工工艺、安装工艺类的问题。二是验证数据中心是否达到设计指标,无论空调系统、配电系统还是网络,建造、施工是否达到了设计要求。三是站在系统的层面上,各个设备都是OK的情况下,整个系统能否良好的配合起来,运转起来,达到安全稳定运行的要求。简单展示了一些数据中心常见的出故障的风险点,包括ATS状态不正确,仪表不准,没有电流显示,发电机并机测试不均衡等等。电池放电几乎是大型数据中心测试中都会遇到的问题。


技术规范的编写,因为这几年越来越多数据中心投入使用,可能用户也意识到测试验证是一个数据中心在交付运营之前,最后一道关口,如何保证交出来的数据中心能够安全运行,一个典型的1000个机柜的机房,在测试阶段大概发现的问题一般都在300条以上。如果直接就交付运行,可能这300条问题就会在以后运维过程中三年五年时间中陆陆续续发现,如果在这个时期发现并解决掉,可能就把绝大多数问题在萌芽阶段就解决了。百度、阿里、腾讯、中国信通院、京东、移动、电信、联动、华为、中兴、创意银河,这些年都经历了很多项目的测试验证。我们在编写的过程中,也开展了多次的讨论论证,包括现场讨论,邮件更改,这里面可以说是吸取了各家在测试验证方面的一些积累的经验。


规范的架构包括引用的规范,环境的搭建,故障的模拟,仪器仪表使用,还有具体单设备、单系统测试流程,都有比较详细的介绍。目前市面上做的测试验证工作,也有不少单位,但是测试报告也是千奇百样,有一两百页,也有三四千页的,这个规范出来以后,典型的1000个架的数据中心测试报告都会在1000—1500页,最大程度把一些以前靠经验去做的一些工作进行了量化,适用单位包括建设单位、运营单位、业主和验证测试机构,都可以作为参考学习的资料。


测试验证里的两大要素,一个是压力,一个是方法,第一个为什么是压力?要想在测试阶段,没上业务阶段,把各种问题暴露出来,无论空调系统还是电力系统,要最大可能展现它的各种工况,通过它达到单设备,单系统,满系统的满载压力测试。配电系统从高压一直到PDU,整个配电链路,全链路的压力测试可以进行拉网式的检查。空调系统也是,包括它的风量设计,包括每千瓦散热的流量都是相同的,包括电力转化效率也是99.5%左右,最大程度再现了在未来实际运行情况下最大的负荷情况。方法的规定,一般做测试过程中,会先做安装检查、然后功能检查、单系统检查、满系统压力联合调试,为什么要按照这个顺序来做呢?因为在发现一些问题的时候,做一些完善,可以避免下一步测试过程中出现的故障事故。功能测试是指先做带电测试,但是不带负载,然后再做系统测试,包括电能质量、制冷能力、满载、发热,配电系统、空调系统的要求是没有抽测的概念,百分之百对每个系统进行检测。对于测试验证环境搭建,通过机架式测负载,满足单模组最大复合,满足冷机群控加机条件,测试在常规验收阶段不容易达到或者不容易发生问题的情况,在测试环境搭建的情况下可以得到良好的满足。另外在整体式阻性假负载,可以补充变压器最大负荷,补充母线最大负荷。整体式容性假负载,按照发电机功率因数配置。如果发电机没有考虑相应特点,有可能出现在负荷一定程度以上,会出现切换设备的情况,所以这次测试验证环境上做了比较量化的规定。


在关键基础设施全覆盖,基本上做到了内容的全覆盖,从内容角度来讲,它具有很强的直接的操作指导性,以UPS为例,包括安装检查、功能测试、单机加载性能测试等等。规范的颁布实施,将为数据中心建设运营以及从事数据中心检测的机构,提供一定意义上的指导,从而进一步规范国内数据中心市场的健康良性发展,也希望规范的面世能够把国内数据中心建设水平,提升到新的高度。下面看看大家对刚才演讲的内容有什么问题没有。


Q1:你们的电力负载是什么形式的?


张春阳:我们做配电系统和空调系统测试的时候,它的电源转化效率是99.5%,跟实际服务器比较一致。从UPS无论现在讲的是交流UPS还是高压直流,它的特点是怕感性,不怕容性和阻容性,发电机是不怕感性,怕容性和阻容性,我们从安全性能的角度,在测UPS的时候,发现用容性和阻容性测试发现对性能影响不大,但是对于发电机测试的时候影响非常大。


Q2:刚才提的今年可能会测试验证的数据10万架,这个数据从什么方向来的?


张春阳:我们公司本身也有市场部门,我们上半年已经完成1万架测试项目,我们估计今年是2.5万架左右,对于全国数据中心推测,因为我们这几年每年都在追踪,去年15万架,今年20万架,都是我们根据国内实际在建项目进行推断的,会有误差,但不会太大。


Q3:我们是一家测试机构,这个标准真的期待了很久,对于我们从业类似的公司有很好的指导作用。在我们标准里面,对于消防系统我们的标准是跟国家的国标验收标准是参考还是更多从我们实际应用角度去编制和定义的?


张春阳:消防目前国内非常特殊,它是有专门的消防部门做验收,在这个部分约定其实有两个内容,一个是消防有信号的时候,它对电器怎么切换。另外是安全的角度,是否能确保人员安全,这里面包括几方面的内容,一个是门是否能打开,包括打开的方向,还有人是否能够安全的出去。另外还有跟消防配合的,在封闭的情况下,它的顶棚怎么打开,至于专业的消防验收还是交给专业的机构去做。


Q4:关于做发电机测试的时候,针对容性负载的问题,一般我知道有几个大的IDC公司都出现这个问题,发电机直接把UPS旁路掉,这个问题出现了发电机处于叫镜像运行的模式,对于这个指导值有没有推荐的?


张春阳:目前对于阻容性没有做定量的要求,随着现在UPS技术不断发展,其实IT侧的功率数在得到不断优化和改善,在前两三年的时候,我们实测了很多数据中心功率数,有0.7、0.8左右的比较多,但是这两年新建数据中心实际使用的时候功率数都能做到0.9以上,在主动测试的时候,我们也是建议你这个值到底做到0.8还是0.85、0.9,既要考虑原有设备的特点,还要考虑将来业务发展。

相关资讯

共有访客发表了评论 网友评论

验证码: 看不清楚?