专家文章

数据中心创新——测量准确度如何提高能源效率

Keith Dunnavant, Munters & Anu Kätkä, Vaisala

Keith Dunnavant, Munters & Anu Kätkä, Vaisala

建筑物和室内空气质量
工业测量

在接下来的文章中,来自 Munters Keith Dunnavant 和来自维萨拉的 Anu Kätkä 将描述数据中心领域的未来走向,并讨论暖通空调测量对能源效率的影响。随着能源成本不断攀升和各国政府迫切寻求减少温室气体排放的机会,数据中心能效成为国际审查的焦点。

两位作者都在数据中心的能源管理方面拥有长期的经验和丰富的专业知识。Munters 是为包括数据中心在内的关键任务流程提供节能和可持续气候控制解决方案的设备生产厂商,而维萨拉是天气、环境和工业测量领域的设备生产厂商。

数据中心能耗

“电源使用效率”(PUE) 作为衡量标准

 

全球对电力的需求量约为 20,000 太瓦时;ICT(信息与通信技术)行业使用 2,000 太瓦时,数据中心使用大约 200 太瓦时,占总量的 1%。因此,数据中心是多数国家/地区能源消耗的重要部分。据估计,全球的数据中心有超过 1800 万台服务器。除了自身的电力需求外,这些 IT 设备还需要配套的基础设施,例如冷却、配电、灭火、不间断电源、发电机等。

为比较数据中心的能效,通常的做法是使用“电源使用效率”(PUE) 作为衡量标准。这一概念定义为数据中心使用的总能源与 IT 使用的能源之比。理想情况下的 PUE 为 1,这意味着所有能源都用于 IT,而配套基础设施不消耗任何能源。

因此,要更大限度地降低 PUE,目标是减少冷却和配电等配套基础设施的消耗。现存传统数据中心的典型 PUE 约为 2,而大型超大规模数据中心可达到 1.2 以下。2020 年全球平均水平约为 1.67。这意味着平均而言,总能耗的 40% 是非 IT 消耗。然而,PUE 是一个比值,因此它不能体现有关能源消耗总量的信息,这意味着如果 IT 设备相比冷却系统消耗的能源水平较高,则 PUE 看起来会很好。因此,衡量总功耗以及 IT 设备的效率和生命周期也很重要。此外,从环境的角度来看,还应考虑发电方式、消耗的水量(包括发电和现场冷却)以及是否利用废热。

PUE 概念最初由 Green Grid 于 2006 年提出,并于 2016 年作为 ISO 标准发布。Green Grid 是一个开放的行业联盟,由数据中心运营商、云提供商、技术和设备供应商、设施架构师和最终用户组成,致力于提高全球范围内数据中心生态系统的能源和资源效率,努力降低碳排放。

PUE 仍然是计算数据中心能效的常用方法。例如,在 Munters,PUE 是根据每个项目的峰值和年化基础进行评估的。在计算 PUE 指标时,在 PUE 的计算中仅考虑 IT 负载和冷却负载。这称为部分 PUE (pPUE) 或机械 PUE (PUEM)。电气工程师使用峰值 pPUE 来确定最大负载以及备用发电机的大小。年化 pPUE 用于评估一年的典型耗电量,并与其他冷却方案进行比较。虽然 PUE 可能不是一个完美的工具,但随着 WUE(水利用效率)、CUE(碳使用效率)等其他衡量标准以及 SPUE(服务器 PUE)和 TUE(总 PUE)等可增强 PUE 相关性的方法的采用,PUE 得到越来越多的支持。

数据中心趋势

在过去十年中,高效的超大规模数据中心在数据中心总能耗中的相对份额有所增加,而许多效率较低的传统数据中心已经关闭。因此,总能源消耗尚未明显增加。这些新建的超大规模数据中心专为提高效率而设计。然而我们知道,由于人工智能、机器学习、自动化、无人驾驶汽车等许多新兴趋势的涌现,对信息服务和计算机密集型应用程序的需求将会不断增长。因此,数据中心的能源需求预计会有所增加,而增加的水平是人们争论的主题。在最理想的情况下,与当前需求相比,到 2030 年全球数据中心的能源消耗将增加三倍,但更有可能增加八倍。这些能源消耗预测中包含了 IT 和非 IT 基础设施。大部分非 IT 能源消耗来自冷却,或者更准确地说,来自服务器的散热,仅冷却成本就可轻松占据年度总能源成本的 25% 及以上。冷却当然是维持 IT 功能的必要条件,这可以通过建筑系统的良好设计和有效运行来优化。

近期的一个重要趋势是服务器机架功率密度增加,有些甚至高达 30 至 40 千瓦及以上。根据数据中心专业人士行业协会 AFCOM 进行的研究,2020 年数据中心状态报告表明,平均机架密度跃升至每个机架 8.2 kW;高于 2019 年的 7.3 kW 和 2018 年的 7.2 kW。约 68% 的受访者表示,机架密度在过去三年中有所增加。

向云计算的转变无疑推动了超大规模和托管型数据中心的发展。从历史上看,一个 1 兆瓦数据中心的设计初衷是满足银行、航空公司或大学的需求,但许多机构和公司现在正在转向超大规模和托管型数据中心设施内的云服务。随着这一需求的不断增长,对数据速度的要求也越来越高,当然所有这些数据中心都在服务于关键任务应用,因此基础设施的可靠性非常重要。

人们也越来越关注边缘数据中心以减少延迟,还采用液体冷却来应对高性能芯片并减少能源使用。

温度和湿度控制

风冷数据中心冷却能效的主要考虑因素之一是热通道/冷通道温湿度控制。遗憾的是,许多现存数据中心的温湿度控制系统仍然管理不善,导致能源效率低下。而另一方面,新的数据中心建设往往非常重视温湿度控制,这对性能提升有很大贡献。

很多情况下,理想送风温度应介于 24 °C 和 25.5 °C 之间。然而,热通道和冷通道之间的温差 (delta-T) 至关重要。通常,delta-T 约为 10 至 12 °C,但在数据中心设计中通常将目标定为 14 °C。delta-T 的提升会带来两方面的收益,即减少冷却系统所需的风扇电机能耗,以及增加实现节能散热策略的潜力。

Data center temperature variations

节能是利用室外空气促进数据中心部分散热的过程。节能可以直接发生,室外空气直接引入冷却系统并输送到服务器(经过适当的空气过滤);也可以间接发生,再循环的数据中心空气通过空气-空气热回收器排入环境。这能降低成本并提高效率和可持续性。但为了保持效率,应尽量减少由于过滤导致的空气侧压下降。因此,如果空气在数据中心内进行再循环而不引入外部空气,则应该可以减少或完全消除对过滤的需求。

冷却和通风需要精准控制,重要的是部署高效风扇,保持建筑物的微正压并控制室内湿度。例如,新风系统应将空间露点控制在足够低的水平,以便冷却螺旋管仅进行显冷,而不必处理潜热载荷(降低空气湿度)。

排热系统的总体目标是保持 IT 设备的最佳状态,同时尽可能减少能耗。例如,湿度低会增加静电风险,而湿度高会导致冷凝,进而对电气和金属设备构成威胁,增加故障风险并缩短工作寿命。现已证明,高湿度水平与各种环境污染物相结合会加速服务器内各种组件的腐蚀。

必须进行冷却来消除 IT 设备产生的热量,以避免过热和防止故障。根据一些研究,相较于稳定的高温,温度快速波动实际上对 IT 设备的危害更大,因此从这一角度来看,控制回路至关重要。

新的 IT 设备通常能够在较高的温度下运行,这意味着可以提高进气温度,且更有可能实现自然冷却和节能。室外空气可直接或间接(如上所述)用于冷却室内空气,蒸发或绝热冷却可进一步提高节能效率。随着不消耗水的干排热策略日渐流行,上述这些节能技术已得到广泛应用。由于热提取介质(气体或液体)温度升高,有效利用数据中心废热的潜力也随之增加,比如可以将废热用于区域供热网络。例如,在赫尔辛基,Microsoft 和能源集团 Fortum 正在合作开展一个收集余热的项目。Microsoft 数据中心将会使用 100% 无排放电力,同时 Fortum 把服务器冷却过程中产生的清洁热量传输到与其区域供热系统相连的家庭、服务和商业场所。该数据中心废热回收设施可能是世界上同类设施中最大的。

准确监测的重要性

在许多现代设施中,正常运行时间预计为 99.999%;这意味着每年只有几分钟的停机时间。由于 IT 基础设施处理的数据和流程十分重要且富有价值,良好的性能必不可少。

数据中心设计的一个关键特性是为服务器提供正确的温度,而这只有在控制系统使用精确传感器的情况下才能实现。机房越大,可能越难以监测,因为它们的空间温度更有可能发生变化,因此应配备足够数量的温度传感器来确保监测到所有服务器,这一点至关重要。

Keith Dunnavant, Munters

Keith Dunnavant, Munters

有些服务器可能距离冷却装置较近,有些则较远;有些可能在机架底部,有些则在较高的位置,因此存在发生三维变化的可能性。因此,除了部署足够数量的传感器外,确保在整个服务器机房中妥当放置冷却装置且气流通畅也很重要。通过将适当的设计和监控结合,可以有效地控制冷却和气流,从而满足所需的规范。

为了评估不同变量对年均能耗的影响,Munters 在三个不同的位置建立了系统运行模型,以三种不同的控制应用模型运行;每个系统都有一个 1 兆瓦 ITE 负载的数据中心:

  1. 基准案例场景中,设计供给温度为 24 °C,回风温度为 35 °C (delta-T = 11 °C)。
    案例二中,供给和回风温度降低 1 °C(delta-T 保持不变)。
    案例三中,仅将回风温度降低 1 °C(delta-T 降低)。

结果显示,在气候较温和的位置,三种场景的能耗均较低。场景 2 显示,供给和回风温度降低 1 度,能耗增加 1% 至 2%。情景 3 中能耗的增加较显著;仅将回风温度降低 1 °C(从而降低 delta-T),三个位置的能耗都增加了 8% 至 9%。温度的小幅偏差就能产生很大的影响,这凸显了 delta-T 和传感器准确度的重要性。

无论采用何种冷却方法,以可靠的方式控制暖通空调流程和室内条件都至关重要。为实现这一目标,数据中心管理人员需要有精确的连续测量作为参考,因为良好的控制回路与测量的质量息息相关。因此,高质量传感器是有效控制暖通空调流程和稳定室内环境的推动因素。但是,安装时的传感器规格并不一定能作为长期性能可靠性的指标。传感器的价值体现在其整个生命周期中,因为频繁的维护要求可能需要高昂的成本,而且正如 Munters 的模型所显示的那样,即使是小幅的准确度偏差也会导致能源成本飙升。

在多数情况下,IT 基础设施中数据的价值非常高,而且通常是关键任务,因此,如果会导致高昂的维护成本或高价值数据面临风险,部署低成本的传感器就毫无意义了。所以用户应该寻找耐用的测量设备,能够长期提供可靠、稳定的读数,因为重要的是设备终生的可靠性。

影响选择传感器的因素

1.可靠性

传感器在安装点的准确度显然很重要,但更重要的是传感器能长期稳定提供精确的读数。考虑到数据中心的较高价值以及通常较为偏远的位置,变送器的使用寿命应远高于正常水平。因此,制造商应具备该领域的经验,并具有在关键环境中进行可靠测量的声誉。可追溯的校准证书可确保传感器在出厂前正常运行,而经验证的可靠性意味着可以长期保持这种准确度水平。

Anu Kätkä, Product Manager, Vaisala

Anu Kätkä, Product Manager, Vaisala

2. 维护

应避免使用维护要求高的传感器,不仅因为其涉及的成本,还因为此类传感器会带来更高的故障风险。此外,如上所述,传感器漂移或准确度下降会导致巨额能源成本。数据中心对正常运行时间有较高水平的要求,这意味着监控设备的维护操作不应干扰数据中心的运行。因此,像维萨拉的这样带有可更换测量探头或模块的仪表能更好地满足客户需求;尤其是此类仪表可以移除传感器并离线校准。如果更换了测量探头或模块,则还应更新校准证书,这一点也很重要。理想情况下,应该能够使用仪表供应商提供的工具在现场进行维护操作,并且这项工作应作为定期保养计划的一部分进行。
 

3.可持续性

从传感器的角度来看,新技术允许用户只升级传感器的测量部件,而不必更换或报废整个变送器,这有助于避免不必要的浪费。在决定购买时,应考虑供应商的环境和可持续性证书。这能够让可持续发展沿供应链向下延伸,并为企业形成驱动力。可持续发展是 Munters 和维萨拉的核心。以 Munters 为例,他们在全球安装了超过 1.5 吉瓦的数据中心冷却设备:节省的能源相当于瑞典每年能源消耗的 2%。维萨拉在《金融时报》的“2022 年欧洲气候领袖企业”名单中位列前五。这一榜单包含了在 2015 年至 2020 年期间温室气体减排量最多的欧洲公司。

总结

由于价值数十亿美元的关键数据在数据中心进行处理和存储,因此耗电大的服务器必须保持在理想的温度和湿度条件下,以防止停机。同时,随着当下能源成本不断攀升,我们还迫切需要降低温室气体排放、提高能源效率、降低能源成本并采取更好的 PUE 衡量标准。这种“完美风暴”的驱动因素意味着准确控制和优化暖通空调流程很重要。

关于作者

Keith Dunnavant 是 Munters 的销售副总裁,负责其公司在美洲的数据中心业务。Anu Kätkä 是维萨拉的产品经理,负责维萨拉的全球暖通空调和数据中心产品领域。

You might also like...

Questions about Vaisala's solutions for data centers? We are here to help!