【48812】液冷:助AI算力从源头节能

发布时间: 2024-08-09 23:11:49 作者:风冷型降温除湿机

  自以ChatGPT为代表的人工智能(AI)大模型引爆IT圈以来,国内多家企业或安排纷繁推出相应的大模型产品,可谓“百模大战”。当人们还在比较哪家的“类ChatGPT”产品更智能之际,“曙光数创”这家IaaS公司却因其“液冷龙头”的身份首先“火”了。

  据赛迪参谋《2023我国液冷运用商场研讨报告》显现,2021年至2023年上半年,曙光数创以均匀58.8%的商场占有率,位列我国液冷数据中心基础设施商场布置规划榜首,多年稳居职业头名。

  日前,曙光数创在京举办了一场战略发布会,发布其“冷平衡”战略,对标当下液冷技能在数据中心落地中的“微弱功能、绿色低碳、可控本钱”的三元平衡需求。

  在当天会后的媒体碰头时刻,曙光数创相关负责人谈到了“大模型产品连续面世,给液冷工业带来哪些改变”的论题。

  “咱们感触最深的是,数据中心要处理的散热问题,变得比五年前、七八年前越来越急迫。”曙光数创产品规划部负责人白泽阳说道,特别是大模型鼓起以来,小到芯片散热、服务器功耗,大到数据中心用电,近一两年提高速率简直超越了此前五年的增幅。

  而这,也让他们坚决了“大力深耕液冷职业、不断推进液冷方向技能创新”的决计。

  以ChatGPT为代表的AI大模型练习,需求极大的算力支撑。如GPT-4大模型约需求2~3万张A100卡,练习一个月左右时刻。与此同时,我国算力与存力建造相同处于快速地开展阶段。到2022年末,我国在用规范机架超越650万架,算力总规划达180EFLOPS,存力总规划超越1000EB(1万亿GB)。

  一面是激增的存算基础设施,另一面则是方针对数据中心能耗更严厉的约束。工信部等多部门联合印发的《绿色数据中心政府收购需求规范》已于本年6月1日实施。该文明确要求,2023年6月起,新布置数据中心PUE不高于1.4,2025年起不高于1.3。

  PUE取自数据中心总能耗与IT设备负载能耗的比值,是反映数据中心是否绿色环保的最直接目标,越挨近数字“1”则显现数据中心能效水平越高。为AI大模型预练习供给算力的数据中心,往往需求很多高功率、高密度服务器,对AI算力中心而言,“低PUE布置”简直是刚需。

  “往往高功率的服务器、全闪存存储服务器等,由于芯片功耗太高了,会优先用液冷。不过,许多通用服务器也在布置液冷。”曙光数创副总裁张鹏表明,商场挑选液冷服务器是出于全体考虑,包含本钱、安全性和可靠性,“在挑选液冷布置方面,互联网公司需求最凶”。

  互联网企业对液冷的挑选其实很好了解:算力需求暴增,数据中心作为“能耗巨兽”正迎来低碳节能等议题的应战。

  有研讨多个方面数据显现,2020年,我国仅数据中心的用电量就超越2000亿千瓦时,占国民总用电量的2.7%;估计2023年这组数据将变为2500亿千瓦时和3%,2030年到达惊人的4000亿千瓦时和3.7%。

  如此巨大的动力运用,依照PUE值为1.5核算,散热体系将占到30%以上——不必还不可,假如不做好散热,将直接影响数据中心的功能、稳定性和可靠性。

  绿色和开展,有必要统筹。可以准确制冷散热、比较风冷散热功率有着千百倍提高作用的液冷,事实上为算力经济可继续开展供给了一条可行的处理之道。

  张鹏共享的一组核算多个方面数据显现,现在95%以上的数据中心依然挑选传统的风冷散热形式——由于服务器此前都是风冷。我国每年服务器的收购量约在200~300万台之间,其间液冷散热机型的浸透率仅为5%~8%。曙光数创作为液冷龙头,约占这部分商场58.8%的比例。他以为,随商场对液冷的认可,未来几年内这个数据可能会增加至15~30%之间。

  液冷散热机型浸透率低,存在一些实际困难,比方改造本钱,比方数据中心的规划规划等。

  “本来的数据中心机房,都是依照风冷散热进行规划规划的,那么它布置液冷设备就会有困难。”白泽阳告知《我国科学报》。

  不过,白泽阳也表明,机房不适于布置也会在用户接收液冷后在规划和规划阶段处理。现在液冷布置还存在一个比较扎手的状况:缺少一致规范。

  “现行一些规范与国家对数据中心要求不匹配,比方液冷设备的供水供电,与传统风冷数据中心有些细节乃至是相左的。”白泽阳说,从曙光数创的视点,期望能联合上下游企业一同推进更适用于液冷年代的职业规范、国家规范的落地。

  他们也一向朝着这个方向尽力。据张鹏介绍,迄今为止,曙光参编的与液冷技能相关的规范已超20个,包含职业约请、协会安排和一些国标的拟定。但张鹏更期望,未来三年,能否把这些规范一致?

  “这一定是大势所趋。”张鹏说,假如规范纷歧乃至“百标齐放”,不只对IaaS厂商而言绝非功德,用户也会堕入纠结和苍茫,对液冷数据中心能否可继续打下问号;而假如一致规范,液冷数据中心的规划建造、节能设备检验、液冷机房运维等将变得明晰,必然会对职业下降布置本钱、拥抱绿色核算带来更多积极意义。

  曙光不只早在2011年就开端投入液冷研制技能,还早在2015年就有了榜首批商用的冷板式液冷设备下线年布置了榜首套商用化浸没液冷设备,并各自具有时刻最长的运用事例。

  在此次“冷平衡”战略发布会上,曙光数创发布了其总结多年经历的SLiquid液冷技能品牌和CloudBASE数据中心全体处理方案品牌,为有关规范的落地供给有力的技能与产品支撑。

  在上述战略和品牌发布典礼之前,曙光数创总裁何继盛向会议宾客致欢迎词。他表明,曙光数创期望可以经过根据本身全液冷产品、全工业链协同、全周期服务的才能,找到数据中心完成微弱功能、绿色低碳、全体TCO可控三元平衡的最优解,“引领数据中心走向绿色可继续未来”。