联想孙伟:海神液冷服务器荣膺HPC CHINA“技术创新奖”

发布时间: 2024-07-14 22:10:00 作者:风冷型降温除湿机

  以“算力互联 智引未来”为主题的CCF全国高性能计算学术年会(CCF HPC  China)近日在青岛举办。作为全世界领先的科学计算解决方案提供商,联想以“新算力 新动能  联想HPC绿色低碳计算”为主题,携高性能计算整体解决方案、温水水冷解决方案、人工智能解决方案及AI新品、仿真一体机等亮相CCF全国高性能计算学术年会展台。此外,联想温水水冷服务器系列再度荣膺“技术创新奖”。

  我们有幸采访到了联想(深圳)计算机科技有限公司服务器专家孙伟,跟她一起畅聊了关于液冷服务器的技术发展历史、技术细节、技术优势、创新产品和实施案例等多个方向,分享了联想在液冷服务器方面的最新进展。

  科学计算至今已有数十载的发展历史,液冷技术很早就被应用在一些顶级的超算中心。但时至今日,随着AI算力将首次超过通用算力,人工智能、大数据、云计算等不一样的计算应用不断融合等新趋势的产生,计算机液冷需求已发生了非常大的变化。联想(深圳)服务器专家孙伟在分享中指出:“我们应该数据中心向低碳、绿色方向演进,最重要的一环就应该采用更加绿色低碳的IT产品部署数据中心,从而加速实现  双碳 目标”。作为全球领先的科学计算解决方案提供商,联想建立了海神液冷技术体系,为多元的计算场景进行全面的绿色赋能。

  孙伟表示,液冷是数据中心实现低碳、降低PUE最直接的一个手段。液体比传统空气冷却有两个指标优势明显:液冷比传统风冷效率高25倍;液冷在单位时间内能够带走的热量是空气冷却的3000倍。联想集团是数据中心行业的领军企业,早在2012年就推出了温水液冷技术。通过不断的优化和升级,联想最新一代海神温水液冷技术的PUE(能源使用效率)可降至1.1左右,实现了42%的节能减排。据披露,联想高性能计算已在全球范围内部署了超过10万个温水液冷节点。

  目前,联想海神液冷技术体系分为液冷辅助技术和直接液冷技术两大类,为不同规模和场景的数据中心提供最佳选择。对于一些希望采用高算力芯片,但又不具备机房改造条件的用户,能够使用风液混合的液冷辅助技术来提高局部的散热效率,简单易行。对于一些新建数据中心,智算中心等高性能负载用户,能够最终靠联想直接液冷技术,实现高性能和低能耗。通过液冷冷板系统的热交换,来带走主要功耗部件乃至全部功耗的部件的热量,大幅度降低由风扇和环境空调带来的能耗。孙伟透露,按照他们团队的规划,直接液冷技术将会是下一代绿色数据中心最重要的节能手段。利用直接液冷技术,可以将PUE降至1.0-1.2之间。

  关于联想温水液冷技术的优势,她小结了几点:1,采用直接温液冷却+液体辅助空气冷却+后门热交换器的创新技术,大幅度的降低了能源消耗;2,温水冷却消除了冷水冷却所需的大部分结构空间,节约了宝贵的空间资源;3,温水冷技术的液冷介质是水,不仅成本低,同时也避免了氟化液制冷的处理和运维问题。

  孙伟描述了温水冷却研发技术过程,经过他们团队通过大量实验数据分析发现,进水温度最高50℃,出水温度58℃左右,能轻松的获得更优的能耗比和经济效用。这样一来,一方面室外侧散热效率更加高,满足AI算力需求下,CPU计算、GPU计算以及CPU+GPU等异构计算带来的性能提升的同时更少能耗;另一方面可直接满足城市地暖、热水供应对水温的要求,利于数据中心余热利用。

  关于联想最新推出的液冷产品,孙伟专家透露在针对科学计算的液冷节点上,联想坚持高计算密度、高稳定性、高安全性和低PUE“三高一低”的设计思想,联想新一代海神(Neptune™)温水液冷系统在42U的标准机柜中,最多能支持144张最新的GPU和72个CPU,单机柜达到约7.5PFlops双精度计算能力。它采用了冷板全液冷设计的具体方案,功耗器件覆盖高达98%,PUE最低1.05,覆盖了CPU、GPU、内存、硬盘等所有核心部件,并且无风扇的设计,能够减少风扇故障点,实现0噪音。值得一提的是,在目前大热的AI算力方面,联想于上周发布了两款AI服务器新品。其中的联想问天WA7780  G3  AI大模型训练服务器,即在提供澎湃算力的同时,从设计上预留了液冷冷板设计,未来将支持液冷,大幅度降低AI大模型训练过程中,因系统散热带来的额外能耗,助力AI算力绿色发展。

  接下来,孙工程师给笔者介绍了一些他们团队液冷服务器的成功实施案例:在中国,联想助力高校科研、制造、气象海洋、生命科学等多领域客户部署液冷超算中心,持续提供着领先成熟的算力解决方案。例如在制造行业,联想液冷团队助力吉利汽车集团打造了吉利星睿智算中心·智能仿真平台,联想海神(Neptune™)温水液冷技术的应用,使得整个数据中心PUE值接近1.1,远低于政府要求,实现新车制造绿色与安全同行。此外,联想集团为北京大学打造的国内首个温水液冷高性能计算平台未名一号,每年为北京大学节省  60 万度电,降低 50% 的制冷散热成本。孙伟所在的联想液冷团队还承担冬奥会气象预报任务的北京市气象局提供了高性能计算系统。

  国际上,联想液冷服务器更加被普遍的使用,光是孙伟老师参与的项目就包括:韩国气象厅(KMA)、德国马普计算和数据中心(MPCDF)、欧洲顶尖理工大学KIT,澳大利亚国家计算机基地(NCI)等,最近联想还宣布德国波茨坦气候影响研究所(PIK)已选择使用联想HPC及海神温水液冷解决方案开发下一代高性能计算机,这将帮助人们更加进一步探索气候平均状态随时间的变化,部署具有变革性的高能效应用。

  践行算力的绿色低碳和可持续发展,不仅仅体现在算力所采用的服务器和技术方案上,也体现在算力建设,运营,淘汰的整一个完整的过程中。从技术发展,产品设计,落实到数据中心建设层面,液冷技术还将克服承重/空间,供电,不同PUE要求等数据中心环节复杂性,孙伟在分享中提出,联想也在以实际行动,从每个方面打造绿色算力,实现可持续发展。目前联想在全球高性能计算TOP500榜单上,已连续11年问鼎份额第一名,分布在全球22个国家和地区,份额占比高达33.6%。在今年6月发布的Green500榜单中,联想的科学计算集群以65.40GFlops/W(每瓦654亿次浮点运算)的能效再次登顶首位。

  可持续发展是一个不断前进的旅程。对于未来,孙伟专家这样认为他们联想液冷团队将全力打造更多性能与节能兼备的产品和解决方案,把“双碳”目标刻印在产品基因中,持之以恒地以领先技术和创造新兴事物的能力,助力算力产业节能高效运营,支持国家打造绿色低碳的算力,以可持续的姿态,加速“双碳”目标的实现。