数字化改革如火如荼,算力正在重塑各产业格局,数据中心随之成为数字经济发展的重要底座,而数据中心的能耗伴随着算力规模持续增大而增加。国网能源研究院的测算显示,在2020年,我国数据中心用电量就已经突破2000亿千瓦时,约占用电总量的2.7%。
在“碳中和” 背景下,数据中心这头“能耗巨兽”面临着日益严峻的节能减排、提效降耗压力。同时,近几年,我国各级政府也纷纷出台推动数据中心绿色发展的相关政策,为数据经济的长远发展奠定基础。
(资料图片)
清华大学智能产业研究院(AIR)院长张亚勤院士表示,随着AI的发展,数据中心需要越来越强的算力,同样,越来越大的模型需要建立大型数据中心和大的算力网络。“如何用AI让计算、存储、传输工具变得越来越高效、越来越绿色,对产业、对整个社会,都是一个大的课题。”
面对“绿色”这道必解题,如何提升效率且降低能耗是数据中心发展的关键步骤。清华AIR助理研究员詹仙园博士认为,传统决策优化方法由于建模能力有限或过分依赖仿真建模,瓶颈日益凸显。以离线强化学习为代表的新兴数据驱动决策优化方法,在解决真实复杂系统决策优化问题方面具有巨大的潜力。
基于此,清华大学智能产业研究院(AIR)跟英特尔合作,正在研究把数据驱动决策优化的方法用到高能耗数据中心联合优化上面。
“用分层离线强化学习框架解决问题,在上层会着重考虑IT系统能耗方面的优化,在下层则去做冷却系统跟上层的IT系统调度进行匹配,在满足负载和温度要求的情况下,实现冷却系统本身的节能优化。使用了这样的模型进行控制之后,数据中心温场的变化相对平稳很多。”詹仙园博士介绍称。
为了“让数据中心更绿色”这个愿景,2022年,英特尔面向中国市场发布了“英特尔中国绿色数据中心技术框架1.0”,从XPU层、服务器层、机架基层和数据中心层,以及高能效与高功率密度、先进的散热技术及基础设施智能化等12种维度,帮助合作伙伴和客户让数据中心变得更加绿色。
因节能减排和低PUE的要求,以及CPU/GPU功耗持续增加以应对高性能高算力的发展趋势, 风冷不能或不能很经济地满足数据中心高功耗元器件的散热需求。数据中心部署液冷,包括冷板式液冷和浸没式液冷成为必然选择。
英特尔数据中心平台及架构事业部主任工程师周绍荣认为,“对于浸没式液冷,冷却液体的选择最为关键。在保证冷却液体与被冷却电子元器件之间的相容性和长期可靠性的前提下,冷却液体的环境友好性,换热能力以及购买成本也是重要考量指标。”
为了给数据中心液冷产品的设计、制造、测试和验证提供统一的规范,从而加速液冷方案在数据中心的部署,英特尔还联合产业伙伴共同开发了冷板液冷关键部件的4个标准,其中冷板本身的标准将在2023年3月15日正式实施,其余3个相关标准将在23年年底之前发布。对于浸没式液冷,英特尔还独家发布了OCP规范。
关键词: