金字招牌,诚信至上:芯片级精密冷却技术,JetCool CEO 谈数千个微型喷射冷却装置将如何走进数据中心
作者:金年会发布时间:2025-01-18
随着芯片温度和机柜密度的不断提高,众多公司纷纷提出了对未来冷却技术的愿景。
人工智能及其他高密度工作负载的冷却需求已超越传统空气冷却系统的能力,需要某种形式的液体冷却。
JetCool首席执行官Bernie Malouin解释道:“在液体冷却的技术领域,我们看到三种主要类别。”
▌冷却技术的三大类别
1. 单相浸没冷却
“这是将设备浸入油中。这种方式有趣,但在芯片功率方面有一些限制——长时间以来它们被限制在400W。尽管有人试图提高这一功率,但与实际需求相比仍显不足。”
2. 两相介电冷却
“这一类可以处理更高的热设计功率(TDP)处理器,功率可达900-1000W。从技术上讲,这适用于计算的未来,但受限于化学物质的使用。”
许多两相冷却方案使用全氟烷基物质(PFAS),即所谓的“永久化学品”,与健康风险相关,并在美国和欧洲受到限制。尽管像ZutaCore这样的公司承诺在2026年前转向其他解决方案,但进展较慢。
“我们的客户对这些化学物质的安全性和持续供应感到担忧,因此转向我们寻求解决方案,”Malouin说道。
3. 直接液冷(DLC)冷却板
“我们属于这一类别,”Malouin说。“当然,还有其他公司。”
DLC冷却板是一种最古老的IT液冷形式,通过直接将冷却液引入安装在发热组件上的金属板来散热。尽管这种方法长期被高性能计算社区采用,但JetCool认为是时候对这一概念进行升级了。
▌微喷射冷却的创新
JetCool的技术通过冷却喷嘴直接将冷却液引导至芯片表面。“我们设计了数千个微型冷却喷嘴,并与主要芯片制造商(如英特尔、AMD和英伟达)合作,智能分布这些喷嘴,使其与芯片的热源对齐。”
这种微对流冷却方法不再将芯片视为一个整体冷却单元,而是根据不同部分的热需求进行针对性冷却。“芯片的不同部分有不同的热负载和温度要求,”Malouin解释道。
例如,高带宽内存(HBM)部分可能功率较低,但对温度更敏感,而核心部分功率较高且允许的温度也更高。这种方式可以为不同区域提供精准冷却。
▌设施级液冷和未来发展
Malouin相信,数据中心的未来在于设施级液冷,但JetCool也为那些希望逐步尝试液冷的用户提供了独立的冷却系统。通过与戴尔合作,公司推出了一个面向双插槽部署的解决方案。该系统由两个小型泵模块提供冷却液循环,并通过空气热交换器排出热量。
“尽管增加了泵的能耗,但风扇功率可以大幅降低,使噪音减少15-20分贝。总体上,我们每台服务器节省约100W功率,”Malouin表示。

他补充道,对于10个机柜以上的部署,设施级液冷更加合理。他提到,系统可以灵活适应不同的入口温度。“我们甚至可以处理入口冷却液温度高达60°C(140°F)的场景,同时仍能为满负载设备提供冷却。”
▌能源效率的突破
JetCool还是美国能源部COOLERCHIPS项目的一部分,旨在显著提升数据中心冷却系统的性能。JetCool获得了超过100万美元的资助,不仅专注于冷却潜力,还涉及一个诱人的附加效益:通过减少半导体泄漏电流,提高芯片的电效率达8%-10%金年会金字招牌。
未来,Malouin展望更深层次的技术集成,比如将冷却系统嵌入硅片中,并与外部热能回收系统配合。“我们认为这将带来数据中心效率的重大飞跃。”
目前,JetCool的技术已支持最大功率为900W的英伟达GPU,同时冷却某些定制芯片,其功率达到1500W。
“如果想要运行生成式人工智能,不仅是未来,甚至是现在,都需要依靠液体冷却,”Malouin总结道。
-end-本文由“壹伴编辑器”提供技术支持*版权声明:尊重原创,内容素材来源于网络,若涉及版权问题,请及时联系进行删除或合作事宜。