[go: up one dir, main page]

CN115793815A - 服务器的散热控制方法及系统 - Google Patents

服务器的散热控制方法及系统 Download PDF

Info

Publication number
CN115793815A
CN115793815A CN202211502241.7A CN202211502241A CN115793815A CN 115793815 A CN115793815 A CN 115793815A CN 202211502241 A CN202211502241 A CN 202211502241A CN 115793815 A CN115793815 A CN 115793815A
Authority
CN
China
Prior art keywords
server
temperature
processor
module
water outlet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211502241.7A
Other languages
English (en)
Inventor
段志桐
党光跃
张昭明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yiyike Data Equipment Technology Co ltd
Original Assignee
Shenzhen Yiyike Data Equipment Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yiyike Data Equipment Technology Co ltd filed Critical Shenzhen Yiyike Data Equipment Technology Co ltd
Priority to CN202211502241.7A priority Critical patent/CN115793815A/zh
Publication of CN115793815A publication Critical patent/CN115793815A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

本申请实施例公开了一种服务器的散热控制方法及系统。所述方法应用于服务器的散热控制系统,所述系统用于对服务器集群进行散热控制,所述服务器集群包括多个服务器,所述方法包括:针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度;针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制。通过本申请可以对服务器集群中的各服务器进行精准散热控制。

Description

服务器的散热控制方法及系统
技术领域
本申请涉及服务器散热技术领域,尤其涉及一种服务器的散热控制方法及系统。
背景技术
随着信息技术的发展,服务器散热量和机房散热密度的增长,依靠电力的精密空调散热方式,将逐渐被新型的制冷方式所取代,随着移动数据、云计算和大数据业务的迅猛发展,数据中心建设规模越来越大,单机柜密度增加,服务器设备芯片的发热量也不断增大。
传统的风冷模式不但耗电量大而且已越来越不能满足服务器的散热需求,对数据中心节能的诉求,也逐渐突显出来,因此冷板式散热的服务器技术应运而生,冷板式散热的冷量分配单元(Colant Distribution Unit,CDU)是一个为服务器集群中各个服务器节点散热冷板分配冷却液体的装置,CDU通过其内置的PLC软件获取CDU进出水口冷却液温度来统一控制服务器集群中服务器节点冷板散热模块中的冷却液流速,如果某个服务器中的CPU温度突然异常升高,但其他服务器中的CPU温度不高并且温度变化不明显,即当某一服务器节点CPU温度过高时,CDU进水口温度可能升高的不明显,导致该节点冷却液供给不足,该服务器极有可能因温度过高异常关机,严重影响客户业务,故现亟需一种可以对服务器集群中各服务器进行精准散热控制的方法,避免上述存在服务器因温度过高异常关机的问题发生。
发明内容
本申请实施例提供了一种服务器的散热控制方法及系统,可以对服务器集群中的各服务器进行精准散热控制。
第一方面,本申请实施例提供了一种服务器的散热控制方法,所述方法应用于服务器的散热控制系统,所述系统用于对服务器集群进行散热控制,所述服务器集群包括多个服务器,所述方法包括:
针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度;
针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;
根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制。
第二方面,本申请实施例还提供了一种服务器的散热控制装置,所述装置被集成于服务器的散热控制系统,所述系统用于对服务器集群进行散热控制,所述服务器集群包括多个服务器,所述装置包括:
收发单元,用于针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度;
处理单元,用于针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制。
在一些实施例中,所述处理单元在执行所述根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值步骤之前,还用于:
针对各所述服务器,通过所述收发单元获取所述服务器的处理器当前温度;
判断所述处理器当前温度是否大于处理器温度阈值;
此时,所述处理单元在执行所述根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值步骤时,具体用于:
若所述处理器当前温度小于或等于所述处理器温度阈值,则根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;
若所述处理器当前温度大于所述处理器温度阈值,则根据所述服务器对应的处理器最大设计功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值,所述处理器最大设计功率为所述服务器中处理器对应的最大设计功率。
在一些实施例中,所述处理单元在执行所述根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值步骤时,具体用于:
根据所述处理器当前功率以及预设的检测周期时长确定处理器实际放热量;
根据所述处理器实际放热量、所述进水口冷却液温度、所述出水口冷却液温度、对应冷却液的比热容以及所述冷却液的液体密度确定所述目标流量值。
在一些实施例中,所述处理单元在执行所述根据所述服务器对应的处理器最大设计功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值步骤时,具体用于:
根据所述处理器最大设计功率以及预设的检测周期时长确定处理器最大放热量;
根据所述处理器最大放热量、所述进水口冷却液温度、所述出水口冷却液温度、对应冷却液的比热容以及所述冷却液的液体密度确定所述目标流量值。
在一些实施例中,所述系统包括CDU单元以及分别设置在各所述服务器上的第一BMC芯片,所述CDU单元包括第二BMC芯片、网络交换机以及为各所述服务器分别配置的服务器散热模块,所述第二BMC芯片上运行有OpenRmc模块,各所述第一BMC芯片上运行有BMC模块,所述BMC模块通过所述网络交换机模块与所述OpenRmc模块连接,所述OpenRmc模块连接与所述服务器散热模块连接;所述针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度;所述处理单元在执行所述针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值步骤时,具体用于:
针对各所述服务器,通过所述BMC模块获取所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度;
利用所述BMC模块将所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度通过所述网络交换机模块上报至所述OpenRmc模块;
针对各所述服务器,通过所述OpenRmc模块根据所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器散热模块的目标流量值。
在一些实施例中,所述服务器散热模块包括出水泵、出水管道以及回流管道,所述出水泵设置于所述出水管道中,所述出水管道与所述对应服务器的进水口连接,所述回流管道与对应所述服务器的出水口连接,所述所述第二BMC芯片包括的PWM模块,所述PWM模块与对应的所述出水泵连接;所述处理单元在执行所述根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制步骤时,具体用于:
根据预设的流量与PWM占空比的对应关系以及各所述服务器分别对应的所述目标流量值分别确定各所出水泵的目标PWM占空比;
通过所述PWM模块,将所述目标PWM占空比分别发送至对应的所述出水泵,使得对应的所述出水泵根据所述目标PWM占空比对所述出水管道中的冷却液流量进行调节,实现对各所述服务器的散热控制。
通过所述OpenRmc模块根据所述服务器管理指令对所述服务器集群进行管理。
在一些实施例中,所述系统还包括客户端,所述客户端与所述网络交换机模块连接;
所述收发单元,还用于通过所述客户端接收服务器管理指令;通过所述网络交换机模块将所述服务器管理指令发送至所述OpenRmc模块;
所述处理单元,还用于通过所述OpenRmc模块根据所述服务器管理指令对所述服务器集群进行管理。
第三方面本申请实施例还提供了一种服务器的散热控制系统,所述系统用于执行上述任一实施例所述的服务器的散热控制方法,其中:
所述系统包括CDU单元以及分别设置在各所述服务器上的第一BMC芯片,所述CDU单元包括第二BMC芯片、网络交换机以及为各所述服务器分别配置的服务器散热模块,所述第二BMC芯片上运行有OpenRmc模块,各所述第一BMC芯片上运行有BMC模块,所述BMC模块通过所述网络交换机模块与所述OpenRmc模块连接,所述OpenRmc模块连接与所述服务器散热模块连接。
在一些实施例中,所述服务器散热模块包括出水泵、出水管道以及回流管道,所述出水泵设置于所述出水管道中,所述出水管道与对应所述服务器的进水口连接,所述回流管道与对应所述服务器的出水口连接,所述所述第二BMC芯片包括的PWM模块,所述PWM模块与对应的所述出水泵连接。
在一些实施例中,所述系统还包括客户端,所述客户端与所述网络交换机模块连接。
第四方面,本申请实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。
第五方面,本申请实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时可实现上述方法。
本申请实施例提供了一种服务器的散热控制方法及系统。其中,所述方法应用于服务器的散热控制系统,所述系统用于对服务器集群进行散热控制,所述服务器集群包括多个服务器,所述方法包括:针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度;针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制。由于本申请实施例可以针对获取到的各个服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度,分别对各服务器进行流量值计算,然后根据计算到的各服务器分别对应的流量值对各服务器分别进行散热控制,故本申请可以对服务器集群中的各服务器进行精准散热控制。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的服务器的散热控制系统的一个框架示意图;
图2为本申请实施例提供的服务器的散热控制系统的另一个框架示意图;
图3为本申请实施例提供的服务器集群中服务器的一个结构示意图;
图4为本申请实施例提供的服务器的散热控制系统与服务器集群的一个总体框图;
图5为本申请实施例提供的服务器的散热控制方法的一个流程示意图;
图6为本申请实施例提供的服务器的散热控制方法的另一个流程示意图;
图7为本申请实施例提供的服务器的散热控制装置的示意性框图;
图8为本申请实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
以下首先对本申请实施例提及的名字进行解释:
PWM:Pulse Width Modulation,脉冲宽度调制,通常用以对可调速设备进行转速调节,例如风扇的转子,泵的电机。
CDU:Colant Distribution Unit,液冷数据中心中用以冷却液流速控制的冷量分配单元。
CPU:Central Processing Unit,中央处理器。
OpenRmc:Open Rock Management Controller,基于开源的基板管理控制软件修改的机架管理软件,本申请中的OpenRmc模块运行在第二BMC芯片之上,该机架管理软件可以通过连接网络交换机来连接到机柜内各个服务器中的BMC模块来获取各个服务器的信息,例如CPU温度、系统信息、网络信息,达到批量远程管理机柜各个服务器节点的能力。
BMC:Baseboard Management Controller,基板管理控制器,用以对服务器进行监控和控制,BMC芯片通常具备PWM模块,本实施例包括设置在服务器上的第一BMC芯片以及设置在CDU单元中的第二BMC芯片,第一BMC芯片上运行有BMC模块,第二BMC芯片上运行有OpenRmc模块。
PLC:Programmable Logic Controller,一种具有微处理器的数字电子设备,用于自动化控制的数字逻辑控制器,通常用于工业控制领域。
TCO:Total Cost ofOwnership,总拥有成本。
Redfish:由分布式管理任务组(DMTF)发布的开放式行业标准规范。
请参阅图1,图1为本申请实施例提供的服务器的散热控制系统1的一个框架示意图,该系统1用于对服务器集群进行散热控制,服务器集群包括多个服务器,在一些实施例中,系统1包括CDU单元10以及分别设置在各服务器上的第一BMC芯片20,CDU单元10包括第二BMC芯片11、网络交换机模块12以及为各服务器分别配置的服务器散热模块13,第二BMC芯片11上运行有OpenRmc模块,各第一BMC芯片20上运行有BMC模块,BMC模块通过网络交换机模块12与OpenRmc模块连接,OpenRmc模块与服务器散热模块13连接。
具体地,在一些实施例中,服务器散热模块13包括出水泵131、出水管道132以及回流管道133,出水泵131设置于出水管道132中,出水管道132与对应服务器的进水口连接,回流管道133与对应服务器的出水口连接,第二BMC芯片11包括的PWM模块,PWM模块与对应的出水泵131连接。
请参阅图2,图2为本申请实施例提供的服务器的散热控制系统1的另一个框架示意图,相对于图1,系统1还包括客户端30,客户端30与网络交换机模块12连接,具体地,在一些实施例中,客户端30与网络交换机模块12直接通过网线连接。此时,用户可以通过客户端30对服务器集群中的服务器进行资产管理、服务器部署、远程更新固件等操作,其中,该客户端30可以为手机或电脑等用户终端。
本申请实施例提供的服务器的散热控制系统的CDU单元内部件的功能进行说明:
OpenRmc模块:负责收集所述服务器端中第一BMC芯片中BMC模块上传的信息数据,该信息数据包含CPU的功率(服务器的处理器当前功率)、位于服务器端进出水口冷却液(冷却水)的温度(进水口冷却液温度以及出水口冷却液温度(回流热水))、服务器整机的资产信息。在一些实施例中,该整机信息数据还包括CPU的温度(处理器当前温度),其中CPU的温度、CPU的功率、位于服务器端进出水口冷却液的温度用于控制出水泵的转速,服务器整机的资产信息用于客户端所使用的OpenRmc管理页面信息展示以及对服务器进行集群管理。
网络交换机模块:负责通过网络与各服务器端BMC模块的管理端口连接,以及负责向客户端提供OpenRmc模块的管理端口,用以批量远程管理服务器。
出水泵:负责接受来自OpenRmc模块的PWM控制,用于精准控制整机柜中每台服务器的冷板散热模块冷却液流量,泵的数量需要做冗余备份,当主泵正常的时候备用泵的转速为0,当主泵损坏的时候备用泵开始转动,提高CDU系统的稳定性。
管道部分:包括出水管道以及回流管道,出水管道用于连接CDU冷水出口以及服务器的冷却液进水口,回流管道用于连接服务器的冷却液出水口和CDU的热水入口,管道部分需要设计成冷热分离,避免一台服务器的回流热水进入下一台服务器的进水口,保证每台服务器BMC模块上报的进出水口冷却液温度的准确性,确保每台服务器冷板散热模块出水口冷却液温度的上升只与该服务器的处理器发热量相关。
请参阅图3,图3为本申请实施例提供的服务器集群中服务器的一个结构示意图,在一些实施例中,每台服务器包括两个CPU,分别为CPU1和CPU2,系统为各所述服务器分别配置有冷板散热模块,该冷板散热模块可以紧贴设置在对应服务器的表面,具体地,可以设置在服务器内部CPU的表面,当CPU发热时,通过冷板散热模块中的冷却液带走CPU的热量,并且服务器的进水口及出水口即该冷板散热模块的进水口以及出水口,并且在每个服务器内部,冷板散热模块为每个CPU都分别设置了一个冷却液流路。
本实施例在服务器面板端安装冷却液分配模块,该模块负责三个工作:1.负责采集供给到服务器的进出水口冷却液温度,并传递给服务器中的BMC模块;2.负责将冷却液平均分给每个CPU,保证每个CPU上的冷板散热装置的冷却液流速相同;3.负责将流经CPU的回流冷却液汇集到一个出水口(即汇集到回流管道),回流到CDU。其中,服务器中的BMC模块通过网线连接到CDU的内置网络交换机模块,负责提供给OpenRmc模块管理该服务器的Redfish接口,同时将该服务器的CPU功率以及服务器进出水口冷却液温度上报给OpenRmc模块。
具体地,请参阅图4,图4为本申请实施例提供的服务器的散热控制系统与服务器集群的一个总体框图。
服务器的散热控制系统中的CDU单元与各个服务器的连接如图4所示,各个服务器通过网线将BMC模块与CDU单元内置的网络交换机模块连接,CDU单元与外界冷却装置进行冷却液冷却循环,通过管道以及出水泵将冷却之后的冷却液分别输入各服务器对应的冷板散热模块,以及收集服务器冷板散热模块回流的热冷却液。
本申请实施例提供了一种服务器的散热控制方法及系统。
该服务器的散热控制方法的执行主体可以是本申请实施例提供的服务器的散热控制装置,或者集成了该服务器的散热控制装置的服务器的散热控制系统,其中,该服务器的散热控制系统的结构如图1或图2所示。
其中,本实施例提供的服务器的散热控制方法应用于服务器的散热控制系统,所述系统用于对服务器集群进行散热控制,所述服务器集群包括多个服务器,所述方法包括:针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度;针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制。
图5是本申请实施例提供的服务器的散热控制方法的流程示意图。所述方法应用于服务器的散热控制系统,所述系统用于对服务器集群进行散热控制,所述服务器集群包括多个服务器,如图5所示,该方法包括以下步骤S110-S130。
S110、针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度。
本实施例中,服务器的散热控制系统中的CDU包括OpenRmc模块、网络交换机模块,并且服务器集群中的每个服务器都设置有BMC模块,各所述BMC模块通过所述网络交换机模块与所述OpenRmc模块连接。
此时,步骤S110包括:针对各所述服务器,通过所述BMC模块获取所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度;利用所述BMC模块将所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度通过所述网络交换机模块上报至所述OpenRmc模块,使得OpenRmc模块获取到各服务器的上述数值。
具体地,根据预设的检测周期时长(例如1秒)通过BMC模块获取对应服务器内部的CPU的处理器当前功率以及获取对应服务器冷板散热模块的进水口冷却液温度以及该冷板散热模块的所述出水口冷却液温度,该进水口冷却液温度表示冷却液进入服务器的冷板散热模块时的温度,该出水口冷却液温度表示冷却液流出该服务器的冷板散热模块时的温度。
具体地,为节省能源,在执行步骤110之前,还要判断各服务器是否处于开机状态,如果处于开机状态,则为该服务器执行步骤S110,如果不是处于开机状态,则将该服务器对应的出水泵的PWM设置为0。
S120、针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值。
具体地,本实施例针对各所述服务器,通过所述OpenRmc模块根据所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值。
在本实施例中,步骤S120包括以下步骤a和步骤b:
a、根据所述处理器当前功率以及预设的检测周期时长确定处理器实际放热量。
具体地,本实施例中,检测周期时长可以为1秒,也可以由用户根据实际需要设定为其他数值,例如设定为2秒,检测周期时长的具体时间长度此处不作限定。
进一步地,本实施例通过预设的热量公式确定处理器实际放热量,其中热量公式为:Q=p*t;
其中,Q为服务器内所有处理器的处理器实际放热量(单位:焦耳),p为服务器所有处理器当前功率总和(单位:瓦特),t是检测周期时长(单位:秒)。
b、根据所述处理器实际放热量、所述进水口冷却液温度、所述出水口冷却液温度、对应冷却液的比热容以及所述冷却液的液体密度确定所述目标流量值。
具体地,首先通过预设的比热容公式确定单位时间内的冷却液质量,比热容公式为:Q=c*m*△t,从而可得,m=Q/(c*△t),Q为服务器内所有处理器的处理器实际放热量(单位:焦耳),m是冷却液的质量(单位:千克),△t是液体温升(单位:℃),其中,△t=出水口冷却液温度-进水口冷却液温度,c是液体比热容(单位:焦耳每千克摄氏度),将Q、c以及△t的数值代入即可得计算得到单位时间内的冷却液质量m。
然后通过液体质量公式确定单位时间内的液体体积,其中,液体质量公式为:V=m/ρ,ρ是液体密度(单位:千克每立方米),m为单位时间内的冷却液质量,将m以及ρ的输入值代入即可得到单位时间内的液体体积V。
其中V的单位是立方米每秒,流量单位是升每分钟,换算即得到对应出水泵的目标流量值。
S130、根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制。
在一些实施例中,步骤S130包括以下步骤:根据预设的流量与PWM占空比的对应关系以及各所述服务器分别对应的所述目标流量值分别确定所述CDU端对应出水泵的目标PWM占空比;通过所述CDU端与所述服务器对应的所述出水泵的所述PWM模块,将所述目标PWM占空比输入至CDU端对应所述服务器的对应所述出水泵,使得所述出水泵根据所述目标PWM占空比对对应所述服务器冷板散热模块中的冷却液流量进行调节,实现对各所述服务器的散热控制。
具体地,本实施例的系统中预设有流量与PWM占空比的对应关系,该对应关系可以由出水泵厂商提供,根据仿真和实测得到。需要说明的是,对于不同型号的泵,其流量与PWM占空比的对应关系不同。
在另一些实施例中,可以首先根据流量与功率的对应关系确定目标流量值对应的出水泵的目标功率,然后通过功率与PWM占空比的对应关系确定目标功率对应的PWM占空比。其中,该流量与功率的对应关系与泵的型号、冷板散热模块扬程、口径等均有关联。
需要说明的是,本实施例中的系统还包括客户端,所述客户端与所述网络交换机模块连接;所述方法还包括:通过所述客户端接收服务器管理指令;通过所述网络交换机模块将所述服务器管理指令发送至所述OpenRmc模块;通过所述OpenRmc模块根据所述服务器管理指令对所述服务器集群进行管理。
具体地,该服务器管理指令可以为服务器集群中服务器资产管理、服务器部署、远程更新固件等操作指令,根据这些指令可以分别对对应的服务器进行资产管理、服务器部署、远程更新固件等操作。
综上所述,本实施例中的服务器的散热控制系统针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度;针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制。由于本申请实施例可以针对获取到的各个服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度,分别对各服务器进行流量值计算,然后根据计算到的各服务器分别对应的流量值对各服务器分别进行散热控制,故本申请可以对服务器集群中的各服务器进行精准散热控制。
图6是本申请另一实施例提供的一种服务器的散热控制方法的流程示意图。如图6所示,本实施例的服务器的散热控制方法包括步骤S210-S270。
S210、针对各所述服务器,获取所述服务器的处理器当前功率、处理器当前温度、进水口冷却液温度以及出水口冷却液温度。
本实施例相对于图5对应实施例中的步骤S110的不同点在于,本步骤还获取了处理器当前温度,具体地,通过各服务器中的BMC模块获取对应的处理器当前温度,然后通过网络交换机模块将该服务器对应的处理器当前温度上报至所述OpenRmc模块,使得OpenRmc模块得到该处理器当前温度、处理器温度阈值和处理器最大设计功率。
其中,本实施例中获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度的具体步骤与步骤S110类似,具体此处不作赘述。
S220、判断所述处理器当前温度是否大于处理器温度阈值;若否,则执行步骤S230,若是,则执行步骤S240。
本实施例中,OpenRmc模块获取到服务器中CPU的处理器当前温度之后,将会分别判断各服务器的处理器当前温度是否大于处理器温度阈值,如果大于处理器温度阈值,则说明该服务器中的CPU的温度过高,此时,为了降低风险,需要提升出水泵冷却液流速为该服务器处理器加速降温,如果不大于处理器温度阈值,则可以按照正常步骤进行散热控制。
其中,该处理器温度阈值可以在获取处理器当前功率、处理器当前温度、进水口冷却液温度以及出水口冷却液温度时,一同从服务器端BMC模块中获取,也可以为OpenRmc模块中预先存储的一个值,并且该处理器温度阈值的具体数值此处不作限定。
S230、针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值。
本实施例中,如果处理器当前温度不大于处理器温度阈值,则可以根据根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值,其中,步骤S230与步骤S120类似,具体此处不作赘述。
S240、根据所述服务器对应的处理器最大设计功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值。
需要说明的时,该处理器最大设计功率可以在获取处理器当前功率、处理器当前温度、进水口冷却液温度以及出水口冷却液温度时,一同从服务器端BMC模块中获取,也可以只在OpenRmc模块每一次监测到对应服务器端开机时获取并将该值进行存储,其中,所述处理器最大设计功率为所述服务器中处理器厂商出厂设定的对应最大功率。
本实施例中,如果处理器当前温度大于处理器温度阈值,例如90度,而处理器温度阈值为80度,处理器当前功率是150瓦,处理器最大设计功率是300瓦,此时,需要将处理器当前功率替换为处理器最大设计功率进行目标流量值的计算,即将用作目标流量值计算的功率替换为300瓦,该处理器最大设计功率为对应CPU预设的最大功率值,为处理器厂商出厂标定的一额定值。
具体包括如下步骤A和步骤B。
A.根据所述处理器最大设计功率以及预设的检测周期时长确定处理器最大放热量。
当处理器当前温度大于处理器温度阈值时,为了加快降温,采用对应CPU的处理器最大设计功率进行目标流量值的计算,而不是采用读取到的处理器当前功率进行计算,相对于步骤S120中的步骤a,本实施例将步骤a中处理器当前功率替换为本步骤的处理器最大设计功率,然后进行处理器最大放热量(步骤a为处理器实际放热量的计算)的计算,其中,本实施例中根据处理器最大设计功率以及预设的检测周期时长确定处理器最大放热量与步骤a中根据所述处理器当前功率以及预设的检测周期时长确定处理器实际放热量的具体计算过程类似,将步骤a中的处理器当前功率替换为本步骤中的处理器最大设计功率进行计算即可,由于其的具体计算过程与步骤a类似,具体计算过程可参考步骤a,具体此处不作赘述。
B.根据所述处理器最大放热量、所述进水口冷却液温度、所述出水口冷却液温度、对应冷却液的比热容以及所述冷却液的液体密度确定所述目标流量值。
相对于步骤S120中的步骤a,本实施例将步骤a中的处理器实际放热量替换为本步骤的处理器最大放热量进行计算,根据所述处理器最大放热量、所述进水口冷却液温度、所述出水口冷却液温度、对应冷却液的比热容以及所述冷却液的液体密度确定所述目标流量值与步骤b中根据所述处理器实际放热量、所述进水口冷却液温度、所述出水口冷却液温度、对应冷却液的比热容以及所述冷却液的液体密度确定所述目标流量值的具体计算过程类似,将步骤b中的处理器实际放热量替换为本步骤中的处理器最大放热量即可,由于其具体计算过程与步骤b类似,具体计算过程可参考步骤b,具体此处不作赘述。
S250、根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制。
本步骤与图5对应实施例中的步骤S130类似,具体此处不作赘述。
需要说明的是,本实施例中的系统还包括客户端,所述客户端与所述网络交换机模块连接;所述方法还包括:通过所述客户端接收服务器管理指令;通过所述网络交换机模块将所述服务器管理指令发送至所述OpenRmc模块;通过所述OpenRmc模块根据所述服务器管理指令对所述服务器集群进行管理。
具体地,该服务器管理指令可以为服务器集群中服务器资产管理、服务器部署、远程更新固件等操作指令,根据这些指令可以分别对对应的服务器进行资产管理、服务器部署、远程更新固件等操作。
综上所述,本实施例中的服务器的散热控制系统针对各所述服务器,获取所述服务器的处理器当前功率、处理器当前温度、进水口冷却液温度以及出水口冷却液温度;针对各所述服务器,根据所述服务器对应的所述处理器当前功率、处理器当前温度、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制。由于本申请实施例可以针对获取到的各个服务器的处理器当前功率、处理器当前温度、进水口冷却液温度以及出水口冷却液温度,分别对各服务器进行流量值计算,然后根据计算到的各服务器分别对应的流量值对各服务器分别进行散热控制,故本申请可以对服务器集群中的各服务器进行精准散热控制。
该申请提供的服务器的散热控制系统主要适用于使用冷板式服务器构建的液冷数据中心,将CDU部分和服务器批量管理部分集成到一个系统中,该系统运作流程如下:
1、在初始运行时,先将冷却液通入CDU进行初始的冷却液循环,避免出水泵空转。
2、CDU系统先上电,完成OpenRmc模块的初始化、网络交换机模块的初始化、将连接到OpenRmc模块的出水泵初始化,将主管道冷却液流速稳定在固定流速,将连接到OpenRmc模块的出水泵流速设定到10%占空比(安全转速),使出水泵泵连接到的各个服务器设备上的液冷冷板散热模块中的冷却液有一个初始的循环流速。
3、服务器集群中的服务器上电,服务器会根据BMC模块设定的电源启动策略进行有序启动。
4、CDU单元中的OpenRmc模块通过Redfish和网络交换机模块定时(如1秒)收集机柜内所有服务器端BMC模块的信息,包含CPU的温度、CPU的功率、位于服务器端进出水口冷却液的温度。收集到的单节点服务器的CPU的温度、CPU的功率、位于服务器端进出水口冷却液的温度用于控制连接BMC芯片的出水泵的转速,出水泵的转速控制流程可参考图5或图6实施例的对应部分,具体此处不作赘述。
大规模部署冷板式液冷服务器集群后,通过将流体泵和服务器集群管理软件OpenRmc结合,构造一个可以批量管理机柜BMC模块,并且可以精确控制冷板式液冷服务器中冷板散热模块冷却液流量的装置,可以节约机柜的空间,摆放更多服务器。使用运行在BMC芯片上的OpenRmc开源软件,将泵的PWM信号连接到BMC芯片的PWM引脚上,复用BMC芯片的PWM控制功能,降低了CDU软件开发难度和硬件设计难度的同时还可以精准地对泵的转速进行控制,还能降低客户在液冷数据中心的TCO,达到节约企业在液冷数据中心建设的开支的目的。
可见,本申请至少还包括以下有益效果:
1、将CDU和服务器远程管理软件结合,在精确控制服务器节点泵流量的同时还可以提供批量管理服务器的功能,节约机柜空间,容纳更多的服务器,降低企业拥有成本。
2、复用BMC芯片的PWM管脚,将硬件PWM信号连接到泵,用以控制泵的流量,由于BMC芯片功耗很低,能大幅降低数据中心的电量消耗。
3、使用开源基板管理控制软件架构搭建的OpenRmc方案,不需要企业额外购买代码,节约了企业开发成本。
图7是本申请实施例提供的一种服务器的散热控制装置的示意性框图。如图7所示,对应于以上服务器的散热控制方法,本申请还提供一种服务器的散热控制装置。所述装置被集成于服务器的散热控制系统,所述系统用于对服务器集群进行散热控制,所述服务器集群包括多个服务器。具体地,请参阅图7,该服务器的散热控制装置700包括收发单元701以及处理单元702。
收发单元701,用于针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度;
处理单元702,用于针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制。
在一些实施例中,所述处理单元702在执行所述根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值步骤之前,还用于:
针对各所述服务器,通过所述收发单元701获取所述服务器的处理器当前温度;
判断所述处理器当前温度是否大于处理器温度阈值;
此时,所述处理单元702在执行所述根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值步骤时,具体用于:
若所述处理器当前温度小于或等于所述处理器温度阈值,则根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;
若所述处理器当前温度大于所述处理器温度阈值,则根据所述服务器对应的处理器最大设计功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值,所述处理器最大设计功率为所述服务器中处理器对应的最大设计功率。
在一些实施例中,所述处理单元702在执行所述根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值步骤时,具体用于:
根据所述处理器当前功率以及预设的检测周期时长确定处理器实际放热量;
根据所述处理器实际放热量、所述进水口冷却液温度、所述出水口冷却液温度、对应冷却液的比热容以及所述冷却液的液体密度确定所述目标流量值。
在一些实施例中,所述处理单元702在执行所述根据所述服务器对应的处理器最大设计功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值步骤时,具体用于:
根据所述处理器最大设计功率以及预设的检测周期时长确定处理器最大放热量;
根据所述处理器最大放热量、所述进水口冷却液温度、所述出水口冷却液温度、对应冷却液的比热容以及所述冷却液的液体密度确定所述目标流量值。
在一些实施例中,所述系统包括CDU单元以及分别设置在各所述服务器上的第一BMC芯片,所述CDU单元包括第二BMC芯片、网络交换机以及为各所述服务器分别配置的服务器散热模块,所述第二BMC芯片上运行有OpenRmc模块,各所述第一BMC芯片上运行有BMC模块,所述BMC模块通过所述网络交换机模块与所述OpenRmc模块连接,所述OpenRmc模块连接与所述服务器散热模块连接;所述针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度;所述处理单元702在执行所述针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值步骤时,具体用于:
针对各所述服务器,通过所述BMC模块获取所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度;
利用所述BMC模块将所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度通过所述网络交换机模块上报至所述OpenRmc模块;
针对各所述服务器,通过所述OpenRmc模块根据所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器散热模块的目标流量值。
在一些实施例中,所述服务器散热模块包括出水泵、出水管道以及回流管道,所述出水泵设置于所述出水管道中,所述出水管道与所述对应服务器的进水口连接,所述回流管道与对应所述服务器的出水口连接,所述所述第二BMC芯片包括的PWM模块,所述PWM模块与对应的所述出水泵连接;所述处理单元702在执行所述根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制步骤时,具体用于:
根据预设的流量与PWM占空比的对应关系以及各所述服务器分别对应的所述目标流量值分别确定各所出水泵的目标PWM占空比;
通过所述PWM模块,将所述目标PWM占空比分别发送至对应的所述出水泵,使得对应的所述出水泵根据所述目标PWM占空比对所述出水管道中的冷却液流量进行调节,实现对各所述服务器的散热控制。
通过所述OpenRmc模块根据所述服务器管理指令对所述服务器集群进行管理。
在一些实施例中,所述系统还包括客户端,所述客户端与所述网络交换机模块连接;
所述收发单元701,还用于通过所述客户端接收服务器管理指令;通过所述网络交换机模块将所述服务器管理指令发送至所述OpenRmc模块;
所述处理单元702,还用于通过所述OpenRmc模块根据所述服务器管理指令对所述服务器集群进行管理。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述服务器的散热控制装置和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述服务器的散热控制装置可以实现为一种计算机程序的形式,该计算机程序可以在如图8所示的计算机设备上运行。
请参阅图8,图8是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备800可以是服务器的散热控制系统中的控制装置,所述系统用于对服务器集群进行散热控制,所述服务器集群包括多个服务器。
参阅图8,该计算机设备800包括通过系统总线801连接的处理器802、存储器和网络接口805,其中,存储器可以包括非易失性存储介质803和内存储器804。
该非易失性存储介质803可存储操作系统8031和计算机程序8032。该计算机程序8032包括程序指令,该程序指令被执行时,可使得处理器802执行一种服务器的散热控制方法。
该处理器802用于提供计算和控制能力,以支撑整个计算机设备800的运行。
该内存储器804为非易失性存储介质803中的计算机程序8032的运行提供环境,该计算机程序8032被处理器802执行时,可使得处理器802执行一种服务器的散热控制方法。
该网络接口805用于与其它设备进行网络通信。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备800的限定,具体的计算机设备800可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器802用于运行存储在存储器中的计算机程序8032,以实现如下步骤:
针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度;
针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;
根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制。
应当理解,在本申请实施例中,处理器802可以是中央处理单元(CentralProcessing Unit,CPU),该处理器802还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本申请还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中计算机程序包括程序指令。该程序指令被处理器执行时使处理器执行如下步骤:
针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度;
针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;
根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种服务器的散热控制方法,其特征在于,所述方法应用于服务器的散热控制系统,所述系统用于对服务器集群进行散热控制,所述服务器集群包括多个服务器,所述方法包括:
针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度;
针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;
根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制。
2.根据权利要求1所述的方法,其特征在于,所述根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值之前,所述方法包括:
针对各所述服务器,获取所述服务器的处理器当前温度;
判断所述处理器当前温度是否大于处理器温度阈值;
所述根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值,包括:
若所述处理器当前温度小于或等于所述处理器温度阈值,则根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值;
若所述处理器当前温度大于所述处理器温度阈值,则根据所述服务器对应的处理器最大设计功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值,所述处理器最大设计功率为所述服务器中处理器对应的最大设计功率。
3.根据权利要求2所述的方法,其特征在于,所述根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值,包括:
根据所述处理器当前功率以及预设的检测周期时长确定处理器实际放热量;
根据所述处理器实际放热量、所述进水口冷却液温度、所述出水口冷却液温度、对应冷却液的比热容以及所述冷却液的液体密度确定所述目标流量值。
4.根据权利要求2所述的方法,其特征在于,所述根据所述服务器对应的处理器最大设计功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值,包括:
根据所述处理器最大设计功率以及预设的检测周期时长确定处理器最大放热量;
根据所述处理器最大放热量、所述进水口冷却液温度、所述出水口冷却液温度、对应冷却液的比热容以及所述冷却液的液体密度确定所述目标流量值。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述系统包括CDU单元以及分别设置在各所述服务器上的第一BMC芯片,所述CDU单元包括第二BMC芯片、网络交换机模块以及为各所述服务器分别配置的服务器散热模块,所述第二BMC芯片上运行有OpenRmc模块,各所述第一BMC芯片上运行有BMC模块,所述BMC模块通过所述网络交换机模块与所述OpenRmc模块连接,所述OpenRmc模块连接与所述服务器散热模块连接;所述针对各所述服务器,获取所述服务器的处理器当前功率、进水口冷却液温度以及出水口冷却液温度;针对各所述服务器,根据所述服务器对应的所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器的目标流量值,包括:
针对各所述服务器,通过所述BMC模块获取所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度;
利用所述BMC模块将所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度通过所述网络交换机模块上报至所述OpenRmc模块;
针对各所述服务器,通过所述OpenRmc模块根据所述处理器当前功率、所述进水口冷却液温度以及所述出水口冷却液温度确定所述服务器散热模块的目标流量值。
6.根据权利要求5所述的方法,其特征在于,所述服务器散热模块包括出水泵、出水管道以及回流管道,所述出水泵设置于所述出水管道中,所述出水管道与所述对应服务器的进水口连接,所述回流管道与对应所述服务器的出水口连接,所述所述第二BMC芯片包括的PWM模块,所述PWM模块与对应的所述出水泵连接;所述根据各所述服务器分别对应的所述目标流量值分别对各所述服务器进行散热控制,包括:
根据预设的流量与PWM占空比的对应关系以及各所述服务器分别对应的所述目标流量值分别确定各所出水泵的目标PWM占空比;
通过所述PWM模块,将所述目标PWM占空比分别发送至对应的所述出水泵,使得对应的所述出水泵根据所述目标PWM占空比对所述出水管道中的冷却液流量进行调节,实现对各所述服务器的散热控制。
7.根据权利要求5所述的方法,其特征在于,所述系统还包括客户端,所述客户端与所述网络交换机模块连接;所述方法还包括:
通过所述客户端接收服务器管理指令;
通过所述网络交换机模块将所述服务器管理指令发送至所述OpenRmc模块;
通过所述OpenRmc模块根据所述服务器管理指令对所述服务器集群进行管理。
8.一种服务器的散热控制系统,其特征在于,所述系统用于执行如权利要求1至7中任一项所述的方法,其中:
所述系统包括CDU单元以及分别设置在各所述服务器上的第一BMC芯片,所述CDU单元包括第二BMC芯片、网络交换机模块以及为各所述服务器分别配置的服务器散热模块,所述第二BMC芯片上运行有OpenRmc模块,各所述第一BMC芯片上运行有BMC模块,所述BMC模块通过所述网络交换机模块与所述OpenRmc模块连接,所述OpenRmc模块连接与所述服务器散热模块连接。
9.根据权利要求8所述的系统,其特征在于,所述服务器散热模块包括出水泵、出水管道以及回流管道,所述出水泵设置于所述出水管道中,所述出水管道与对应所述服务器的进水口连接,所述回流管道与对应所述服务器的出水口连接,所述所述第二BMC芯片包括的PWM模块,所述PWM模块与对应的所述出水泵连接。
10.根据权利要求8或9任一项所述的系统,其特征在于,所述系统还包括客户端,所述客户端与所述网络交换机模块连接。
CN202211502241.7A 2022-11-28 2022-11-28 服务器的散热控制方法及系统 Pending CN115793815A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211502241.7A CN115793815A (zh) 2022-11-28 2022-11-28 服务器的散热控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211502241.7A CN115793815A (zh) 2022-11-28 2022-11-28 服务器的散热控制方法及系统

Publications (1)

Publication Number Publication Date
CN115793815A true CN115793815A (zh) 2023-03-14

Family

ID=85442216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211502241.7A Pending CN115793815A (zh) 2022-11-28 2022-11-28 服务器的散热控制方法及系统

Country Status (1)

Country Link
CN (1) CN115793815A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119653705A (zh) * 2024-11-25 2025-03-18 苏州元脑智能科技有限公司 冷却液流量的调控方法和装置、存储介质及电子设备
CN119882964A (zh) * 2025-03-28 2025-04-25 苏州元脑智能科技有限公司 液冷模组、服务器和服务器的控制方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107105608A (zh) * 2017-06-29 2017-08-29 郑州云海信息技术有限公司 一种服务器散热系统及基于该系统的液体流量控制方法
CN111221398A (zh) * 2020-01-19 2020-06-02 苏州浪潮智能科技有限公司 一种传统服务器水冷风冷两用冗余散热器及其使用方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107105608A (zh) * 2017-06-29 2017-08-29 郑州云海信息技术有限公司 一种服务器散热系统及基于该系统的液体流量控制方法
CN111221398A (zh) * 2020-01-19 2020-06-02 苏州浪潮智能科技有限公司 一种传统服务器水冷风冷两用冗余散热器及其使用方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119653705A (zh) * 2024-11-25 2025-03-18 苏州元脑智能科技有限公司 冷却液流量的调控方法和装置、存储介质及电子设备
CN119882964A (zh) * 2025-03-28 2025-04-25 苏州元脑智能科技有限公司 液冷模组、服务器和服务器的控制方法
CN119882964B (zh) * 2025-03-28 2025-08-22 苏州元脑智能科技有限公司 液冷模组、服务器和服务器的控制方法

Similar Documents

Publication Publication Date Title
CN107346163B (zh) 服务器机架电力管理
JP6663970B2 (ja) システム電源管理方法及び計算機システム
US10402207B2 (en) Virtual chassis management controller
US7272732B2 (en) Controlling power consumption of at least one computer system
CN100487630C (zh) 一种实现可变风量分区控制的方法和系统框架
US10976793B2 (en) Mass storage device electrical power consumption monitoring
US20130110926A1 (en) Method for Controlling Rack System
CN105868077B (zh) 一种获取整机柜服务器节点监控信息的方法
US20080184044A1 (en) Method of managing power consumption for collections of computer systems
US10587935B2 (en) System and method for automatically determining server rack weight
CN115793815A (zh) 服务器的散热控制方法及系统
CN105952675A (zh) 计算机风扇控制方法及风扇控制系统
US10216212B1 (en) Operating temperature-based mass storage device management
CN116382439A (zh) 服务器风扇的控制方法、装置、计算机设备及存储介质
CN110701084A (zh) 电子系统内的风扇控制方法
CN118815738A (zh) 服务器及其风扇调速方法、装置、设备及失性存储介质
CN110674007A (zh) 一种服务器散热系统、方法和装置及整机柜服务器
TW201816276A (zh) 機櫃風扇控制方法及模組
TW201710895A (zh) 伺服器機櫃監控方法
CN111324503A (zh) 机框管理装置、方法和计算机可读存储介质
CN109917900A (zh) 系统电源管理方法及计算机系统
US20170091133A1 (en) Universal sleds server architecture
CN103049050B (zh) 一种刀片服务器的扩容配置方法及管理系统
CN116498592A (zh) 风扇转速平稳调控方法、系统、终端及存储介质
CN115826712A (zh) 服务器散热控制方法、装置及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination