[go: up one dir, main page]

CN105868077B - 一种获取整机柜服务器节点监控信息的方法 - Google Patents

一种获取整机柜服务器节点监控信息的方法 Download PDF

Info

Publication number
CN105868077B
CN105868077B CN201610222967.3A CN201610222967A CN105868077B CN 105868077 B CN105868077 B CN 105868077B CN 201610222967 A CN201610222967 A CN 201610222967A CN 105868077 B CN105868077 B CN 105868077B
Authority
CN
China
Prior art keywords
node
cmd
bmc
server
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610222967.3A
Other languages
English (en)
Other versions
CN105868077A (zh
Inventor
苏孝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IEIT Systems Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201610222967.3A priority Critical patent/CN105868077B/zh
Publication of CN105868077A publication Critical patent/CN105868077A/zh
Application granted granted Critical
Publication of CN105868077B publication Critical patent/CN105868077B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Computer And Data Communications (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

本发明公开了一种获取整机柜服务器节点监控信息的方法,其具体实现过程为:设置硬件部分,在由若干服务器节点组成的整机柜服务器内,每个服务器节点内置BMC芯片,在整机柜服务器中安装集中监控管理单元RMC和节点中板;在BMC中增加OEM命令模块;定义节点的BMC OEM CMD模块的具体数据格式,即OEM命令采用CMD模块格式,支持多个CMD模块同时获取和发送;节点中板给BMC发送OEM CMD模块数据获取节点信息;RMC从节点中板间获取节点信息,实时监控和散热调控。该一种获取整机柜服务器节点监控信息的方法与现有技术相比,简化了节点BMC和节点中板的通信过程,节点中板可一次从节点BMC中获取大量数据,尤其是实时变化信息,对提高系统响应时间大有裨益,实用性强。

Description

一种获取整机柜服务器节点监控信息的方法
技术领域
本发明涉及计算机技术领域,具体地说是一种实用性强、获取整机柜服务器节点监控信息的方法。
背景技术
随着计算机技术的发展,整机柜服务器在实际应用中尤其是在大型数据中心应用越来越广泛,整机柜信息一般由RMC(Rack Management Controller)来统一管理、集中监控。在整机柜服务器系统中,每一层(一般是4U)服务器节点通过I2C与节点中板连接,整机柜中每层节点中板通过I2C连接到上层集中监控管理系统RMC。节点中板发送命令给本层每个节点BMC获取节点信息,RMC发送命令给每层节点中板间接获取节点监控信息。目前节点中板通常通过标准IPMI命令获取本层节点sensor,网络,FRU等信息。但是标准IPMI命令存在的问题是数据格式中包含信息量较少,而节点中板需要从节点获取的信息量较多,这样节点中板必定要发送很多IPMI 命令给BMC来获取节点信息,造成两者的交互效率低,对于CPU温度、内存温度、进风口温度等散热策略需要用到的的实时变化信息,往往因为信息获取速度慢,采集数据不及时造成整机柜散热效果较差,风扇墙和节点功耗也不能有效降低。因此,实现一种能快速高效获取整机柜服务器节点监控信息的方法,成为设计和开发人员亟需解决的问题。
发明内容
本发明的技术任务是针对以上不足之处,提供一种实用性强、获取整机柜服务器节点监控信息的方法。
一种获取整机柜服务器节点监控信息的方法,其具体实现过程为:
设置硬件部分,在由若干服务器节点组成的整机柜服务器内,每个服务器节点内置BMC芯片,在整机柜服务器中安装集中监控管理单元RMC和节点中板;
在BMC中增加OEM命令模块;
定义节点的BMC OEM CMD模块的具体数据格式,即OEM命令采用CMD模块格式,支持多个CMD模块同时获取和发送;
节点中板给BMC发送OEM CMD模块数据获取节点信息;
RMC从节点中板间获取节点信息,实时监控和散热调控。
所述整机柜服务器为4U服务器,每一层的服务器节点均通过I2C与节点中板连接,整机柜服务器中每层的节点中板通过I2C连接到上层集中监控管理系统RMC。
定义节点BMC OEM CMD模块具体数据格式的详细过程为:该CMD模块包括sensorCMD、网络CMD、FRU CMD三部分,在sensor CMD中,定义CPU温度、节点进出风温度、内存温度、电压、节点功耗、节点开关机状态、健康状态的数据格式;在网络CMD中,支持BMC share NIC和专口网络信息获取和设置;在FRU CMD中,支持Product Name、Product Serial、ChassisExtra字段同时获取和设置。
所述节点中板和节点BMC之间通信使用IPMB通信接口通信连接。
节点中板和节点BMC之间通过CMD模块进行通讯,该CMD模块支持获取和设置命令,用于节点中板从节点获取信息和设置节点信息,每条CMD信息包括三部分:
CMD Index,即区分不同的CMD;
CMD length,即具体数据长度;
CMD data,即具体数据格式定义,每一个CMD模块的CMD data部分包含若干节点BMC监控管理信息。
本发明的一种获取整机柜服务器节点监控信息的方法,具有以下优点:
本发明的一种获取整机柜服务器节点监控信息的方法,通过节点中板基于BMC中OEM CMD模块方式实现整机柜节点监控信息实时获取,简化了节点BMC和节点中板的通信过程,大大减少了RMC获取节点信息的时间,提高了获取效率,节点中板可一次从节点BMC中获取大量数据,尤其是实时变化信息,大大提高了系统响应时间;RMC能根据CPU,内存,进风口温度等实时信息快速调整控制风扇转速,不仅提高了散热效果,也能进一步降低节点功耗,实用性强,易于推广。
附图说明
附图1为本发明的实现流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
如附图1所示,本发明提供一种获取整机柜服务器节点监控信息的方法,通过整机柜服务器集中监控管理单元(RMC,Rack Management Controler)和节点中板,基于节点BMC中增加的OEM命令模块更快速高效地从节点BMC获取信息,如服务器节点开关机状态、温度信息、网络信息、FRU信息,资产信息,节点功耗等。
其具体实现过程为:
设置硬件部分,在由若干服务器节点组成的整机柜服务器内,每个服务器节点内置BMC芯片,在整机柜服务器中安装集中监控管理单元RMC和节点中板;
在BMC中增加OEM命令模块;
定义节点的BMC OEM CMD模块的具体数据格式,即OEM命令采用CMD模块格式,支持多个CMD模块同时获取和发送;
节点中板给BMC发送OEM CMD模块数据获取节点信息;
RMC从节点中板间获取节点信息,实时监控和散热调控。
所述整机柜服务器为4U服务器,每一层的服务器节点均通过I2C与节点中板连接,整机柜服务器中每层的节点中板通过I2C连接到上层集中监控管理系统RMC。
定义节点BMC OEM CMD模块具体数据格式的详细过程为:该CMD模块包括sensorCMD、网络CMD、FRU CMD三部分,在传感器模块sensor CMD中,将CPU温度、节点进出风温度、内存温度、电压、节点功耗、节点开关机状态、健康状态等数据格式定义好,在网络CMD模块中同时支持BMC share NIC和专口网络信息获取和设置,在FRU CMD模块中,即现场可更换部件field-replaceable unit模块,支持Product Name、Product Serial、Chassis Extra等字段同时获取和设置。
所述节点中板和节点BMC之间通信使用IPMB通信接口通信连接。
节点中板和节点BMC之间通过CMD模块进行通讯,该CMD模块支持获取和设置命令,用于节点中板从节点获取信息和设置节点信息,每条CMD信息包括三部分:
CMD Index,即区分不同的CMD;
CMD length,即具体数据长度;
CMD data,即具体数据格式定义,每一个CMD模块的CMD data部分包含若干节点BMC监控管理信息。
本发明提出的快速高效获取整机柜服务器节点监控信息的方法,简化了节点BMC和节点中板的通信过程,节点中板可一次从节点BMC中获取大量数据,尤其是实时变化信息,对提高系统响应时间大有裨益。对于整机柜散热调速,由于RMC能通过节点中板快速一次获取到CPU、内存、进风口温度等信息,在节点负载变化时就能很快根据当前散热状况调整风扇转速,提高散热效果,同时也能大大降低风扇墙和节点功耗。
上述具体实施方式仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述具体实施方式,任何符合本发明的一种获取整机柜服务器节点监控信息的方法的权利要求书的且任何所述技术领域的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。

Claims (2)

1.一种获取整机柜服务器节点监控信息的方法,其特征在于,其具体实现过程为:
设置硬件部分,在由若干服务器节点组成的整机柜服务器内,每个服务器节点内置BMC芯片,在整机柜服务器中安装集中监控管理单元RMC和节点中板;
在BMC中增加OEM命令模块;
定义节点的BMC OEM CMD模块的具体数据格式,即OEM命令采用CMD模块格式,支持多个CMD模块同时获取和发送;
节点中板给BMC发送OEM CMD模块数据获取节点信息;
RMC从节点中板间获取节点信息,实时监控和散热调控;
定义节点BMC OEM CMD模块具体数据格式的详细过程为:该CMD模块包括sensor CMD、网络CMD、FRU CMD三部分,在sensor CMD中,定义CPU温度、节点进出风温度、内存温度、电压、节点功耗、节点开关机状态的数据格式;在网络CMD中,支持BMC共用网卡和专口网络信息获取和设置;在FRU CMD中,支持Product Name、Product Serial、Chassis Extra字段同时获取和设置;
所述节点中板和节点BMC之间通信使用IPMB通信接口通信连接;
节点中板和节点BMC之间通过CMD模块进行通讯,该CMD模块支持获取和设置命令,用于节点中板从节点获取信息和设置节点信息,每条CMD信息包括三部分:
CMD Index,即区分不同的CMD;
CMD length,即具体数据长度;
CMD data,即具体数据格式定义,每一个CMD模块的CMD data部分包含若干节点BMC监控管理信息。
2.根据权利要求1所述的一种获取整机柜服务器节点监控信息的方法,其特征在于,所述整机柜服务器为4U服务器,每一层的服务器节点均通过I2C与节点中板连接,整机柜服务器中每层的节点中板通过I2C连接到上层集中监控管理系统RMC。
CN201610222967.3A 2016-04-12 2016-04-12 一种获取整机柜服务器节点监控信息的方法 Active CN105868077B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610222967.3A CN105868077B (zh) 2016-04-12 2016-04-12 一种获取整机柜服务器节点监控信息的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610222967.3A CN105868077B (zh) 2016-04-12 2016-04-12 一种获取整机柜服务器节点监控信息的方法

Publications (2)

Publication Number Publication Date
CN105868077A CN105868077A (zh) 2016-08-17
CN105868077B true CN105868077B (zh) 2018-09-25

Family

ID=56637476

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610222967.3A Active CN105868077B (zh) 2016-04-12 2016-04-12 一种获取整机柜服务器节点监控信息的方法

Country Status (1)

Country Link
CN (1) CN105868077B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326050A (zh) * 2016-08-18 2017-01-11 浪潮电子信息产业股份有限公司 一种整机柜服务器自动化监控管理方法
CN106339294A (zh) * 2016-08-29 2017-01-18 浪潮电子信息产业股份有限公司 一种电压监控系统及方法
CN107977273A (zh) * 2016-10-25 2018-05-01 郑州云海信息技术有限公司 一种机柜中结点信息采集内存共享的内存优化方法
CN107979502A (zh) * 2016-10-25 2018-05-01 郑州云海信息技术有限公司 一种服务器中板兼容不同类型结点监控的方法及流程
CN106528308B (zh) * 2016-11-25 2019-07-02 山东浪潮人工智能研究院有限公司 一种服务器传感器信息采集方法
CN106850814B (zh) * 2017-02-15 2020-02-14 浪潮集团有限公司 一种增加自定义命令支持实现传感器信息采集的方法
CN107302465B (zh) * 2017-08-18 2021-06-29 郑州云海信息技术有限公司 一种PCIe Switch服务器整机管理方法
CN107623591A (zh) * 2017-08-28 2018-01-23 北京云集智造科技有限公司 一种服务器通用监控方法及装置
CN109240891A (zh) * 2018-09-26 2019-01-18 郑州云海信息技术有限公司 一种sr整机柜服务器的监控方法及装置
CN113204361A (zh) * 2021-05-20 2021-08-03 山东英信计算机技术有限公司 一种整机柜服务器自动配置方法及装置
CN115150304B (zh) * 2022-07-29 2023-06-02 苏州浪潮智能科技有限公司 服务器节点IPv6网络的监控方法、系统、装置及介质
CN120560949B (zh) * 2025-07-30 2025-09-23 苏州元脑智能科技有限公司 整机柜服务器节点监控方法、系统、计算机设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224756A (zh) * 2015-10-14 2016-01-06 浪潮电子信息产业股份有限公司 一种获取SmartRack整机柜风量的设计方法
CN105389242A (zh) * 2015-10-14 2016-03-09 浪潮电子信息产业股份有限公司 一种实现批量获取整机柜服务器信息的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224756A (zh) * 2015-10-14 2016-01-06 浪潮电子信息产业股份有限公司 一种获取SmartRack整机柜风量的设计方法
CN105389242A (zh) * 2015-10-14 2016-03-09 浪潮电子信息产业股份有限公司 一种实现批量获取整机柜服务器信息的方法

Also Published As

Publication number Publication date
CN105868077A (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
CN105868077B (zh) 一种获取整机柜服务器节点监控信息的方法
CN107346163B (zh) 服务器机架电力管理
US8656003B2 (en) Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed
CN114442794B (zh) 服务器功耗控制方法、系统、终端及存储介质
CN205315328U (zh) 一种服务器的智能散热系统
CN103118103A (zh) 一种可实现多节点间互联与管理的云服务器架构
CN102289402A (zh) 一种基于物理多分区计算机体系结构的监控管理方法
CN103926994A (zh) 一种基于me的服务器动态能耗管理及修正方法
CN112114650B (zh) 一种功耗调控方法、装置、设备及可读存储介质
CN106598183A (zh) 一种适用于多节点服务器的两级风扇调控系统及方法
CN105389244A (zh) 一种服务器监控方法及装置
CN104035849A (zh) 一种防止Rack机柜风扇管理失效的方法
US20140317267A1 (en) High-Density Server Management Controller
CN119271023B (zh) 一种服务器散热系统、方法及基板管理控制器
CN112000501A (zh) 一种多节点分区服务器访问i2c设备的管理系统
CN105630723A (zh) 基于异构处理器平台的管理架构及其管理方法
CN106502355A (zh) 一种Rack服务器电源进风温度获取方法
CN102520783A (zh) 一种可以实现smartrack节能的方法及机柜系统
CN105224756A (zh) 一种获取SmartRack整机柜风量的设计方法
CN112732035B (zh) 一种温度实时监控和风扇管理装置和服务器
CN103984394A (zh) 一种高密度、节能刀片服务器系统
CN103970632A (zh) 一种Smart Rack机柜恢复风扇默认转速的方法
CN107241886B (zh) 一种新型Rack节点中板及其设计方法
CN104182322A (zh) 一种基于PSoC高密度服务器冗余监控管理方法
CN107145209A (zh) 一种机柜服务器的电源管理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant