CN120428838A - 供电系统、服务器、故障检测方法、设备及存储介质 - Google Patents
供电系统、服务器、故障检测方法、设备及存储介质Info
- Publication number
- CN120428838A CN120428838A CN202510942166.3A CN202510942166A CN120428838A CN 120428838 A CN120428838 A CN 120428838A CN 202510942166 A CN202510942166 A CN 202510942166A CN 120428838 A CN120428838 A CN 120428838A
- Authority
- CN
- China
- Prior art keywords
- power supply
- electronic switch
- power
- fault
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Stand-By Power Supply Arrangements (AREA)
Abstract
本申请公开了一种供电系统、服务器、故障检测方法、设备及存储介质,涉及服务器技术领域,本申请通过在主板上设置第一电子开关和故障处理电路,能够在待机电源故障情况下确保系统的可靠性和完整的故障记录。具体而言,电源分配板通过第一电子开关提供的第一待机电源异常时,第一电子开关关闭,故障处理电路能够在待机电源发生故障后继续工作,实现故障信息的准确完整记录,为后续故障原因分析提供数据支持,从而能够实现对待机电源的有效监控。
Description
技术领域
本申请涉及服务器技术领域,尤其涉及一种供电系统、服务器、故障检测方法、设备及存储介质。
背景技术
数字化时代,服务器作为数据存算的核心枢纽,其持续稳定运行是业务连续性的关键保障。服务器的正常运行有赖于电源的稳定性。
相关技术中,通常关注于对服务器开机运行后的主电源进行监控,该监控是基于待机电源的稳定,因此,如何有效监控待机电源是当前亟待解决的技术问题。
发明内容
本申请提供了一种供电系统、服务器、故障检测方法、设备及存储介质,以实现对待机电源进行有效监控。
本申请第一方面提供了一种供电系统,包括:
储能器件;
故障诊断模块;
第一电子开关,第一端与电源分配板10连接,第二端与第一受电设备和储能器件连接,用于在交流上电后进入开启状态,为第一受电设备和储能器件提供第一待机电源,在第一待机电源为异常状态时进入关闭状态,还用于根据自身的开关状态生成第一电源就绪信号;
续电开关,第一输入端与储能器件连接,输出端与故障诊断模块连接,控制端与第一电子开关连接,用于在第一电源就绪信号指示第一电子开关为关闭状态时,将储能器件与故障诊断模块导通;
故障诊断模块,用于在储能器件的供电下,进行故障信息的记录。
本申请提供了一种服务器,包括:上述的供电系统。
本申请提供了一种故障检测方法,应用于供电系统,供电系统包括:储能器件、第一电子开关、续电开关、第一控制器、第二电子开关和故障诊断模块;其中,第一电子开关的第一端与电源分配板10连接,第一电子开关的第二端与第一受电设备和储能器件连接;续电开关的第一输入端与储能器件连接,续电开关的输出端与故障诊断模块连接,续电开关的控制端与第一电子开关连接;第一控制器与第一电子开关的第二端和第二电子开关的控制端连接;第二电子开关的第一端与电源分配板10连接,第二电子开关的第二端与第二受电设备连接;
方法包括:
在第一待机电源的供电下,控制第二电子开关进入开启状态,为第二受电设备提供第二待机电源;第一待机电源是第一电子开关在交流上电后进入开启状态而根据电源分配板10生成的;
获取第二电源就绪信号;第二电源就绪信号是第二电子开关根据自身的开关状态生成的;
根据第二电源就绪信号确定第一电源异常信息;
若第一电源异常信息指示第二待机电源存在异常,则将第一电源异常信息发送给故障诊断模块,将第一电子开关关断。
本申请还提供了一种故障检测装置,包括:
控制模块,用于在第一待机电源的供电下,控制第二电子开关进入开启状态,为第二受电设备提供第二待机电源;第一待机电源是第一电子开关在交流上电后进入开启状态而根据电源分配板10生成的;
获取模块,用于获取第二电源就绪信号;第二电源就绪信号是第二电子开关根据自身的开关状态生成的;
确定模块,用于根据第二电源就绪信号确定第一电源异常信息;
处理模块,用于若第一电源异常信息指示第二待机电源存在异常,则将第一电源异常信息发送给故障诊断模块,将第一电子开关关断。
本申请还提供了一种电子设备,包括:存储器,用于存储计算机程序;处理器,用于执行计算机程序时实现上述任一种故障检测方法的步骤。
本申请还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,其中,计算机程序被处理器执行时实现上述任一种故障检测方法的步骤。
本申请还提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现上述任一种故障检测方法的步骤。
通过本申请,在主板上设置第一电子开关和故障处理电路,能够在待机电源故障情况下确保系统的可靠性和完整的故障记录。具体而言,电源分配板通过第一电子开关提供的第一待机电源异常时,第一电子开关关闭,故障处理电路能够在待机电源发生故障后继续工作,实现故障信息的准确完整记录,为后续故障原因分析提供数据支持,从而能够实现对待机电源的有效监控。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的供电系统的结构示意图一;
图2a为本申请实施例提供的供电系统的结构示意图二;
图2b为本申请实施例提供的供电系统的结构示意图三;
图3a为本申请实施例提供的供电系统的电路板的结构示意图;
图3b为本申请实施例提供的供电系统的电子开关的应用示意图;
图4为本申请实施例提供的故障检测方法的流程示意图一;
图5为本申请实施例提供的故障检测方法的流程示意图一;
图6为本申请实施例提供的故障检测装置的结构示意图;
图7为本申请提供的电子设备的结构示意图。
附图标记:
10:电源分配板;20:主板;100:故障处理电路;200:第一电子开关;300:第一受电设备;101:故障诊断模块;102:储能器件;103:续电开关; 104:第一电压调节模块;400:管理控制器;500:第二电压调节模块;600:第一控制器;700:第二电子开关;800:第一存储模块;P12V_STBY_1:第一待机电源;P12V_STBY_2:第二待机电源;P12V_STBY_1_PWRGD:第一电源就绪信号;P12V_STBY_2_PWRGD:第二电源就绪信号。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。
需要说明的是,在本申请的描述中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。本申请中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。
数字化发展进程中,承载数据存储、处理与传输重任的服务器,其不间断运行是业务连续性的关键。确保这一点的首要前提,是持续稳定的电力输入。遗憾的是,服务器主板电源环节的失效并非个例,其后果轻则硬件报废,重则可能升级为火灾风险。
相关技术中,通常设计有电源装置(Power Supply Unit, PSU)冗余方案,可以根据服务器的工作状态和各类器件所需的供电需求实现不同的供电策略,且可以通过电压调节模块进行异常掉电后的检测、上报及处理。
然而,上述方式中通常是针对主(core)电源信号异常的检测、上报与处理,core电一般只有在开机状态下才会有电压输出,而待机(Standby Power,STBY)电源即在插入交流电(Alternating Current,AC)状态下就有电压输出,用于整张板卡的待机状态下的供电;由于主板上的主板管理控制器(Baseboard Management Controller, BMC)、复杂可编程逻辑器件(Complex Programmable Logic Device, CPLD)等监控与管理器件依托于STBY电才能正常工作,而当STBY电异常后往往上述监控器件已经失活,即使能识别到异常发生,往往也很难实现异常信息的日志记录功能,导致无法准确定位到异常点,难以快速定位故障原因,给后续的维护和修复工作带来极大困难。
为了解决上述技术问题,本申请发明人研究发现可以通过在供电系统中的主板上设置第一电子开关和故障处理模块,由第一电子开关控制电源分配板对主板的供电,并在第一电子开关检测到电源分配板提供的STBY电发生异常后通过故障处理模块继续完成信息记录,从而为故障诊断提供详细准确的数据支持,对于保障服务器稳定运行、提高数据安全性和减少运维成本具有重要意义。基于此,本申请实施例提供一种供电系统。
为了使本技术领域的技术人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。
图1为本申请实施例提供的供电系统的结构示意图一,如图1所示,本申请的实施例提供了一种供电系统,包括:电源分配板10和主板20;主板20包括第一受电设备300、第一电子开关200和故障处理电路100;电源分配板10的输出端与第一电子开关200的第一端连接,第一电子开关200的第二端与第一受电设备300和故障处理电路100连接;电源分配板10用于在第一电子开关200为开启状态时,为第一受电设备300和故障处理电路100提供第一待机电源;第一电子开关200,用于在第一待机电源为异常状态时进入关闭状态;故障处理电路100,用于在第一电子开关200为关闭状态时,进行故障信息的记录。
本实施例中,第一电子开关200连接于电源分配板10和第一受电设备300之间,其主要功能为在交流电上电后自动默认开启,进入开启状态,为第一受电设备300和故障处理电路100提供电力。在检测到电源异常时(例如电压过低或断电),自动关闭以保护第一受电设备300。还用于生成第一电源就绪信号,指示当前的开关状态(开启或关闭)。在第一电子开关200关闭后,故障处理电路100仍可以继续进行故障信息的记录。
示例性的,如图3a所示,电源分配板10(Power Distribution Board,PDB)10可以通过垂直电源板对板连接器为主板20(Motherboard,MB)20输入提供P12V_PSU电源(即电源分配板10)。
从上述描述可知,本申请实施例提供的供电系统,通过在主板20上设置第一电子开关200和故障处理电路100,能够在待机电源故障情况下确保系统的可靠性和完整的故障记录。具体而言,电源分配板10通过第一电子开关200提供的第一待机电源异常时,第一电子开关200关闭,故障处理电路100能够在待机电源发生故障后继续工作,实现故障信息的准确完整记录,为后续故障原因分析提供数据支持,从而能够实现对待机电源的有效监控。
在一些实施例中,如图2a所示,故障处理电路100包括:续电开关103、储能器件102和故障诊断模块101;储能器件102的输入端与第一电子开关200的第二端连接,储能器件102的输出端与续电开关103的第一输入端连接,续电开关103的输出端与故障诊断模块101连接;续电开关103,用于在第一电子开管为关闭状态时,将储能器件102与故障诊断模块101导通;故障诊断模块101,用于在储能器件102的供电下,进行故障信息的记录。
本实施例中,储能器件102是用于存储电能的组件,可以为储能电容器或电池。其主要功能是在第一待机电源因故障或因其他位置的电源故障而主动掉电后,来支持故障诊断模块101的运行,以继续记录故障信息,为后续的故障原因分析和定位提供支持。
续电开关103用于在第一电子开关200关闭时,才会导通储能器件102的电力。
故障诊断模块101,在电源故障情况下,用于在储能器件102的供电下继续工作,其主要功能是记录故障信息,例如电源异常的时间和可能的原因,该故障信息对后续的故障分析和系统维护非常重要。
在具体的工作过程中,在正常情况下,电源分配板10通过第一电子开关200为第一受电设备300和储能器件102供电。储能器件102在此期间被充电。当检测到电源异常时,第一电子开关200关闭,断开电源分配板10的连接。第一电源就绪信号指示第一电子开关200的关闭状态,触发续电开关103导通。储能器件102通过续电开关103为故障诊断模块101供电,使其能够记录故障信息。记录的故障信息可以用于后续的系统分析和维护,提高系统的可靠性和可维护性。
从上述描述可知,本申请实施例提供的供电系统,通过在主板20上设置储能器件102、第一电子开关200、续电开关103和故障诊断模块101,能够在电源故障情况下确保系统的可靠性和完整的故障记录。第一待机电源P12V_STBY_1异常时,第一电子开关200关闭,储能器件102能够在待机电源发生故障后继续为故障诊断模块101供电,实现故障信息的准确完整记录,为后续故障原因分析提供数据支持,从而能够实现对待机电源的有效监控。
在一些实施例中,如图2b所示,故障诊断模块101包括第一控制单元和第一存储单元;第一控制单元,与储能器件102和第一存储单元连接,用于在储能器件102的供电下,将故障信息存储于第一存储单元。
本实施例中,第一控制单元是故障诊断模块101的核心组件,用于处理和管理故障信息,可以为微控制单元(Microcontroller Unit,MCU)。第一控制单元与储能器件102连接,确保在电源故障时能够立即获得储能器件102的备用电力的支持。第一控制单元的主要功能是在故障发生后能够继续进行故障信息的完整记录,以便后续进行故障分析和定位。
第一存储单元用于保存由第一控制单元处理过的故障信息。为了确保数据的完整性、安全性和持久性,第一存储单元可以采用非易失性存储器,如闪存、微型存储卡。
在具体工作过程中,在正常运行时,第一控制单元使用第一待机电源P12V_STBY_1进行供电,当检测到电源故障时,储能器件102为第一控制单元供电,使其能够继续运行。第一控制单元继续进行故障信息的采集,将相关数据(如电源中断的时间、可能的原因等)存储到第一存储单元。存储的故障信息在电力恢复后可用于系统分析、故障排查和维护决策。
本申请实施例提供的供电系统,通过在故障诊断模块101中集成微控制单元(MCU)和第一存储单元,实现了在电源故障情况下的高效故障信息记录和存储。MCU确保在电源中断时,能够迅速切换至储能器件102供电,持续采集和处理故障数据。第一存储单元则保障了数据的完整性和持久性,为后续的故障分析和系统维护提供可靠依据。提高了系统的稳定性和故障响应能力,优化了维护效率。
在一些实施例中,如图2b所示,第一电子开关200,与故障诊断模块101连接;第一电子开关200,用于根据自身状态生成第一电源就绪信号,将第一电源就绪信号发送给故障诊断模块101;故障诊断模块101,用于记录第一电源就绪信号。
本申请实施例提供的供电系统,通过设置第一电子开关200与故障诊断模块101连接,能够在电源状态变化时及时发送第一电源就绪信号P12V_STBY_1_PWRGD至故障诊断模块101。使得故障诊断模块101可以实时记录电源状态的变化,包括电源的就绪状态和故障状态。确保了系统在电源恢复时能够准确识别电源状态的变化,并对其进行记录和分析。通过对电源就绪信号的记录,系统维护人员可以更好地了解电源故障的频率和持续时间,从而优化电源管理策略,提高系统的可靠性和稳定性。
在一些实施例中,如图2b所示,故障处理电路100还包括:第一电压调节模块104;第一电压调节模块104,输入端与第一电子开关200的第二端连接,输出端与续电开关103的第二输入端连接,用于对第一待机电源进行调节;续电开关103,用于在第一电子开关200为开启状态时,选通第一电压调节模块104为故障诊断模块101供电;故障诊断模块101,用于在第一电压调节模块104的供电下,进行故障信息的记录。
本实施例中,第一电压调节模块104的主要功能是对第一待机电源P12V_STBY_1进行电压调节。第一电压调节模块104的输入端连接到第一电子开关200的第二端,确保在电源就绪时能够接收到电力。第一电压调节模块104的输出端连接到续电开关103的第二输入端,以提供稳定的电压输出。该调节功能对于保护故障诊断模块101免受电压波动影响至关重要。
续电开关103的作用是根据第一电源就绪信号P12V_STBY_1_PWRGD的状态,控制第一电压调节模块104的供电路径。当第一电子开关200处于开启状态时,续电开关103选通第一电压调节模块104,使其为故障诊断模块101供电。确保了在电源稳定时,故障诊断模块101能够获得经过调节的电力供应。
故障诊断模块101在获得第一电压调节模块104的稳定供电后,故障诊断模块101能够有效地进行故障信息的记录。通过记录电源状态和故障信息,该模块为系统的维护和优化提供了重要的数据支持。
在具体工作过程中,当第一电子开关200检测到电源就绪状态时,发送信号以控制续电开关103。续电开关103选通第一电压调节模块104,使其对输入电压进行调节,并将稳定的电力供应给故障诊断模块101。故障诊断模块101在稳定供电下,持续记录故障信息和电源状态变化。当第一电子开关200检测到电源异常时,第一电源就绪信号P12V_STBY_1_PWRGD控制续电开关103选通储能器件102,使其为故障诊断模块101进行供电,使得故障诊断模块101在异常掉电后依然能够继续将故障信息进行记录,以保存完整的故障信息,为后续故障分析提供支持。
本申请实施例提供的供电系统,通过设置第一电压调节模块104和续电开关103,能够在电源就绪时提供稳定的电力供应给故障诊断模块101。电压调节模块确保电压稳定,减少因电压波动导致的故障风险;续电开关103则根据电源状态智能控制供电路径。提高了系统的电源管理效率,确保故障诊断模块101在各种电源条件下都能可靠地记录故障信息,增强了系统的稳定性和维护能力。
在一些实施例中,如图2b所示,第一电压调节模块104,与储能器件102连接,用于对第一待机电源进行调节,为储能器件102提供充电电压。本申请实施例通过将第一电压调节模块104与储能器件102连接,实现了对第一待机电源P12V_STBY_1的电压调节,为储能器件102提供适宜的充电电压。电压调节模块能够确保为储能器件102提供稳定且合适的充电电压,从而延长储能器件102的使用寿命并提高其充电效率。此外,稳定的充电电压有助于防止过充或欠充现象,减少储能器件102的损耗和潜在故障风险。
在一些实施例中,如图2b所示,故障信息包括运行数据,主板20还包括管理控制器400;管理控制器400,与第一电子开关200的第二端和故障诊断模块101连接,用于在第一待机电源供电的情况下,获取运行数据,并将运行数据发送给故障处理电路100。
本实施例中,管理控制器400是系统中的关键组件,可以为基板管理控制器400(Baseboard Management Controller, BMC),用于在第一待机电源P12V_STBY_1供电的情况下获取系统的运行数据。管理控制器400与第一电子开关200的第二端连接,确保在电源就绪时能够正常工作。管理控制器400的主要功能是收集与系统运行相关的数据,如温度、压力、电流、电压等参数。
故障诊断模块101与管理控制器400连接,用于接收并记录由管理控制器400发送的运行数据。通过记录这些数据,故障诊断模块101能够提供系统运行状态的详细历史记录。这些记录对于分析系统性能、识别潜在故障以及优化系统设计非常重要。
在具体工作过程中,当第一待机电源P12V_STBY_1供电时,管理控制器400开始采集系统的运行数据。采集到的数据通过管理控制器400发送至故障诊断模块101。故障诊断模块101接收并记录这些数据,为后续的故障分析和系统优化提供依据。当出现电源故障时,故障诊断模块101继续在储能器件102的供电下,将运行数据记录完整。
本申请实施例通过引入管理控制器400,实现了对系统运行数据的高效采集和管理。管理控制器400在第一待机电源P12V_STBY_1供电的情况下,能够实时获取关键运行数据,并将这些数据发送至故障诊断模块101进行记录。实时的数据采集和记录提高了系统的监控能力,使得系统能够及时识别和响应异常情况。其次,详细的运行数据记录为系统性能分析和故障预测提供了重要依据,有助于进行预防性维护和优化设计。此外,在电源故障时,故障诊断模块101依然能够在储能器件102的支持下继续记录数据,确保数据的完整性和连续性,从而增强了系统的可靠性和稳定性。
在一些实施例中,如图2b所示,主板20还包括第二电压调节模块500;第二电压调节模块500,输入端与第一电子开关200连接,输出端与管理控制器400连接,用于对第一待机电源进行调节,为管理控制器400提供电源。本申请实施例提供的供电系统,通过设置第二电压调节模块500,能够为管理控制器400提供稳定且适宜的电源供应,确保其在多变的电源条件下持续正常运行。有效地调节了第一待机电源P12V_STBY_1的电压输出,避免了电压波动对系统造成的潜在影响,从而显著提高了系统的可靠性和稳定性。
在一些实施例中,如图2b所示,故障信息包括第一电源异常信息;主板20还包括:第一控制器600和第二电子开关700;第一控制器600,与第一电子开关200的第二端和第二电子开关700的控制端连接,用于在第一待机电源供电的情况下,对第二电子开关700进行控制;第二电子开关700,第一端与电源分配板10连接,第二端与第二受电设备连接,用于在开启状态下,为第二受电设备提供第二待机电源,还用于在第二待机电源为异常状态时进入关闭状态;
第一控制器600,还用于根据第二电子开关700的开关状态生成第一电源异常信息,将第一电源异常信息发送给故障处理电路100。
在具体工作过程中,当第一待机电源P12V_STBY_1供电时,第一控制器600控制第二电子开关700进入开启状态,确保第二受电设备获得电源供应。第二电子开关700生成的第二电源就绪信号P12V_STBY_2_PWRGD被发送至第一控制器600。若检测到第二电源就绪信号P12V_STBY_2_PWRGD指示第二电子开关700关闭,则可以判定第二待机电源P12V_STBY_2异常,第一控制器600生成第一电源异常信息并传递给故障诊断模块101,为后续的故障分析和系统优化提供依据。
本申请实施例提供的供电系统,通过设置第一控制器600和第二电子开关700,实现了对电源状态的高效监控和管理。第一控制器600在第一待机电源P12V_STBY_1供电时,控制第二电子开关700开启,为第二受电设备提供稳定电源。第二电子开关700生成的电源就绪信号使第一控制器600能够及时检测和报告第一电源异常信息至故障诊断模块101。提高了系统对电源异常的响应速度和可靠性,确保系统在异常情况下稳定运行。通过设置第一电子开关200和第二电子开关700能够实现分区监控,提高故障定位的准确性以及使受电设备得到更好的保护。
在一些实施例中,如图2b所示,故障信息包括第二电源异常信息;供电系统还包括从板(如图3a所示的风扇板等),从板包括:第三电子开关和第三受电设备;第三电子开关,第一端与第一电子开关200的第二端连接,第二端与第三受电设备连接,控制端与第一控制器600连接,用于在第一控制器600的控制下进入开启状态,为第三受电设备提供第三待机电源,还用于在第三待机电源为异常状态时进入关闭状态;第一控制器600,用于根据第三电子开关的开关状态生成第二电源异常信息,将第二电源异常信息发送给故障诊断模块101。
本实施例中第三电子开关与第一电子开关200形成两个层级的电子开关,能够对供电系统进行分层管控。
在具体工作过程中,当第一待机电源P12V_STBY_1供电时,第一控制器600控制第三电子开关进入开启状态,确保第三受电设备获得电源供应。同时,第三电子开关生成的第三电源就绪信号被发送至第一控制器600。若检测到异常,第一控制器600生成第二电源异常信息并传递给故障诊断模块101,为后续的故障分析和系统优化提供依据。通过设置两级电子开关,能够对待机电源进行分层管控,对不同层级的电子开关所对应的受电设备进行分区域保护,降低保护的(Overcurrent Protection,OCP)点,提高保护使得时效性。
本申请实施例通过设置两级电子开关,实现了对待机电源的分层管控和分区域保护。第一控制器600控制第三电子开关为第三受电设备提供电源,并生成电源就绪信号。若检测到异常,及时生成并传递第二电源异常信息至故障诊断模块101。此设计有效降低了过流保护(OCP)点,提高了保护的时效性,确保系统在电源异常情况下的稳定运行,增强了系统的可靠性和安全性。
在一些实施例中,如图2b所示,主板20还包括第一存储模块800;第一存储模块800,与第一控制器600连接,用于将第一电源异常信息存储于第一存储模块800。
本实施例中,第一存储模块800与第一控制器600连接,专用于存储第一电源异常信息。第一存储模块800可以为电可擦可编程只读存储器(Electrically ErasableProgrammable Read-Only Memory, EEPROM),通过将异常信息存储在第一存储模块800中,系统实现故障信息的快速存取。
第一控制器600在检测到电源异常时,第一控制器600不仅将异常信息发送至故障诊断模块101,还将这些信息存储在第一存储模块800中。确保了异常信息的完整性和可追溯性。
故障诊断模块101继续接收来自第一控制器600的异常信息,并结合存储模块中的历史数据进行更深入的分析。有助于识别系统中潜在的长期问题,并为系统优化提供数据支持。
在具体工作过程中,当电源异常被检测到时,第一控制器600会立即生成异常信息,并将其存储在第一存储模块800中,同时发送至故障诊断模块101。不仅能够实时响应电源异常,还能通过存储的历史数据进行长期分析和改进。提高了系统的可靠性和维护效率,为电源管理提供了更全面的支持。
在一些实施例中,如图2b所示,供电系统还包括:I2C开关和传感器,第一控制器600包括SPI模块、I2C主模块、中断模块、I2C从模块和时序模块。其中,第一控制600用于通过SPI模块,基于串行外设接口(Serial Peripheral Interface, SPI)将故障信息发送给故障诊断模块101中的第一控制单元MCU,还用于通过中断模块,基于通用输入/输出(General Purpose Input/Output, GPIO)端口告知管理控制器400读取第一存储模块800(例如EEPROM)的异常信息。I2C开关用于切换I2C从模块和传感器,以便管理控制器400通过I2C从模块读取第一控制器600的运行信息,或者读取传感器采集的传感信息。
本申请实施例还提供一种服务器,包括如上述实施例的供电系统。
本申请实施例提供的服务器,通过在主板上设置第一电子开关和故障处理电路,能够在待机电源故障情况下确保系统的可靠性和完整的故障记录。具体而言,电源分配板通过第一电子开关提供的第一待机电源异常时,第一电子开关关闭,故障处理电路能够在待机电源发生故障后继续工作,实现故障信息的准确完整记录,为后续故障原因分析提供数据支持,从而能够实现对待机电源的有效监控。
以下结合图3a和图2b对供电系统的电路板级别的结构进行示例说明。
P12V_PSU在主板上的系统输入口通过第一电子开关200(例如MP5991)转化为P12V_STBY_1(即第一待机电源P12V_STBY_1),通过第二电子开关700转换为P12V_STBY_2(即第二待机电源P12V_STBY_2)。通过该两条供电链路为整系统提供总输入保护。
其中,P12V_STBY_1为中央处理单元CPU0、内存条DIMM0、CPU0的VR、故障诊断模块供电VR(即第一电压调节模块104)、硬盘背板,第三扩展卡(例如前置开放计算项目(OpenCompute Project,OCP)扩展卡),第二扩展卡(可以设置前置高速外围组件互连(Peripheral Component Interconnect Express,PCIe)插槽)供电。
P12V_STBY_2为中央处理单元CPU1,内存条DIMM1,风扇板FAN,第一扩展卡(例如前置PCIe插槽)供电。
在具体工作过程中,AC上电后,P12V_STBY_1所在的第一电子开关200会默认直接开启,为该线路下的设备提供STBY电,CPLD(即第一控制器600)、BMC(即管理控制器400)等器件上电加载,同时该第一电子开关200会产生一个 P12V_STBY_1_PWRGD信号(即第一电源就绪信号P12V_STBY_1_PWRGD)给到故障诊断模块供电线路上的MUX(即续电开关103),用于实现故障诊断模块供电电源的切换,该MUX默认将通道切给储能电容器(即储能器件102),当P12V_STBY_1_PWRGD信号为高电平后将切换到故障诊断模块供电VR(即第一电压调节模块104);CPLD加载完成后CPLD会控制P12V_STBY_2所在的第二电子开关700开启,从而给该线路下的设备提供STBY电;服务器开机后CPLD可以根据时序逻辑控制将其控制下的各VR及电子开关使能。
在一些实施例中,可以采用MP5991作为第一电子开关200、第二电子开关700和第三电子开关,其应用电路如图3b所示。
以下结合图3a对系统防烧板的原理进行示例说明。
电源分配板10P12V_PSU经放置在系统输入口的第一电子开关200和第二电子开关700为整系统提供总输入保护,减少板上不受保护的PCB区域。
电扇板FAN、硬盘背板在风扇板上放置二级电子开关(即各第三电子开关)提供分区域保护,降低保护的OCP点,提高保护的时效性,并通过CPLD监控各第三电子开关和第二电子开关700的使能信号ENABLE与电源就绪信号PWRGD的状态记录日志。
各扩展卡上也可以放置第三电子开关以对扩展卡上的电路进行保护。
当二级电子开关下的相关供电异常时,CPLD若检测到任一第三电子开关的ENABLE信号为高且PWRGD信号为低时则可以判定为异常,并关断除P12V_STBY_1的第一电子开关200以外的电子开关(包括第二电子开关700)及相关VR的使能,避免烧板。
为避免内存烧坏,在DIMM0与DIMM1供电线路上可以增加第三电子开关用于实现内存供电异常时快速的将内存供电电源关断。
当CPLD检测到第二电子开关700的使能信号P12V_STBY_2_ENABLE为高,且第二电源就绪信号P12V_STBY_2_PWRGD为低时,CPLD会判定P12V_STBY_2电源异常,CPLD会将所控制的电子开关及VR的使能全部关闭,然后CPLD会主动推高第一电子开关200的关断信号P12V_STBY_1_SHUTDOWN,主动调低P12V_STBY_1的OCP值,使主板系统输入口处的P12V_STBY_1的第一电子开关200主动过流并闩锁保护,使整系统的STBY电下电,实现整系统完全断电,而此时故障诊断模块101(DMPU)的供电会由故障诊断模块供电VR切换为储能电容器,即使整板下电后也能实现将异常日志等故障信息存储到DMPU的TF卡中。
当第一待机电源P12V_STBY_1发生异常后,该电源的第一电子开关200会因过流快速关断,与此同时CPLD与BMC也已失活,因此整板会由于当P12V_STBY_1电源的异常而全部断电,因此导致CPLD与BMC无法实现 P12V_STBY_1电源异常的记录,因为在主板上设置有故障诊断模块101,且设计有供电切换电路,因此即使P12V_STBY_1电源发生异常关断后,也能通过MUX切换至通过储能电容器为故障诊断模块101进行继续供电,以便实现 故障诊断模块101对P12V_STBY_1电源异常的准确完整记录。
图4为本申请实施例提供的故障检测方法的流程示意图一,如图4所示,本申请的实施例提供了一种故障检测方法,该方法应用于如上实施例的供电系统,供电系统包括:电源分配板和主板;主板包括第一受电设备、第一电子开关、第一控制器、第二电子开关和故障处理电路;电源分配板的输出端与第一电子开关的第一端连接,第一电子开关的第二端与第一受电设备和故障处理电路连接;第一控制器与第一电子开关的第二端和第二电子开关的控制端连接;第二电子开关的第一端与电源分配板连接,第二端与第二受电设备连接;对方法进行详细描述,如下:
401、在第一待机电源的供电下,控制第二电子开关进入开启状态,为第二受电设备提供第二待机电源;第一待机电源是第一电子开关在交流上电后进入开启状态而由电源分配板提供的。
示例性的,如图2b所示,AC上电后,P12V_STBY_1所在的第一电子开关200会默认直接开启,为该线路下的设备提供STBY电,CPLD(即第一控制器600)、BMC(即管理控制器400)等器件上电加载,同时该第一电子开关200会产生一个 P12V_STBY_1_PWRGD信号(即第一电源就绪信号P12V_STBY_1_PWRGD)给到故障诊断模块供电线路上的MUX(即续电开关103),用于实现故障诊断模块供电电源的切换,该MUX默认将通道切给储能电容器(即储能器件102),当P12V_STBY_1_PWRGD信号为高电平后将切换到故障诊断模块供电VR(即第一电压调节模块104);CPLD加载完成后CPLD会控制P12V_STBY_2所在的第二电子开关700开启,从而给该线路下的设备提供STBY电;服务器开机后CPLD可以根据时序逻辑控制将其控制下的各VR及电子开关使能。
402、获取第二电源就绪信号;第二电源就绪信号是第二电子开关根据自身的开关状态生成的。
403、根据第二电源就绪信号确定第一电源异常信息。
404、若第一电源异常信息指示第二待机电源存在异常,则将第一电源异常信息发送给故障处理电路,将第一电子开关关断。
在一些实施例中,STBY电异常时不能迅速关断电源,可能会对服务器硬件造成进一步的损坏,甚至烧坏主板导致报废,增加维修成本和停机时间。因此,将第一电子开关关断,可以包括:将第一电子开关当前的第一过流阈值电压设置为第二过流阈值电压,以使第一电子开关进入过流保护而关断;第二过流阈值电压小于第一过流阈值电压,且小于第一待机电源。
示例性的,如图2b所示,当CPLD(即第一控制器600)检测到第二电子开关700的使能信号P12V_STBY_2_ENABLE为高,且第二电源就绪信号P12V_STBY_2_PWRGD为低时,CPLD会判定P12V_STBY_2电源异常,CPLD会将所控制的电子开关及VR的使能全部关闭,然后CPLD会主动推高第一电子开关200的关断信号P12V_STBY_1_SHUTDOWN,主动调低P12V_STBY_1的OCP值,使主板系统输入口处的P12V_STBY_1的第一电子开关200主动过流并闩锁保护,使整系统的STBY电下电,实现整系统完全断电,而此时故障诊断模块101(DMPU)的供电会由故障诊断模块供电VR切换为储能电容器,即使整板下电后也能实现将异常日志等故障信息存储到DMPU的TF卡(即第一存储单元)中。
本申请实施例提供的故障检测方法,通过集成多层次的电源监控和故障诊断机制,能够显著提高供电系统的可靠性和安全性。首先,通过第一电子开关200和第二电子开关700的协调控制,实现了对第一待机电源P12V_STBY_1和第二待机电源P12V_STBY_2的独立监控,确保在任何电源异常情况下都能及时响应。其次,故障诊断模块101在检测到电源异常时,能够迅速切换供电来源至储能器件102,确保在系统完全断电的情况下,仍能将关键故障信息存储到第一存储单元中。不仅提高了系统的故障恢复能力,还为后续的故障分析和维护提供了重要的数据支持。此外,通过优化电源切换和保护机制,能够有效防止因过流或其他电源异常导致的设备损坏,延长设备的使用寿命。
在一些实施例中,主板还包括第二受电设备;第二受电设备与第二电子开关的第二端连接;方法还包括:对第二受电设备的异常报错信息进行屏蔽。
具体的,如图2b所示,当识别到异常发生原因为P12V_STBY_2导致,则CPLD屏蔽其他异常信号的监控功能,屏蔽其他异常信号监控功能的原因为:当P12V_STBY_2电源异常时,其线路上的电子开关(例如MP5991)会因异常导致电压下降,进而导致该线路上的CPU1等器件的VR模块因识别到供电电压异常而导致主动关断,进而使CPU1电源被切断,CPU1供电切断后会误报一些难以预料的异常,因此CPLD内部对因P12V_STBY_2电源异常而导致的CPU1的误报异常进行屏蔽。
在一些实施例中,主板还包括第一存储模块;第一存储模块,与第一控制器连接;方法还包括:若第一电源异常信息指示第二待机电源存在异常,则将第一电源异常信息存储于第一存储模块。
本申请实施例提供的故障检测方法,通过同时使用第一存储模块800(例如EEPROM)和故障诊断模块101(含TF卡)记录异常,能够构建分层冗余的日志系统,以应对不同故障场景下的数据可靠性需求。EEPROM一般存储容量比较小,其下挂在CPLD的I2C下面,可以用于CPLD记录第二待机电源P12V_STBY_2的异常情况,TF卡容量大,故障诊断模块101可以通过TF卡存储整个服务器的状态数据。
在一些实施例中,主板还包括管理控制器,管理控制器与第一电子开关的第二端、故障处理电路连接和第一控制器连接;方法还包括:在交流上电后,从第一存储模块读取最新存入的第一电源异常信息;根据第一电源异常信息控制管理控制器根据第一电源异常信息生成异常日志,将异常日志显示在展示界面上。
示例性的,如图2b所示,CPLD加载完成后,CPLD会通过I2C主模块回读所下挂第一存储模块800(例如EEPROM)中的数据并进行数据解析,若解析后得到数据中存在P12V_STBY_2异常信息的记录,CPLD会将该异常值写入第一寄存器特定位(例如表2所示的0x20寄存器中byte3 bit7),还会将第二寄存器特定位(例如表1所示的0x01寄存器byte1 bit2值)写为0,同时拉低CPLD与BMC之间的中断GPIO,用以告知BMC进行异常状态的读取,BMC完成异常状态的日志记录及WEB显示。
本申请实施例提供的故障检测方法,通过在AC上电时由CPLD自动读取EEPROM存储的历史异常信息(如P12V_STBY_2故障记录),并触发BMC联动响应机制,能够实现在冷启动阶段识别历史硬件故障(如电源模块异常),阻止对已损部件的重复上电,避免二次损伤与火灾隐患,主动拦截风险设备;通过寄存器位映射(如0x20 byte3 bit7)固化故障类型,结合BMC的WEB界面可视化呈现,将故障定位时间从小时级缩短至分钟级,从而精准定位故障源;硬件层(CPLD寄存器标记)、固件层(GPIO中断触发)和软件层(BMC日志记录)三级协同,形成从异常检测到运维决策的闭环证据链,显著提升系统可靠性。
在一些实施例中,供电系统还包括第三电子开关和第三受电设备;第三电子开关的第一端与第一电子开关的第二端连接,第二端与第三受电设备连接,控制端与第一控制器连接;方法还包括:在第一待机电源的供电下,控制第三电子开关进入开启状态,为第三受电设备提供第三待机电源;获取第三电源就绪信号;第三电源就绪信号是第三电子开关根据自身的开关状态生成的;根据第三电源就绪信号确定第二电源异常信息;若第二电源异常信息指示第三待机电源存在异常,则将第二电源异常信息发送给故障处理电路,且将第二电子开关和第三电子开关进行关断。
示例性的,如图2b所示,当监控到存在异常状态后,若判定异常发生原因是第三电子开关(即二级电子开关)而非P12V_STBY_2导致,则CPLD控制关断除P12V_STBY_1以外的第三电子开关及相关VR的使能,避免烧板,使服务器CORE电下电到S5状态下,且在不重新插拔AC的情况下无法再开机;将相关异常报错记录到0x20寄存器中,将0x01寄存器byte1 bit2中的值写为0,拉低同BMC之间的中断信号,用于BMC记录异常日志。
本申请实施例提供的故障检测方法,通过对第三电子开关(二级efuse)的电源就绪信号(PWRGD)进行实时监控,并基于异常判定执行多级保护动作,能够当第三电子开关异常(如过流保护)时,立即关断对应供电域(第二/三电子开关),将故障影响范围压缩至最小单元,避免单点故障扩散至整板;强制下电至S5状态并锁定重启,防止异常部件反复上电导致热失控风险,同时通过寄存器记录异常代码(0x20)与全局故障标志(0x01),为BMC提供结构化诊断依据;将二级电源异常信息同步至故障诊断模块101,结合电容后备供电实现毫秒级异常快照保存,完整记录电压跌落时序,提升根因定位精度。
表1 0x01寄存器定义---BMC读取总体异常状态
表2 0x20寄存器定义---BMC读取时序相关信号状态
图5为本申请实施例提供的故障检测方法的流程示意图二,如图5所示,以下以第一控制器600为CPLD,第一存储单元为EEPROM为例进行示例介绍。
501、AC上电。当AC上电后,P12V_STBY_1为CPLD(即第一控制器600)供电。
502、P12V_STBY_1上电后CPLD加载完成。
具体的,AC上电后,P12V_STBY_1所在的第一电子开关200会默认直接开启,为该线路下的设备提供STBY电,CPLD(即第一控制器600)、BMC(即管理控制器400)等器件上电加载,同时该第一电子开关200会产生一个 P12V_STBY_1_PWRGD信号(即第一电源就绪信号P12V_STBY_1_PWRGD)给到故障诊断模块供电线路上的MUX(即续电开关103),用于实现故障诊断模块供电电源的切换,该MUX默认将通道切给储能电容器(即储能器件102),当P12V_STBY_1_PWRGD信号为高电平后将切换到故障诊断模块供电VR(即第一电压调节模块104)。
503、CPLD回读EEPROM中的数据并解析,若所解析的数据中存在P12V_SYBY_2信号的异常掉电,则通过写I2C寄存器的形式将该异常告知BMC,用于日志记录及WEB显示。
具体的,CPLD加载完成后,CPLD会通过I2C主模块回读所下挂第一存储模块800(例如EEPROM)中的数据并进行数据解析,若解析后得到数据中存在P12V_STBY_2异常信息的记录,CPLD会将该异常值写入第一寄存器特定位(例如0x20寄存器中byte3 bit7),还会将第二寄存器特定位(0x01寄存器byte1 bit2值)写为0,同时拉低CPLD与BMC之间的中断GPIO,用以告知BMC进行异常状态的读取, BMC完成异常状态的日志记录及WEB显示。
504、CPLD实时监控所控制VR的使能信号ENABLE与电源就绪信号PWRGD,以及P12V_SYBY_2电源的PWRGD信号状态。
具体的,CPLD在加载完成后还会一直监控所控制VR及电子开关的使能信号ENABLE与电源就绪信号PWRGD。
505、CPLD监控到服务器中存在异常掉电发生。
506、判断P12V_SYBY_2电源的PWRGD是否为低,若是则执行步骤508,若否则执行步骤507。
507、CPLD拉低所控制VR的ENABLE信号,使服务器CORE电下电到S5状态下,且在不重新插拔AC的情况下无法再开机;将相关异常报错记录到0x20寄存器中,将0x01寄存器byte1 bit2中的值写为0,拉低CPLD同BMC之间的中断信号。
具体的,当监控到存在异常状态后,若判定异常发生原因是第三电子开关(即二级电子开关)而非P12V_STBY_2导致,则CPLD控制关断除P12V_STBY_1以外的第三电子开关及相关VR的使能,避免烧板,使服务器CORE电下电到S5状态下,且在不重新插拔AC的情况下无法再开机;将相关异常报错记录到0x20寄存器中,将0x01寄存器byte1 bit2中的值写为0,拉低同BMC之间的中断信号,用于BMC记录异常日志。
508、CPLD屏蔽其他异常信号的监控功能,同时做如下动作:①CPLD拉低所控制VR的ENABLE信号,包括P12V_STBY_2 VR的ENABLE信号;②通过SPI将异常状态上报给故障诊断模块101;③通过I2C将异常记录到CPLD下挂的EEPROM中。
具体的,如图2b所示,当识别到异常发生原因为P12V_STBY_2导致,则CPLD屏蔽其他异常信号的监控功能,屏蔽其他异常信号监控功能的原因为:当P12V_STBY_2电源异常时,其线路上的电子开关(例如MP5991)会因异常导致电压下降,进而导致该线路上的CPU1等器件的VR模块因识别到供电电压异常而导致主动关断,进而使CPU1电源被切断,CPU1供电切断后会误报一些难以预料的异常,因此CPLD内部对因P12V_STBY_2电源异常而导致的CPU1的误报异常进行屏蔽。
同时做如下动作来完成故障信息记录:
①CPLD拉低所控制VR的ENABLE信号,包括P12V_STBY_2 VR的ENABLE信号。
②通过SPI将异常状态上报给故障诊断模块101。
③通过I2C将异常记录到CPLD下挂的EEPROM中。
509、判断异常状态是否已上报完毕。若否则返回执行步骤508,若是则执行510。
510、CPLD推高关断信号P12V_STBY_1_SHUTDOWN信号给到P12V_STBY_1的第一电子开关。
511、P12V_STBY_1电源关断,P12V_STBY_1_PWRGD信号变低,服务器下电。
512、故障诊断模块供电MUX切换,使用储能电容给DMPU模块供电用以完成日志数据的存储。
具体的,当异常信息上报完毕后,CPLD会推高接给P12V_STBY_1供电线路上第一电子开关200的关断信号P12V_STBY_1_SHUTDOWN,第一电子开关200收到该信号后会主动关断,使整板下电,同时拉低第一电源就绪信号P12V_STBY_1_PWRGD,故障诊断模块供电线路切换MUX(即续电开关103)收到P12V_STBY_1_PWRGD信号拉低后将障诊断模块供电由 P12V_STBY_1切换到储能电容器,以保证故障诊断模块101可以将异常信息完整准确记录到TF卡(即第一存储单元)中,同时保证了电源的快速切断。
本申请实施例提供的故障检测方法,通过在原有服务器主板基础上引入故障诊断模块101,不仅可实现服务器运行数据的记录,同时可以为异常发生且整机下电后的故障原因记录及定位提供保障,根据CPLD、BMC、故障诊断模块101三个器件/模块的优势,进行不同的功能划分,设定协同控制策略,以实现异常发生后的整机快速断电,异常日志的准确记录,以及重新上电后异常日志的恢复功能。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
图6为本申请实施例提供的故障检测装置的结构示意图。如图6所示,本申请的实施例还提供了一种故障检测装置60,包括: 。
控制模块601,用于在第一待机电源的供电下,控制第二电子开关进入开启状态,为第二受电设备提供第二待机电源;第一待机电源是第一电子开关在交流上电后进入开启状态而由电源分配板提供的。
获取模块602,用于获取第二电源就绪信号;第二电源就绪信号是第二电子开关根据自身的开关状态生成的。
确定模块603,用于根据第二电源就绪信号确定第一电源异常信息。
处理模块604,用于若第一电源异常信息指示第二待机电源存在异常,则将第一电源异常信息发送给故障处理电路,将第一电子开关关断。
本申请实施例提供的故障检测装置,通过集成多层次的电源监控和故障诊断机制,能够显著提高供电系统的可靠性和安全性。首先,通过第一电子开关和第二电子开关的协调控制,实现了对第一待机电源和第二待机电源的独立监控,确保在任何电源异常情况下都能及时响应。其次,故障诊断模块在检测到电源异常时,能够迅速切换供电来源至储能器件,确保在系统完全断电的情况下,仍能将关键故障信息存储到第一存储单元中。不仅提高了系统的故障恢复能力,还为后续的故障分析和维护提供了重要的数据支持。此外,通过优化电源切换和保护机制,能够有效防止因过流或其他电源异常导致的设备损坏,延长设备的使用寿命。
故障检测装置所对应实施例中特征的说明可以参见故障检测方法所对应实施例的相关说明,这里不再一一赘述。
在一些实施例中,主板还包括第二受电设备;第二受电设备与第二电子开关的第二端连接;处理模块604还用于:对第二受电设备的异常报错信息进行屏蔽。
在一些实施例中,处理模块604具体用于:将第一电子开关当前的第一过流阈值电压设置为第二过流阈值电压,以使第一电子开关进入过流保护而关断;第二过流阈值电压小于第一过流阈值电压,且小于第一待机电源。
在一些实施例中,主板还包括第一存储模块;第一存储模块,与第一控制器连接;处理模块604还用于:若第一电源异常信息指示第二待机电源存在异常,则将第一电源异常信息存储于第一存储模块。
在一些实施例中,主板还包括管理控制器,管理控制器与第一电子开关的第二端、故障处理电路连接和第一控制器连接;处理模块604还用于:在交流上电后,从第一存储模块读取最新存入的第一电源异常信息;根据第一电源异常信息控制管理控制器根据第一电源异常信息生成异常日志,将异常日志显示在展示界面上。
在一些实施例中,供电系统还包括第三电子开关和第三受电设备;第三电子开关的第一端与第一电子开关的第二端连接,第二端与第三受电设备连接,控制端与第一控制器连接;处理模块604还用于:在第一待机电源的供电下,控制第三电子开关进入开启状态,为第三受电设备提供第三待机电源;获取第三电源就绪信号;第三电源就绪信号是第三电子开关根据自身的开关状态生成的;根据第三电源就绪信号确定第二电源异常信息;若第二电源异常信息指示第三待机电源存在异常,则将第二电源异常信息发送给故障处理电路,且将第二电子开关和第三电子开关进行关断。
图7为本申请提供的电子设备的结构示意图。如图7所示,本实施例提供的电子设备70包括:至少一个处理器701和存储器702。可选地,该电子设备70还包括通信部件703。其中,处理器701、存储器702以及通信部件703通过总线连接。
在具体实现过程中,至少一个处理器701执行存储器702存储的计算机执行指令,使得至少一个处理器701执行上述的故障检测方法实施例。
处理器701的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述的实施例中,应理解,处理器可以是中央处理单元(Central ProcessingUnit,简称:CPU),还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor,简称:DSP)、专用集成电路(Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速存储器(Random Access Memory,RAM),也可能还包括非易失性存储器(Non-volatile Memory,NVM),例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一种XX方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本申请的实施例还提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,计算机程序被处理器执行时实现上述任一种故障检测方法实施例中的步骤。
本申请的实施例还提供了另一种计算机程序产品,包括非易失性计算机可读存储介质,非易失性计算机可读存储介质存储计算机程序,计算机程序被处理器执行时实现上述任一种故障检测方法实施例中的步骤。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上对本申请所提供的一种供电系统、服务器、故障检测方法、设备及存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
Claims (22)
1.一种供电系统,其特征在于,包括:电源分配板和主板;所述主板包括第一受电设备、第一电子开关和故障处理电路;
所述电源分配板的输出端与所述第一电子开关的第一端连接,所述第一电子开关的第二端与所述第一受电设备和所述故障处理电路连接;
所述电源分配板用于在所述第一电子开关为开启状态时,为所述第一受电设备和所述故障处理电路提供第一待机电源;
所述第一电子开关,用于在所述第一待机电源为异常状态时进入关闭状态;
所述故障处理电路,用于在所述第一电子开关为关闭状态时,进行故障信息的记录。
2.根据权利要求1所述的系统,其特征在于,所述故障处理电路包括:续电开关、储能器件和故障诊断模块;
所述储能器件的输入端与所述第一电子开关的第二端连接,所述储能器件的输出端与所述续电开关的第一输入端连接,所述续电开关的输出端与所述故障诊断模块连接;
所述续电开关,用于在所述第一电子开管为关闭状态时,将所述储能器件与所述故障诊断模块导通;
所述故障诊断模块,用于在所述储能器件的供电下,进行故障信息的记录。
3.根据权利要求2所述的系统,其特征在于,所述故障诊断模块包括第一控制单元和第一存储单元;
所述第一控制单元,与所述储能器件和所述第一存储单元连接,用于在所述储能器件的供电下,将所述故障信息存储于所述第一存储单元。
4.根据权利要求2所述的系统,其特征在于,所述第一电子开关,与所述故障诊断模块连接;
所述第一电子开关,用于根据自身状态生成第一电源就绪信号,将所述第一电源就绪信号发送给所述故障诊断模块;
所述故障诊断模块,用于记录所述第一电源就绪信号。
5.根据权利要求2所述的系统,其特征在于,所述故障处理电路还包括:第一电压调节模块;
所述第一电压调节模块,输入端与所述第一电子开关的第二端连接,输出端与所述续电开关的第二输入端连接,用于对所述第一待机电源进行调节;
所述续电开关,用于在所述第一电子开关为开启状态时,选通所述第一电压调节模块为所述故障诊断模块供电;
故障诊断模块,用于在所述第一电压调节模块的供电下,进行故障信息的记录。
6.根据权利要求5所述的系统,其特征在于,所述第一电压调节模块,与所述储能器件连接,用于对所述第一待机电源进行调节,为所述储能器件提供充电电压。
7.根据权利要求1所述的系统,其特征在于,所述故障信息包括运行数据,所述主板还包括管理控制器;
所述管理控制器,与所述第一电子开关的第二端和所述故障处理电路连接,用于在所述第一待机电源供电的情况下,获取运行数据,并将所述运行数据发送给所述故障处理电路。
8.根据权利要求7所述的系统,其特征在于,所述主板还包括第二电压调节模块;
所述第二电压调节模块,输入端与所述第一电子开关连接,输出端与所述管理控制器连接,用于对所述第一待机电源进行调节,为所述管理控制器提供电源。
9.根据权利要求1-8任一项所述的系统,其特征在于,所述故障信息包括第一电源异常信息;所述主板还包括:第一控制器和第二电子开关;
所述第一控制器,与所述第一电子开关的第二端和所述第二电子开关的控制端连接,用于在所述第一待机电源供电的情况下,对所述第二电子开关进行控制;
所述第二电子开关,第一端与所述电源分配板连接,第二端与第二受电设备连接,用于在开启状态下,为所述第二受电设备提供第二待机电源,还用于在所述第二待机电源为异常状态时进入关闭状态;
所述第一控制器,还用于根据所述第二电子开关的开关状态生成所述第一电源异常信息,将所述第一电源异常信息发送给所述故障处理电路。
10.根据权利要求9所述的系统,其特征在于,所述故障信息包括第二电源异常信息;所述供电系统还包括从板,所述从板包括:第三电子开关和第三受电设备;
所述第三电子开关,第一端与所述第一电子开关的第二端连接,第二端与所述第三受电设备连接,控制端与所述第一控制器连接,用于在所述第一控制器的控制下进入开启状态,为所述第三受电设备提供第三待机电源,还用于在所述第三待机电源为异常状态时进入关闭状态;
所述第一控制器,用于根据所述第三电子开关的开关状态生成所述第二电源异常信息,将所述第二电源异常信息发送给所述故障处理电路。
11.根据权利要求9所述的系统,其特征在于,所述主板还包括第一存储模块;
所述第一存储模块,与所述第一控制器连接,用于将所述第一电源异常信息存储于所述第一存储模块。
12.一种服务器,其特征在于,包括如权利要求1至11任一项所述的供电系统。
13.一种故障检测方法,其特征在于,应用于如权利要求9至11任一项所述的供电系统,所述供电系统包括:电源分配板和主板;所述主板包括第一受电设备、第一电子开关、第一控制器、第二电子开关和故障处理电路;所述电源分配板的输出端与所述第一电子开关的第一端连接,所述第一电子开关的第二端与所述第一受电设备和所述故障处理电路连接;所述第一控制器与所述第一电子开关的第二端和所述第二电子开关的控制端连接;所述第二电子开关的第一端与所述电源分配板连接,第二端与第二受电设备连接;
所述方法包括:
在第一待机电源的供电下,控制所述第二电子开关进入开启状态,为所述第二受电设备提供第二待机电源;所述第一待机电源是所述第一电子开关在交流上电后进入开启状态而由所述电源分配板提供的;
获取第二电源就绪信号;所述第二电源就绪信号是所述第二电子开关根据自身的开关状态生成的;
根据所述第二电源就绪信号确定第一电源异常信息;
若所述第一电源异常信息指示所述第二待机电源存在异常,则将所述第一电源异常信息发送给所述故障处理电路,将所述第一电子开关关断。
14.根据权利要求13所述的方法,其特征在于,所述主板还包括第二受电设备;所述第二受电设备与所述第二电子开关的第二端连接;所述方法还包括:
对所述第二受电设备的异常报错信息进行屏蔽。
15.根据权利要求13所述的方法,其特征在于,所述将所述第一电子开关关断,包括:
将所述第一电子开关当前的第一过流阈值电压设置为第二过流阈值电压,以使所述第一电子开关进入过流保护而关断;所述第二过流阈值电压小于所述第一过流阈值电压,且小于所述第一待机电源。
16.根据权利要求13所述的方法,其特征在于,所述主板还包括第一存储模块;所述第一存储模块,与所述第一控制器连接;所述方法还包括:
若所述第一电源异常信息指示所述第二待机电源存在异常,则将所述第一电源异常信息存储于所述第一存储模块。
17.根据权利要求16所述的方法,其特征在于,所述主板还包括管理控制器,所述管理控制器与所述第一电子开关的第二端、所述故障处理电路连接和所述第一控制器连接;所述方法还包括:
在交流上电后,从所述第一存储模块读取最新存入的第一电源异常信息;
根据所述第一电源异常信息控制所述管理控制器根据所述第一电源异常信息生成异常日志,将所述异常日志显示在展示界面上。
18.根据权利要求13所述的方法,其特征在于,所述供电系统还包括第三电子开关和第三受电设备;所述第三电子开关的第一端与所述第一电子开关的第二端连接,第二端与第三受电设备连接,控制端与所述第一控制器连接;所述方法还包括:
在所述第一待机电源的供电下,控制所述第三电子开关进入开启状态,为所述第三受电设备提供第三待机电源;
获取第三电源就绪信号;所述第三电源就绪信号是所述第三电子开关根据自身的开关状态生成的;
根据所述第三电源就绪信号确定第二电源异常信息;
若所述第二电源异常信息指示所述第三待机电源存在异常,则将所述第二电源异常信息发送给所述故障处理电路,且将所述第二电子开关和所述第三电子开关进行关断。
19.一种故障检测装置,其特征在于,包括:
控制模块,用于在第一待机电源的供电下,控制第二电子开关进入开启状态,为第二受电设备提供第二待机电源;所述第一待机电源是第一电子开关在交流上电后进入开启状态而由电源分配板提供的;
获取模块,用于获取第二电源就绪信号;所述第二电源就绪信号是所述第二电子开关根据自身的开关状态生成的;
确定模块,用于根据所述第二电源就绪信号确定第一电源异常信息;
处理模块,用于若所述第一电源异常信息指示所述第二待机电源存在异常,则将所述第一电源异常信息发送给故障处理电路,将所述第一电子开关关断。
20.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求13至18任一项所述故障检测方法的步骤。
21.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求13至18任一项所述故障检测方法的步骤。
22.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求13至18任一项所述故障检测方法的步骤。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202510942166.3A CN120428838A (zh) | 2025-07-09 | 2025-07-09 | 供电系统、服务器、故障检测方法、设备及存储介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202510942166.3A CN120428838A (zh) | 2025-07-09 | 2025-07-09 | 供电系统、服务器、故障检测方法、设备及存储介质 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN120428838A true CN120428838A (zh) | 2025-08-05 |
Family
ID=96565945
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202510942166.3A Withdrawn CN120428838A (zh) | 2025-07-09 | 2025-07-09 | 供电系统、服务器、故障检测方法、设备及存储介质 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN120428838A (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN121050558A (zh) * | 2025-10-30 | 2025-12-02 | 浪潮计算机科技有限公司 | 基于状态监测的电源故障检测电路及方法、电子设备 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108983938A (zh) * | 2017-05-31 | 2018-12-11 | 广达电脑股份有限公司 | 当待机电源故障时可操作系统、计算机实现方法、及介质 |
| CN119376516A (zh) * | 2024-12-30 | 2025-01-28 | 苏州元脑智能科技有限公司 | 一种供电系统及其故障检测方法、设备、介质、程序产品 |
-
2025
- 2025-07-09 CN CN202510942166.3A patent/CN120428838A/zh not_active Withdrawn
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108983938A (zh) * | 2017-05-31 | 2018-12-11 | 广达电脑股份有限公司 | 当待机电源故障时可操作系统、计算机实现方法、及介质 |
| CN119376516A (zh) * | 2024-12-30 | 2025-01-28 | 苏州元脑智能科技有限公司 | 一种供电系统及其故障检测方法、设备、介质、程序产品 |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN121050558A (zh) * | 2025-10-30 | 2025-12-02 | 浪潮计算机科技有限公司 | 基于状态监测的电源故障检测电路及方法、电子设备 |
| CN121050558B (zh) * | 2025-10-30 | 2026-01-27 | 浪潮计算机科技有限公司 | 基于状态监测的电源故障检测电路及方法、电子设备 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN118897615B (zh) | 服务器电源管理系统、方法、设备、介质及程序产品 | |
| US8201009B2 (en) | Computer management and power backup system and device | |
| CN101782746B (zh) | 一种监控装置和监控方法 | |
| CN111831488B (zh) | 具有安全等级设计的tcms-mpu控制单元 | |
| CN120428838A (zh) | 供电系统、服务器、故障检测方法、设备及存储介质 | |
| CN110675143A (zh) | 加密货币采矿农场的操作和性能参数的监测和管理系统 | |
| US7045914B2 (en) | System and method for automatically providing continuous power supply via standby uninterrupted power supplies | |
| CN110445638A (zh) | 一种交换机系统故障保护方法及装置 | |
| JP3712556B2 (ja) | 電源装置、電源制御装置および電源システムのスケジュール運転監視制御方法 | |
| CN115237719A (zh) | 一种服务器电源可靠性的预警方法及系统 | |
| CN110032465A (zh) | 一种bmc重启日志记录方法和装置 | |
| CN113162015B (zh) | 一种主板电源异常定位保护方法及装置 | |
| CN118232506B (zh) | 一种节能自动售货机用ups电源智能管理方法及系统 | |
| US20040073817A1 (en) | Method for automatically saving in-process programs before shutdown | |
| CN111488050B (zh) | 一种电源监控方法、系统及服务器 | |
| CN110750427A (zh) | 一种数据中心设备巡检方法及系统 | |
| CN111338455A (zh) | 一种服务器电源管理装置、方法及系统 | |
| CN116301276A (zh) | 一种服务器电源模块状态检测装置及方法 | |
| JPH03103044A (ja) | 二重化電源のダイオード故障検出方式 | |
| CN114442785B (zh) | 一种服务器电源的输出保持时间延长方法和系统 | |
| CN114579361A (zh) | 一种基于cpld的系统监控装置 | |
| CN115309250A (zh) | 一种提高电源oring可靠性的方法及系统 | |
| CN111857319A (zh) | 一种服务器功耗智能优化方法与系统 | |
| CN120595923A (zh) | 异常断电保护系统、边缘计算机 | |
| CN100426194C (zh) | 自动存储ups相连设备中已开启文件的方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| WW01 | Invention patent application withdrawn after publication |
Application publication date: 20250805 |
|
| WW01 | Invention patent application withdrawn after publication |