[go: up one dir, main page]

CN120164516A - 一种热插拔测试板、热插拔测试系统、方法、设备及介质 - Google Patents

一种热插拔测试板、热插拔测试系统、方法、设备及介质 Download PDF

Info

Publication number
CN120164516A
CN120164516A CN202510198774.8A CN202510198774A CN120164516A CN 120164516 A CN120164516 A CN 120164516A CN 202510198774 A CN202510198774 A CN 202510198774A CN 120164516 A CN120164516 A CN 120164516A
Authority
CN
China
Prior art keywords
hot
hard disk
nvme
nvme hard
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202510198774.8A
Other languages
English (en)
Inventor
王树明
赵现普
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Computer Technology Co Ltd
Original Assignee
Inspur Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Computer Technology Co Ltd filed Critical Inspur Computer Technology Co Ltd
Priority to CN202510198774.8A priority Critical patent/CN120164516A/zh
Publication of CN120164516A publication Critical patent/CN120164516A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/56External testing equipment for static stores, e.g. automatic test equipment [ATE]; Interfaces therefor
    • G11C29/56016Apparatus features

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本申请实施例提供了一种热插拔测试板、热插拔测试系统、方法、设备及介质,涉及互联网大数据领域。热插拔测试板包括:逻辑模块、信号开关切换单元和电源检测单元,逻辑模块与信号开关切换单元相连接,用于传输NVME信号,并且控制信号开关切换单元的选通和切断,以实现NVME硬盘的热移除或热添加,信号开关切换单元响应于逻辑模块的控制,选通或切断对所述NVME硬盘的NVME信号传输,电源检测单元与NVME硬盘相连接,用于检测NVME硬盘在热插拔后是否正常下电或上电。通过这种方式,可以在不影响原有服务器整机结构、硬件软件逻辑的前提下,高效便捷进行NVME硬盘热插拔测试。

Description

一种热插拔测试板、热插拔测试系统、方法、设备及介质
技术领域
本申请涉及互联网大数据领域,特别涉及一种热插拔测试板、热插拔测试系统、方法、设备及介质。
背景技术
随着互联网大数据以及大模型应用的兴起,服务器对数据存储容量、存储速度以及系统运行速度的要求越来越高,相应的对NVME SSD(Non Volatile Memory ExpressSolid State Disk,非易失性固态硬盘)硬盘的需求也越来越大。AI(ArtificialIntelligence,人工智能)服务器系统中随着GPU(Graphics Processing Unit,图形处理器)模组数量以及算力爆发式的增长,数据存储的需求也使得NVME SSD配置数量逐渐增加。
如果服务器在业务运行时出现了NVME硬盘出现故障或NVME硬盘存储空间不足时,则需要运维人员及时更换故障NVME硬盘或添加NVME硬盘,而且不能影响业务正常运营。因此需要运维人员对NVME硬盘进行在线热插拔,而服务器的NVME SSD热插拔功能是否稳定可靠,必须经过充分的测试,避免出现因接线错误、软件故障导致NVME热插拔功能异常。
但目前服务器产品在工厂产线生产中,极少地对NVME SSD热插拔功能进行有效的功能检测,一方面NVME热插拔动作需要产线人员手工进行拔盘、插盘测试需要耗费极大人力,另一方面无法与OS(Operating System,操作系统)自动化老化程序形成配合,使得该项测试在大部分服务器生产过程中都是缺省的。因此,如何高效便捷地实现NVME硬盘热插拔测试,是亟待解决的问题。
发明内容
基于上述技术问题,本申请实施例提供一种热插拔测试板、热插拔测试系统、方法、设备及介质,旨在如何高效便捷地对服务器中NVME硬盘进行热插拔测试。
本申请实施例第一方面提供了一种热插拔测试板,包括:
逻辑模块、信号开关切换单元和电源检测单元;
所述逻辑模块与所述信号开关切换单元相连接,用于传输NVME信号,并且控制所述信号开关切换单元的选通和切断,以实现NVME硬盘的热移除或热添加;
所述信号开关切换单元响应于所述逻辑模块的控制,选通或切断对所述NVME硬盘的NVME信号传输;
所述电源检测单元与所述NVME硬盘相连接,用于检测所述NVME硬盘在热移除后是否正常下电或所述NVME硬盘在热添加后是否正常供电。
可选地,所述NVME信号包括NVME低速信号和NVME高速信号;所述逻辑模块与所述信号开关切换单元相连接,用于传输NVME信号,并且控制信号开关切换单元的选通和切断,包括:
在对所述NVME硬盘进行热移除的情况下,所述逻辑模块将所述NVME低速信号置为无效,并控制所述信号开关切换单元切断所述NVME高速信号的传输;
在对所述NVME硬盘进行热添加的情况下,所述逻辑模块将所述NVME低速信号置为有效,并控制所述信号开关切换单元选通所述NVME高速信号的传输。
可选地,所述热插拔测试板,还包括:
第一连接器组、第二连接器组;
所述第一连接器组分别与所述逻辑模块与所述信号开关切换单元相连接,所述第一连接器组用于接收所述NVME信号,并将所述NVME高速信号传输至所述信号开关切换单元,将所述NVME低速信号传输至所述逻辑模块;
所述第二连接器组分别与所述逻辑模块与所述信号开关切换单元相连接,所述第二连接器组接收来自所述信号开关切换单元的所述NVME高速信号,以及接收来自所述逻辑模块的低速信号,并将接收到的信号传输至所述NVME硬盘。
可选地,所述信号开关切换单元包括多组单刀双掷开关;
所述单刀双掷开关的输入端与所述第一连接器组连接,所述单刀双掷开关的第一输出端与所述第二连接器组连接,所述单刀双掷开关的第二输出端置于悬空状态。
可选地,所述热插拔测试板,还包括:
供电连接器、指令信号连接器;
所述供电连接器与所述逻辑模块、所述信号开关切换单元和所述电源检测单元相连接,用于接收电压输入,并对所述逻辑模块、所述信号开关切换单元和所述电源检测单元供电;
所述指令信号连接器与所述逻辑模块相连接,用于接收基板管理控制器对所述NVME硬盘的热插拔测试指令并发送给所述逻辑模块。
可选地,所述热插拔测试板,还包括:
接触开关;
所述接触开关用于向基板管理控制器提供所述热插拔测试板的在位状态。
本申请实施例第二方面提供了一种热插拔测试系统,包括:
热插拔测试板、中央处理单元、以及基板管理控制器;
所述热插拔测试板分别与所述中央处理单元和所述基板管理控制器连接,所述热插拔测试板为本申请第一方面所述的热插拔测试板;
所述中央处理单元与所述基板管理控制器连接,用于通过所述基板管理控制器获取热插拔测试板的在位状态,并向所述热插拔测试板发送NVME硬盘热插拔测试指令,所述NVME硬盘热插拔测试指令为热移除指令或热添加指令;
所述基板管理控制器用于反馈所述热插拔测试板的在位状态,以及将所述NVME硬盘热插拔测试指令转发给所述热插拔测试板。
本申请实施例第三方面提供了一种热插拔测试方法,应用于本申请实施例第二方面中所述的一种热插拔测试系统,所述方法包括:
中央处理单元通过基板管理控制器获取热插拔测试板的在位状态,并根据所述在位状态向所述基板管理控制器发送NVME硬盘热插拔测试指令,所述NVME硬盘热插拔测试指令为热移除指令或热添加指令;
所述基板管理控制器将所述NVME硬盘热插拔测试指令转发给所述热插拔测试板;
所述热插拔测试板根据所述NVME硬盘热插拔测试指令,对NVME硬盘进行热插拔测试。
可选地,在所述NVME硬盘热插拔测试指令为热移除指令的情况下,所述热插拔测试板根据所述NVME硬盘热插拔测试指令,对所述NVME硬盘进行热插拔测试,所述方法包括:
所述热插拔测试板的逻辑模块将NVME低速信号置为无效,并控制信号开关切换单元切断NVME高速信号的传输,以使所述NVME硬盘的状态信号变为无效;
在检测到所述NVME硬盘的状态信号变为无效的情况下,将所述NVME硬盘移除信息告知所述中央处理单元,以使所述中央处理单元卸载所述NVME硬盘的相关资源,并停止对所述NVME硬盘供电;
通过电源检测单元检测所述NVME硬盘是否正常下电,并将结果反馈给所述基板管理控制器;
所述中央处理单元检测所述NVME硬盘的是否移除成功,并通过所述基板管理控制器确定所述NVME硬盘是否停止供电。
可选地,在所述NVME硬盘热插拔测试指令为热添加指令的情况下,所述热插拔测试板根据所述NVME硬盘热插拔测试指令,对所述NVME硬盘进行热插拔测试,所述方法包括:
所述热插拔测试板的逻辑模块将NVME低速信号置为有效,并控制所述信号开关切换单元选通NVME高速信号的传输,以使所述NVME硬盘的状态信号变为有效;
在检测到所述NVME硬盘的状态信号变为有效的情况下,将所述NVME硬盘添加信息告知所述中央处理单元,以使所述中央处理单元安装所述NVME硬盘的相关资源,并开始对所述NVME硬盘供电;
通过电源检测单元检测所述NVME硬盘是否正常供电,并将结果反馈给所述基板管理控制器;
所述中央处理单元检测所述NVME硬盘的是否添加成功,并通过所述基板管理控制器确定所述NVME硬盘是否开始供电。
本申请实施例第四方面提供了一种电子设备,所述电子设备包括:包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被该处理器执行时实现如本申请实施例第三方面的热插拔测试方法。
本申请实施例第五方面提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现本申请实施例第三方面的热插拔测试方法。
本申请实施例第六方面提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现本申请实施例第三方面的热插拔测试方法。
根据本申请实施例中提出的热插拔测试板,在服务器原有的设计基础上,将待测试的NVME硬盘通过热插拔测试板连接安装至服务器中,通过逻辑模块与信号开关切换单元分别对NVME硬盘工作的高速信号与低速信号进行传输,并且通过逻辑模块接收热插拔测试的指令,控制信号开关切换单元切断或选通高速信号的传输,并且将低速信号置为无效或有效,还可以通过电源检测单元检测NVME硬盘是否正常下电或上电,在待测试的NVME硬盘连接在热插拔测试板的情况下,模拟NVME硬盘热移除以及热添加的不同情况,进行NVME硬盘的热插拔测试。
本申请中,通过连接热插拔测试板对NVME硬盘进行热插拔测试,在服务器整机结构的基础上,外接热插拔测试板,不影响整机的结构和逻辑功能,并且不仅正常对NVME硬盘转发各种信号,并且在进行热插拔测试的过程中,可以对实际热插拔使用场景中信号变化进行真实的模拟,使得测试结果更贴近真实情况;并且本申请中所提出的热插拔测试方法可以适用于服务器的自动化老化程序,可以直接添加为服务器自动化老化测试其中的一个环节,使得测试过程具备更高的效率;并且通过使用逻辑模块与信号开关切换单元对NVME硬盘信号进行控制,可以达到接近实际物理热插拔的方式,但是又不会对设备产生由于反复插拔所带来的机械性损耗,有益于提高产品质量。测试人员通过成本申请所提出的热插拔测试方法,可以在不影响原有服务器整机结构、硬件软件逻辑的前提下,通过自动化老化程序直接进行NVME硬盘热插拔功能的测试,整个过程高效便捷,确保了NVME硬盘热插拔功能的正常可靠,从而提升服务器整机质量的可靠性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是相关技术一实施例提出的一种软件控制模拟热插拔测试的连接示意图;
图2是相关技术一实施例提出的一种热插拔控制模块的连接示意图;
图3是本申请一实施例提出的一种热插拔测试板主要器件的示意图;
图4是本申请一实施例提出的一种热插拔测试板的示意图;
图5是本申请一实施例提出的一种检测NVME硬盘在位状态的示意图;
图6是相关技术一实施例提出的一种NVME硬盘管理拓扑结构示意图;
图7是本申请一实施例提出的一种热插拔测试系统示意图;
图8是本申请一实施例提供的一种热插拔测试方法的步骤流程图;
图9是本申请一实施例示出的一种电子设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在附图中,有时为了明确起见,可能夸大表示了构成要素的大小、层的厚度或区域,因此,本公开的任意一个实现方式并不一定限定与图中所示的尺寸,附图中部件的形状和大小不反映真实比例。此外,附图示意性地示出了理想的例子,本公开的任意一个实现方式不局限于附图所示的形状或数值等。
相关技术中,在大部分的服务器生产过程中,并一种便捷高效地对NVME硬盘进行热插拔测试的方法,有的基于自动化机械插拔结构的测试方法,可以应用于U.2等硬盘连接器的寿命可靠性测试中,但是并不能够结合服务器整机的电气装置进行NVME硬盘热插拔测试的功能验证,并且反复地进行物理性插拔,容易对服务器寿命产生影响,并且自动化机械结构要求设备空间较大,操作不够灵活,无法实现高效地进行NVME硬盘的热插拔测试。
在另一种相关技术中,一些服务器产品生产中采用软件控制的方式,如图1所示,图1是相关技术一实施例提出的一种软件控制模拟热插拔测试的连接示意图,通过系统的操作对NVME硬盘的PCIE(PCI-Express,peripheral component interconnect express)标准配置空间进行操作,其中第一总线为PCIE总线,中央处理单元为CPU,使得CPU(CentralProcessing Unit,中央处理器)与NVME硬盘之间的PCIE重复进行创建连接、断开连接的操作,模拟NVME的热插拔动作。但是这种通过软件模拟的方式,缺少了带外管理模块的配合,仅仅是对PCIE总线进行了建链可靠性的测试,并没有将服务器整机的热插拔功能进行测试,具备一定的功能缺陷,并不能模拟实际NVME硬盘热插拔过程可能出现的情况。
还有一种相关技术中,通过在服务器的背板中添加额外的热插拔控制模块进行热插拔的测试,如图2所示,图2是相关技术一实施例提出的一种热插拔控制模块的连接示意图,该热插拔控制模块可以模拟NVME硬盘热插拔的动作,并可以结合BMC(BaseboardManagement Controller,基板管理控制器)对测试的启动和停止进行控制,其中,第二总线为I2C(Inter-Integrated Circuit,集成电路总线)总线,对测试次数进行技术,模拟实际热插拔的动作。但是通过这种方法,虽然可以模拟热插拔处理流程,但是其实际的执行逻辑和服务器整机正常运行时的逻辑并不完全相同,进行了较大的更改,使得测试情况并不能完全代表实际工况,而且并不能结合现有的自动化老化程序,无法在进行自动化老化测试的过程中,高效地进行NVME硬盘的热插拔测试。
针对相关技术中所存在的不足,该发明设计了一种热插拔测试板,以及热插拔测试系统和方法,通过在服务器整机中安装热插拔测试板,可以在不影响整机结构和逻辑功能的前提下,有效地对NVME热插拔功能进行测试检验,解决在服务器生产过程中高效便捷地实现NVME硬盘热插拔测试的问题。本申请所提出了一种热插拔测试板请参照图3,图3是本申请一实施例提出的一种热插拔测试板主要器件的示意图。如图3所示,包括:
逻辑模块、信号开关切换单元和电源检测单元;
所述逻辑模块与所述信号开关切换单元相连接,用于传输NVME信号,并且控制所述信号开关切换单元的选通和切断,以实现NVME硬盘的热移除或热添加;
所述信号开关切换单元响应于所述逻辑模块的控制,选通或切断对所述NVME硬盘的NVME信号传输;
所述电源检测单元与所述NVME硬盘相连接,用于检测所述NVME硬盘在热移除后是否正常下电或所述NVME硬盘在热添加后是否正常供电。
本申请实施例中,热插拔测试板中主要包括逻辑模块、信号开关切换单元与电源检测单元三个部件,其中热插拔测试板的安装位置位于现有的服务器背板与NVME硬盘之间,原本直接连接传输给NVME硬盘的NVME信号,经过热插拔测试板中的逻辑模块和信号开关切换单元再传输至NVME硬盘中。其中逻辑模块还负责接收热插拔的测试指令并对信号开关切换单元下发控制信号,控制信号开关切换单元进行选通或切换。在一种可选的实施例中,逻辑模块为CPLD(Complex Programmable logic device,复杂可编程逻辑器件),信号开关切换单元为PCIE MUX(PCI-Express,peripheral component interconnect expressMultiplexer,高速串行计算机扩展总线多路复用器)。热插拔测试板中的电源检测单元,与测试板所连接的各个NVME硬盘相连接,可以检测NVME硬盘的供电状态,在进行热插拔的测试过程中,可以通过电源检测单元确定在热移除后NVME硬盘是否正常下电以及在热添加后NVME硬盘是否正常上点,并且,电源检测单元还可以检测热插拔测试板是否供电正常,以及热插拔测试板中的各个模块是否供电正常。
具体地,所述NVME信号包括NVME低速信号和NVME高速信号;所述逻辑模块与所述信号开关切换单元相连接,用于传输NVME信号,并且控制信号开关切换单元的选通和切断,所述热插拔测试板还包括:
在对所述NVME硬盘进行热移除的情况下,所述逻辑模块将所述NVME低速信号置为无效,并控制所述信号开关切换单元切断所述NVME高速信号的传输;
在对所述NVME硬盘进行热添加的情况下,所述逻辑模块将所述NVME低速信号置为有效,并控制所述信号开关切换单元选通所述NVME高速信号的传输。
本申请实施例中,在NVME硬盘正常连接在服务器的情况中,NVME信号包括有NVME低速信号,如BMC I2C管理信号、NVME pcie reset信号、NVME present信号、ifdet#信号、active信号等,还包括有NVME高速信号,如PCIe信号、100M时钟信号等,在实际使用的过程中,NVME硬盘通过连接器连接在服务器中,在进行热插拔的过程中,由于连接器中金手指长短不一,因此不同的信号在进行热插拔的过程中其连接和断开的顺序不尽相同,金手指较短的传输通道中信号就会更早的断开,金手指较长的传输通道中信号就会更晚的断开,因此,需要将NVME信号根据高速信号与低速信号进行划分,分别进行控制。在本申请中,通过信号开关切换单元控制NVME高速信号,通过逻辑模块控制低速信号,具体表现为:在进行热移除的过程中,逻辑模块接收到热移除指令,将NVME低速信号按照顺序依次置为无效状态,模拟实际热移除过程中NVME硬盘从服务器的连接器中拔出的状态,各个低速信号根据金手指的长短依次断开,同时,逻辑模块还对信号开关切换单元下发控制指令,使得信号开关切换单元切断NVME高速信号的传输;反之,在进行热添加的过程中,逻辑模块接收到热添加指令,将NVME低速信号按照顺序依次置为有效状态,模拟实际热添加过程中NVME硬盘插入服务器的连接器中的状态,各个低速信号根据金手指的长短依次连接,同时,逻辑模块还对信号开关切换单元下发控制指令,使得信号开关切换单元选通NVME高速信号的传输。
具体地,所述热插拔测试板还包括:
第一连接器组、第二连接器组;
所述第一连接器组分别与所述逻辑模块与所述信号开关切换单元相连接,所述第一连接器组用于接收所述NVME信号,并将所述NVME高速信号传输至所述信号开关切换单元,将所述NVME低速信号传输至所述逻辑模块;
所述第二连接器组分别与所述逻辑模块与所述信号开关切换单元相连接,所述第二连接器组接收来自所述信号开关切换单元的所述NVME高速信号,以及接收来自所述逻辑模块的低速信号,并将接收到的信号传输至所述NVME硬盘。
本申请实施例中,如图4所示,图4是本申请一实施例提出的一种热插拔测试板的示意图,在原本NVME硬盘与背板相连接的位置中间添加了热插拔测试板,热插拔测试板需要建立服务器背板与NVME硬盘之间的连接关系,因此还需要包括第一连接器组与第二连接器组,第一连接器组用于与服务器背板对应连接,用于传输服务器与各个NVME硬盘之间的NVME信号,在服务器的NVME信号通过第一连接器组传输至热插拔测试板后,第一连接器组将NVME高速信号传输至信号开关切换单元,将低速信号传输至逻辑模块。同样的,在热插拔测试板的另一侧还包括第二连接器组,第二连接器组与各个NVME硬盘相连接,用于建立热插拔测试板与NVME硬盘之间的NVME信号的传输,具体地,将NVME高速信号由信号开关切换单元传输至NVME硬盘中,将NVME低速信号由逻辑模块传输至NVME硬盘中。
具体地,信号开关切换单元包括多组单刀双掷开关;
所述单刀双掷开关的输入端与所述第一连接器组连接,所述单刀双掷开关的第一输出端与所述第二连接器组连接,所述单刀双掷开关的第二输出端置于悬空状态。
本申请实施例中,信号开关切换单元中包括有多组单刀双掷开关,每个开关均对应一个NVME硬盘,用于控制对应NVME硬盘高速信号的选通与切断,其中单刀双掷开关的输入端与第一连接器组对应的连接器相连接,用于接收服务器的NVME高速信号,而输出端分为第一输出端和第二输出端,在开关连接至第一输出端时,单刀双掷开关与第二连接器组相连接,建立起对应的NVME硬盘的NVME高速信号的传输通道,而当开关连接至第二输出端时,单刀双掷开关悬空,对应的NVME硬盘与服务器之间高速NMVE信号的传输被切断,模拟NVME硬盘热移除的情况。
具体地,所述热插拔测试板还包括:
供电连接器、指令信号连接器;
所述供电连接器与所述逻辑模块、所述信号开关切换单元和所述电源检测单元相连接,用于接收电压输入,并对所述逻辑模块、所述信号开关切换单元和所述电源检测单元供电;
所述指令信号连接器与所述逻辑模块相连接,用于接收基板管理控制器对所述NVME硬盘的热插拔测试指令并发送给所述逻辑模块。
本申请实施例中,热插拔测试板上除了上文所述的第一连接器组和第二连接器组之外,还存在供电连接器与指令信号连接器与服务器背板相连接,其中供电连接器用于接收服务器背板中的电压输入,并且传输至热插拔测试板的各个模块中,实现对热插拔测试板中的逻辑模块、信号开关切换单元和电源检测单元的供电;而指令信号连接器用于接收服务器CPU中所下发的进行热插拔测试的指令信号,指令信号发送至逻辑模块中,逻辑模块根据收到的指令信号,对其中的低速信号置为无效或有效,并且控制对应信号开关切换单元进行切断或选通。
具体地,所述热插拔测试板还包括:
接触开关;
所述接触开关用于向基板管理控制器提供所述热插拔测试板的在位状态。
本申请实施例中,还在热插拔测试板上设置有一个接触开关,该接触开关与服务器背板中所设置的接触开关相对应,在热插拔测试板安装于服务器背板后,这两个相对应的接触开关闭合接触,从而向服务器发出热插拔测试板的在位信号,表示热插拔测试板已经成功连接至服务器背板上,服务器中的基板管理控制器控制器在确认热插拔测试板处于在位的状态后,确定可以进行NVME硬盘的热插拔测试,从而再根据测试的需要,通过上文所述的指令信号连接器向热插拔测试板中的逻辑模块下发进行热插拔测试的具体指令信号。
可选地,在本申请一实施例中示出了一种检测NVME硬盘在位状态的设计,如图5所示,图5是本申请一实施例提出的一种检测NVME硬盘在位状态的示意图,如图所示,中央处理单元通过第三总线连通选路芯片,其中第三总线可以为HP_I2C(hotplug_Inter-Integrated Circuit,热插拔集成电路总线)总线,而选路芯片可以为I2C switch芯片,通过选路芯片外接一个多GPIO(General-purpose input/output,通用输入输出端口)的模拟芯片,可以为9555i2c GPIO扩展芯片,通过扩展芯片检测NVME硬盘的在位信号,并且当在位信号发生变化时,可以告知CPU(图5中的中央处理单元),从而CPU根据NVME硬盘是否在位的信息对其进行相应的资源添加或是移除。在一种可选的实施例中,也可以通过背板逻辑单元,执行9555io的逻辑模拟,通过逻辑模拟灵活配置,增加适用性。
本申请中,还提出了一种热插拔测试系统,其中包括:
热插拔测试板、中央处理单元、以及基板管理控制器;
所述热插拔测试板分别与所述中央处理单元和所述基板管理控制器连接,所述热插拔测试板为上述实施例中任一所述的热插拔测试板;
所述中央处理单元与所述基板管理控制器连接,用于通过所述基板管理控制器获取热插拔测试板的在位状态,并向所述热插拔测试板发送NVME硬盘热插拔测试指令,所述NVME硬盘热插拔测试指令为热移除指令或热添加指令;
所述基板管理控制器用于反馈所述热插拔测试板的在位状态,以及将所述NVME硬盘热插拔测试指令转发给所述热插拔测试板。
相关技术中,在服务器中连接NVME硬盘的具体连接系统如图6所示,图6是相关技术一实施例提出的一种NVME硬盘管理拓扑结构示意图,其中中央处理单元,即CPU设置在主板上,通过第三总线,即HP_I2C总线与背板中的背板逻辑单元相连接,获取各个NVME硬盘的状态信息并传输NVME低速信号,并且通过第一总线,即PCIE总线和各个NVME硬盘建立高速信号传输,其中,背板逻辑单元为CPLD(Complex Programmable logic device,复杂可编程逻辑器件);基板管理控制器通过选路芯片获取各个NVME硬盘的槽位信息,以及访问NVME硬盘,通过背板上的总线开关在NVME硬盘移除时进行选通切换。
本申请实施例中,在相关技术的基础上,添加了热插拔测试板至服务器中,如图7所示,图7是本申请一实施例提出的一种热插拔测试系统示意图,其中,热插拔测试板通过上文所述的各个连接器与服务器背板相连接,并通过第二连接器组连接多个NVME硬盘,通过第一总线,即PCIE总线与中央处理单元相连接,获取中央处理单元发送至各个NVME硬盘的高速信号,通过与背板逻辑单元相连接,获取发送至各个NVME硬盘的低速信号,为将背板中设置的CPLD与热插拔测试板中所使用的CPLD加以区分,此处将背板中的CPLD称为背板逻辑单元,将热插拔测试板中的CPLD称为逻辑模块。基板管理控制器安装在基板管理控制器管理板上,通过接触开关中的在位信号,基板管理控制器获取热插拔测试板的在位状态,并且通过第四总线上报至中央处理单元,在一种可选的实施例中,第四总线可以为LPC(Lowpin count)/eSPI(Enhanced Serial Peripheral Interface)总线。中央处理单元安装在服务器主板上,基板管理控制器可以根据中央处理单元的指令对热插拔测试板发出热插拔测试的指令,其中处理器背板上还设置有电子熔断器(efuse),用于对热插拔测试板的供电进行供电保护。
本申请实施例中还提出了一种热插拔测试方法,如图8所示,图8是本申请一实施例提供的一种热插拔测试方法的步骤流程图,该方法应用于本申请实施例中的热插拔测试系统,包括步骤S801至步骤S803:
步骤S801:中央处理单元通过基板管理控制器获取热插拔测试板的在位状态,并根据所述在位状态向所述基板管理控制器发送NVME硬盘热插拔测试指令,所述NVME硬盘热插拔测试指令为热移除指令或热添加指令;
步骤S802:所述基板管理控制器将所述NVME硬盘热插拔测试指令转发给所述热插拔测试板;
步骤S803:所述热插拔测试板根据所述NVME硬盘热插拔测试指令,对NVME硬盘进行热插拔测试。
本申请实施例中,在热插拔测试板连接至服务器中,触发了在位开关产生的在位信号后,中央处理单元即可通过基板管理控制器获取到热插拔测试板的在位状态,在热插拔测试板在位的情况下,开始进行热插拔测试,首先需要对进行测试的目标NVME硬盘下发热插拔测试的指令,具体可以为进行热添加或者热移除,通常情况下,在进行服务器的生产测试阶段,选择先进行热移除、再进行热添加的方式,完整地进行NVME硬盘的热插拔测试;然后在中央处理器下发了热插拔测试的具体指令后基板管理控制器将热插拔指令下通过指令信号连接器发至热插拔测试板中的逻辑模块,逻辑模块根据所接到的热插拔测试指令,即可进行相应的热插拔测试。
结合以上实施例,在一种实施方式中,本申请还提供了一种热插拔测试方法,在所述NVME硬盘热插拔测试指令为热移除指令的情况下,所述热插拔测试板根据所述NVME硬盘热插拔测试指令,对所述NVME硬盘进行热插拔测试,包括:
首先,所述热插拔测试板的逻辑模块将NVME低速信号置为无效,并控制信号开关切换单元切断NVME高速信号的传输,以使所述NVME硬盘的状态信号变为无效。
本申请实施例中,在逻辑模块接收到热移除指令后,首先会对将其中所传输NVME低速信号,根据实际热移除的情况依次置为无效状态,例如,将其中的ifdet#、present信号先后置为无效状态,同时,逻辑模块还会对信号开关切换单元下发热移除的控制指令,对目标NVME硬盘所对应的单刀双掷开关进行控制,将其由第一输出端切换至悬空状态的第二输出端,从而切断目标NVME硬盘的NVME高速信号的传输。在中央处理单元下发了热移除指令后,背板逻辑单元还会对目标NVME硬盘的状态信号进行检测,在热插拔测试板完成热移除操作时NVME高速信号与NVME低速信号的切断模拟后,目标NVME硬盘的状态变为无效。
然后,在检测到所述NVME硬盘的状态信号变为无效的情况下,将所述NVME硬盘移除信息告知所述中央处理单元,以使所述中央处理单元卸载所述NVME硬盘的相关资源,并停止对所述NVME硬盘供电。
本申请实施例中,背板逻辑单元在检测到目标NVME硬盘的状态信号变为无效的情况下,会将该目标NVME硬盘已经移除的信息告知中央处理单元,中央处理单元便会对该目标NVME硬盘相关的资源进行卸载,同时还会停止对目标NVME硬盘停止供电,并且在总线开关对NVME硬盘的选择中,移除对目标NVME硬盘的选项。
接着,通过电源检测单元检测所述NVME硬盘是否正常下电,并将结果反馈给所述基板管理控制器。
本申请实施例中,在中央处理单元对目标NVME硬盘停止供电后,热插拔测试板中的电源检测单元还会持续对目标NVME硬盘的供电情况进行检测,并且在热移除的测试中,检测到目标NVME硬盘已经正常下电,还会根据中央处理单元的指令,将下电成功的结果反馈给基板管理控制器。
最后,所述中央处理单元检测所述NVME硬盘的是否移除成功,并通过所述基板管理控制器确定所述NVME硬盘是否停止供电。
本申请实施例中,中央处理单元在完成下发热移除的指令后,会经过一段等待时间,等待后续热插拔测试板完成对目标NVME硬盘的热移除操作,再进行检测所述NVME硬盘是否移除成功,同时还会下发指令给基板管理控制器,确定目标NVME硬盘是否已经为移除下电状态,在检测通过并且目标NVME硬盘已经停止供电的情况下,证明目标NVME硬盘已经热移除成功。
结合以上实施例,在一种实施方式中,本申请还提供了一种热插拔测试方法,在所述NVME硬盘热插拔测试指令为热添加指令的情况下,所述热插拔测试板根据所述NVME硬盘热插拔测试指令,对所述NVME硬盘进行热插拔测试,包括:
所述热插拔测试板的逻辑模块将NVME低速信号置为有效,并控制所述信号开关切换单元选通NVME高速信号的传输,以使所述NVME硬盘的状态信号变为有效;
在检测到所述NVME硬盘的状态信号变为有效的情况下,将所述NVME硬盘添加信息告知所述中央处理单元,以使所述中央处理单元安装所述NVME硬盘的相关资源,并开始对所述NVME硬盘供电;
通过电源检测单元检测所述NVME硬盘是否正常供电,并将结果反馈给所述基板管理控制器;
所述中央处理单元检测所述NVME硬盘的是否添加成功,并通过所述基板管理控制器确定所述NVME硬盘是否开始供电。
本申请实施例中,在通常情况下而言,进行服务器的测试过程中,通常都会对NVME硬盘先进行热移除测试,再进行热添加测试,热添加测试的测试过程与上述热移除测试的过程类似,首先根据中央处理单元下发的热添加指令,热插拔测试板的逻辑模块将目标NVME硬盘的低速信号置为有效,并且控制信号开关切换单元将NMVE高速信号进行选通,从而使得目标NVME硬盘的状态变为有效;在背板逻辑单元在检测到目标NVME硬盘的状态信号变为有效的情况下,会将该目标NVME硬盘已经添加的信息告知中央处理单元,中央处理单元便会对该目标NVME硬盘相关的资源进行安装,同时还会对目标NVME硬盘供电,并且在总线开关对NVME硬盘的选择中,添加对目标NVME硬盘的选项;同时,热插拔测试板的电源检测单元还会对目标NVME硬盘的供电状态进行检测,检测到正常上电后,会将结果反馈给基板管理控制器;最后中央处理单元在完成下发热添加指令并等待一段时间后,检测目标NVME硬盘是否添加成功,并且还会下发指令给基板管理控制器,确定目标NVME硬盘已经为上电状态,在检测通过并且目标NVME硬盘已经上电的情况下,证明目标NVME硬盘已经热添加成功。
基于同一设计构思,本申请另一实施例提供一种计算机可读存储介质,该计算机程序产品上存储有计算机程序,该计算机程序被处理器执行时实现如本申请上述任一实施例所述的热插拔测试方法中的步骤。
基于同一设计构思,本申请另一实施例提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现如本申请上述任一实施例所述的热插拔测试方法中的步骤。
基于同一设计构思,本申请另一实施例提供一种电子设备,如图9所示。图9是本申请一实施例示出的一种电子设备的示意图。该电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行时实现本申请上述任一实施例所述的热插拔测试方法中的步骤。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种热插拔测试板、热插拔测试系统、方法、设备及介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (12)

1.一种热插拔测试板,其特征在于,包括:
逻辑模块、信号开关切换单元和电源检测单元;
所述逻辑模块与所述信号开关切换单元相连接,用于传输NVME信号,并且控制所述信号开关切换单元的选通和切断,以实现NVME硬盘的热移除或热添加;
所述信号开关切换单元响应于所述逻辑模块的控制,选通或切断对所述NVME硬盘的NVME信号传输;
所述电源检测单元与所述NVME硬盘相连接,用于检测所述NVME硬盘在热移除后是否正常下电或所述NVME硬盘在热添加后是否正常供电。
2.根据权利要求1所述的热插拔测试板,其特征在于,所述NVME信号包括NVME低速信号和NVME高速信号;所述逻辑模块与所述信号开关切换单元相连接,用于传输NVME信号,并且控制信号开关切换单元的选通和切断,包括:
在对所述NVME硬盘进行热移除的情况下,所述逻辑模块将所述NVME低速信号置为无效,并控制所述信号开关切换单元切断所述NVME高速信号的传输;
在对所述NVME硬盘进行热添加的情况下,所述逻辑模块将所述NVME低速信号置为有效,并控制所述信号开关切换单元选通所述NVME高速信号的传输。
3.根据权利要求2所述的热插拔测试板,其特征在于,还包括:
第一连接器组、第二连接器组;
所述第一连接器组分别与所述逻辑模块与所述信号开关切换单元相连接,所述第一连接器组用于接收所述NVME信号,并将所述NVME高速信号传输至所述信号开关切换单元,将所述NVME低速信号传输至所述逻辑模块;
所述第二连接器组分别与所述逻辑模块与所述信号开关切换单元相连接,所述第二连接器组接收来自所述信号开关切换单元的所述NVME高速信号,以及接收来自所述逻辑模块的低速信号,并将接收到的信号传输至所述NVME硬盘。
4.根据权利要求3所述的热插拔测试板,其特征在于,所述信号开关切换单元包括多组单刀双掷开关;
所述单刀双掷开关的输入端与所述第一连接器组连接,所述单刀双掷开关的第一输出端与所述第二连接器组连接,所述单刀双掷开关的第二输出端置于悬空状态。
5.根据权利要求1所述的热插拔测试板,其特征在于,还包括:
供电连接器、指令信号连接器;
所述供电连接器与所述逻辑模块、所述信号开关切换单元和所述电源检测单元相连接,用于接收电压输入,并对所述逻辑模块、所述信号开关切换单元和所述电源检测单元供电;
所述指令信号连接器与所述逻辑模块相连接,用于接收基板管理控制器对所述NVME硬盘的热插拔测试指令并发送给所述逻辑模块。
6.根据权利要求1所述的热插拔测试板,其特征在于,还包括:
接触开关;
所述接触开关用于向基板管理控制器提供所述热插拔测试板的在位状态。
7.一种热插拔测试系统,其特征在于,包括:
热插拔测试板、中央处理单元、以及基板管理控制器;
所述热插拔测试板分别与所述中央处理单元和所述基板管理控制器连接,所述热插拔测试板为权利要求1-6任一所述的热插拔测试板;
所述中央处理单元与所述基板管理控制器连接,用于通过所述基板管理控制器获取热插拔测试板的在位状态,并向所述热插拔测试板发送NVME硬盘热插拔测试指令,所述NVME硬盘热插拔测试指令为热移除指令或热添加指令;
所述基板管理控制器用于反馈所述热插拔测试板的在位状态,以及将所述NVME硬盘热插拔测试指令转发给所述热插拔测试板。
8.一种热插拔测试方法,其特征在于,应用于权利要求7所述的热插拔测试系统,包括:
中央处理单元通过基板管理控制器获取热插拔测试板的在位状态,并根据所述在位状态向所述基板管理控制器发送NVME硬盘热插拔测试指令,所述NVME硬盘热插拔测试指令为热移除指令或热添加指令;
所述基板管理控制器将所述NVME硬盘热插拔测试指令转发给所述热插拔测试板;
所述热插拔测试板根据所述NVME硬盘热插拔测试指令,对NVME硬盘进行热插拔测试。
9.根据权利要求8所述的热插拔测试方法,其特征在于,在所述NVME硬盘热插拔测试指令为热移除指令的情况下,所述热插拔测试板根据所述NVME硬盘热插拔测试指令,对所述NVME硬盘进行热插拔测试,包括:
所述热插拔测试板的逻辑模块将NVME低速信号置为无效,并控制信号开关切换单元切断NVME高速信号的传输,以使所述NVME硬盘的状态信号变为无效;
在检测到所述NVME硬盘的状态信号变为无效的情况下,将所述NVME硬盘移除信息告知所述中央处理单元,以使所述中央处理单元卸载所述NVME硬盘的相关资源,并停止对所述NVME硬盘供电;
通过电源检测单元检测所述NVME硬盘是否正常下电,并将结果反馈给所述基板管理控制器;
所述中央处理单元检测所述NVME硬盘的是否移除成功,并通过所述基板管理控制器确定所述NVME硬盘是否停止供电。
10.根据权利要求8所述的热插拔测试方法,其特征在于,在所述NVME硬盘热插拔测试指令为热添加指令的情况下,所述热插拔测试板根据所述NVME硬盘热插拔测试指令,对所述NVME硬盘进行热插拔测试,包括:
所述热插拔测试板的逻辑模块将NVME低速信号置为有效,并控制所述信号开关切换单元选通NVME高速信号的传输,以使所述NVME硬盘的状态信号变为有效;
在检测到所述NVME硬盘的状态信号变为有效的情况下,将所述NVME硬盘添加信息告知所述中央处理单元,以使所述中央处理单元安装所述NVME硬盘的相关资源,并开始对所述NVME硬盘供电;
通过电源检测单元检测所述NVME硬盘是否正常供电,并将结果反馈给所述基板管理控制器;
所述中央处理单元检测所述NVME硬盘的是否添加成功,并通过所述基板管理控制器确定所述NVME硬盘是否开始供电。
11.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述计算机程序被所述处理器执行时实现如权利要求8至10任一所述的热插拔测试方法。
12.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求8至10任一所述的热插拔测试方法。
CN202510198774.8A 2025-02-21 2025-02-21 一种热插拔测试板、热插拔测试系统、方法、设备及介质 Pending CN120164516A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202510198774.8A CN120164516A (zh) 2025-02-21 2025-02-21 一种热插拔测试板、热插拔测试系统、方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202510198774.8A CN120164516A (zh) 2025-02-21 2025-02-21 一种热插拔测试板、热插拔测试系统、方法、设备及介质

Publications (1)

Publication Number Publication Date
CN120164516A true CN120164516A (zh) 2025-06-17

Family

ID=96008349

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202510198774.8A Pending CN120164516A (zh) 2025-02-21 2025-02-21 一种热插拔测试板、热插拔测试系统、方法、设备及介质

Country Status (1)

Country Link
CN (1) CN120164516A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN120560924A (zh) * 2025-07-30 2025-08-29 苏州元脑智能科技有限公司 背板测试装置、方法、系统、设备、存储介质及程序产品
CN121255699A (zh) * 2025-12-08 2026-01-02 苏州元脑智能科技有限公司 一种热插拔管理板及其热插拔方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN120560924A (zh) * 2025-07-30 2025-08-29 苏州元脑智能科技有限公司 背板测试装置、方法、系统、设备、存储介质及程序产品
CN120560924B (zh) * 2025-07-30 2025-12-05 苏州元脑智能科技有限公司 背板测试装置、方法、系统、设备、存储介质及程序产品
CN121255699A (zh) * 2025-12-08 2026-01-02 苏州元脑智能科技有限公司 一种热插拔管理板及其热插拔方法

Similar Documents

Publication Publication Date Title
CN120164516A (zh) 一种热插拔测试板、热插拔测试系统、方法、设备及介质
CN111339010B (zh) 一种pcie设备热插拔识别方法、系统及相关组件
CN112306952B (zh) 一种主机板及服务器
CN109240953A (zh) 一种自适应切换硬盘的方法、转接板及系统
WO2021098485A1 (zh) PCIe设备的上下电控制方法以及系统
CN119473744B (zh) 链路测试方法、电子设备、存储介质、产品及计算设备
CN101408857B (zh) Sas接口测试装置
CN118503179B (zh) 基于飞腾服务器的NVMe硬盘热插拔系统及方法
CN115904024A (zh) 一种多模硬盘背板结构、方法及服务器
CN213365511U (zh) 一种主机板及服务器
CN101923505A (zh) 外围组件互连快速插槽的测试系统及测试方法
CN112069002A (zh) 一种服务器热插拔调试装置及方法
CN103178980A (zh) 网卡管理系统
CN114356411A (zh) 一种应用于安培服务器的硬盘上下电控制系统
CN114116415A (zh) 一种硬盘背板、硬盘点灯控制系统、方法、装置及介质
CN217787754U (zh) 自动化测试装置及系统
CN107590045A (zh) 一种在Linux系统下对EIO板卡进行热插拔测试的方法
CN120353303B (zh) 服务器的管理系统及服务器
CN110990316A (zh) 用于输出热插拔设备状态的方法和可编程逻辑电路
CN107179972A (zh) 用于测试计算机的方法、微控制器、测试设备和测试系统
CN118626431B (zh) 处理器通信方法、装置、设备、系统及存储介质
CN111694340B (zh) 一种PSU BootLoader自动测试治具及方法
CN110874293A (zh) 热插拔测试装置
CN114238001B (zh) 一种服务器主板上电电路及上电方法
CN114265786B (zh) 自动化测试方法、装置,计算机设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination