[go: up one dir, main page]

CN111008119A - 一种硬盘预测模型的更新方法、装置、设备及介质 - Google Patents

一种硬盘预测模型的更新方法、装置、设备及介质 Download PDF

Info

Publication number
CN111008119A
CN111008119A CN201911284442.2A CN201911284442A CN111008119A CN 111008119 A CN111008119 A CN 111008119A CN 201911284442 A CN201911284442 A CN 201911284442A CN 111008119 A CN111008119 A CN 111008119A
Authority
CN
China
Prior art keywords
hard disk
prediction model
sample data
updating
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911284442.2A
Other languages
English (en)
Inventor
张廷雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IEIT Systems Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201911284442.2A priority Critical patent/CN111008119A/zh
Publication of CN111008119A publication Critical patent/CN111008119A/zh
Priority to US17/781,326 priority patent/US20230004824A1/en
Priority to PCT/CN2020/103737 priority patent/WO2021114676A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Hardware Design (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种硬盘预测模型的更新方法,获取用于更新硬盘预测模型的第一样本数据,并根据第一样本数据确定硬盘预测模型中需要更新的目标决策树;按照预设的选取规则,从第一样本数据中选取出第二样本数据;根据第二样本数据确定目标决策树中需要更新的目标叶节点;根据硬盘预测模型自身的分裂规则,对目标叶节点进行分裂以更新目标决策树。由此可见,整个更新过程简单,无需重新建立新的硬盘预测模型,节省了更新所用的时间;提高了硬盘故障预测的准确性,更好地满足了用户的需求。此外,本发明所提供的一种硬盘预测模型的更新装置、设备及存储介质与上述方法对应。

Description

一种硬盘预测模型的更新方法、装置、设备及介质
技术领域
本发明涉及云计算数据中心技术领域,特别是涉及一种硬盘预测模型的更新方法、装置、设备及介质。
背景技术
随着云计算技术的迅猛发展,数据的总量呈现指数级的增长。但在数据中心,硬盘仍然是主要的数据存储媒介,一旦硬盘出现故障,将导致出现数据丢失的危险,给企业带来严重的损失。因此,对硬盘故障进行预测是保证数据存储安全的十分重要的步骤。
一般情况下,首先从硬盘中获取到的用于代表硬盘状态的监测数据,并根据增量随机森林算法和获取到的监测数据建立硬盘故障预测模型,通过硬盘故障预测模型预测硬盘的故障情况。但是,硬盘状态在不断变化,硬盘中获得的监测数据也随之增加,在增量场景下使用相同的故障预测模型,将导致预测结果的精度逐渐降低。
现有技术中,为防止预测结果的精度逐渐降低的情况,通常采用重新建立硬盘故障预测模型的方式。但是,重新建立故障模型需要重新收集大量的数据,并利用增量随机森林算法进行复杂地计算,操作步骤繁琐,十分耗时,并不适用于增量场景下多次进行操作,无法更好地满足用户的需求。
发明内容
本发明的目的是提供一种硬盘预测模型的更新方法、装置、设备及介质。通过确定出当前的硬盘预测模型中需要更新的叶节点,并仅对各叶节点进行分裂操作,从而完成硬盘预测模型中的决策树的更新,也就完成了整个硬盘预测模型的更新。整个更新过程简单,无需重新建立新的硬盘预测模型,仅对当前的硬盘预测模型适应性地更新,保证了硬盘故障预测模型的时效性的同时,节省了更新所用的时间;提高了硬盘故障预测的准确性,确保数据存储的可靠性,更好地满足了用户的需求。
为解决上述技术问题,本发明提供一种硬盘预测模型的更新方法,包括:
获取用于更新硬盘预测模型的第一样本数据,并根据所述第一样本数据确定所述硬盘预测模型中需要更新的目标决策树;
按照预设的选取规则,从所述第一样本数据中选取出第二样本数据;
根据所述第二样本数据确定所述目标决策树中需要更新的目标叶节点;
根据所述硬盘预测模型自身的分裂规则,对所述目标叶节点进行分裂以更新所述目标决策树。
优选地,所述第一样本数据具体为硬盘中新增的SMART数据。
优选地,所述根据所述第一样本数据确定所述硬盘预测模型中需要更新的目标决策树具体包括:
将所述第一样本数据中的各数据依次输入至硬盘预测模型的各个决策树中,分别记录各所述数据在各所述决策树中得到的预测结果;
将所述预测结果与各所述数据的实际结果进行比较,计算各所述决策树的预测准确率;
将所述预测准确率低于目标准确率的决策树确定为所述目标决策树。
优选地,所述选取规则具体为选取所述第一样本数据中所述预测结果与所述实际结果不一致的数据作为所述第二样本数据。
优选地,所述根据所述第二样本数据确定所述目标决策树中需要更新的目标叶节点具体包括:
将所述第二样本数据输入至所述目标决策树中,判断所述目标决策树中各叶节点得到的当前决策信息与存储的历史决策信息是否一致;
如果否,则确定所述叶节点为所述目标叶节点。
优选地,所述获取用于更新硬盘预测模型的第一样本数据具体为:
定时获取用于更新所述硬盘预测模型的第一样本数据。
优选地,所述目标准确率具体为各所述预测准确率的平均数。
为解决上述技术问题,本发明还提供一种硬盘预测模型的更新装置,包括:
第一确定模块,用于获取用于更新硬盘预测模型的第一样本数据,并根据所述第一样本数据确定所述硬盘预测模型中需要更新的目标决策树;
选取模块,用于按照预设的选取规则,从所述第一样本数据中选取出第二样本数据;
第二确定模块,用于根据所述第二样本数据确定所述目标决策树中需要更新的目标叶节点;
分裂模块,用于根据所述硬盘预测模型自身的分裂规则,对所述目标叶节点进行分裂以更新所述目标决策树。
为解决上述技术问题,本发明还提供一种硬盘预测模型的更新设备,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述任一项所述的硬盘预测模型的更新方法的步骤。
为解决上述技术问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的硬盘预测模型的更新方法的步骤。
本发明所提供的一种硬盘预测模型的更新方法,首先获取用于更新硬盘预测模型的第一样本数据,并根据第一样本数据确定硬盘预测模型中需要更新的目标决策树;按照预设的选取规则,从第一样本数据中选取出第二样本数据;根据第二样本数据确定目标决策树中需要更新的目标叶节点;根据硬盘预测模型自身的分裂规则,对目标叶节点进行分裂以更新目标决策树。由此可见,通过确定出当前的硬盘预测模型中需要更新的叶节点,并仅对各叶节点更新,从而完成硬盘预测模型中的决策树的更新,也就完成了整个硬盘预测模型的更新。整个更新过程简单,无需重新建立新的硬盘预测模型,仅对当前的硬盘预测模型适应性地更新,保证了硬盘故障预测模型的时效性的同时,节省了更新所用的时间;提高了硬盘故障预测的准确性,确保数据存储的可靠性,更好地满足了用户的需求。
此外,本发明所提供的一种硬盘预测模型的更新装置、设备及存储介质与上述方法对应,具有同样的有益效果。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种硬盘预测模型的更新方法的流程图;
图2为本发明实施例提供的一种硬盘预测模型的更新装置的结构图;
图3为本发明实施例提供的一种硬盘预测模型的更新设备的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
本发明的核心是提供一种硬盘预测模型的更新方法、装置、设备及介质。通过确定出当前的硬盘预测模型中需要更新的叶节点,并仅对各叶节点更新,从而完成硬盘预测模型中的决策树的更新,也就完成了整个硬盘预测模型的更新。整个更新过程简单,无需重新建立新的硬盘预测模型,仅对当前的硬盘预测模型适应性地更新,保证了硬盘故障预测模型的时效性的同时,节省了更新所用的时间;提高了硬盘故障预测的准确性,确保数据存储的可靠性,更好地满足了用户的需求。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
图1为本发明实施例提供的一种硬盘预测模型的更新方法的流程图;如图1所示,本发明实施例提供的一种硬盘预测模型的更新方法,包括步骤S101-步骤S104:
步骤S101:获取用于更新硬盘预测模型的第一样本数据,并根据第一样本数据确定硬盘预测模型中需要更新的目标决策树;
需要说明的是,本发明提供的硬盘预测模型具体为基于随机森林算法建立的模型。在硬盘故障预测模型建立时,首先获取硬盘的检测数据,并对检测数据进行标准化、归一化及均衡化操作以完成预处理。并将预处理后的监测数据作为训练样本,根据随机森林算法训练得出硬盘故障预测模型。本发明根据上述方法构成的硬盘故障预测模型,提出了一种硬盘预测模型的更新方法。
在一个实施例中,首先获取用于更新硬盘预测模型的第一样本数据。具体地,第一样本数据具体为硬盘中新增的SMART数据。本发明实施例将上次预测时刻至当前的时间段内新增的SMART数据作为第一样本数据。本领域技术人员也可根据实际应用情况,确定其它数据作为第一样本数据,本发明实施例不作限定。
在具体实施例中,将第一样本数据输入至硬盘预测模型中,确定硬盘预测模型中需要更新的目标决策树。在一个实施例中,根据第一样本数据确定硬盘预测模型中需要更新的目标决策树具体包括:
将第一样本数据中的各数据依次输入至硬盘预测模型的各个决策树中,分别记录各数据在各决策树中得到的预测结果;
将预测结果与各数据的实际结果进行比较,计算各决策树的预测准确率;
将预测准确率低于目标准确率的决策树确定为目标决策树。
具体地,将第一样本数据中包含的所有数据,依次输入至硬盘预测模型的各个决策树中,并记录各数据在各决策树中得到的预测结果。可以理解地,预测结果具体为用于表示硬盘故障或正常的信息。并且,第一样本数据在获取时,已知各数据代表的实际结果。例如,在硬盘出现故障的前十分钟的数据作为确定其实际结果为故障,将其它数据的实际结果确定为正常;若硬盘至今未出现任何类型故障,则可确定第一样本数据中包含的所有数据的实际结果均为正常。详细地获取样本数据的实际结果的方法可参见现有技术,本发明实施例不再赘述。
将各数据的预测结果与实际结果进行比较,确定出预测结果与实际结果一致的数据的数量,并计算各决策树的预测准确率。预测准确率Accuracy可通过以下公式计算:
Figure BDA0002317612760000051
其中,TP表示实际结果为正常,预测结果为正常的数据的数量;TN表示实际结果为故障,预测结果为故障的数据的数量;P表示第一样本数据中实际结果为正常的数据的数量;N表示第一样本数据中实际结果为故障的数据的数量。可以理解地,TP与TN的和为预测结果与实际结果一致的数据的数量,P与N的和为第一样本数据中数据的总数量。例如,第一样本数据中包含有100个数据,硬盘预测模型中包含有10个决策树。第一样本数据通过硬盘预测模型中的第一个决策树后,其中30个数据的预测结果与实际结果一致,则第一个决策树的预测准确率为30%。
按照上述方式,确定出各个决策树的预测准确率,将预测准确率低于目标准确率的决策树确定为目标决策树。在一个实施例中,目标准确率具体为各决策树的预测准确率的平均数。本领域技术人员也可根据实际应用情况,确定其它数值作为目标准确率,本发明实施例不作限定。
步骤S102:按照预设的选取规则,从第一样本数据中选取出第二样本数据;
在一个实施例中,预设的选取规则具体为选取第一样本数据中预测结果与实际结果不一致的数据作为第二样本数据。例如,第一样本数据的100个数据中,通过目标决策树后,有40个数据得到的预测结果与实际结果不一致,则选取该40个数据作为第二样本数据。
步骤S103:根据第二样本数据确定目标决策树中需要更新的目标叶节点;
步骤S104:根据硬盘预测模型自身的分裂规则,对目标叶节点进行分裂以更新目标决策树。
在具体实施中,将第二样本数据中的各数据在目标决策树上进行遍历,根据在目标决策树的各叶节点上得到的当前决策信息确定出需要更新的目标叶节点,具体包括:
将第二样本数据输入至目标决策树中,判断目标决策树中各叶节点得到的当前决策信息与存储的历史决策信息是否一致;
如果否,则确定叶节点为目标叶节点。
需要说明的是,当前决策信息为当前遍历时得到的决策信息;历史决策信息为存储的上一次该叶节点得到的决策信息。当存在叶节点的当前决策信息与历史决策信息不一致时,则可确定该叶节点为目标叶节点。根据硬盘预测模型自身的分裂规则,对目标叶节点进行分裂以更新目标决策树。当所有目标决策树更新完毕后,则完成了硬盘预测模型的更新。需要说明的是,详细的硬盘预测模型的分裂规则可参见现有技术,本发明实施例不再赘述。
在一个实施例中,可根据实际应用情况,定时获取用于更新硬盘预测模型的第一样本数据,从而实现硬盘预测模型的定时更新。
本发明所提供的一种硬盘预测模型的更新方法,首先获取用于更新硬盘预测模型的第一样本数据,并根据第一样本数据确定硬盘预测模型中需要更新的目标决策树;按照预设的选取规则,从第一样本数据中选取出第二样本数据;根据第二样本数据确定目标决策树中需要更新的目标叶节点;根据硬盘预测模型自身的分裂规则,对目标叶节点进行分裂以更新目标决策树。由此可见,通过确定出当前的硬盘预测模型中需要更新的叶节点,并仅对各叶节点更新,从而完成硬盘预测模型中的决策树的更新,也就完成了整个硬盘预测模型的更新。整个更新过程简单,无需重新建立新的硬盘预测模型,仅对当前的硬盘预测模型适应性地更新,保证了硬盘故障预测模型的时效性的同时,节省了更新所用的时间;提高了硬盘故障预测的准确性,确保数据存储的可靠性,更好地满足了用户的需求。
本发明还提供一种硬盘预测模型的更新装置和硬盘预测模型的更新设备对应的实施例。需要说明的是,本发明从两个角度对实施例进行描述,一种是基于功能模块的角度,另一种是基于硬件的角度。
图2为本发明实施例提供的一种硬盘预测模型的更新装置的结构图;如图2所示,本发明实施例提供的一种硬盘预测模型的更新装置,包括:
第一确定模块10,用于获取用于更新硬盘预测模型的第一样本数据,并根据第一样本数据确定硬盘预测模型中需要更新的目标决策树;
选取模块11,用于按照预设的选取规则,从第一样本数据中选取出第二样本数据;
第二确定模块12,用于根据第二样本数据确定目标决策树中需要更新的目标叶节点;
分裂模块13,用于根据硬盘预测模型自身的分裂规则,对目标叶节点进行分裂以更新目标决策树。
由于本部分的实施例与方法部分的实施例相互对应,因此本部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本发明所提供的一种硬盘预测模型的更新方法,首先获取用于更新硬盘预测模型的第一样本数据,并根据第一样本数据确定硬盘预测模型中需要更新的目标决策树;按照预设的选取规则,从第一样本数据中选取出第二样本数据;根据第二样本数据确定目标决策树中需要更新的目标叶节点;根据硬盘预测模型自身的分裂规则,对目标叶节点进行分裂以更新目标决策树。由此可见,通过确定出当前的硬盘预测模型中需要更新的叶节点,并仅对各叶节点更新,从而完成硬盘预测模型中的决策树的更新,也就完成了整个硬盘预测模型的更新。整个更新过程简单,无需重新建立新的硬盘预测模型,仅对当前的硬盘预测模型适应性地更新,保证了硬盘故障预测模型的时效性的同时,节省了更新所用的时间;提高了硬盘故障预测的准确性,确保数据存储的可靠性,更好地满足了用户的需求。
图3为本发明实施例提供的一种硬盘预测模型的更新设备的结构图。如图3所示,本发明实施例还提供一种硬盘预测模型的更新设备,包括存储器20,用于存储计算机程序;
处理器21,用于执行计算机程序时实现如上述任一项的硬盘预测模型的更新方法的步骤。
其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器20可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器20还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器20至少用于存储以下计算机程序201,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例公开的硬盘预测模型的更新方法中的相关步骤。另外,存储器20所存储的资源还可以包括操作系统202和数据203等,存储方式可以是短暂存储或者永久存储。其中,操作系统202可以包括Windows、Unix、Linux等。
在一些实施例中,硬盘预测模型的更新设备还可包括有输入输出接口22、通信接口23、电源24以及通信总线25。
本领域技术人员可以理解,图3中示出的结构并不构成对硬盘预测模型的更新设备的限定,可以包括比图示更多或更少的组件。
由于本部分的实施例与方法部分的实施例相互对应,因此本部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。在本发明的一些实施例中,处理器和存储器可通过总线或其它方式连接。
本发明所提供的一种硬盘预测模型的更新设备,能实现如下方法:首先获取用于更新硬盘预测模型的第一样本数据,并根据第一样本数据确定硬盘预测模型中需要更新的目标决策树;按照预设的选取规则,从第一样本数据中选取出第二样本数据;根据第二样本数据确定目标决策树中需要更新的目标叶节点;根据硬盘预测模型自身的分裂规则,对目标叶节点进行分裂以更新目标决策树。由此可见,通过确定出当前的硬盘预测模型中需要更新的叶节点,并仅对各叶节点更新,从而完成硬盘预测模型中的决策树的更新,也就完成了整个硬盘预测模型的更新。整个更新过程简单,无需重新建立新的硬盘预测模型,仅对当前的硬盘预测模型适应性地更新,保证了硬盘故障预测模型的时效性的同时,节省了更新所用的时间;提高了硬盘故障预测的准确性,确保数据存储的可靠性,更好地满足了用户的需求。
最后,本发明还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本发明所提供的一种硬盘预测模型的更新方法、装置、设备及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种硬盘预测模型的更新方法,其特征在于,包括:
获取用于更新硬盘预测模型的第一样本数据,并根据所述第一样本数据确定所述硬盘预测模型中需要更新的目标决策树;
按照预设的选取规则,从所述第一样本数据中选取出第二样本数据;
根据所述第二样本数据确定所述目标决策树中需要更新的目标叶节点;
根据所述硬盘预测模型自身的分裂规则,对所述目标叶节点进行分裂以更新所述目标决策树。
2.根据权利要求1所述的硬盘预测模型的更新方法,其特征在于,所述第一样本数据具体为硬盘中新增的SMART数据。
3.根据权利要求1所述的硬盘预测模型的更新方法,其特征在于,所述根据所述第一样本数据确定所述硬盘预测模型中需要更新的目标决策树具体包括:
将所述第一样本数据中的各数据依次输入至硬盘预测模型的各个决策树中,分别记录各所述数据在各所述决策树中得到的预测结果;
将所述预测结果与各所述数据的实际结果进行比较,计算各所述决策树的预测准确率;
将所述预测准确率低于目标准确率的决策树确定为所述目标决策树。
4.根据权利要求3所述的硬盘预测模型的更新方法,其特征在于,所述选取规则具体为选取所述第一样本数据中所述预测结果与所述实际结果不一致的数据作为所述第二样本数据。
5.根据权利要求1所述的硬盘预测模型的更新方法,其特征在于,所述根据所述第二样本数据确定所述目标决策树中需要更新的目标叶节点具体包括:
将所述第二样本数据输入至所述目标决策树中,判断所述目标决策树中各叶节点得到的当前决策信息与存储的历史决策信息是否一致;
如果否,则确定所述叶节点为所述目标叶节点。
6.根据权利要求1所述的硬盘预测模型的更新方法,其特征在于,所述获取用于更新硬盘预测模型的第一样本数据具体为:
定时获取用于更新所述硬盘预测模型的第一样本数据。
7.根据权利要求3所述的硬盘预测模型的更新方法,其特征在于,所述目标准确率具体为各所述预测准确率的平均数。
8.一种硬盘预测模型的更新装置,其特征在于,包括:
第一确定模块,用于获取用于更新硬盘预测模型的第一样本数据,并根据所述第一样本数据确定所述硬盘预测模型中需要更新的目标决策树;
选取模块,用于按照预设的选取规则,从所述第一样本数据中选取出第二样本数据;
第二确定模块,用于根据所述第二样本数据确定所述目标决策树中需要更新的目标叶节点;
分裂模块,用于根据所述硬盘预测模型自身的分裂规则,对所述目标叶节点进行分裂以更新所述目标决策树。
9.一种硬盘预测模型的更新设备,其特征在于,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的硬盘预测模型的更新方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的硬盘预测模型的更新方法的步骤。
CN201911284442.2A 2019-12-13 2019-12-13 一种硬盘预测模型的更新方法、装置、设备及介质 Pending CN111008119A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201911284442.2A CN111008119A (zh) 2019-12-13 2019-12-13 一种硬盘预测模型的更新方法、装置、设备及介质
US17/781,326 US20230004824A1 (en) 2019-12-13 2020-07-23 Method, Apparatus, and Device for Updating Hard Disk Prediction Model, and Medium
PCT/CN2020/103737 WO2021114676A1 (zh) 2019-12-13 2020-07-23 一种硬盘预测模型的更新方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911284442.2A CN111008119A (zh) 2019-12-13 2019-12-13 一种硬盘预测模型的更新方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN111008119A true CN111008119A (zh) 2020-04-14

Family

ID=70114871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911284442.2A Pending CN111008119A (zh) 2019-12-13 2019-12-13 一种硬盘预测模型的更新方法、装置、设备及介质

Country Status (3)

Country Link
US (1) US20230004824A1 (zh)
CN (1) CN111008119A (zh)
WO (1) WO2021114676A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021114676A1 (zh) * 2019-12-13 2021-06-17 浪潮电子信息产业股份有限公司 一种硬盘预测模型的更新方法、装置、设备及介质
CN113868866A (zh) * 2021-09-29 2021-12-31 天翼物联科技有限公司 基于非均匀采样的流式异常检测方法、装置、设备及介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117271229A (zh) * 2022-06-09 2023-12-22 中兴智能科技南京有限公司 一种硬盘故障预测方法、装置、存储介质及电子装置
CN115729761B (zh) * 2022-11-23 2023-10-20 中国人民解放军陆军装甲兵学院 一种硬盘故障预测方法、系统、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101438335A (zh) * 2006-03-03 2009-05-20 因瑞克斯有限公司 使用来自移动数据源的数据估算道路交通状况
CN107025154A (zh) * 2016-01-29 2017-08-08 阿里巴巴集团控股有限公司 磁盘的故障预测方法和装置
CN108647136A (zh) * 2018-05-10 2018-10-12 南京道熵信息技术有限公司 基于smart信息和深度学习的硬盘损坏预测方法及装置
CN108845760A (zh) * 2018-05-28 2018-11-20 郑州云海信息技术有限公司 一种硬盘维护方法、装置、设备及可读存储介质
CN109828869A (zh) * 2018-12-05 2019-05-31 中兴通讯股份有限公司 预测硬盘故障发生时间的方法、装置及存储介质
CN110427311A (zh) * 2019-06-26 2019-11-08 华中科技大学 基于时序特征处理与模型优化的磁盘故障预测方法和系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8306942B2 (en) * 2008-05-06 2012-11-06 Lawrence Livermore National Security, Llc Discriminant forest classification method and system
UA117679C2 (uk) * 2013-07-22 2018-09-10 Аселсан Електронік Санаї Ве Тиджарет Анонім Ширкеті Інкрементно навчаний класифікатор на основі адаптивної комбінації слабких навчаних класифікаторів, розподілених по нежорсткому бінарному дереву
CN105718490A (zh) * 2014-12-04 2016-06-29 阿里巴巴集团控股有限公司 一种用于更新分类模型的方法及装置
CN106446964B (zh) * 2016-10-21 2018-04-03 河南大学 一种增量式的梯度提升决策树更新方法
CN108989075A (zh) * 2017-06-05 2018-12-11 中国移动通信集团广东有限公司 一种网络故障定位方法及系统
CN107330464A (zh) * 2017-06-30 2017-11-07 众安信息技术服务有限公司 数据处理方法和装置
CN108764282A (zh) * 2018-04-19 2018-11-06 中国科学院计算技术研究所 一种类别增量行为识别方法和系统
CN109460004A (zh) * 2018-10-26 2019-03-12 国网天津市电力公司 基于大数据的配电网故障预测方法及系统
CN111008119A (zh) * 2019-12-13 2020-04-14 浪潮电子信息产业股份有限公司 一种硬盘预测模型的更新方法、装置、设备及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101438335A (zh) * 2006-03-03 2009-05-20 因瑞克斯有限公司 使用来自移动数据源的数据估算道路交通状况
CN107025154A (zh) * 2016-01-29 2017-08-08 阿里巴巴集团控股有限公司 磁盘的故障预测方法和装置
CN108647136A (zh) * 2018-05-10 2018-10-12 南京道熵信息技术有限公司 基于smart信息和深度学习的硬盘损坏预测方法及装置
CN108845760A (zh) * 2018-05-28 2018-11-20 郑州云海信息技术有限公司 一种硬盘维护方法、装置、设备及可读存储介质
CN109828869A (zh) * 2018-12-05 2019-05-31 中兴通讯股份有限公司 预测硬盘故障发生时间的方法、装置及存储介质
CN110427311A (zh) * 2019-06-26 2019-11-08 华中科技大学 基于时序特征处理与模型优化的磁盘故障预测方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张廷雷: "基于改进随机森林的硬盘故障预测方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021114676A1 (zh) * 2019-12-13 2021-06-17 浪潮电子信息产业股份有限公司 一种硬盘预测模型的更新方法、装置、设备及介质
CN113868866A (zh) * 2021-09-29 2021-12-31 天翼物联科技有限公司 基于非均匀采样的流式异常检测方法、装置、设备及介质

Also Published As

Publication number Publication date
US20230004824A1 (en) 2023-01-05
WO2021114676A1 (zh) 2021-06-17

Similar Documents

Publication Publication Date Title
CN111008119A (zh) 一种硬盘预测模型的更新方法、装置、设备及介质
US9348857B2 (en) Probabilistically finding the connected components of an undirected graph
CN113536081B (zh) 基于人工智能的数据中心数据管理方法及系统
US20180136933A1 (en) Dependency rank based on commit history
CN111797998B (zh) 生成机器学习样本的组合特征的方法及系统
CN114663753B (zh) 一种生产任务在线监控方法及系统
CN108388509B (zh) 一种软件测试方法、计算机可读存储介质及终端设备
CN111143039A (zh) 一种虚拟机的调度方法、装置及计算机存储介质
CN115392592B (zh) 一种存储产品参数配置推荐方法、装置、设备及介质
CN111881010A (zh) 存储设备的性能预测方法、装置及计算机可读存储介质
WO2021139335A1 (zh) 物理机销售数据预测方法、装置、计算机设备及存储介质
CN111860858B (zh) 一种模型更新参数的确定方法、确定装置及可读存储介质
CN112001786A (zh) 基于知识图谱的客户信用卡额度配置方法及装置
LU505740A1 (en) Data monitoring method and system
CN114443738A (zh) 异常数据挖掘方法、装置、设备及介质
CN117763024A (zh) 一种数据分片抽取方法及装置
CN112764957A (zh) 应用故障定界方法及装置
CN112685222B (zh) 管理备份数据的方法、设备和计算机程序产品
CN115344459A (zh) 巡检方法、装置,存储介质以及电子设备
CN111090554A (zh) 服务器性能测试时间的预测方法、装置、设备及存储介质
CN109978172B (zh) 一种基于极限学习机的资源池利用率预测方法及装置
CN114465957A (zh) 一种数据写入方法及装置
CN114118676A (zh) 一种基于多类型感知设备的数据分析方法、装置及可读介质
US20170177767A1 (en) Configuration of large scale advection diffusion models with predetermined rules
CN116701716A (zh) 基于图计算的大型数据集群系统重要性定级方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200414