CN104239231A - 一种加速二级缓存预热的方法及装置 - Google Patents
一种加速二级缓存预热的方法及装置 Download PDFInfo
- Publication number
- CN104239231A CN104239231A CN201410441302.2A CN201410441302A CN104239231A CN 104239231 A CN104239231 A CN 104239231A CN 201410441302 A CN201410441302 A CN 201410441302A CN 104239231 A CN104239231 A CN 104239231A
- Authority
- CN
- China
- Prior art keywords
- cache
- data
- metadata
- equipment
- preheating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000013507 mapping Methods 0.000 claims abstract description 8
- 238000007906 compression Methods 0.000 claims description 17
- 230000006835 compression Effects 0.000 claims description 11
- 230000008676 import Effects 0.000 claims description 10
- 230000000737 periodic effect Effects 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 8
- 230000001133 acceleration Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 238000004321 preservation Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000002679 ablation Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003446 memory effect Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Landscapes
- Memory System Of A Hierarchy Structure (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种加速二级缓存预热的方法及装置,其中,所述方法在二级缓存设备上保存与二级缓存数据相应的元数据,并对二级缓存数据进行压缩处理,实现二级缓存数据的写入和读取,其中,二级缓存数据的写入具体为:周期性扫描主缓存中的缓存数据,获得设定时间内使用次数量少的数据及其相应元数据,该元数据包含主缓存与二级缓存设备间的映射关系;对数据进行压缩处理;压缩后的数据及元数据一起写入二级缓存设备;二级缓存数据的读取具体为:遍历二级缓存设备上的元数据,读取二级缓存设备中的数据并解压缩后,根据元数据中的映射关系,将数据加载到主缓存中。与现有技术相比,本发明具有提高缓存数据预热的效率和二级缓存设备的利用率等优点。
Description
技术领域
本发明涉及计算机存储技术领域,具体涉及一种加速二级缓存预热的方法及装置。
背景技术
当前,随着信息化技术的不断发展,人们需要保存的资料、数据越来越多,对存储容量的需求越来越大,而且各种应用程序随着软、硬件的升级,对存储设备的性能要求也越来越高。从存储领域来看,不管是传统的存储设备,还是基于软件定义的新型存储设备,为了实现性能最大化和成本最低化,各存储厂商往往采用基于混合存储池的分级存储方式,通过采用大容量的固态硬盘(SSD)或者NVRAM等非易失性存储设备作为缓存,实现对磁盘、磁带等持久化存储设备的二级或者多级缓存系统,达到性能和价格的一个均衡。这样的系统性能虽然上无法和新型的全闪存存储阵列媲美,但在价格上却有巨大的优势,而且性能比传统存储阵列要高很多。性能的提升主要是依据存储系统的局部性原理,通过将热点数据(频繁访问的特定区域)缓存在高速设备中来实现。
这些二级或者多级缓存系统,作为高速访问设备(内存)和低速访问设备(磁盘、磁带)之间的缓存,屏蔽了不同设备之间访问速度的差距,以有限的投资,即能取得较好的加速效果,但也存在一些问题:比如需要一定时间的预热,即需要存储系统运行一段时间后,通过被动或者主动(数据预取)的方式,将数据从磁盘重新加载到二级缓存设备。而事实上,通常二级缓存设备(如SSD)本身就具有非易失的特性(即所存储的数据不会因为设备断电而丢失的存储器),需要预热的原因,很大程度上是因为二级缓存设备上保存的是纯粹的数据块,没保存元数据(即数据存储的属性、位置等信息,用来对数据进行定位、查找),且数据也是无组织的,导致缓存与二级缓存在系统重新上电后,无法直接使用,而需要一个重新预热的过程。预热的时间随着二级缓存大小以及业务IO的特性而不同,有些存储系统甚至需要几天时间连续运行来实现预热。另一方面,二级缓存的空间是十分宝贵的,传统的存储将裸数无组织存放的另一个缺陷是空间浪费严重。
综上可知,在传统的二级缓存系统设计和实现上,存在预热时间过长和空间浪费严重的问题,有改进和优化的空间。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种加速二级缓存预热的方法及装置,针对基于混合存储池的系统,通过持久化和压缩二级缓存数据,提高了缓存数据预热的效率,同时也提高了二级缓存设备的利用率,一定程度上降低了存储设备的成本。
本发明的目的可以通过以下技术方案来实现:
本发明提供一种加速二级缓存预热的方法,该方法在二级缓存设备上保存与二级缓存数据相应的元数据,并对二级缓存数据进行压缩处理,实现二级缓存数据的写入和读取,其中,
所述二级缓存数据的写入具体为:
1)周期性扫描主缓存中的缓存数据,获得设定时间内使用次数量少的数据及其相应元数据,该元数据包含主缓存与二级缓存设备间的映射关系;
2)对步骤1)获得的数据进行压缩处理;
3)将步骤2)中压缩后的数据及步骤1)中的元数据写入二级缓存设备;
所述二级缓存数据的读取具体为:
遍历二级缓存设备上的元数据,读取二级缓存设备中的数据并解压缩后,根据元数据中的映射关系,将数据加载到主缓存中。
所述元数据由超级块、索引块和索引块指针组织而成。
所述遍历二级缓存设备上的元数据具体为:
a)读取超级块,开始遍历元数据;
b)判断当前超级块所对应的索引块是否遍历完,若是,则结束,若否,则执行步骤c);
c)判断当前索引块所对应的索引块指针是否遍历完,若是,则返回步骤a),若否,则执行步骤d);
d)读取数据并解压缩,返回步骤c)。
数据加载到主缓存中后,应用程序读取数据时,首先判断是否在主缓存中命中数据时,若是,则直接从主缓存中读取,若否,则向磁盘设备读取,有效避免频繁向磁盘设备发起I/O请求。
所述二级缓存设备包括SSD或NVRAM。
本发明还提供一种加速二级缓存预热的装置,包括:
异步扫描模块,用于周期性扫描主缓存中的缓存数据,获得设定时间内使用次数量少的数据;
压缩模块,用于对写入二级缓存设备的数据进行压缩或对从二级缓存设备读取的数据进行解压缩;
异步预热模块,用于将二级缓存设备中的数据加载到主缓存。
所述异步预热模块包括:
元数据遍历单元,用于遍历二级缓存设备中保存的元数据;
数据传输单元,用于根据元数据遍历结果读取二级缓存设备中的数据并传输给压缩模块。
与现有技术相比,本发明具有以下有益效果:
1、在存储设备重新上电时,避免了从磁盘频繁加载数据到主缓存,减少了对磁盘进行的大量I/O操作,使得系统上电完毕就可以使用之前缓存的数据,加速了缓存的预热(系统上电后数据从磁盘搬移到缓存的过程),极大提高缓存的可用性。
2、通过压缩技术,使得小容量的二级缓存设备,可以达到大容量设备的缓存效果,提高了存储设备的性价比。
3、由于压缩技术的使用,使得需要加载的数据量变小,进一步加速了缓存的预热。
4、本发明设置异步预热模块,通过异步的方式,在系统加载存储池时实现缓存预热,不影响系统启动速度。
附图说明
图1为二级缓存设备上元数据组织方式示意图;
图2为混合存储池IO数据流示意图;
图3为本发明扫描流程示意图;
图4为本发明预热流程示意图;
图5为本发明装置的结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
本发明实施例提供一种加速二级缓存预热的方法,该方法在二级缓存设备上保存与二级缓存数据相应的元数据,并对二级缓存数据进行压缩处理,实现二级缓存数据的写入和读取。本发明方法主要包含以下几个要点:
1、引入一种元数据保存方式,如图1所示,通过超级块、索引块和索引块指针,实现元数据以该方式保存在二级缓存设备(SSD或者NVRAM)上。当主缓存中的数据写入二级缓存设备时,其相应的元数据也随之写入二级缓存设备。这样二级缓存设备重新上电后,通过索引元数据,我们可以将保存在二级缓存设备中的数据恢复到主缓存,提供给应用程序使用。
2、在缓存数据写入和读取过程中增加压缩模块,即数据保存到二级缓存设备前先经过压缩,数据恢复到主缓存时经过解压,这样既保证了数据的完整性,也大大减少了数据、元数据在二级缓存设备上占用的空间。
基于上述两点,本发明实施例提供一种加速二级缓存预热的方法对二级缓存数据的写入和读取具体描述如下:
(1)写入过程
1)如图3所示,周期性扫描主缓存中的缓存数据,获得设定时间内使用次数量少的数据及其相应元数据,该元数据包含主缓存与二级缓存设备间的映射关系;
2)对步骤1)获得的数据进行压缩处理;
3)将步骤2)中压缩后的数据及步骤1)中的元数据写入二级缓存设备。
(2)读取过程
虚拟池在上电时,启动一个异步预热任务,将二级缓存中数据加载到主缓存,加载过程中遍历二级缓存设备上的元数据,读取二级缓存设备中的数据并解压缩后,根据元数据中的映射关系,将数据加载到主缓存中。
如图4所示,所述遍历二级缓存设备上的元数据具体为:
a)读取超级块,开始遍历元数据;
b)判断当前超级块所对应的索引块是否遍历完,若是,则结束,若否,则执行步骤c);
c)判断当前索引块所对应的索引块指针是否遍历完,若是,则返回步骤a),若否,则执行步骤d);
d)读取数据并解压缩,返回步骤c)。
数据加载到主缓存中后,应用程序读取数据时,首先判断是否在主缓存中命中数据时,若是,则直接从主缓存中读取,若否,则向磁盘设备读取,有效避免频繁向磁盘设备发起I/O请求。
本发明中涉及到的数据IO流如图2所示,通过上述过程,可以大大降低系统上电时主缓存的预热时间,提高缓存设备空间的利用率,从而避免向磁盘(disk)发起大量I/O请求,最终提升了存储设备的性能。
如图5所示,本发明实施例还提供一种实现上述加速二级缓存预热方法的装置,包括:
异步扫描模块1,用于周期性扫描主缓存中的缓存数据,获得设定时间内使用次数量少的数据;
压缩模块2,用于对写入二级缓存设备的数据进行压缩或对从二级缓存设备读取的数据进行解压缩;
异步预热模块3,用于将二级缓存设备中的数据加载到主缓存。
所述异步预热模块包括:
元数据遍历单元,用于遍历二级缓存设备中保存的元数据;
数据传输单元,用于根据元数据遍历结果读取二级缓存设备中的数据并传输给压缩模块。
上述加速二级缓存预热的装置在初次使用时,需要在应用环境下进行正常预热。
在本发明实施例中,需要启动二级缓存装置,将主缓存中淘汰的数据和元数据写入二级缓存设备,在系统重新上电时,将二级缓存中的数据恢复到主缓存,这样系统在访问这些数据的时候就可以直接从主缓存中读取。
Claims (7)
1.一种加速二级缓存预热的方法,其特征在于,该方法在二级缓存设备上保存与二级缓存数据相应的元数据,并对二级缓存数据进行压缩处理,实现二级缓存数据的写入和读取,其中,
所述二级缓存数据的写入具体为:
1)周期性扫描主缓存中的缓存数据,获得设定时间内使用次数量少的数据及其相应元数据,该元数据包含主缓存与二级缓存设备间的映射关系;
2)对步骤1)获得的数据进行压缩处理;
3)将步骤2)中压缩后的数据及步骤1)中的元数据写入二级缓存设备;
所述二级缓存数据的读取具体为:
遍历二级缓存设备上的元数据,读取二级缓存设备中的数据并解压缩后,根据元数据中的映射关系,将数据加载到主缓存中。
2.根据权利要求1所述的一种加速二级缓存预热的方法,其特征在于,所述元数据由超级块、索引块和索引块指针组织而成。
3.根据权利要求2所述的一种加速二级缓存预热的方法,其特征在于,所述遍历二级缓存设备上的元数据具体为:
a)读取超级块,开始遍历元数据;
b)判断当前超级块所对应的索引块是否遍历完,若是,则结束,若否,则执行步骤c);
c)判断当前索引块所对应的索引块指针是否遍历完,若是,则返回步骤a),若否,则执行步骤d);
d)读取数据并解压缩,返回步骤c)。
4.根据权利要求1所述的一种加速二级缓存预热的方法,其特征在于,数据加载到主缓存中后,应用程序读取数据时,首先判断是否在主缓存中命中数据时,若是,则直接从主缓存中读取,若否,则向磁盘设备读取。
5.根据权利要求1-4任一所述的一种加速二级缓存预热的方法,其特征在于,所述二级缓存设备包括SSD或NVRAM。
6.一种加速二级缓存预热的装置,其特征在于,包括:
异步扫描模块,用于周期性扫描主缓存中的缓存数据,获得设定时间内使用次数量少的数据;
压缩模块,用于对写入二级缓存设备的数据进行压缩或对从二级缓存设备读取的数据进行解压缩;
异步预热模块,用于将二级缓存设备中的数据加载到主缓存。
7.根据权利要求6所述的一种加速二级缓存预热的装置,其特征在于,所述异步预热模块包括:
元数据遍历单元,用于遍历二级缓存设备中保存的元数据;
数据传输单元,用于根据元数据遍历结果读取二级缓存设备中的数据并传输给压缩模块。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201410441302.2A CN104239231B (zh) | 2014-09-01 | 2014-09-01 | 一种加速二级缓存预热的方法及装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201410441302.2A CN104239231B (zh) | 2014-09-01 | 2014-09-01 | 一种加速二级缓存预热的方法及装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN104239231A true CN104239231A (zh) | 2014-12-24 |
| CN104239231B CN104239231B (zh) | 2018-01-30 |
Family
ID=52227345
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201410441302.2A Active CN104239231B (zh) | 2014-09-01 | 2014-09-01 | 一种加速二级缓存预热的方法及装置 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN104239231B (zh) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106708819A (zh) * | 2015-07-17 | 2017-05-24 | 阿里巴巴集团控股有限公司 | 一种数据缓存的预热方法及其装置 |
| CN108009008A (zh) * | 2016-10-28 | 2018-05-08 | 北京市商汤科技开发有限公司 | 数据处理方法和系统、电子设备 |
| CN108132757A (zh) * | 2016-12-01 | 2018-06-08 | 阿里巴巴集团控股有限公司 | 数据的存储方法、装置及电子设备 |
| CN110647532A (zh) * | 2019-08-15 | 2020-01-03 | 苏州浪潮智能科技有限公司 | 一种数据一致性的维护方法与装置 |
| CN113064553A (zh) * | 2021-04-02 | 2021-07-02 | 重庆紫光华山智安科技有限公司 | 数据存储方法、装置、设备及介质 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20080183983A1 (en) * | 2007-01-31 | 2008-07-31 | Canon Kabushiki Kaisha | Decoding circuit |
| CN101794259A (zh) * | 2010-03-26 | 2010-08-04 | 成都市华为赛门铁克科技有限公司 | 数据存储方法和装置 |
| CN101916228A (zh) * | 2010-08-17 | 2010-12-15 | 中国人民解放军国防科学技术大学 | 带有数据压缩功能的闪存转换层及实现方法 |
| CN102567490A (zh) * | 2011-12-21 | 2012-07-11 | 华为技术有限公司 | 数据库内的描述信息的恢复和数据的缓存方法及设备 |
| CN102609360A (zh) * | 2012-01-12 | 2012-07-25 | 华为技术有限公司 | 一种数据处理方法、装置及系统 |
| US8775741B1 (en) * | 2009-01-13 | 2014-07-08 | Violin Memory Inc. | Using temporal access patterns for determining prefetch suitability |
-
2014
- 2014-09-01 CN CN201410441302.2A patent/CN104239231B/zh active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20080183983A1 (en) * | 2007-01-31 | 2008-07-31 | Canon Kabushiki Kaisha | Decoding circuit |
| US8775741B1 (en) * | 2009-01-13 | 2014-07-08 | Violin Memory Inc. | Using temporal access patterns for determining prefetch suitability |
| CN101794259A (zh) * | 2010-03-26 | 2010-08-04 | 成都市华为赛门铁克科技有限公司 | 数据存储方法和装置 |
| CN101916228A (zh) * | 2010-08-17 | 2010-12-15 | 中国人民解放军国防科学技术大学 | 带有数据压缩功能的闪存转换层及实现方法 |
| CN102567490A (zh) * | 2011-12-21 | 2012-07-11 | 华为技术有限公司 | 数据库内的描述信息的恢复和数据的缓存方法及设备 |
| CN102609360A (zh) * | 2012-01-12 | 2012-07-25 | 华为技术有限公司 | 一种数据处理方法、装置及系统 |
Non-Patent Citations (1)
| Title |
|---|
| 叶晨等: "一种海量存储系统二级缓存的设计与实现", 《计算机与现代化》 * |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106708819A (zh) * | 2015-07-17 | 2017-05-24 | 阿里巴巴集团控股有限公司 | 一种数据缓存的预热方法及其装置 |
| TWI734681B (zh) * | 2015-07-17 | 2021-08-01 | 香港商阿里巴巴集團服務有限公司 | 資料緩存的預熱方法及其裝置 |
| CN108009008A (zh) * | 2016-10-28 | 2018-05-08 | 北京市商汤科技开发有限公司 | 数据处理方法和系统、电子设备 |
| CN108132757A (zh) * | 2016-12-01 | 2018-06-08 | 阿里巴巴集团控股有限公司 | 数据的存储方法、装置及电子设备 |
| CN108132757B (zh) * | 2016-12-01 | 2021-10-19 | 阿里巴巴集团控股有限公司 | 数据的存储方法、装置及电子设备 |
| CN110647532A (zh) * | 2019-08-15 | 2020-01-03 | 苏州浪潮智能科技有限公司 | 一种数据一致性的维护方法与装置 |
| CN113064553A (zh) * | 2021-04-02 | 2021-07-02 | 重庆紫光华山智安科技有限公司 | 数据存储方法、装置、设备及介质 |
| CN113064553B (zh) * | 2021-04-02 | 2023-02-17 | 重庆紫光华山智安科技有限公司 | 数据存储方法、装置、设备及介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN104239231B (zh) | 2018-01-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN102609360B (zh) | 一种数据处理方法、装置及系统 | |
| US10446174B2 (en) | File system for shingled magnetic recording (SMR) | |
| CN103294710B (zh) | 一种数据存取方法和装置 | |
| CN105117351B (zh) | 向缓存写入数据的方法及装置 | |
| CN112632069B (zh) | 哈希表数据存储管理方法、装置、介质和电子设备 | |
| US9342247B2 (en) | Leveraging a hybrid infrastructure for dynamic memory allocation and persistent file storage | |
| US8429339B2 (en) | Storage device utilizing free pages in compressed blocks | |
| CN103136109A (zh) | 一种具有压缩功能的固态存储系统ftl写入及读取方法 | |
| CN106575260A (zh) | 采用数据压缩的高速缓存技术 | |
| US11042328B2 (en) | Storage apparatus and method for autonomous space compaction | |
| CN102662856A (zh) | 一种固态硬盘及其存取方法 | |
| CN101520797A (zh) | 电力系统跨平台大数据文件高速并发存取方法 | |
| CN102567427A (zh) | 一种对象数据处理方法及装置 | |
| US9471366B2 (en) | Virtual machine disk image backup using block allocation area | |
| CN104239231A (zh) | 一种加速二级缓存预热的方法及装置 | |
| CN103678166A (zh) | 一种采用固态硬盘作为计算机高速缓存的实现方法及系统 | |
| CN105094695A (zh) | 一种存储方法和系统 | |
| US8151068B2 (en) | Data copy management for faster reads | |
| JP2009003934A (ja) | データ管理システム及びデータ管理方法、並びにデータ管理方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| CN106681659A (zh) | 数据压缩的方法及装置 | |
| CN106802950A (zh) | 一种分布式文件系统小文件写缓存优化的方法 | |
| CN103309621B (zh) | 读取分段压缩包中数据的方法 | |
| CN108664577A (zh) | 一种基于flash空闲区的文件管理方法及系统 | |
| Lv et al. | Zonedstore: A concurrent zns-aware cache system for cloud data storage | |
| CN116774940A (zh) | 一种文件存储方法、系统、存储介质和电子设备 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| CB02 | Change of applicant information |
Address after: 201112 Shanghai, Minhang District, United Airlines route 1188, building second layer A-1 unit 8 Applicant after: SHANGHAI EISOO INFORMATION TECHNOLOGY CO., LTD. Address before: 201112 Shanghai, Minhang District, United Airlines route 1188, building second layer A-1 unit 8 Applicant before: Shanghai Eisoo Software Co.,Ltd. |
|
| COR | Change of bibliographic data | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |