[go: up one dir, main page]

CN118861039A - 数据库的大对象存储方法、存储介质及设备 - Google Patents

数据库的大对象存储方法、存储介质及设备 Download PDF

Info

Publication number
CN118861039A
CN118861039A CN202411046720.1A CN202411046720A CN118861039A CN 118861039 A CN118861039 A CN 118861039A CN 202411046720 A CN202411046720 A CN 202411046720A CN 118861039 A CN118861039 A CN 118861039A
Authority
CN
China
Prior art keywords
storage
data
slice
database
large object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202411046720.1A
Other languages
English (en)
Inventor
王伟
赵立静
王建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Electronics Technology Group Jincang Beijing Technology Co ltd
Original Assignee
China Electronics Technology Group Jincang Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Electronics Technology Group Jincang Beijing Technology Co ltd filed Critical China Electronics Technology Group Jincang Beijing Technology Co ltd
Priority to CN202411046720.1A priority Critical patent/CN118861039A/zh
Publication of CN118861039A publication Critical patent/CN118861039A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种数据库的大对象存储方法、存储介质和设备。其中,数据库的大对象存储方法,包括:获取待存储的大对象数据项,作为存储目标;识别存储目标的数据量大小;若存储目标的数据量小于等于预设阈值,将存储目标的元数据和数据本体存储至数据库的数据基表行内;若存储目标的数据量大于预设阈值,将存储目标的部分元数据存储至数据库的数据基表行内,将其余元数据和数据本体存储至数据库的对象与存储切片表中。本发明的优点是通过优化体量悬殊的大对象存储方式,可以有效适应不同数据量大小的存储目标的存储需求,提高了数据管理的灵活性。

Description

数据库的大对象存储方法、存储介质及设备
技术领域
本发明涉及数据库技术领域,特别是涉及一种数据库的大对象存储方法、存储介质及设备。
背景技术
大对象(Large Object)是数据库中的一类特殊的数据类型,主要有二进制大对象(Binary Large Object,简称BLOB)和大文本对象(Character Large Object/NationalCharacter Large Object,简称CLOB/NCLOB)两大类。BLOB用来存储二进制大型对象数据,例如图像、音频文件、视频或其他非文本格式的数据;CLOB和NCLOB则用于存储大量的字符数据,适合于存放长文本如文章、报告或者XML文档等。这类数据单个数据项的体量上限很高,最高可达GB级甚至TB级,同时体量差异又很大,数据量小的也可以小到几个字节,甚至为空。
传统的数据库管理系统在处理大对象类型数据时,往往采用行外存储的方式,然而这种存储方式在读写大对象时,需要频繁地进行行内外数据的转换和访问,导致读写流程复杂,效率低下。此外,对于体量悬殊的大对象,如果采用统一的存储方式,也会导致存储空间的浪费和管理上的不便。
发明内容
本发明第一方面的一个目的是要优化体量悬殊的大对象存储方式。
本发明第一方面的另一个目的是要在一定程度上简化读写流程,提高读写速度。
本发明第一方面的又一个目的是要实现高效的数据存储和管理。
特别地,根据本发明的第一方面,本发明提供了一种数据库的大对象存储方法,包括:
获取待存储的大对象数据项,作为存储目标;
识别所述存储目标的数据量大小;
若所述存储目标的数据量小于等于预设阈值,将所述存储目标的元数据和数据本体存储至所述数据库的数据基表行内;
若所述存储目标的数据量大于所述预设阈值,将所述存储目标的部分元数据存储至所述数据库的数据基表行内,将其余元数据和数据本体存储至所述数据库的对象与存储切片表中。
可选地,所述存储目标的元数据包括所述存储目标的描述信息、对象标识符以及存储选项,所述存储选项包括存储位置、压缩级别、是否加密以及加密算法;
将所述存储目标的元数据和数据本体存储至所述数据库的数据基表行内的步骤包括:
在所述数据库的数据基表行内设置大对象控制块,将所述存储目标的描述信息、对象标识符、存储选项以及数据本体存储至所述大对象控制块中。
可选地,所述存储目标的部分元数据包括所述存储目标的描述信息和对象标识符;
将所述存储目标的部分元数据存储至所述数据库的数据基表行内的步骤包括:
在所述数据库的数据基表行内设置大对象控制块,将所述存储目标的描述信息和对象标识符存储至所述大对象控制块中。
可选地,所述存储目标的其余元数据包括所述存储目标的存储选项;
将其余元数据和数据本体存储至所述数据库的对象与存储切片表中的步骤包括:
在所述对象与存储切片表中为所述存储目标设置一条对象记录;
将所述存储目标的存储选项和数据本体中小于等于所述预设阈值的数据存储至所述对象记录中;
将所述数据本体中大于所述预设阈值的数据分割为多个存储切片;
在所述对象与存储切片表中分别为每个所述存储切片设置一条切片记录;
将所述存储切片的数据对应存储至所述切片记录中。
可选地,将其余元数据和数据本体存储至所述数据库的对象与存储切片表中的步骤还包括:
在所述对象记录中记录所述存储目标的对象标识符,在所述切片记录中记录所述存储切片的切片标识符;并且
根据所述对象记录中的所述存储选项对所述存储切片中的数据进行存储。
可选地,将其余元数据和数据本体存储至所述数据库的对象与存储切片表中的步骤还包括:
在所述对象记录中设置存储切片索引块,利用所述存储切片索引块记录所述存储目标的所有所述存储切片的排列顺序、原始数据逻辑长度和切片标识符。
可选地,所述切片记录中记录有所述存储切片的排重特征值,利用所述排重特征值在排重任务中缩小所述存储切片的比对范围。
可选地,所述切片记录中还记录有所述存储切片的引用标识和引用计数,所述引用标识为所述存储切片所引用的切片的标识,所述引用计数为所述存储切片被其他切片所引用的次数。
根据本发明的第二方面,本发明提供了一种机器可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述中任意一种数据库的大对象存储方法。
根据本发明的第二方面,本发明提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,并且所述处理器执行所述计算机程序时实现中任意一种数据库的大对象存储方法。
本发明的数据库的大对象存储方法,可以根据存储目标的数据量大小自动选择存储方式。对于数据量小于等于预设阈值的存储目标,直接将其元数据和数据本体存储在数据基表行内,对于数据量大于预设阈值的存储目标,将其元数据分为两部分进行存储。部分元数据存储在数据基表行内,以便快速定位和管理对象。其余元数据和数据本体则存储在对象与存储切片表中,实现了元数据和数据的分离。如此,可以优化体量悬殊的大对象存储方式,有效适应不同数据量大小的存储目标的存储需求,这有利于提高数据管理的灵活性。
进一步地,本发明的数据库的大对象存储方法,对于数据量小于等于预设阈值的存储目标,通过在数据基表行内设置大对象控制块,并将存储目标的元数据和数据本体直接存储在控制块中,有利于减少数据访问时的跨表或跨行操作,从而简化了读写流程。同时,由于控制块位于数据基表行内,数据库系统可以直接通过行操作来访问和管理这些数据,进一步提高了读写速度。此外,元数据细致划分为描述信息、对象标识符以及存储选项等。描述信息提供了关于存储目标的基本属性,对象标识符确保了每个存储目标的唯一性,而存储选项则涵盖了存储位置、压缩级别、加密设置等关键参数。这种细化的元数据管理有助于数据库系统更加精确地控制和优化数据的存储和访问过程。
进一步地,本发明的数据库的大对象存储方法,对于数据量大于预设阈值的存储目标,可以将存储目标的存储选项作为元数据的一部分与数据本体一同存储在对象记录中,数据库系统能够在存储数据时根据存储选项进行相应的处理,提高数据处理的效率和准确性。通过将数据本体分割为多个存储切片,并在对象与存储切片表中为每个切片设置独立的切片记录,实现了数据的分布式存储和管理。这种方式不仅优化了存储空间的使用,也能够适应数据量的增长和存储需求的变化,还便于进行数据的备份、恢复和迁移等操作,提高了数据的安全性和可靠性。对象与存储切片表的引入,使得数据库系统能够清晰地跟踪和管理每个存储目标和其对应的切片数据,实现了高效的数据存储和管理。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是根据本发明一个实施例的具有大对象列的数据表中表结构的示意图;
图2是根据本发明一个实施例的具有大对象列的数据表中系统表的示意图;
图3是根据本发明一个实施例的具有大对象列的数据表中一种可选大对象控制块的示意图;
图4是根据本发明一个实施例的具有大对象列的数据表中另一种可选大对象控制块的示意图;
图5是根据本发明一个实施例的具有大对象列的数据表中对象与存储切片表的示意图;
图6是根据本发明一个实施例的具有大对象列的数据表中存储切片互相引用的示意图;
图7是根据本发明一个实施例的数据库的大对象存储方法的流程图;
图8是根据本发明一个实施例的计算机可读存储介质的示意图;
图9是根据本发明一个实施例的计算机设备的示意图。
具体实施方式
本领域技术人员应当理解的是,下文所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,该一部分实施例旨在用于解释本发明的技术原理,并非用于限制本发明的保护范围。基于本发明提供的实施例,本领域普通技术人员在没有付出创造性劳动的情况下所获得的其它所有实施例,仍应落入到本发明的保护范围之内。
需要说明的是,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
本实施例提供了一种数据库的大对象存储方法,在对本申请实施例进行详细说明之前,首先对本实施例中的数据库进行说明,以便更好地理解本实施例所依赖的数据库环境,该数据库环境不仅支持大对象的存储和操作,并且能够提供足够的灵活性来执行复杂的重写任务。
本实施例的数据库建立有数据基表,数据基表可以为用户基表,根据创建语句进行创建。数据基表具有至少一列大对象列,并且大对象列中的至少部分大对象数据项被分割为多个存储切片进行存储。大对象列中的数据项可以为BLOB、CLOB/NCLOB或者其他类型的可变长度的二进制数据、字符数据、外部数据等。数据基表可以为用户基表,根据创建语句进行创建。大对象列的数量可以根据业务需求进行设置,例如设置为一列、两列或者更多列。
在数据库预设的大对象模式中,每个大对象列或者每个大对象列的分区设置有存储管理表空间,每个存储管理表空间存储有对应大对象列或者大对象列分区的对象与存储切片表,对象与存储切片表用于存储存储切片的描述信息及数据。
在一个示例中,建立数据基表的步骤包括:获取创建指令并根据创建指令生成数据基表,为数据基表的每个大对象列或者每个大对象列的分区生成列对象标识符;以及为对象与存储切片表根据列对象标识符进行命名,得到存储表对象标识符。创建指令可以使用例如SQL(Structured Query Language),以一个简单的情况为例,假设用户建立了一个业务表user_biz_data,其中包含两个大对象列col_x和col_y,(以及其他常规数据列col_a和col_b)并且用户没有将大对象列设置分区,创建语句可以为:
其中KLOB可以为本实施例数据库定义的大对象数据类型,其包括KBLOB、KCLOB、KNCLOB三种专有基类型,分别对应传统的BLOB、CLOB、NCLOB类型。在本实施例的数据库中,可以利用既有的Domain类型机制,将KBLOB、KCLOB和KNCLOB设置为BLOB、CLOB和NCLOB背后的可替换实现之一。这意味着,当用户在创建表或定义列时指定使用BLOB、CLOB或NCLOB类型时,实际上可以选择使用本实施例的专有基类型KBLOB、KCLOB或KNCLOB作为替代。
在用户建立user_biz_data的业务表(基表),其中包含两个未作分区的大对象列col_x和col_y。本方案将自动为这两个大对象列生成UUID(Universally UniqueIdentifier,列对象标识符,或称为通用唯一标识码)。
数据库预设的大对象模式可以为在数据库中创建的专用的模式(Schema),在一些实施例中,该大对象模式可以命名为sys_klob_schema,其定义了数据库的组织和结构。用户基表中的每一个大对象列及其列分区,数据库系统均可在上述Schema中建立一组表和索引来存储和管理大对象。对象本身将被切分为小的存储切片(Chunk)保存在这些表中。需要说明的是,大对象列可以根据需要进行分区,大对象列分区可被认为大对象列的一部分,每个大对象列分区具有一个对象与存储切片表。在一些实施例中,在不需要分区的情况下,每个大对象列具有一个对象与存储切片表。
例如sys_klob_sch Schema可以为两个未作分区的大对象列col_x和col_y分别设置配套的对象与存储切片表,分别命名为tab_colx_uuid,tab_coly_uuid。对象与存储切片表tab_colx_uuid,tab_coly_uuid分别以随机产生的UUID生成全局唯一标识。全局唯一标识的格式可以为前缀(例如上述tab_为前缀)与UUID的组合,以满足数据库对象的名称的命名要求。对象与存储切片表中的对象记录为对象的首条存储切片记录。在本实施例中,UUID用于标识一个大对象列或大对象列分区,数据表、索引、序列可以分别通过各自的前缀与UUID组合生成各自的名称。
数据库系统表中预设的大对象列元数据表中记录对象与存储切片表的描述信息。为管理大对象,数据库系统建立了一组专用的系统表,用于存储用户表中的大对象列与这些数据库对象之间的对应关系以及大对象列独有的存储参数。大对象列元数据表可被命名为sys_klob_column,为数据库系统专为大对象配置的一组系统表中的一个。
大对象列元数据表sys_klob_column还可以记录有基表的对象标识符(用于标识数据基表,可命名为rel_oid,在查找数据基表的元数据时使用)、大对象列的标识(可为大对象列在基表中的列编号,用于定位大对象列的位置,可命名为attr_no,与rel_oid配合可以唯一确定数据库的一个表列,在查找表列元数据时使用)。并且大对象列元数据表中记录的对象与存储切片表的描述信息包括存储表对象标识符(可命名为tab_oid,即上述对象与存储切片表的OID,在不做分区的情况下,每个大对象列具有一个对应的tab_oid,如果大对象列进行了分区,则每个大对象列分区具有一个对应的tab_oid)。
在数据基表中使用大对象控制块替代对应大对象数据项的位置,大对象控制块至少记录有大对象数据项的描述信息和数据项对象标识符。也即在最终的数据基表中,大对象数据项的位置为一个控制块,该控制块可以根据大对象数据的大小设置为不同的数据构造,至少包括的内容包括大对象数据项的描述信息和数据项对象标识符。其中大对象数据项的描述信息用于描述大对象数据项的类型、各种标志位、版本等。数据项对象标识符为该对象的全局唯一固定标识,是一个UUID类型的标识,在对象创建的时候随机生成,在对象的整个生命周期中保持不变。
数据库系统专为大对象配置的一组系统表还可以包括:存储参数历史表(可命名为sys_klob_store_params)、排重任务历史表(可命名为sys_klob_dedup_tasks),此外数据库系统表中的系统元数据表(可命名为pg_attribute)也记录有大对象列与其他常规数据类型一致的其他基本属性。
在一些实施例中,在数据库系统表中预设的存储参数历史表sys_klob_store_params中记录对象与存储切片表的存储表对象标识符tab_oid以及存储参数,这些存储参数可以包括存储参数版本号、存储选项、加密参数、任务标识等。存储参数历史表sys_klob_store_params的数据可以在大对象的压缩、加密等存储选项修改或者需要重新已有数据时使用。
在一些实施例中,在数据库系统表中预设的排重任务历史表sys_klob_dedup_tasks中记录对象与存储切片表的存储表对象标识符tab_oid以及排重任务信息,其中排重任务信息包括排重任务序号、排重任务标识,用于确定排重任务的执行状态。
数据库系统表的原有系统表也存储了大对象存储所用的表和索引本身的元数据,这与其他普通数据类型元数据记录基本一致,在此不做赘述。
每个存储管理表空间还存储有对象与存储切片表的主键索引。主键索引用于在对象与存储切片表中查找大对象数据项和/或存储切片;以及大对象列元数据表还记录有主键索引的信息。主键索引一般可以使用hash索引的方式。通过建立索引提高查找效率。
对象与存储切片表中还设置有引用列。引用列用于记录存储切片与其他存储切片的引用关系和/或大对象数据项与其他大对象数据项的引用关系。利用这些引用关系,可以避免重复存储相同大对象数据项和/或存储切片,节省存储空间资源。进一步地,每个存储管理表空间还可以存储有对象与存储切片表的引用列索引。引用列索引用于在对象与存储切片表查询引用关系;以及大对象列元数据表还记录有引用列索引的信息。通过建立引用列索引提高查找引用关系存储效率。
由于修改存储选项时重写数据和大对象排重均需要耗费大量的执行时间。为了尽量减小对用户日常业务的影响,上述操作一般在后台渐进式地进行。为了保证上述操作的正确执行,在一些实施例中,可以为对象与存储切片表创建数据重写任务序列(store_seq_<col/part uuid>)以及排重任务序列(dedup_seq_<col/part uuid>)。数据重写任务序列用于记录对象与存储切片表的重写过程,排重任务序列用于记录对象与存储切片表的排重过程,从而利用这两个序列分别跟踪修改存储选项时重写数据和大对象排重的任务。
在本实施例中,为了实现大对象的高效存储和管理,特别是在处理TB级大对象时,采用了基于表和索引的存储环境设计。这种方法避免了对数据库底层存储实现机制进行复杂的改造,而是通过在数据库中预设的大对象模式中为每个大对象列或每个大对象列的分区设置存储管理表空间。
仍以建立业务表user_biz_data,包含两个大对象列col_x和col_y为例进行介绍。图1是根据本发明一个实施例的具有大对象列的数据表中表结构的示意图。
在用户建立数据基表(业务表)user_biz_data时,数据库系统为其包含的col_x和col_y大对象列分别生成UUID(colx_uuid和coly_uuid)。生成数据库对象时,则在相应的UUID前加前缀,一方面是因为有些UUID文本形式首字符是数字,不符合数据库对象命名规则;另一方面是因为用于存储一个大对象列或列分区的是一组数据库对象,包括表、索引、Sequence(序列)等,其中,Sequence(序列)在数据库中的确是用来生成自增序列值的对象,通常用于为表中的记录提供唯一的标识符。在本方案中,为重写任务和排重任务分别生成序列号,主要目的是标识这些任务的执行顺序。由于这些序列号是在特定的列或列分区范围内生成的,并且考虑到这两类任务的执行次数通常不会太多,因此序列值回绕(即序列值达到上限后重新开始)的可能性确实很小。这确保了在这些范围内,序列号具有唯一性。另外,这些序列号并不是像UUID的全局唯一标识。UUID通常用于生成全局唯一的标识符,无论在哪里生成,UUID的冲突概率都非常低。而序列生成的唯一标识符只在特定的上下文或范围内有效,超出这个范围可能就不再唯一。如果col_x和col_y进行了分区,则每个分区具有各自的UUID。此外常规数据类型列col_a和col_b按照原有的存储逻辑进行存储。
整个数据库的结构包括:系统元数据模式pg_catalog schema、应用程序模式schema、大对象模式sys_klob_schema,其中系统元数据模式pg_catalog schema为数据库元数据,应用程序模式schema以及大对象模式sys_klob_schema主要为用户业务数据。
在系统表中,关系属性表(或称为系统元数据表,可命名为pg_attribute)用于并保存数据库一般普通数据类型和数据表的通用基本属性(包括大对象列与其他常规数据类型一致的基本属性)、大对象列元数据表sys_klob_column、存储参数历史表sys_klob_store_params、排重任务历史表sys_klob_dedup_tasks作为大数据的特有存储属性。大对象列元数据表sys_klob_column记录所创建的表和索引的Oid,以及大对象列特有的存储属性。表中的基表OID(rel_oid)和大对象列编号(attr_no)字段用于与数据库中原有的系统表相关联,表明这行数据记录的是哪个数据基表中的哪个列的属性。
为了跟踪排重任务以及修改大对象列存储选项时重写已有数据这些长时间任务的执行状态,并确保能从中断的任务中恢复,存储参数历史表sys_klob_store_params、排重任务历史表sys_klob_dedup_tasks用于记录存储参数和排重任务参数的历史。
大对象模式sys_klob_schema中包括col_x数据存储表空间、col_x数据存储表空间,如果大对象列具有分区,则每个分区具有各自的数据存储表空间。以col_x数据存储表空间为例,除了col_x对象与存储切片表进行数据存储外,还为对象与存储切片表的主键和引用列分别建立索引(可为hash索引)idx_<colx_uuid>、ref_<colx_uuid>。
col_x对象与存储切片表可以用tab_前缀加colx_uuid为名称,用于保存对象记录与存储切片记录,两者都以随机产生的UUID为全局唯一标识。对象记录本质上就是对象的第一条存储切片(Chunk)记录(Chunk)。tab_<colx_uuid>主键索引idx_<colx_uuid>可用于快速查找对象或存储切片Chunk。在支持对象排重的情况下,允许对象引用其他对象、Chunk引用其他Chunk,tab_<colx_uuid>引用列索引ref_<colx_uuid>可以用于加快引用关系的查询操作。
在基表user_biz_data中,大对象数据项的位置将由大对象控制块代替,其中会包含大对象数据项的实际存储位置。在一些实施例中,如果大对象数据项数据量很小时,为优化性能,也可以根据用户选择,将小数据量的数据项直接保存在大对象控制块中。
图2是根据本发明一个实施例的具有大对象列的数据表中系统表的示意图。与大对象相列关的系统表主要有4个:大对象列元数据表sys_klob_column、关系属性表pg_attribute、存储参数历史表sys_klob_store_params、大对象列排重任务历史表sys_klob_dedup_tasks。
关系属性表pg_attribute用于记录表列元数据,与其他常规数据类型的列一样,大对象列的基本属性也同样保存在这个表中。其中数据基表OID rel_oid和大对象列在基表中的列编号attr_no可以定位数据基表中的大对象列位置。
大对象列元数据表sys_klob_column用于保存大对象列及其列分区的特有属性,通过数据基表OID rel_oid和大对象列在基表中的列编号attr_no两个字段与关系属性表pg_attribute关联。在大对象列不分区的情况下,关系属性表pg_attribute中的每条记录在大对象列元数据表sys_klob_column中有一条对应的记录。在大对象列分区的情况下,每个分区也会在大对象列元数据表sys_klob_column中有一条对应的记录。
具体而言,大对象列元数据表sys_klob_column可以包括以下属性:
数据基表OID rel_oid,在查找基表相关的元数据时使用;
大对象列在基表中的列编号attr_no,与rel_oid配合可以确定唯一确定数据库中的一个表列,在查找表列元数据时使用;
对象与存储切片表OID tab_oid,用于存储大对象及其存储切片表的OID,在大对象列不分区的情况下,每个大对象列对应这样一个表,在大对象列分区的情况下,每个分区也会对应这样一个表;
主键索引OID idx_<colx_uuid>,对象与存储切片表主键列unit_id的索引(可为Hash索引)的OID,在大对象列不分区的情况下,每个大对象列对应于一个主键索引,在大对象列分区的情况下,则每个分区也会对应这样一个索引;
引用列索引OID ref_<colx_uuid>:对象与存储切片表应用对象/存储切片标识列ref_id的索引(Hash索引)的OID,在大对象列不分区的情况下,每个大对象列对应这样一个索引,在大对象列分区的情况下,则每个分区也会对应这样一个索引;
所属表空间OID tbs_oid,对象与存储切片表及其索引所在的表空间的OID;大对象列可以与其他数据放在不同的表空间,也可以将每个列分区放在不同的表空间,在用户需要的情况下,可以为每个大对象列(未分区情况下)或者大对象列分区(分区的情况下)指定一个独立的表空间;
存储参数版本号序列OID store_seq_oid,为大对象列或大对象列分区存储参数版本号序列store_seq_<col/part uuid>的OID,该序列store_seq_生成的整数用来标识大对象存储参数的版本及其先后次序;每个大对象列(未分区情况下)或者大对象列分区(分区的情况下)对应这样一个序列对象;
排重任务序号序列OID dedup_seq_oid,为大对象列或大对象列分区排重任务序号序列dedup_seq_<col/part uuid>的OID,排重任务序列dedup_seq生成的整数用来标识大对象排重任务参数的版本及其先后次序,每个大对象列(未分区情况下)或者大对象列分区(分区的情况下)对应这样一个序列对象;
存储切片chunk物理大小chunk_size,用于记录大对象的存储切片Chunk的大小,可以使用字节数为单位,Chunk的大小不受底层存储页大小的限制,可以在2K到1G之间选择,每个大对象列(未分区情况下)或者大对象列分区(分区的情况下)单独设置Chunk大小,从而满足不同大数据列的要求;
当前存储选项lob flags,为当前存储选项,这可以一个32位的位串,其中包含了存储位置、压缩、加密等方面的存储选项,存储参数历史表sys_klob_store_params同样完整记录了每个版本的存储选项,为了加速某些操作,当前存储选项lob flags保留了一个冗余字段,进行了重复的存储;
当前存储参数版本号store ver,是由大对象列/分区存储参数版本号序列生成的最新序号,用来与tab_oid共同标识当前存储参数对应于系统表sys_klob_store_params中的哪条记录;
dedup_ord:当前排重任务号,它是由大对象列或大对象列分区排重任务序号序列生成的最新序号,用来与tab_oid共同标识当前排重任务对应于大对象列排重任务历史表sys_klob_dedup_tasks中的哪条记录;
分区策略partstrat,用于记录分区策略,分区策略可以包括h哈希分区,l列表分区,r范围分区表,该属性仅在对象与存储切片分区表对应的行中有值;
分区键中的列数partnatts;仅在对象与Chunk分区表对应的行中有值;
默认分区partdefid:这个分区表的默认分区的pg_class项的OID,如果这个分区表没有默认分区则为零。仅在对象与Chunk分区表对应的行中有值;
分区键列号向量partattrs,是一个长度为partnatts值的数组,指示哪些表列是分区键的组成部分。例如,值1 3表示第一个和第三个表列组成了分区键。这个数组中的零表示对应的分区键列是一个表达式而不是简单的列引用,仅在对象与存储切片分区表对应的行中有;
分区键操作符类OID向量partclass,对于分区键中的每一个列,这个域包含要使用的操作符类的OID,仅在对象与存储切片分区表对应的行中有值;
分区键列排序规则OID向量partcollation,对于分区键中的每一个列,这个域包含要用于分区的排序规则的OID,如果该列不是一种可排序数据类型则对应值为零,仅在对象与存储切片分区表对应的行中有值。
分区键列表达式树partexprs,非简单列引用的分区键列的表达式树(以nodeToString()的表达方式),这是一个列表,partattrs中每一个零项都对应有一个元素。如果所有分区键列都是简单列引用,则这个域为空。仅在对象与Chunk分区表对应的行中有值;
单个分区边界的内部表达relpartbound,为分区边界的内部表达,仅在列分区对应的行中有值。
大对象列特有存储参数历史表sys_klob_store_params,用于保存数据库库中每个大对象列特有存储参数的所有历史版本,通过tab_oid列与sys_klob_column表中的记录相关联。在修改大对象的压缩、加密等存储选项需要重写已有的数据时,会用到这些历史数据。
具体而言,大对象列特有存储参数历史表sys_klob_store_params可以包括以下属性:
对象与存储切片表OID tab_oid;
存储参数版本号store_ver,由前述tab_oid为store_seq_<col/part uuid>的序列产生;
存储选项lob flags,其可以用于标识行外存储方式(包括表存储方式、文件存储方式、OSS(Object Storage Service,对象存储服务)存储方式等)、是否可用行内存储(可用或不可用)、是否加密(加密或不加密)、压缩级别(不压缩、低等级压缩、中等级压缩、高等级压缩)、加密算法标识(加密算法类型),上述标识的内容分别占用存储选项lob flags的一个或多个标识位,在一些实施例中,存储选项lob flags可以为一个32位的位串,由以上标识位拼接而成。
密钥过期UTC时间key_expr,用来加密大对象列的密钥的过期时间,可以采用UTC时间(Coordinated Universal Time,协调世界时);
密钥enc_key,为加密大对象列的密钥,以密文形式存储,用上级密钥加密;
加密&压缩任务标识enc_task_id,为大对象列加密与压缩任务的标识;可采用一个UUID形式的标识,在创建大对象列加密与压缩任务时随机生成,并在内存中的一个哈希表中登记;如果该表中记录的标识在当前内存中的加密与压缩任务登记表里找不到,则代表执行这个加密与压缩任务的进程已经退出。
大对象列特有存储参数历史表sys_klob_store_params中的tab_oid和store_ver字段合起来可以唯一确定库中一个大对象列或大对象列分区的一个存储参数版本。
大对象列排重任务历史表sys_klob_dedup_tasks,保存数据库中每个大对象列每一次排重任务的参数,通过tab_oid列与sys_klob_column表中的记录相关联,用于判定排重任务的执行状态。
具体而言,大对象列排重任务历史表sys_klob_dedup_tasks可以包括以下属性:
对象与存储切片表OID tab_oid,含义同以上其他系统表的tab_oid属性;
排重任务序号dedup_ord,由对象与存储切片表OID为大对象列或大对象列分区排重任务序号序列dedup_seq_<col/part uuid>的序列产生;
排重任务进程组唯一标识dedup_task_id,是一个UUID形式的标识,在创建大对象列排重任务时随机生成,并在内存中的一个哈希表中登记;如果该表中记录的标识在当前内存中的排重任务登记表里找不到,则代表执行这个排重任务的进程已经退出。
上述建立的专用的系统表记录对象与存储切片表的描述信息。这些专用的系统表用于存储用户表中的大对象列与上述用于存储大对象的数据库对象之间的对应关系以及大对象列独有的存储参数,使得数据管理更加高效,符合大对象的存储管理特点。
本实施例的方案中,在数据基表中使用大对象控制块替代对应大对象数据项的位置。大对象控制块可以包括行内大对象存储结构和行外大对象存储结构两种。
图3是根据本发明一个实施例的具有大对象列的数据表中一种可选大对象控制块的示意图。图3示出了行外大对象存储结构。大对象控制块varattrib_4b包括文件头varattrib_4b.va_header,以及数据varattrib_4b.va_data。其中数据varattrib_4b.va_data中包括大对象数据项的描述信息(LOB对象控制块描述字)和数据项对象标识符(LOB对象固定唯一标识)。
大对象数据项的描述信息可以描述控制块类型(行内或者行外)、行内是否有数据等标志位、控制块格式版本号等。上述内容可以分别占用描述信息的一个或多个标识位,在一些实施例中,大对象数据项的描述信息可以为一个32位的位串,由以上描述对应的标识位拼接而成。
数据项对象标识符是一个UUID类型的标识,在对象创建的时候随机生成,在对象的整个生命周期中保持不变。
行外大对象存储结构只包含其中的LOB对象控制块描述字和LOB对象固定唯一标识,这两个字段在对象的整个生命周期中保持不变,避免了在更新大对象内容时更新数据基表。
图4是根据本发明一个实施例的具有大对象列的数据表中另一种可选大对象控制块的示意图。图4示出了行内大对象存储结构。
行内大对象存储结构针对于数据量较小(例如32k之内)的大对象数据项,其在控制块内存储大对象数据(大对象数据的最大尺寸在设定范围内,例如最大为32k)。在数据varattrib_4b.va_data中除了LOB对象控制块描述字和LOB对象固定唯一标识还进一步包括:LOB对象存储选项、LOB数据。LOB对象存储选项可为一个位串,可以采用与系统表sys_klob_column和sys_klob_store_params中的lob_flags字段相同的格式。LOB数据包含大对象的数据。
通过区分行内大对象存储结构和行外大对象存储结构,满足了不同数据大小的大对象数据项的存储要求,仅将超过一定数据大小(例如32k)的数据存储在行外。
对象与存储切片表是实际存储大对象数据的表。在数据库运行期间,每个大对象列或列分区配套创建对象与存储切片表。本实施例对对象与存储切片表进行了优化改进,与现有PostgreSQL的明显不同,具有明显的优点。
在PostgreSQL的数据库方案中,大对象存储表pg_largeobject是个系统表,只用来存储存储切片数据,包含3个字段:loid、pageno、data。其中loid为大对象唯一标识,类型为OID(4字节无符号整数),在数据库范围内具有唯一性。pageno标识该chunk数据在大对象中的页号(从0开始),类型为4字节整数。data为Chunk数据,体量不超过数据库存储页大小的1/4,对于常见的8K存储页设置,其大小不超过2K。
在PostgreSQL的数据库中,全库大对象总容量受到单表数据量上限的限制,全库对象总数受到OID取值范围的限制。如果用户业务表中采用了int8等取值范围更大的数据类型,则大对象标识的数量可能不够用。而且,这种OID类型的标识只能确保在一个数据库内的唯一性,如果要将大对象导入其他数据库中,则必须重新分配标识,不利于对大对象的跟踪。大数据对象的每一行保存一个大对象的一个页的数据,从对象内部的字节偏移量(pageno*LOBLKSIZE)开始。允许稀疏存储,页面可能丢失,并且可能比LOBLKSIZE字节短(即便不是最后一页)。一个大对象中丢失的区域会被读出为0。也就是说,这种方案并不支持在大对象中间进行插入或删除操作,只支持内容的追加和替换,其行为模式不同于一般理解的编辑操作。
图5是根据本发明一个实施例的具有大对象列的数据表中对象与存储切片表的示意图。本实施例的方案中,对象与存储切片表存储的记录有两种类型。第一种类型为对象记录,它包含了对象元数据和前32K(例举,可以设置为其他数值)以内的数据,用于加速部分函数的操作。对于超过32K(例举,可以设置为其他数值)大小的对象还包含存储切片索引块,用于查找用户读写的数据位于哪些存储切片内。第二种类型是存储切片记录,包含了存储切片元数据和32K以上部分的数据。一个大体量(32K以上)的对象会由一条对象记录和若干条存储切片记录组成。对于每个大对象列或列分区,存储切片的大小可以在1G以内自由选择。如果列中对象的平均大小较小,则适合采用较小的存储切片数据尺寸;如果列中对象的平均大小很大,则适合采用较大的存储切片尺寸。例如对于TB级的大对象,可以使用最大的存储切片尺寸(1GB)。
具体而言,对象与存储切片表可以包括以下属性:对象固定唯一标识uint_id、系统内部使用的分区键part_key、存储参数版本号store_ver、引用对象标识ref_id、引用对象计数ref_count、对象排重特征值dedup_feat、对象前32k以内的数据prefetch、附加数据字段ext_data。
对象固定唯一标识uint_id,为一个UUID型的唯一标识,对于对象记录而言这是对象标识,对于存储切片而言这是存储切片标识。UUID型的标识可以认为在任何情况下都具有唯一性,即使将一个对象导入到其他数据库中,这种标识也可以保持不变,不会发生冲突。
part_key为系统内部使用的分区键,可为有符号整数。当用户选择用基表中的其他列作为大对象列的分区键时,用户所做的原始分区设置将被翻译成一种内部的列表分区形式,该字段包含内部使用的分区键;当用户选择基于对象/存储切片标识进行Hash分区时,此字段可为NULL。
store_ver是对象的存储参数版本号,在存储切片记录中则为NULL,该字段也可以用来区分对象记录和存储切片记录;
ref_id,对于对象记录而言,如果有值则为被引用对象的标识(UUID),代表该对象与被引用对象完全相同;对于存储切片记录,该字段如果有值则为被引用存储切片的标识(UUID),代表该存储切片与另一个存储切片完全相同。在该字段不为NULL的情况下,该记录的prefetch和ext_data字段都为NULL。另外,只有当一个对象与另一个对象完全相同时,两者才可能存在引用关系。如果只是部分存储切片相同,则只存在存储切片之间的引用关系,不存在对象间的引用关系。
ref_count,为在对象记录中代表本对象被其他对象的引用次数;在存储切片记录中代表该存储切片被其他存储切片的引用次数。如果对象或存储切片未被引用,则该字段值为0。
dedup_feat在存储切片记录中是存储切片本身的排重特征值,在对象记录中则是整个对象的排重特征值。这可是一个二进制数据块,其长度由排重特征值算法决定。若从未在对应的列或列分区上启用过排重功能,则该字段为NULL(初始状态)。对于行外存储的小型对象,如果DML操作改变了对象内容,那么在DML操作发生时:1、如果当前未启用排重,则将该字段置为NULL;2、如果当前已启用排重,则生成新的对象特征值,并填入该字段;对于行外存储的大型对象,如果DML操作改变了其下属切片内容,则在DML操作发生时:1、如果当前未启用排重,则将该字段置为NULL;2、如果当前已启用排重,则生成新的切片特征值,并填入该字段。排重任务执行时,会为尚无特征值的小型对象以及大型对象的切片生成特征值,并填入该字段。
prefetch,在对象记录中为对象前32K以内的数据,按照对象存储参数的设定进行存储,可能会压缩和加密;在存储切片记录中该字段总是为NULL。
ext_data,在对象记录中,该附加数据字段包含存储切片索引块,记录了对象所有存储切片的排列顺序、原始数据逻辑长度和唯一标识。这里所说的逻辑长度,是指按原始数据的单位计算的长度。对于BLOB单位是字节,对于CLOB/NCLOB而言,单位是字符。在存储切片记录中,该字段包含大对象32K以上部分的数据。无论是存储切片索引块还是存储切片数据,都会按照对象存储参数的设定进行存储,可能会压缩和加密。例如,在某个大对象的首个存储切片的记录中,该附加数据字段可以用来存储该大对象对应的所有存储切片的索引记录,也即存储切片索引块,在该大对象除去首个存储切片的其他存储切片中,该附加数据字段用于存储对应存储切片的数据。也即只有大对象的首个存储切片在附加数据字段用于存储存储切片索引块,其自身的数据存储于prefetch字段,其余存储切片在ext_data这一附加数据字段则会存储自身对应的数据内容。无论是存储切片索引块还是存储切片数据,都会按照对象存储参数的设定进行存储,可能会压缩和加密。
在上述存储结构下,本方案的存储切片内容修改方式与现有技术中PostgreSQL数据库存在明显不同,可以高效地支持在大对象中间进行插入和删除操作,并采用与字符串插入、删除操作相同的语义。
在对象记录(即对象的第一个数据行)中,prefetch字段用来存对象的第一个切片,即对象头部有限长度的数据,这部分数据在有些场景下可以像常规字段一样直接读写,无需通过文件式的API;它的长度上限也低,不像后续切片可以设置得很大;ext_data字段用来存储切片索引块。在切片记录(即第二个及其后的切片所在的数据行)中,prefetch字段用不到,置NULL;ext_data字段用来存储切片的数据内容。
通过上述数据库的设计方式,可以在大对象被拆分为多个存储切片的情况下,首先数据基表(也即user_biz_data表)中确定大对象自身的全局唯一标识,并根据大对象全局唯一标识在对象与存储切片表中找到其所在的首个存储切片(大对象全局唯一标识便是首个存储切片的切片唯一标识);随后通过首个存储切片中记录的存储切片索引块确定查找的目标数据所在的目标存储切片的全局唯一标识,接着通过目标存储切片的全局唯一标识在对象与存储切片表中找到目标存储切片,最终在其ext_data列获取目标存储切片的具体数据。
除此之外,想要修改目标存储切片的数据也可以按照上述方法找到对应的目标存储切片并执行操作,随后同步更新首个存储切片的附加数据字段中存储切片索引块的内容。
存储切片的索引块是一个二进制数据块,包含了一个对象所有存储切片的定位信息,其中依次包含如下字段:存储切片索引库格式描述字、存储切片数量、存储切片长度数组、存储切片标识数组。
存储切片索引库格式描述字可为有符号整数,作为一个位串使用,其部分位(例如低8位)为存储切片索引块格式版本号,其他位可以作为保留。
存储切片总数,即后边存储切片数组的长度,类型为有符号整数。如果该字段为0,则代表不包含任何存储切片。
存储切片长度数组,长度为前边所说的存储切片总数,数组元素类型为有符号整数,按照存储切片在对象中的先后顺序排列。
存储切片标识数组,长度为存储切片总数,数组元素类型为UUID数,也按照存储切片在对象中的先后顺序排列。
从图5中可以看到,在存储切片索引块中,存储切片的元数据(长度和标识)不是按行存储,而是按列存储,即:先将所有的存储切片长度值连续存储,再将所有的存储切片标识值连续存储。由于大对象通常较少更新,其存储切片的长度值会存在很多重复值,这样做有助于提高压缩率。
在本实施例的方案中,存储切片的元数据(标识、长度等)与数据是分开存储的,存储切片的实际长度是可变的,存储切片在大对象中的顺序是由存储切片索引块记录的。因此,在大对象中间插入或删除数据时,只有插入或删除的数据涉及的存储切片需要重写,其他存储切片不动,大大减少了更新时需要重写的数据量,提升了性能。
相比较地,而PostgreSQL数据库采用定长的存储切片,存储切片元数据与数据保存在一条记录中,通过存储切片序号来表示其在对象中的位置,如果从中间插入或删除数据,就需要重写插入/删除点后的所有存储切片,性能远不如本实施例的方案。
通过加入引用对象/存储切片uint_id、、ref_id、ref_count,本实施例的方案的大对象存储支持排重操作,也即对重复的对象或存储切片进行简化。图6是根据本发明一个实施例的具有大对象列的数据表中存储切片互相引用的示意图。例如对于某一大对象数据项A的部分存储切片与另一大对象数据项B中存储切片相同,这些存储切片相对独立,具有唯一标识,但不存放实际数据,而保存对象数据项B的存储切片的标识。例如在存储切片102与存储切片201相同,存储切片104、存储切片105与存储切片204相同的情况下,存储切片102内存储存储切片201的标识,存储切片104、存储切片105分别保存存储切片204的标识。存储切片201、存储切片204分别记录引用计数。
相类似的,如果某一大对象数据项D与另一大对象数据项C相同,则大对象数据项D可以存储大对象数据项C的标识,而不必存储数据。大对象数据项C记录引用计数。当然,这仅是针对体量小于等于32K的大对象数据项而言的,对于更大的大对象数据项,由于判断其整体上是否重复的代价过高,完全匹配的概率较低,只在存储切片的粒度上排重才是更好的选择。
上述记录的引用计数可以在数据修改时,执行DML时避免数据出现错误。
使用上述存储结构中,大对象的存储形式可以分为三种:行内存储的小型对象、行外存储的小型对象、行外存储的大型对象。
其中,行内存储的小型对象的元数据和数据本体都存储在数据基表行内,其形式为一个行内控制块。行内存储的小型对象结构紧凑、占用空间小。
行外存储的小型对象的部分元数据存储在数据基表行内,其余元数据和数据本体存储在对象与存储切片表中,其形式为一个行外对象控制块和一条对象记录。行外存储的小型对象除了控制块和对象数据本身外,还包含支持分区、排重和渐进后台任务等其他特性的字段。
行外存储的大型对象的部分元数据存储在行内,其余元数据、前32K数据和存储切片索引块存储在一条对象记录中,32K以上的数据则存储在一组存储切片记录中。行外存储的大型对象包括一条对象记录和若干条存储切片记录组成。对象记录和若干条存储切片记录存储在同一个表中,使用同一种主键列。对象记录作为访问大对象数据的入口。
值得说明的是,虽然行外存储的大型对象也具有也具有上述小型对象的支持分区、排重和渐进后台任务等其他特性的字段,但区别在于,1、在大型对象的对象记录中,ref_id、ref_count、dedup_feat是用不到的,因为不对大型对象作整体排重,只做切片级排重;2、在大型对象的切片记录中:store_ver是用不到的,因为单个对象的所有内容采用统一的存储参数,比较符合用户普遍的预期;prefetch也用不到,因为用户读写大对象内指定的片段时,不需要快速获取切片头部的一小片数据。
前文提到,传统的数据库管理系统在处理大对象类型数据时,往往采用行外存储的方式,然而这种存储方式在读写大对象时,需要频繁地进行行内外数据的转换和访问,导致读写流程复杂,效率低下。此外,对于体量悬殊的大对象,如果采用统一的存储方式,也会导致存储空间的浪费和管理上的不便。
为解决上述问题,本发明提供了一种数据库的大对象存储方法,图7是根据本发明一个实施例的数据库的大对象存储方法的流程图,如图7所示,该数据库的大对象存储方法至少包括以下步骤S701至步骤S704。
步骤S701,获取待存储的大对象数据项,作为存储目标。
步骤S702,识别存储目标的数据量大小。
步骤S703,若存储目标的数据量小于等于预设阈值,将存储目标的元数据和数据本体存储至数据库的数据基表行内。
步骤S704,若存储目标的数据量大于预设阈值,将存储目标的部分元数据存储至数据库的数据基表行内,将其余元数据和数据本体存储至数据库的对象与存储切片表中。
上述实施例的大对象存储方法,可以根据存储目标的数据量大小自动选择存储方式。对于数据量小于等于预设阈值的存储目标,直接将其元数据和数据本体存储在数据基表行内,对于数据量大于预设阈值的存储目标,将其元数据分为两部分进行存储。部分元数据存储在数据基表行内,以便快速定位和管理对象,其余元数据和数据本体则存储在对象与存储切片表中,实现了元数据和数据的分离。如此,可以优化体量悬殊的大对象存储方式,有效适应不同数据量大小的存储目标的存储需求,这有利于提高数据管理的灵活性。
存储目标包括元数据和数据本体,元数据主要用于描述数据属性的信息,而数据本体则是实际的数据内容。在存储过程中,元数据和数据本体是密不可分的,共同构成了存储目标。
元数据可以包括存储目标的描述信息、对象标识符以及存储选项等,其中,描述信息提供了关于存储目标的基本属性,对象标识符确保了每个存储目标的唯一性,而存储选项则涵盖了存储位置、压缩级别、是否加密以及加密算法等关键参数。这种细化的元数据管理有助于数据库系统更加精确地控制和优化数据的存储和访问过程。
在一些实施例中,对于数据量小于等于预设阈值的存储目标而言,将存储目标的元数据和数据本体存储至数据库的数据基表行内的步骤可以是:在数据库的数据基表行内设置大对象控制块,将存储目标的描述信息、对象标识符、存储选项以及数据本体存储至大对象控制块中,可参照图5。
这样,将存储目标的元数据和数据本体直接存储在控制块中,可以减少数据访问时的跨表或跨行操作,从而简化读写流程。同时,由于大对象控制块位于数据基表行内,数据库系统可以直接通过行操作来访问和管理这些数据,进一步提高读写速度。
在一些实施例中,对于数据量大于预设阈值的存储目标而言,将存储目标的部分元数据存储至数据库的数据基表行内的步骤可以是:在数据库的数据基表行内设置大对象控制块,将存储目标的描述信息和对象标识符存储至大对象控制块中,可参照图4。
这样,可以将部分元数据与数据本体分开存储,由于元数据的描述信息和对象标识符是被存储在数据基表行内的,既可以与数据本体保持一定的关联性,又不会占用过多的行内空间,从而优化了存储结构。
进一步地,将其余元数据和数据本体存储至数据库的对象与存储切片表中的步骤可以是:在对象与存储切片表中为存储目标设置一条对象记录,将存储目标的存储选项和数据本体中小于等于预设阈值的数据存储至对象记录中,将数据本体中大于预设阈值的数据分割为多个存储切片,在对象与存储切片表中分别为每个存储切片设置一条切片记录,将存储切片的数据对应存储至切片记录中。
可以理解,存储选项作为其余元数据与数据本体一同存储在对象记录中,数据库系统在处理数据时可以直接读取和应用这些选项。这意味着系统能够根据预设的规则或策略,自动地对数据进行压缩、加密或其他必要的处理。由于大对象控制块是设置在数据集表行内的,当需要改写对象内容或存储选项时,系统可以保持大对象控制块不变。这意味着系统可以更加快速地改写数据,同时保持数据结构的稳定性和一致性。
另外,通过将数据本体分割为多个存储切片,并在对象与存储切片表中为每个切片设置独立的切片记录,实现了数据的分布式存储和管理。这种方式不仅优化了存储空间的使用,也能够适应数据量的增长和存储需求的变化,还便于进行数据的备份、恢复和迁移等操作,提高了数据的安全性和可靠性。
对象与存储切片表的引入,使得数据库系统能够清晰地跟踪和管理每个存储目标和其对应的切片数据,实现了高效的数据存储和管理。
在一些实施例中,在将其余元数据和数据本体存储至数据库的对象与存储切片表中的过程中,还可以在对象记录中记录存储目标的对象标识符,在切片记录中记录存储切片的切片标识符,并且根据对象记录中的存储选项对存储切片中的数据进行存储。
对象标识符和切片标识符确保了每个对象和存储切片都有唯一的标识,这有助于在数据库中准确地定位和管理特定的数据实体。通过对象标识符和切片标识符,可以清晰地建立起对象与其切片之间的关联关系。这种关系使得在需要时能够快速地检索、组合或更新与特定对象相关的所有切片数据。
每个存储切片通过切片标识符与对象记录关联,这有助于确保数据的完整性。当进行切片操作或更新切片数据时,可以通过切片标识符追踪和验证数据变更,从而保持数据的一致性。在并发环境中,多个操作可能同时访问和修改同一个对象或切片。通过标识符,系统可以更加精确地锁定和管理这些操作,避免数据冲突和不一致。
另外,可以利用标识符作为索引,优化数据库的查询性能。这样,无论是查询对象还是查询其相关的切片,都可以快速定位到需要的数据,提高系统的响应速度。随着系统的发展和数据的增长,可能需要增加新的切片或对切片进行进一步的细分。通过标识符管理,可以更加灵活地添加、删除或修改切片,而不影响整个对象数据的完整性和结构。
存储切片按照对象记录中的存储选项进行存储,可以使同一个对象的内部统一存储参数,这有助于保持数据的一致性和完整性,同时也符合大多数开发者和用户的预期。
在一些特殊情况下,例如,用户在数据重写完成之前频繁更改存储选项或系统突然停机,这可能导致部分对象的存储格式与其他对象不一致。为了应对这种情况,本实施例的方案中,可以仅在对象记录中记录存储目标的存储参数版本号,根据存储参数版本号及对象与存储切片表OID可以从存储参数历史表中确定相应的存储参数版本,如此可以支持渐进式的数据重写。
在实际应用中,当用户发出更改存储参数的命令后,首先会更改系统表sys_klob_column的存储选项,并在sys_klob_store_params中添加一条新记录。在相应的大对象列或列分区中,由重写任务逐个对象进行重写,每个对象的重写是一个小事务,在该事务中对象的存储选项及其所有数据均会更新。
这样,以对象为单位,如果发现某一个对象自身的存储参数与列或列分区的存储参数不一致,那么该对象即为待重写的对象。
在遭遇意外停机,有事务进行了一半时,这类事务的问题是靠数据库自身的恢复机制,在数据库启动时自动修复的,其他问题则不会导致事务被破坏。
重写任务因各种原因被中止后,可能有部分对象还没来得及重写。这可以通过再做一次重写任务来修复。
另外,仅将存储参数版本号存储在对象记录中,而不是分散在各个存储切片中,可以避免降低版本管理复杂性,如果每个存储切片都有自己的存储参数,那么管理和维护这些版本将变得非常复杂。统一存储参数可以减少版本管理的复杂性,使得更新和同步更加容易。同时,如果每个存储切片都存储自己的存储参数,那么很可能出现数据冗余的情况。统一存储参数可以避免这种冗余,节省存储空间。当需要查询或修改存储参数时,如果存储参数分散在各个切片中,那么查询和修改操作将会变得低效。统一存储参数可以提高查询和修改的效率。
在一些实施例中,在将其余元数据和数据本体存储至数据库的对象与存储切片表中的过程中,可以在对象记录中设置存储切片索引块,利用存储切片索引块记录存储目标的所有存储切片的排列顺序、原始数据逻辑长度和切片标识符。
具体来说,存储切片索引块通过记录存储切片的排列顺序,确保了数据的顺序性和一致性。当需要从数据库中检索数据时,系统可以根据索引块中的顺序信息,按照正确的顺序组合切片,从而还原出完整的数据。
记录原始数据的逻辑长度,并按这种长度切片,首要的原因是在应用层,访问这些数据时是按原始数据中的逻辑长度定位的:用户读写BLOB时以字节为单位表示访问的起始位置和读写的数据长度;用户读写CLOB/NCLOB时以字符为单位表示访问的起始位置和读写的字符串长度。
在存储层面,尽管CLOB/NCLOB在不同编码下数据的实际长度(字节数)会不同,压缩和加密也会改变实际存储的数据长度,但总能通过各种方式保证实际存储的数据长度不超过Chunk Size的设置。
切片标识符是每个存储切片的唯一标识,它使得系统能够精确地定位和管理每个存储切片。通过切片标识符,系统可以快速地检索、更新或删除特定的切片,而无需对整个数据集进行扫描。这种精确性不仅提高了数据处理速度,还降低了出错的可能性。
在一些实施例中,切片记录中记录有存储切片的排重特征值,排重特征值的引入对于减少存储切片的比对范围至关重要。在存储大量数据时,切片之间可能存在重复的内容,通过计算切片的排重特征值,并在切片记录中记录这些值,系统可以在进行排重任务时快速比对这些特征值,从而确定哪些切片可能是重复的。这极大地缩小了比对范围,提高了排重效率,减少了不必要的存储空间占用。
进一步地,切片记录中还记录有存储切片的引用标识和引用计数,引用标识和引用计数的记录有助于实现切片之间的关联管理,引用标识用于标识一个存储切片所引用的其他切片的身份,这样系统可以轻松地追踪切片之间的依赖关系。而引用计数则记录了存储切片被其他切片引用的次数,通过引用计数,系统可以判断何时可以安全地删除一个存储切片。
在本实施例中,预设阈值可以为32K,当然,也可以为其他数值,并非是固定不变的,可以具体的应用场景、实际需求以及系统性能等灵活调整。
上文中提到的小型对象也就是数据量小于等于预设阈值的对象、大型对象也就是数据量大于预设阈值的对象。小型对象之所以存在行内存储和行外存储之分,是因为在一开始,如果用户设置了允许行内存储,那么小于等于预设阈值的对象均是存储在行内的,因为行内数据通常可以更快地被访问和处理。
当一个原本存储在行内的小型对象在更新过程中变得更大,超过预设阈值时,系统会将其转移到行外存储。这样的设计可以确保数据库系统始终维持一个高效且稳定的数据存储结构。
而当一个原本存储在行外的大型对象在更新过程中缩小,小于预设阈值时,系统并不会将其移回行内存储。这是因为考虑到该对象未来可能再次增大,频繁地在行内和行外之间移动对象会带来额外的开销和复杂性。因此,系统选择保持其在行外存储的状态,以应对可能的数据增长。
这种设计既考虑到了数据的动态变化,又平衡了性能和稳定性的需求。它允许数据库系统根据数据的实际情况进行灵活的处理,确保数据始终以最优的方式存储和访问。
本实施例提供的流程图并不旨在指示方法的操作将以任何特定的顺序执行,或者方法的所有操作都包括在所有的每种情况下。此外,方法可以包括附加操作。在本实施例方法提供的技术思路的范围内,可以对上述方法进行附加的变化。
应当理解,在一些实施例中,各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。
本实施例还提供了一种计算机可读存储介质20和计算机设备30。图8是根据本发明一个实施例的计算机可读存储介质20的示意图,图9是根据本发明一个实施例的计算机设备30的示意图。
计算机可读存储介质20,其上存储有上述计算机程序21,计算机程序21被处理器32执行时实现上述任一实施例的数据库的大对象存储方法的步骤。计算机设备30可以包括存储器31、处理器32及存储在存储器31上并在处理器32上运行的计算机程序21。
用于执行本发明操作的计算机程序21可以是汇编指令、指令集架构(InstructionSet Architecture,简称ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路的配置数据、或者以一种或多种编程语言和过程编程语言的任意组合编写的源代码或目标代码。计算机程序21可以完全在用户的计算机上执行,部分在用户的计算机上执行,作为独立的软件包执行,部分在用户的计算机上并且部分在远程计算机上执行,或者完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可以通过任何类型的网络(包括局域网(Local Area Network,简称LAN)或广域网(Wide Area Network,简称WAN)连接到用户的计算机,或者可以连接到外部计算机(例如,使用因特网服务供应商通过因特网)。在一些实施例中,为了执行本发明的各方面,包括例如可编程逻辑电路、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或可编程逻辑阵列(ProgrammableLogic Array,简称PLA)的电子电路可以通过利用计算机可读程序指令的状态信息来执行计算机可读程序指令以使电子电路个性化。
就本实施例的描述而言,计算机可读存储介质20是能够保留和存储计算机程序21的有形设备,其可以是任何可以包含、存储、通信、传播或传输程序21以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读存储介质20的更具体的示例(非穷尽性列表)包括以下:便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式光盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备,以及上述的任何适当组合。
计算机设备30可以是例如服务器、台式计算机、笔记本式计算机、平板计算机或智能手机。在一些示例中,计算机设备30可以是云计算节点。计算机设备30可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括执行特定的任务或者实现特定的抽象数据类型的例程、程序、目标程序、组件、逻辑、数据结构等。计算机设备30可以在通过通信网络链接的远程处理设备执行任务的分布式云计算环境中实施。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
计算机设备30可以包括适于执行存储的指令的处理器32、在操作期间为所述指令的操作提供临时存储空间的存储器31。处理器32可以是单核处理器、多核处理器、计算集群或任何数量的其他配置。存储器31可以包括随机存取存储器(RAM)、只读存储器、闪存或任何其他合适的存储系统。
计算机设备30还可以包括网络适配器/接口和输入/输出(I/O)接口。I/O接口允许用可以连接到计算机设备的外部设备输入和输出数据。网络适配器/接口可以提供计算机设备与通常被示为通信网络的网络之间的通信。
至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。

Claims (10)

1.一种数据库的大对象存储方法,包括:
获取待存储的大对象数据项,作为存储目标;
识别所述存储目标的数据量大小;
若所述存储目标的数据量小于等于预设阈值,将所述存储目标的元数据和数据本体存储至所述数据库的数据基表行内;
若所述存储目标的数据量大于所述预设阈值,将所述存储目标的部分元数据存储至所述数据库的数据基表行内,将其余元数据和数据本体存储至所述数据库的对象与存储切片表中。
2.根据权利要求1所述的数据库的大对象存储方法,其中,
所述存储目标的元数据包括所述存储目标的描述信息、对象标识符以及存储选项,所述存储选项包括存储位置、压缩级别、是否加密以及加密算法;
将所述存储目标的元数据和数据本体存储至所述数据库的数据基表行内的步骤包括:
在所述数据库的数据基表行内设置大对象控制块,将所述存储目标的描述信息、对象标识符、存储选项以及数据本体存储至所述大对象控制块中。
3.根据权利要求1所述的数据库的大对象存储方法,其中,
所述存储目标的部分元数据包括所述存储目标的描述信息和对象标识符;
将所述存储目标的部分元数据存储至所述数据库的数据基表行内的步骤包括:
在所述数据库的数据基表行内设置大对象控制块,将所述存储目标的描述信息和对象标识符存储至所述大对象控制块中。
4.根据权利要求3所述的数据库的大对象存储方法,其中,
所述存储目标的其余元数据包括所述存储目标的存储选项;
将其余元数据和数据本体存储至所述数据库的对象与存储切片表中的步骤包括:
在所述对象与存储切片表中为所述存储目标设置一条对象记录;
将所述存储目标的存储选项和数据本体中小于等于所述预设阈值的数据存储至所述对象记录中;
将所述数据本体中大于所述预设阈值的数据分割为多个存储切片;
在所述对象与存储切片表中分别为每个所述存储切片设置一条切片记录;
将所述存储切片的数据对应存储至所述切片记录中。
5.根据权利要求4所述的数据库的大对象存储方法,其中,将其余元数据和数据本体存储至所述数据库的对象与存储切片表中的步骤还包括:
在所述对象记录中记录所述存储目标的对象标识符,在所述切片记录中记录所述存储切片的切片标识符;并且
根据所述对象记录中的所述存储选项对所述存储切片中的数据进行存储。
6.根据权利要求5所述的数据库的大对象存储方法,其中,将其余元数据和数据本体存储至所述数据库的对象与存储切片表中的步骤还包括:
在所述对象记录中设置存储切片索引块,利用所述存储切片索引块记录所述存储目标的所有所述存储切片的排列顺序、原始数据逻辑长度和切片标识符。
7.根据权利要求4所述的数据库的大对象存储方法,其中,
所述切片记录中记录有所述存储切片的排重特征值,利用所述排重特征值在排重任务中缩小所述存储切片的比对范围。
8.根据权利要求7所述的数据库的大对象存储方法,其中,
所述切片记录中还记录有所述存储切片的引用标识和引用计数,所述引用标识为所述存储切片所引用的切片的标识,所述引用计数为所述存储切片被其他切片所引用的次数。
9.一种机器可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据权利要求1-8任一项所述的数据库的大对象存储方法。
10.一种计算机设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,并且所述处理器执行所述计算机程序时实现根据权利要求1-8任一项所述的数据库的大对象存储方法。
CN202411046720.1A 2024-07-31 2024-07-31 数据库的大对象存储方法、存储介质及设备 Pending CN118861039A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202411046720.1A CN118861039A (zh) 2024-07-31 2024-07-31 数据库的大对象存储方法、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202411046720.1A CN118861039A (zh) 2024-07-31 2024-07-31 数据库的大对象存储方法、存储介质及设备

Publications (1)

Publication Number Publication Date
CN118861039A true CN118861039A (zh) 2024-10-29

Family

ID=93169798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202411046720.1A Pending CN118861039A (zh) 2024-07-31 2024-07-31 数据库的大对象存储方法、存储介质及设备

Country Status (1)

Country Link
CN (1) CN118861039A (zh)

Similar Documents

Publication Publication Date Title
EP3814930B1 (en) System and method for bulk removal of records in a database
EP2615566A2 (en) Unified local storage supporting file and cloud object access
US11221999B2 (en) Database key compression
US11650967B2 (en) Managing a deduplicated data index
WO2008001094A1 (en) Data processing
US20230394010A1 (en) File system metadata deduplication
US12216622B2 (en) Supporting multiple fingerprint formats for data file segment
US20160139980A1 (en) Erasure-coding extents in an append-only storage system
CN112416879B (zh) 一种基于ntfs文件系统的块级数据去重方法
CN106874329A (zh) 数据库表索引的实现方法和装置
CN118861100A (zh) 数据库的大对象读取方法、存储介质及设备
US8156126B2 (en) Method for the allocation of data on physical media by a file system that eliminates duplicate data
US20170242882A1 (en) An overlay stream of objects
US10409799B2 (en) Supporting updatable repeated values over variable schema
CN118861039A (zh) 数据库的大对象存储方法、存储介质及设备
CN118861064A (zh) 数据库的大对象删除方法、存储介质及设备
CN118885485A (zh) 数据库中临时大对象的存储方法及相关产品
CN118861068A (zh) 数据库中大对象的更改方法及相关产品
CN118861063A (zh) 数据库的大对象重写方法、存储介质及设备
CN118861066A (zh) 数据库的大对象更新方法、存储介质及设备
CN118861042A (zh) 具有大对象列的数据表的管理方法与相关产品
CN118861040A (zh) 数据库的大对象排重处理方法、存储介质及设备
CN118861127A (zh) 数据库的大对象排重处理方法、存储介质及设备
CN118861101A (zh) 数据库的大对象读取方法与相关产品
US12050549B2 (en) Client support of multiple fingerprint formats for data file segments

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination