[go: up one dir, main page]

CN1998241B - 用于对xml文档编码和/或解码的方法及装置 - Google Patents

用于对xml文档编码和/或解码的方法及装置 Download PDF

Info

Publication number
CN1998241B
CN1998241B CN200580023461XA CN200580023461A CN1998241B CN 1998241 B CN1998241 B CN 1998241B CN 200580023461X A CN200580023461X A CN 200580023461XA CN 200580023461 A CN200580023461 A CN 200580023461A CN 1998241 B CN1998241 B CN 1998241B
Authority
CN
China
Prior art keywords
xml
value
path
encoded
bit stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200580023461XA
Other languages
English (en)
Other versions
CN1998241A (zh
Inventor
J·休尔
A·胡特
A·科夫勒-沃格特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Corp
Original Assignee
Siemens Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Corp filed Critical Siemens Corp
Publication of CN1998241A publication Critical patent/CN1998241A/zh
Application granted granted Critical
Publication of CN1998241B publication Critical patent/CN1998241B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种用于将XML文档编码为特别是二进制的位流的方法,其中至少一个XML元素具有简单的内容,其中至少一个绝对路径通过一系列XML元素和/或XML属性名称来表示,其中该XML文档通过树结构来表示,其中具有简单内容的XML元素和XML属性的所有绝对路径按照至少一个第一可预先给定的分类准则被分类,在值结构中给相应的绝对路径的具有简单内容的XML元素和XML属性的每一值特性分配值表示,其中,将该值表示按照第二分类准则存储在值结构中,且其中给每一值表示分配路径位置,其中,路径位置是树结构中的相应的值表示关于相应的绝对路径的位置。此外本发明涉及解码方法、编码和解码方法、编码装置、解码装置以及编码和解码装置。

Description

用于对XML文档编码和/或解码的方法及装置
技术领域
本发明涉及编码方法和解码方法。此外,本发明涉及编码和解码方法。另外,本发明涉及编码装置解码装置,和编码和解码装置。
背景技术
XML(=可扩展标记语言(extensible markup language))是一种语言,利用该语言能够以结构化方式描述文档的内容。在此可以使用名称空间,其借助XML模式语言定义来定义。XML模式(XML Schema)的较准确的描述以及其中所使用的结构、数据类型和内容模型参见文献[7]、[8]和[9]。
从现有技术中已公知用于编码基于XML的文档的方法,其中把文档变换为被编码的二进制表示。例如在文献[3]中说明了用于编码和解码基于XML的文档的方法,所述文献[3]在MPEG-7编码标准发展的框架内产生。
从现有技术公知的用于产生基于XML的文档的二进制表示的方法在为了以自由选择方式访问被编码的信息而编码基于XML的文档时具有缺点。从现有技术中已公知数据流的索引方法,所述索引方法允许以自由选择方式访问被编码的数据流[4]、[10]。然而所述索引方法具有以下缺点,即索引信息与被索引的数据流相比相当大。
经常需要根据用户事先提出的询问从位流中读出确定的内容或者关于确定的内容来确定所述内容在位流中是否存在。由用户所定义的询问在此可以借助一种询问语言(例如SQL[1]或者XPATH[2])来表达。
从位流中读出数据的缺点例如在借助XML语言(XML=可扩展标记语言)所建立的以MPEG7-BiM格式表示的文档的情况下产生。关于XML文档的MPEG7-BiM格式在此特别参照文献[3]。在一种这样的表示中将所产生的位流在多个单元(访问单元)内分配,所述单元在其方面又由多个片段(片段更新单元(fragment update unit))组成。这些单元被编码,并在需要时作为MPEG7-BiM流被发送给一个或者多个接收方。
关于对XML文档的信息的询问已经知道多种询问语言,其允许在文档中 查找确定的信息。例如此处参照已经提到的询问语言XPATH[2]。使用询问语言XPATH能够定义用于过滤XML文档内的所希望的信息的选择准则。在此,询问的目的一方面可以估计位流的单元对于接收方是否重要。另一方面,可以借助询问在XML文档中有目的地追溯所希望的信息。MPEG-7编码方法迄今在产生XML文档的位流时未规定能够以自由选择方式访问XML文档的确定的元素的任何机制。因此MPEG-7位流必须为查找元素而被编码。于是再次得到XML格式的文档,其可以借助询问语言XPATH被搜索。因此为查找特定的内容而对XML文档的解码和接着的处理非常耗时,且对确定的时间临界的应用是不可接受的。此外,可能出现以下问题,即解码器中的存储器是有限的,以致位流不能完全被解码。此外,假如在被解码的XML文档处所执行的XPATH询问是否定进行的,则解码的耗费是不需要的。
在文献[4]中所说明的TV-Anytime(即时电视)(TVA)的范围中,使用一种索引结构,其允许以自由选择方式访问数据片段的确定的元素。该索引结构由多个部分组成,并且包括所谓的键索引列表(Key-Index-Liste),其中存储文档的全部索引路径。在询问时,根据次序将这些路径与询问进行比较,直到在键索引列表中找到相应的项。通过在键索引列表中对于该项所存储的信息,可以在描述流中确定该位置,在该位置处被索引的项以编码的方式存在。通过使用键索引列表,不再需要解码不感兴趣的数据片段,使得在询问期间需要较小的存储位置。但是,线性遍历键索引列表是耗时的,且传输所有被索引的路径是耗费的。此外,索引结构与被索引的数据流相比较具有相当大的量。
此外在文献[10]中介绍了方法和装置,利用所述方法和装置能够从索引树中产生位流。然而在此产生两个文档:被编码的XML文档和包括索引节点的索引数据的位流。在此借助位置说明来参考XML文档内的值特性 
Figure DEST_PATH_GA20180065200580023461X01D00021
发明内容
因此本发明的在于,创建一种用于编码基于XML的文档的方法,所述方法以简单而且有效的方式既能够实现对被编码的信息的快速询问也能够实现对XML文档的有效编码。
该任务从按照权利要求1的前序部分的编码方法出发通过其表征的特征、从按照权利要求11的前序部分的解码方法出发通过其表征的特征、以及从按照 权利要求12的前序部分的编码和解码方法出发通过其表征的特征来解决。此外该任务从按照权利要求13的前序部分的编码装置出发通过其表征的特征、从按照权利要求14的前序部分的解码装置出发通过其表征的特征、以及从按照权利要求15的前序部分的用于编码和解码的装置出发通过其表征的特征来解决。
在用于将XML文档编码为位流的方法中,其中XML文档通过树结构来表示,在所述树结构中至少一个绝对路径通过一系列XML元素和/或XML属性名称来表示,并且其中至少一个XML元素具有简单的内容,对具有简单内容的XML元素和XML属性的所有绝对路径按照至少一个第一可预先给定的分类准则进行分类,在值结构中给相应的绝对路径的具有简单内容的XML元素和XML属性的每一值特性分配值表示 
Figure DEST_PATH_GA20180065200580023461X01D00031
其中,将该值表示按照第二分类准则存储在值结构中,并且给每一值表示分配路径位置,其中,路径位置是树结构中相应的值表示关于相应的绝对路径的位置。
通过本发明的编码方法允许,在被编码的、特别是二进制的位流中,既能以迅速而且简单的方式查找可预先给定的查找准则,也能实现对XML文档的有效编码。
此外本发明涉及一种用于对被编码的、特别是二进制的位流进行解码的方法。由此能够对利用用于编码XML文档的方法所产生的被编码的、特别是二进制的位流进行解码。
另外本发明涉及一种编码和解码方法。因此,一方面能够把XML文档编码为被编码的、特别是二进制的位流CB,也能够把该被编码的、特别是二进制的位流CB解码为被解码的XML文档。
此外本发明还涉及一种具有用于编码的装置的编码装置。由此可以执行本发明的编码方法。
此外本发明还包括一种具有用于解码的装置的解码装置。由此可以执行本发明的解码方法。
本发明还涉及一种用于编码和解码的装置。由此可以实现本发明的用于编码和用于解码的方法。
本发明的其他改进在从属权利要求中得以描述。
附图说明
下面根据图1到7表示和说明本发明、它的优点和它的改进。
图1示出结构化的XML文档的例子;
图2作为树结构示出图1的结构化的XML文档的表示的例子;
图3示出对图1的结构化的XML文档的路径按词典编纂方式分类的例子;
图4示出在利用本发明的方法对结构化的XML文档编码后的位流的结构;
图5示出在利用本发明的方法参考值特性对结构化的XML文档编码后的位流的结构;
图6示出图2中所描绘的树结构的绝对路径的分类树的图示;
图7示出在图6中所示的绝对路径的分类树的示例性序列化的图示。
具有相同功能和作用方式的元素在图1到7中赋予相同的参考标记。
具体实施方式
根据图1到6详细地说明本发明的方法。图1以文本形式举例示出XML文档。该XML文档在图2中以树结构(BS)的形式被描绘。在此,圆圈表示XML元素X1、X3、…、X11和XML属性X2。一般地,XML文档包括N个XML元素和/或XML属性X1、…、XN。此外,具有简单内容的XML元素和/或XML属性X1、...、XN包括值特性W1、…、WL,它们具有值例如“3”或者“Heuer”。
图3示出多个绝对路径P1、…、PM。在此,绝对路径P1、…、PM标识要编码的具有简单内容的XML元素和/或XML属性X1、…、XN的链接。例如,绝对路径P2=“/Group/Person/firstName”标识XML元素X9、X6、X3。这些绝对路径P1、…、PM引导到其内容作为类型特定的值被编码和被传输的XML元素和XML属性。根据本发明的方法,绝对路径P1、…、PM按照第一可预先给定的分类准则S1被分类。在按照图3的实施例中,所述绝对路径以所提及的顺序按词典编纂方式以升序被分类。由此第一分类准则S1表示一种按词典编纂的分类算法。在另一个变型方案中,为第一分类准则S1选择统计的准则,例如每一绝对路径P1、…、PM的具有简单内容的XML元素和XML属性的数目。在图2中可以看到,绝对路径P2在该XML文档中出现三次:
-“/Group/Person/firstName”+“Joerg”
-“/Group/Person/firstName”+“Andrea”
-“/Group/Person/firstName”+“Andreas”
由此可以在使用绝对路径P2=“/Group/Person/firstName”的情况下如下写 出这三种组合:
-P2+“Joerg”
-P2+“Andrea”
-P2+“Andreas”
在图4中可以看到按照本发明的方法被编码的二进制位流CB的第一实施例。该位流CB包括两个位流元素BE1、BE2。位流元素BE1包括具有绝对路径的项PL1、…、PLM的列表。该列表的每一列表项PL1、…、PLM分别包括绝对路径P1、…、PM和分别包括对在值结构WS内的值路径列表VL1、…、VLM的逻辑连接(Verknüpfung)VT1、…、VTM,所述值结构WS对应于位流元素BE2。具有列表项PL1、…、PLM的列表这样被产生,使得绝对路径P1、…、PM按照第一可预先给定的分类准则S1被存储在那里。从而列表项PL1包括绝对路径P1,列表项PL2包括绝对路径P2和列表项PL2包括绝对路径P2,因为绝对路径在图3中已经被分类。
值结构WS分别包括:每一绝对路径P1、…、PM一个值路径列表VL1、…、VLM。值路径列表VL1、…、VLM包括一些值特性,所述值特性借助相应的绝对路径P1、…、PM被寻址。于是例如按照图2,三个不同的值特性W1、W3、W5通过绝对路径P2被寻址。从而值路径列表VL2包括三个值路径元素VL21、…、VL23=VL2Y。值元素一般分别包括值表示WE1、…、WEL和分别包括路径位置PL1、…、PLL。在本实施例中,值路径元素包括VL21(WE2,PL2)、VL22(WE3,PL3)和VL23(WE4,PL4)。另外的值路径元素(例如VL11)以类似方式形成。
在按照图4的本实施例中,值表示WE1、WE2、WE3包括值特性W3、W5、W1。在值表示WE1、…、WEL和值特性W1、…、WL之间的分配一方面按照属于相应的绝对路径P1、…、PM的值特性W1、…、WL进行。另一方面,相应的值表示WE1、…、WEL按照本发明的方法按照第二分类准则S2被布置。在此例如可以把值表示WE1、…、WEL按照值表示WE1、…、WEL的相应的值特性W1、…、WL的按词典编纂的升序布置。因此,值表示包括WE2=W3=“Andrea”、WE3=W5=“Andreas”和WE4=W1=“Joerg”。
路径位置PL1、…、PLY包含说明:如果为在绝对路径中包含的相同名称例示(instanziieren)多个相邻的XML元素,则在树中在绝对路径的哪个可能 的位置处例示值特性。根据图2,具有路径“/Group/Person/firstName”的值特性W3=“Andrea”例如具有路径位置PL1=“1/2/1”,因为“Andrea”是第一“Group”元素、第二“Person”元素和第一“firstName”元素的值特性。在本例中,路径位置对于唯一重构XML文档是必要的,因为XML元素“Person”具有多个同名的XML相邻元素。在[3]中给出了用于编码路径位置的另外的方法。存储路径位置允许以原来的顺序重构具有例示的值的结构化的XML文档。
在本发明的方法的一个变型方案中,值表示W1、…、WL借助具有值列表W)的值逻辑连接WR1、…、WEL实现。这将根据图5详细地进行解释。图5的实施例仅在值表示WE1、…、WEL的建立方面不同。代替将值特性W1、…、WL直接采用到相应的值表示WE1、…、WEL中,在根据图5的本实施例中借助具有值列表WA的值逻辑连接WR1、…、WRL来参考所述值特性W1、…、WL。值列表WA包含值特性W1、…、WL。所述值特性可以以分类的顺序被存储在值列表WA内。此外可以把经常出现的值特性W1、…、WL仅通过一个值特性表示,原因在于借助相应的值逻辑连接WR1、…、WRL保证在值表示和值列表WA中的项之间的唯一的分配。
在本发明方法的一个变型方案中,在相应的分类树中对绝对路径P1、…、PM和/或值结构WS的相应的值路径列表VL1、…、VLM的值表示WE1、…、WEL进行分类。在图6中可以看到按照根据图2的实施例的绝对路径P1、…、PM的第一分类树SG。建立这种分类树SG的方法从[10]中获知。通过使用分类树SG代替线性列表(例如绝对路径的列表BE1),极大地减低查找复杂性。
在本发明的方法的一个扩展方案中,分类树SG以序列化的形式被插入到被编码的位流CB中。用于建立这种序列化的形式的方法从[10]中获知。在图7描述了从图6中所获知的第一分类树SG的实现例子。对于绝对路径的每一列表项PL1、…、PLM例如产生序列化的字段SF1、…、SFM。在此,序列化的字段SF1、…、SFM至少包括绝对路径P1、…、PM和逻辑连接VT1、…、VTM。例如序列化的字段SF2包括绝对路径P2和逻辑连接VT2。另外,在一个或者多个序列化的字段SF1、…、SFM中还可以包括偏移OF,该偏移OF使能够跳过不重要的序列化的字段SF1、…、SFM。于是偏移OF(SF3)指明,下一重要的序列化的字段SF3应该位于被编码的位流CS中的哪一位置。
此外,根据本发明的方法可以通过相对于事前所分类的路径的相对路径来 表示绝对路径P1、…、PM。绝对路径P2=“/Group/Person/firstName”和P3=“/Group/Person/lastName”的不同之处仅在于“firstName”和“lastName”。从文献[10]中获知用于从绝对路径中产生相对路径的方法。通过使用相对路径能够进一步减少对被编码的位流所需要的数据容量。
在本发明方法的另一个变型方案中,可以对值特性W1、…、WL和/或绝对路径P1、…、PM和/或相对路径和/或路径位置(PL1、…、PLL)进行二进制编码。二进制编码能够减少被编码的位流CS的数据容量。二进制编码可以按照标准MPEG-7[3]进行。
此外可以像具有简单内容的XML元素(例如XML元素X3)那样处理至少一个具有复杂内容的XML元素(例如XML元素X4),并特别是按照MPEG-7标准作为值特性对具有复杂内容的XML元素的内容编码。例如对于XML元素X4作为值特性处理XML元素X3、X5和值特性W1、W2。因此绝对路径的量将会被减为两种可能性:“/Group/nrOfMembers”和“/Group/Person”。由此对于在调用信息时仅关联地考虑复杂的内容的情况可以进一步降低查找复杂性。因此对于具有复杂内容的XML元素也能够实现按照本发明的方法的实施方式。
此外本发明涉及一种用于解码被编码的位流CB的方法,其中该被编码的位流CB借助用于编码XML文档的方法被产生。该解码方法也可以对以二进制方式被编码的位流CB进行解码。
此外本发明涉及编码和解码方法。一方面,由此能够把XML文档编码为被编码的、特别是二进制的位流CB,也能够把该被编码的、特别是二进制的位流CB解码为被解码的XML文档。
此外本发明还涉及一种具有用于编码XML文档的装置的编码装置。此外本发明还包括一种具有用于把被编码的、特别是二进制的位流CB解码为被解码的XML文档的装置的解码装置。本发明还涉及一种编码和解码装置,其中因此能够把XML文档编码为被编码的、特别是二进制的位流CB,并且也能够把被编码的、特别是二进制的位流CB解码为被解码的XML文档。编码装置和/或解码装置和/或解码和编码装置可以集成在例如按照GSM标准(GSM-全球移动通信(Global System for Mobile Communications))或者UMTS标准(UMTS-通用移动通信系统(Universal Mobile Telecommunications System)) 的设备中。此外,所述编码装置和/或解码装置和/或解码和编码装置可以在连接于无线网络(例如基于IP的网络(IP-因特网协议(Internet Protocol))或者ISDN(ISDN-综合业务数字网(Integrated Services Digital Network)))的设备内实现。
本发明不仅仅局限于所述实施例。相反,附加地和/或可代替地,下面的变型方案和/或优点是本发明的主题。在结构化的文档、特别是XML文档中,文档的XML元素或者XML属性中的信息的类型通过所有父元素的名称来说明。在此,XML元素和XML属性根据文档树中的结构定义来布置。在用于编码结构化的文档的本发明方法中,所有具有简单内容的XML元素、其值应相关联地被编码的XML元素和XML属性按照其名称和其父元素的名称、亦即按照其路径根据任意的准则(例如按词典编纂方式)被分类。这些路径在这里是绝对路径,所述绝对路径从文档结构树的根节点开始并且通向该文档结构树的叶节点。具有相同路径的所有XML属性和XML元素的值被存储在数据区域中,所述数据区域通过公共的路径表征。在该数据区域中的项根据它们的值按照任意的准则(例如按词典编纂方式)被分类。在该数据区域中的每一项连同该项在结构化的文档中出现的路径位置一起被存储。由此能够从按照本发明编码的数据中完全地重构结构化的文档。
在一个优选的实施形式中,在通过路径表征的数据区域中不是存储值,而是存储该值的参照(Verweise)。由此,通过存储耗费较小的多个参考参照一个值,能够避免对该值的重复存储。
在一个特别优选的实施形式中,被分类的路径被布置在序列化的分类树中。分类树包括多个分级层面,其中给每一分级层面分配一个或者多个节点,并且这些节点包括被分类的数据,例如路径,所述数据在该分类树中按照一个或者多个预先给定的准则分类。在序列化时,把节点的被分类的数据插入位流中,此外对于节点分别在该位流中插入信息:即位于相应的节点的分级层面之下的分级层面的一个或者多个节点的数据存在于该位流中的哪个位置。通过存储关于位于其下的分级层面中的节点的附加信息,极大地简化对于确定的数据的查找,因为由此能够跳到对于查找重要的节点。从而保证对数据的大大有效的询问和查找。
在另一个实施形式中,序列化的分类树作为所谓的B树(=平衡树 (Balanced Tree))被构造,其保证在树的节点上对路径的平衡分配。B树的准确的说明参见参考[5]。
在另一个变型方案中,按照深度优先规则(Depth-First-Ordnung)在位流中插入路径。通过使用深度优先规则,将被分类的数据在分类树中首先按照深度插入位流中,由此在位流中彼此相邻地布置对询问重要的信息,并能够有效地跳过不重要的信息。深度优先规则的准确的说明参见参考[6]。
在本发明的一个优选的实施形式中,所述路径是相对路径,其中,相应的节点的相对路径是与相应的节点的、或者位于相应的节点的分级层面之上的分级层面的节点的事先在该位流中所插入的路径相对的路径。通过使用相对路径而利用路径中的公共性,因为相邻节点的路径大多具有公共的部分。以这种方式能够减少对位流中被分类的数据所需要的存储需求。存储需求的进一步减少可以通过以下方式实现,即其被分类的数据作为分级层面的第一被插入到位流中的节点的路径以与在节点中布置被分类的数据的顺序相反的顺序被插入到位流中。在此考虑这样的事实,即与在第一节点的开始处的被分类的数据相比,在分级层面的第一节点末端处的被分类的数据具有对次高分级层面的节点的被分类的数据的较大的相似性。因此在某些情况下借助相对路径得出特别有效的编码。
在本发明的另一个实施形式中,路径包括XML文档(XML=可扩展标记语言)的描述元素,其中所述路径特别是XML文档的XPATH路径。
在本发明的另一个变型方案中,索引数据利用一种编码方法以二进制方式被编码,特别是利用MPEG编码方法。在一个特别优选的实施形式中,作为编码方法使用MPEG7编码方法。
在一个特别的实施形式中,在序列化的分类树中布置值。
在一个特别优选的实施形式中,值按照深度优先规则被插入位流中。
在本发明的另一个实施形式中,值在数据区域内利用一种编码方法以二进制方式被编码,特别是利用MPEG编码方法。在一个特别优选的实施形式中,作为编码方法使用MPEG7编码方法。
在本发明的另一个实施形式中,路径位置利用一种编码方法以二进制方式被编码,特别是利用MPEG编码方法。在一个特别优选的实施形式中,作为编码方法使用MPEG7编码方法。
文献目录:
http://dxl.hrz.uni-dortmund.de:8001/docl/hrz/sqlref/sqloracle.html
http://www.w3.org/TR/xpath
ISo/IEC 15938-1 Multimedia Content Description Interface-Part 1:Systems,Geneva 2002
TV-Anytime Specification Series S-3 on Metadata,Part-B,Version 13
http://www.public.asu.edu/~peterjn/btree/
http://www.generation5.org/simple_search.shtml
http://www.w3.org/TR/2001/REC-xmlschema-0-20010502/
http://www.w3.org/TR/2001/REC-xmlschema-1-20010502/
http://www.w3.org/TR/2001/REC-xmlschema-2-20010502/
Deutsche Patentanmeldung 10 337 825″Verfahren zumErzeugen eines Bitstroms aus einem Indizierungsbaum″

Claims (16)

1.用于将XML文档编码为位流(CB)的方法,其中,XML文档通过树结构(BS)来表示,在该树结构(BS)中至少一个绝对路径通过一系列XML元素和/或XML属性名称表示,其中,至少一个XML元素具有简单的内容,其特征在于,
a)对具有简单内容的XML元素和XML属性的所有绝对路径按照至少一个第一可预先给定的分类准则(S1)进行分类;
b)在值结构(WS)中给相应的绝对路径的具有简单内容的XML元素和XML属性的每一值特性分配值表示,其中,值表示按照第二分类准则(S2)被存储在值结构(WS)中;
c)给每一值表示分配路径位置,其中,所述路径位置表示树结构(BS)中的相应的值表示关于相应的绝对路径的位置。
2.根据权利要求1的方法,其特征在于,
值特性作为值表示被存储在值结构(WS)中。
3.根据权利要求1的方法,其特征在于,
值表示借助具有值列表(WA)的值逻辑连接实现。
4.根据权利要求1到3之一的方法,其特征在于,
绝对路径和/或值结构(WS)的相应的值路径列表的值表示在相应的分类树中被分类。
5.根据权利要求4的方法,其特征在于,
相应的分类树(SG)以序列化的形式被插入到被编码的位流(CB)中。
6.根据权利要求1到3之一的方法,其特征在于,
绝对路径通过相对于事先被分类的路径的相对路径来表示。
7.根据权利要求1到3之一的方法,其特征在于,
至少一个相对和/或绝对路径以二进制方式在位流(CB)中被编码。
8.根据权利要求7的方法,其特征在于,所述至少一个相对和/或绝对路径按照MPEG-7标准被编码。
9.根据权利要求1到3之一的方法,其特征在于,
值特性在位流(CB)中以二进制方式被编码。
10.根据权利要求1到3之一的方法,其特征在于,
至少一个具有复杂内容的XML元素像具有简单内容的XML元素那样被处理,
具有复杂内容的XML元素的内容作为值特性被编码。
11.根据权利要求10的方法,其特征在于,具有复杂内容的XML元素的内容按照MPEG-7标准被编码。
12.根据权利要求1到3之一的方法,其特征在于,
路径位置以二进制方式在位流(CB)中被编码。
13.根据权利要求12所述的方法,其特征在于,路径位置按照MPEG-7标准被编码。
14.根据权利要求1所述的方法,其中所述位流(CB)是二进制的。
15.用于将XML文档编码为位流(CB)的编码装置,其中,XML文档通过树结构(BS)来表示,在该树结构(BS)中至少一个绝对路径通过一系列XML元素和/或XML属性名称表示,其中,至少一个XML元素具有简单的内容,其特征在于,具有
a)用于对具有简单内容的XML元素和XML属性的所有绝对路径按照至少一个第一可预先给定的分类准则(S1)进行分类的装置;
b)用于在值结构(WS)中给相应的绝对路径的具有简单内容的XML元素和XML属性的每一值特性分配值表示的装置,其中,值表示按照第二分类准则(S2)被存储在值结构(WS)中;
c)用于给每一值表示分配路径位置的装置,其中,所述路径位置表示树结构(BS)中的相应的值表示关于相应的绝对路径的位置。
16.根据权利要求15所述的编码装置,其特征在于,所述位流(CB)是二进制的。
CN200580023461XA 2004-07-14 2005-05-24 用于对xml文档编码和/或解码的方法及装置 Expired - Fee Related CN1998241B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102004034004.8 2004-07-14
DE102004034004A DE102004034004A1 (de) 2004-07-14 2004-07-14 Verfahren zum Codieren eines XML-Dokuments, sowie Verfahren zum Decodieren, Verfahren zum Codieren und Decodieren, Codiervorrichtung, Decodiervorrichtung und Vorrichtung zum Codieren und Decodieren
PCT/EP2005/052372 WO2006005646A1 (de) 2004-07-14 2005-05-24 Verfahren zum codieren eines xml-dokuments, sowie verfahren zum decodieren, verfahren zum codieren und decodieren, codiervorrichtung, decodiervorrichtung und vorrichtung zum codieren und decodieren

Publications (2)

Publication Number Publication Date
CN1998241A CN1998241A (zh) 2007-07-11
CN1998241B true CN1998241B (zh) 2011-08-03

Family

ID=35106920

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200580023461XA Expired - Fee Related CN1998241B (zh) 2004-07-14 2005-05-24 用于对xml文档编码和/或解码的方法及装置

Country Status (8)

Country Link
US (1) US20080148141A1 (zh)
EP (1) EP1766982B1 (zh)
JP (2) JP5044399B2 (zh)
KR (1) KR101155146B1 (zh)
CN (1) CN1998241B (zh)
DE (1) DE102004034004A1 (zh)
TW (1) TWI464606B (zh)
WO (1) WO2006005646A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9460064B2 (en) * 2006-05-18 2016-10-04 Oracle International Corporation Efficient piece-wise updates of binary encoded XML data
US7886223B2 (en) * 2006-11-17 2011-02-08 International Business Machines Corporation Generating a statistical tree for encoding/decoding an XML document
US20080165281A1 (en) * 2007-01-05 2008-07-10 Microsoft Corporation Optimizing Execution of HD-DVD Timing Markup
US20090144610A1 (en) * 2007-06-14 2009-06-04 Aristocrat Technologies Australia Pty. Limited Translating xml with multiple namespace extensions
AU2011204906B2 (en) * 2007-06-14 2013-06-27 Aristocrat Technologies Australia Pty Limited Translating XML with multiple namespace extensions
FR2924244B1 (fr) * 2007-11-22 2010-04-23 Canon Kk Procede et dispositif d'encodage et de decodage d'information
US7925643B2 (en) * 2008-06-08 2011-04-12 International Business Machines Corporation Encoding and decoding of XML document using statistical tree representing XSD defining XML document
FR2936623B1 (fr) * 2008-09-30 2011-03-04 Canon Kk Procede de codage d'un document structure et de decodage, dispositifs correspondants
KR101044870B1 (ko) * 2008-10-02 2011-06-28 한국전자통신연구원 경로 코드를 이용한 xml 문서의 부호화 및 복호화 방법과 장치
CN101739462B (zh) * 2009-12-31 2012-11-28 中兴通讯股份有限公司 可扩展标记语言编码方法、解码方法和客户端
FR2959080B1 (fr) * 2010-04-20 2012-08-17 Canon Kk Procede et dispositif de codage de donnees structurees a l'aide d'une expression xpath
CN102096706B (zh) * 2011-01-05 2013-03-06 北京大学 一种变步长xml编码方法
WO2013079999A1 (en) 2011-12-02 2013-06-06 Canon Kabushiki Kaisha Methods and devices for encoding and decoding messages
US9063916B2 (en) 2013-02-27 2015-06-23 Oracle International Corporation Compact encoding of node locations

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6721727B2 (en) * 1999-12-02 2004-04-13 International Business Machines Corporation XML documents stored as column data
US20020116371A1 (en) * 1999-12-06 2002-08-22 David Dodds System and method for the storage, indexing and retrieval of XML documents using relation databases
US7072984B1 (en) * 2000-04-26 2006-07-04 Novarra, Inc. System and method for accessing customized information over the internet using a browser for a plurality of electronic devices
EP1158420A1 (en) * 2000-05-24 2001-11-28 Robert Bosch Gmbh Method for a description of audio-visual data content in a multimedia environment
AUPR063400A0 (en) * 2000-10-06 2000-11-02 Canon Kabushiki Kaisha Xml encoding scheme
AU2001295608A1 (en) * 2000-10-17 2002-04-29 Koninklijke Philips Electronics N.V. Binary format for mpeg-7 instances
CN1294758C (zh) * 2001-02-01 2007-01-10 西门子公司 改善基于mpeg-7和其它xml内容描述的二进制表示的功能的方法
JP2002259451A (ja) * 2001-03-05 2002-09-13 Sharp Corp 検索情報符号化装置
US6799184B2 (en) * 2001-06-21 2004-09-28 Sybase, Inc. Relational database system providing XML query support
ATE327538T1 (de) * 2002-07-15 2006-06-15 Siemens Ag Verfahren und vorrichtungen zum kodieren/dekodieren von strukturierten dokumenten,insbesondere von xml-dokumenten
ATE365948T1 (de) * 2002-07-23 2007-07-15 Samsung Electronics Co Ltd Suchmethode für metadaten und vorrichtung, welche die indizes von metadaten verwendet
DE10337825A1 (de) * 2002-11-15 2004-06-03 Siemens Ag Verfahren zur Erzeugung eines Bitstroms aus einem Indizierungsbaum

Also Published As

Publication number Publication date
JP5044399B2 (ja) 2012-10-10
KR20070041530A (ko) 2007-04-18
CN1998241A (zh) 2007-07-11
JP2011198372A (ja) 2011-10-06
DE102004034004A1 (de) 2006-02-09
JP2008507166A (ja) 2008-03-06
KR101155146B1 (ko) 2012-06-12
US20080148141A1 (en) 2008-06-19
EP1766982A1 (de) 2007-03-28
EP1766982B1 (de) 2013-07-03
TW200606662A (en) 2006-02-16
WO2006005646A1 (de) 2006-01-19
TWI464606B (zh) 2014-12-11

Similar Documents

Publication Publication Date Title
CN1998241B (zh) 用于对xml文档编码和/或解码的方法及装置
US7043686B1 (en) Data compression apparatus, database system, data communication system, data compression method, storage medium and program transmission apparatus
CN100401290C (zh) 使用元数据的索引的元数据搜索方法和装置
JP4561150B2 (ja) 階層データ形式のためのデータベースモデル
US9336188B2 (en) Generating a statistical tree for encoding/decoding an XML document
KR20040013072A (ko) 메타데이터의 인덱스 구조
JP2004514966A (ja) Mpeg−7インスタンス用の二進フォーマット
CN100576750C (zh) 用于从索引树中产生比特流的方法
US20070143664A1 (en) A compressed schema representation object and method for metadata processing
US8723703B2 (en) Method and apparatus for encoding and decoding structured data
JP3865694B2 (ja) 構造化文書の木構造におけるパスの符号化および復号化方法
KR101102629B1 (ko) 구조화된 문서들의 코딩 방법
US7251277B2 (en) Efficient means for creating MPEG-4 textual representation from MPEG-4 intermedia format
US7797346B2 (en) Method for improving the functionality of the binary representation of MPEG-7 and other XML based content descriptions
EP1963997A1 (en) A succinct index structure for xml
KR100500196B1 (ko) 멀티미디어 메타데이터의 오류 내성 부호화/복호화 장치및 방법
US7571152B2 (en) Method for compressing and decompressing structured documents
US7617237B2 (en) Encoding device, encoding method, decoding device, decoding method, program and machine readable recording medium containing the program
US20020120780A1 (en) Two-staged mapping for application specific markup and binary encoding
KR100910061B1 (ko) 디지털 방송을 위한 메타데이터 부호화/복호화 장치 및 그방법
Bruccoleri Database Streaming Compression on Memory-Limited Machines
Böttcher et al. Using XML Schema Subtraction to Compress Electronic Payment Messages
Shin On storing and querying XML data within network-enabled embedded systems
Demmings FILTERING,(C () MPRESSED) XMI, STREAMS
Heuer Effiziente Codierung von XML Instanzen mit MPEG-7 BiM

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110803

Termination date: 20180524