JP2002259194A - Document data encoding method and system - Google Patents
Document data encoding method and systemInfo
- Publication number
- JP2002259194A JP2002259194A JP2001357830A JP2001357830A JP2002259194A JP 2002259194 A JP2002259194 A JP 2002259194A JP 2001357830 A JP2001357830 A JP 2001357830A JP 2001357830 A JP2001357830 A JP 2001357830A JP 2002259194 A JP2002259194 A JP 2002259194A
- Authority
- JP
- Japan
- Prior art keywords
- conversion table
- code
- data
- name
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Transfer Between Computers (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 拡張可能なテキスト形式の記述言語を符号化
することができ、符号データを文書データに復号するこ
となく文書処理をすることができる文書データ符号処理
方法及びシステムを提供する。
【解決手段】 拡張可能なテキスト形式の記述言語で記
載された変換テーブルを用いて、拡張可能なテキスト形
式の記述言語で記載された文書データを符号化する符号
化ステップと、前記変換テーブルを用いて、符号データ
を文書処理する文書処理ステップとを有し、前記変換テ
ーブルは、他の変換テーブルのリンク情報を定義し、要
素名と、該要素名の要素値と、該要素名に指定可能な属
性名と、該属性名の属性値との項目に割り当てられた符
号長及び符号と、第1の要素名に対する第2の要素名が
親子関係を示す符号長及び符号とを定義するものであ
る。
(57) Abstract: A document data encoding method and system capable of encoding an extensible text description language and performing document processing without decoding encoded data into document data. provide. An encoding step of encoding document data described in an extensible text format description language using a conversion table described in an extensible text format description language, and using the conversion table. The conversion table defines link information of another conversion table, and can be specified for an element name, an element value of the element name, and the element name. And a code length and a code assigned to the item of the attribute name, the attribute value of the attribute name, and a code length and a code indicating the parent-child relationship between the first element name and the second element name. is there.
Description
【0001】[0001]
【発明の属する技術分野】本発明は、文書データの符号
処理方法及びシステムに関する。[0001] 1. Field of the Invention [0002] The present invention relates to a method and system for encoding document data.
【0002】[0002]
【従来の技術】従来、伝送すべきデータ量を削減するた
めに、文書データを符号化及び復号化する方法がある。
この方法を実現するには、送信装置及び受信装置はそれ
ぞれ、変換テーブルを所持する必要がある。変換テーブ
ルは、記述言語と符号データとを1対1に対応付けたも
のである。送信装置は、変換テーブルに基づいて文書デ
ータを符号データに符号化する。一方、受信装置は、変
換テーブルに基づいて符号データを文書データに復号化
する。2. Description of the Related Art Conventionally, there is a method of encoding and decoding document data in order to reduce the amount of data to be transmitted.
To realize this method, each of the transmitting device and the receiving device needs to have a conversion table. The conversion table associates the description language with the code data on a one-to-one basis. The transmitting device encodes the document data into encoded data based on the conversion table. On the other hand, the receiving device decodes the code data into document data based on the conversion table.
【0003】このような方法は、特に、インターネット
に有効である。例えば、Webサーバが、HTML(HyperText
Markup Language)のようなテキスト形式のマーク付け言
語で記載された文書データを符号化した符号データを送
信する。これに対し、クライアントが、受信した符号デ
ータを文書データに復号化し、その文書データをブラウ
ザに表示する。このとき、文書データを符号データで伝
送することにより、伝送データ量を削減することができ
る。[0003] Such a method is particularly effective for the Internet. For example, if the web server uses HTML (HyperText
It transmits coded data obtained by encoding document data described in a text markup language such as Markup Language. On the other hand, the client decodes the received encoded data into document data, and displays the document data on the browser. At this time, by transmitting the document data as coded data, the amount of transmitted data can be reduced.
【0004】インターネットにおいて、文書データを符
号化することは、セキュリティの観点からも有効であ
る。変換テーブルを有さないクライアントは、符号デー
タを復号することができないからである。[0004] Encoding document data on the Internet is also effective from the viewpoint of security. This is because a client having no conversion table cannot decode the code data.
【0005】図1は、従来の文書データの符号化及び復
号化方法である。図1によれば、HTML形式の文書データ
12は、変換テーブル11を用いて符号化10される。
一方、符号データは、変換テーブル21を用いて復号化
20される。これにより、HTML形式の文書データ22が
復元される。更に、文書データ22は、パーサ23によ
って要素の論理構造が解析され、ブラウザ24を用いて
表示される。図1によれば、符号化で用いられる変換テ
ーブル11と、復号化で用いられる変換テーブル21
は、同一テーブルである必要がある。FIG. 1 shows a conventional document data encoding and decoding method. According to FIG. 1, document data 12 in HTML format is encoded 10 using a conversion table 11.
On the other hand, the code data is decoded 20 using the conversion table 21. Thereby, the document data 22 in the HTML format is restored. Further, the document data 22 is analyzed by the parser 23 for the logical structure of the element, and is displayed using the browser 24. According to FIG. 1, a conversion table 11 used in encoding and a conversion table 21 used in decoding
Must be the same table.
【0006】[0006]
【発明が解決しようとする課題】しかしながら、近年で
は、Webサーバが送信する文書データは、HTMLのように
情報の表示を規定するだけでなく、情報の構造を規定す
ることもできる拡張可能なテキスト形式のマーク付け言
語が多くなってきた。この言語は、例えば、XML(eXtens
ible Markup Language)又はSGML(Standard Generalized
Markup Language)である。However, in recent years, document data transmitted by a Web server is extensible text that not only defines the display of information like HTML but also can define the structure of information. There are more formal marking languages. This language is, for example, XML (eXtens
ible Markup Language) or SGML (Standard Generalized)
Markup Language).
【0007】例えば、図1のような従来の符号化及び復
号化方法によれば、文書データが拡張されると、変換テ
ーブルも拡張しなければならない。For example, according to the conventional encoding and decoding method as shown in FIG. 1, when the document data is extended, the conversion table must be extended.
【0008】また、マーク付け言語は、要素の論理構造
を規定しているので、必ず、符号データを文書データに
復号し、その文書データの論理構造をパーサによって解
析し且つ処理する必要がある。Further, since the markup language defines the logical structure of elements, it is necessary to always decode code data into document data and analyze and process the logical structure of the document data with a parser.
【0009】そこで、本発明は、拡張可能なテキスト形
式の記述言語を符号化することができ、符号データを文
書データに復号することなく文書処理をすることができ
る文書データ符号処理方法及びシステムを提供すること
を目的とする。Therefore, the present invention provides a document data encoding method and system capable of encoding an extensible text description language and performing document processing without decoding encoded data into document data. The purpose is to provide.
【0010】[0010]
【課題を解決するための手段】本発明の符号処理方法に
よれば、拡張可能なテキスト形式の記述言語で記載され
た変換テーブルを用いて、拡張可能なテキスト形式の記
述言語で記載された文書データを符号データに符号化す
る符号化ステップと、変換テーブルを用いて、符号デー
タを文書データとして文書処理する文書処理ステップと
を有し、変換テーブルは、他の変換テーブルのリンク情
報を定義し、要素名と、該要素名の要素値と、該要素名
に指定可能な属性名と、該属性名の属性値との項目に割
り当てられた符号長及び符号と、第1の要素名に対する
第2の要素名が親子関係にある論理構造を示す符号長及
び符号とを定義するものである。According to the code processing method of the present invention, a document described in an extensible text format description language using a conversion table described in an extensible text format description language. An encoding step of encoding data into encoded data, and a document processing step of performing document processing of encoded data as document data using a conversion table, wherein the conversion table defines link information of another conversion table. , An element name, an element value of the element name, an attribute name that can be specified for the element name, a code length and a code assigned to the item of the attribute value of the attribute name, The element name 2 defines a code length and a code indicating a logical structure having a parent-child relationship.
【0011】これにより、変換テーブル自体が拡張可能
であるので、拡張可能な文書データに対応することがで
きる。また、変換テーブルによって論理構造を符号デー
タに含ませることができるので、文書データに復号し且
つパーシングすることなく、直接的に文書処理を行うこ
とができる。このような効果は、例えば携帯電話機のよ
うに、低い処理能力しか有さない受信装置にとって、処
理負荷が小さいという効果を奏する。[0011] Thus, since the conversion table itself can be expanded, it is possible to cope with expandable document data. Further, since the logical structure can be included in the code data by the conversion table, the document processing can be directly performed without decoding and parsing the document data. Such an effect has an effect that a processing load is small for a receiving device having only a low processing capability, such as a mobile phone.
【0012】本発明の符号処理方法の他の実施形態によ
れば、文書処理ステップで用いる変換テーブルに定義さ
れている項目は、符号化ステップで用いる変換テーブル
に定義されている項目の部分集合の関係にあってもよ
い。According to another embodiment of the encoding processing method of the present invention, the items defined in the conversion table used in the document processing step are the subsets of the items defined in the conversion table used in the encoding step. May be in a relationship.
【0013】例えば、一方の受信装置では、変換テーブ
ルのある部分のみが所持され、他方の受信装置では、変
換テーブルの他の部分のみが所持されているとする。そ
して、送信装置は、1つの文書データを符号化した符号
データを、複数の受信装置へ配信する。この結果、一方
の受信装置では、文書データのある部分のみが表示さ
れ、他方の受信装置では、文書データの他の部分のみを
表示されるようになる。配信する符号データは同じであ
っても、受信装置が所持する変換テーブルによって文書
処理された表示が異なることになる。このような機能
は、セキュリティの観点からも有効なものである。For example, it is assumed that one receiving device has only a certain portion of the conversion table, and the other receiving device has only another portion of the conversion table. Then, the transmitting device distributes encoded data obtained by encoding one document data to a plurality of receiving devices. As a result, only one portion of the document data is displayed on one receiving device, and only the other portion of the document data is displayed on the other receiving device. Even if the code data to be distributed is the same, the display processed by the document is different depending on the conversion table possessed by the receiving device. Such a function is effective also from the viewpoint of security.
【0014】本発明の符号処理方法の他の実施形態によ
れば、符号化ステップは、文書データに、変換テーブル
及び該変換テーブルにリンクされた他の変換テーブルに
存在しない要素名、要素値、属性名及び属性値がある場
合、該要素名、要素値、属性名及び属性値を符号化しな
いことも好ましい。According to another embodiment of the encoding method of the present invention, the encoding step includes adding, to the document data, an element name, an element value which does not exist in the conversion table and another conversion table linked to the conversion table, When there is an attribute name and an attribute value, it is preferable that the element name, the element value, the attribute name, and the attribute value are not encoded.
【0015】これにより、文書データの一部が符号化で
きないという理由で、文書データ全体が符号化できない
とすることを避けることができる。This makes it possible to avoid that the entire document data cannot be encoded because a part of the document data cannot be encoded.
【0016】本発明の符号処理方法の他の実施形態によ
れば、符号化ステップは、変換テーブルを用いて符号化
した部分の占有データ長を該変換テーブルを指示する符
号に付加し、要素名が占有する部分の占有データ長を該
要素名の符号に付加し、要素値が占有する部分の占有デ
ータ長を該要素値の符号に付加し、及び/又は属性名が
占有する占有データ長を該属性名の符号に付加し、文書
処理ステップは、変換テーブルに定義されていない符号
が、符号データに存在する場合、該符号を文書処理せず
に、占有データ長を飛ばした位置の符号データから文書
処理することも好ましい。According to another embodiment of the code processing method of the present invention, the encoding step adds an occupied data length of a portion encoded using the conversion table to a code designating the conversion table, and Add the occupied data length of the part occupied by the element name to the sign of the element name, add the occupied data length of the part occupied by the element value to the sign of the element value, and / or add the occupied data length occupied by the attribute name. In addition to the code of the attribute name, the document processing step includes, when a code not defined in the conversion table exists in the code data, the code data at a position where the occupied data length is skipped without performing the document processing on the code. It is also preferable to perform document processing from.
【0017】これにより、符号データにおける文書処理
をしない部分を読み飛ばすことができる。This makes it possible to skip portions of the code data that are not subjected to document processing.
【0018】本発明の符号処理システムによれば、拡張
可能なテキスト形式の記述言語で記載された文書データ
を送信するサーバと、受信した文書データを、変換テー
ブルを用いて符号データに符号化する符号化サーバと、
受信した符号データを、変換テーブルを用いて文書処理
する手段を有するクライアントとを有し、変換テーブル
は、拡張可能なテキスト形式の記述言語で記載されてお
り、他の変換テーブルのリンク情報を定義し、要素名
と、該要素名の要素値と、該要素名に指定可能な属性名
と、該属性名の属性値とに割り当てられた符号長及び符
号と、第1の要素名に対する第2の要素名が親子関係に
ある論理構造を示す符号長及び符号とを定義するもので
ある。According to the code processing system of the present invention, a server that transmits document data described in an extensible text format description language, and encodes the received document data into code data using a conversion table. An encoding server;
A client having means for processing the received coded data by using the conversion table, and the conversion table is described in an extensible text format description language, and defines link information of other conversion tables. And an element name, an element value of the element name, an attribute name that can be specified for the element name, a code length and a code assigned to the attribute value of the attribute name, and a second element for the first element name. Defines a code length and a code indicating a logical structure having a parent-child relationship.
【0019】これにより、既存のサーバをそのまま利用
することができる。Thus, the existing server can be used as it is.
【0020】本発明の符号処理システムにおける他の実
施形態によれば、符号化サーバで用いる変換テーブルに
定義されている項目は、クライアントで用いる変換テー
ブルに定義されている項目の部分集合の関係にあること
も好ましい。According to another embodiment of the code processing system of the present invention, the items defined in the conversion table used in the encoding server are related to a subset of the items defined in the conversion table used in the client. It is also preferred.
【0021】本発明の符号処理システムにおける他の実
施形態によれば、符号化サーバは、文書データに、変換
テーブルに定義されていない他の変換テーブル、要素
名、要素値、属性名及び属性値が存在する場合、該要素
名、要素値、属性名及び属性値を符号化しないことも好
ましい。According to another embodiment of the code processing system of the present invention, the encoding server stores, in the document data, another conversion table not defined in the conversion table, an element name, an element value, an attribute name, and an attribute value. It is also preferable that the element name, the element value, the attribute name and the attribute value are not coded when.
【0022】本発明の符号処理システムにおける他の実
施形態によれば、符号化サーバは、変換テーブルを用い
て符号化した部分の占有データ長を該変換テーブルを指
示する符号に付加し、項目それぞれが占有する部分の占
有データ長をそれぞれの項目の符号に付加し、クライア
ントは、変換テーブルに定義されていない符号が、符号
データに存在する場合、該符号を文書処理せずに、占有
データ長を飛ばした位置の符号データから文書処理する
ことも好ましい。According to another embodiment of the code processing system of the present invention, the coding server adds an occupied data length of a portion coded using the conversion table to a code indicating the conversion table, and Adds the occupied data length of the portion occupied by to the code of each item, and if a code not defined in the conversion table is present in the code data, the client does not process the code and performs a document processing on the occupied data length. It is also preferable to perform the document processing from the code data at the position where is skipped.
【0023】[0023]
【発明の実施の形態】以下では、図面を用いて、本発明
の実施形態を詳細に説明する。Embodiments of the present invention will be described below in detail with reference to the drawings.
【0024】図2は、本発明による文書データの符号処
理方法である。図2によれば、文書データ12は、複数
の文書データ120及び121によって拡張されてい
る。一方、変換テーブル11も、拡張された文書データ
に対応して、複数の変換テーブル110及び111のリ
ンク情報を定義している。これにより、XML形式の文書
データ12は、変換テーブル11を用いて符号化10さ
れる。FIG. 2 shows a document data encoding method according to the present invention. According to FIG. 2, the document data 12 is extended by a plurality of document data 120 and 121. On the other hand, the conversion table 11 also defines link information of a plurality of conversion tables 110 and 111 corresponding to the extended document data. Thus, the document data 12 in the XML format is encoded 10 using the conversion table 11.
【0025】また、図2によれば、符号データは、変換
テーブル21を用いて、直接的に文書処理30され、ブ
ラウザ24に表示される。本発明によれば、符号データ
には、要素の論理構造も含まれる。従って、文書データ
に復号する必要もなく、更にパーサ23によって論理構
造を解析する必要もない。According to FIG. 2, the code data is directly subjected to document processing 30 using the conversion table 21 and displayed on the browser 24. According to the present invention, the code data also includes the logical structure of the element. Therefore, there is no need to decode the document data, and there is no need to analyze the logical structure by the parser 23.
【0026】図3は、文書データのサンプルである。図
4は、図3の文書データを符号化した符号データであ
る。図5a〜dは、図3の文書データの変換テーブルで
ある。以下では、図3及び図4を参照しつつ、図5a〜
dの変換テーブルを説明する。FIG. 3 shows a sample of document data. FIG. 4 shows encoded data obtained by encoding the document data shown in FIG. 5A to 5D are conversion tables of the document data in FIG. In the following, referring to FIGS. 3 and 4, FIGS.
The conversion table of d will be described.
【0027】変換テーブルは、XMLで記載されており、
図5aのヘッダ部分<head>(1)と、図5b〜cのボディ
部分<body>(8)とに分けられる。ヘッダ部分には、接頭
辞について記述する。ボディ部分には、文書の論理構造
と変換符号とを記述をする。The conversion table is described in XML,
It is divided into a header part <head> (1) in FIG. 5A and a body part <body> (8) in FIGS. 5B to 5C. The header part describes the prefix. In the body part, the logical structure of the document and the conversion code are described.
【0028】図5aによれば、ヘッダ部分には、接頭辞
の符号長(2)として2bitが割り当てられる。接頭辞とし
て、要素名及び属性名には符号"00"(3)が割り当てられ
る。また、要素値及び属性値の内容が、数値であれば符
号"01"(4)が、文字列であれば符号"10"(5)が割り当てら
れる。According to FIG. 5A, 2 bits are assigned to the header portion as the code length (2) of the prefix. As a prefix, a code “00” (3) is assigned to the element name and the attribute name. If the contents of the element value and the attribute value are numerical values, the code “01” (4) is assigned, and if the content is a character string, the code “10” (5) is assigned.
【0029】更に、図3には、要素名SVGが定義されて
いるので、図5aによれば、要素名"SVG"の開始に3bit"0
00"(6)が割り当てられ、その終了に3bit"011"(7)が割り
当てられる。Further, since the element name SVG is defined in FIG. 3, according to FIG. 5A, 3 bit “0” is added to the start of the element name “SVG”.
00 "(6) is assigned, and 3 bits" 011 "(7) are assigned at the end.
【0030】図5bによれば、最初に要素名SVGを以下
で定義する(9)ことを表している。また、この要素名SVG
に付随する属性名に、2bitの符号長を割り当てる(10)こ
とを定義する。そして、属性名widthに符号"10"を割り
当て(11)、属性名heightに符号"11"を割り当てる(13)。
また、属性名widthの属性値は、符号無し整数10bitで表
され(12)、属性名heightの属性値も、符号無し整数10bi
tで表される(14)。FIG. 5B shows that the element name SVG is first defined below (9). Also, this element name SVG
It is defined that a 2-bit code length is assigned to the attribute name attached to (10). The code "10" is assigned to the attribute name width (11), and the code "11" is assigned to the attribute name height (13).
The attribute value of the attribute name width is represented by an unsigned integer 10 bits (12), and the attribute value of the attribute name height is also an unsigned integer 10 bi.
It is represented by t (14).
【0031】次に、要素名SVGの子関係にある要素を符
号長3bitで表す(15)ことを定義する。そして、要素名SV
Gの子要素として要素名rectを定義する(16)。要素名rec
tの開始に符号"001"が割り当てられ、その終了に符号"0
11"が割り当られる(17)。また、要素名SVGの子要素とし
て要素名textを定義する(18)。要素名textの開始に符
号"010"が割り当てられ、その終了に符号"011"が割り当
てられる(19)。Next, it is defined that elements having a child relationship of the element name SVG are represented by a code length of 3 bits (15). And the element name SV
Define element name rect as a child element of G (16). Element name rec
The sign "001" is assigned to the start of t and the sign "0" is assigned to the end.
11 "is assigned (17). Also, an element name text is defined as a child element of the element name SVG (18). The code" 010 "is assigned to the start of the element name text and the code" 011 "is added to the end. Is assigned (19).
【0032】図5cによれば、次に、要素名rectを以下
で定義する(20)ことを表している。また、この要素名re
ctに付随する属性名に、3bitの符号長を割り当てる(21)
ことを定義する。属性名xには符号"100"を割り当て(2
2)、属性名xの属性値は符号付き整数10bitで表される(2
3)。また、属性名yには符号"101"を割り当て(24)、属性
名yの属性値は符号付き整数10bitで表される(25)。ま
た、属性名widthは符号"110"を割り当て(26)、属性名wi
dthの属性値は符号無し整数10bitで表される(27)。最後
に、属性名heightには符号"111"を割り当て(28)、属性
名widthの属性値は符号無し整数10bitで表される(29)。FIG. 5C shows that the element name rect is defined below (20). Also, this element name re
Assign a code length of 3 bits to the attribute name attached to ct (21)
Define that. Assign a code "100" to the attribute name x (2
2), the attribute value of attribute name x is represented by a signed integer 10 bits (2
3). Also, a code "101" is assigned to the attribute name y (24), and the attribute value of the attribute name y is represented by a signed integer 10 bits (25). The attribute name width is assigned a code "110" (26), and the attribute name wi is assigned.
The attribute value of dth is represented by an unsigned integer 10 bits (27). Finally, a code "111" is assigned to the attribute name height (28), and the attribute value of the attribute name width is represented by an unsigned integer 10 bits (29).
【0033】図5dによれば、次に、要素名textを以下
で定義する(30)ことを表している。また、この要素名te
xtに付随する属性名に、2bitの符号長を割り当てる(31)
ことを定義する。属性名xには符号"10"を割り当て(3
2)、属性名xの属性値は符号付き整数10bitで表される(3
3)。また、属性名yには符号"11"を割り当て(34)、属性
名yの属性値は符号付き整数10bitで表される(35)。FIG. 5D shows that the element name text is defined as follows (30). Also, this element name te
Assign 2 bit code length to attribute name attached to xt (31)
Define that. Assign a code "10" to the attribute name x (3
2), the attribute value of attribute name x is represented by a signed integer 10 bits (3
3). Further, a code "11" is assigned to the attribute name y (34), and the attribute value of the attribute name y is represented by a signed integer 10 bits (35).
【0034】次に、要素textの要素値を以下で定義する
(36)を表している。ここでは、要素値がShift-JIS形式
であることを表している(37)。Next, the element value of the element text is defined below.
(36) is shown. Here, it indicates that the element value is in the Shift-JIS format (37).
【0035】図6は、複数の変換テーブルのリンク情報
を定義した変換テーブルの一例である。本発明が対象と
している記述言語は、拡張可能なテキスト形式の記述言
語である。従って、文書データが拡張されると同様に、
変換テーブルも拡張する必要がある。図6によれば、ヘ
ッダ部分に複数の変換テーブルのリンク情報を定義する
だけで、変換テーブルを作成し直す必要がない。ヘッダ
部分には、複数の変換テーブルを拡張するためのメタ情
報を定義する。メタ情報とは、接頭辞符号の符号・符号
長、要素の指定、名前空間の指定、変換テーブルへのリ
ンク情報である。FIG. 6 is an example of a conversion table defining link information of a plurality of conversion tables. The description language targeted by the present invention is an extensible text format description language. Therefore, just as the document data is extended,
The translation table also needs to be extended. According to FIG. 6, it is only necessary to define link information of a plurality of conversion tables in the header part, and there is no need to recreate the conversion tables. In the header part, meta information for extending a plurality of conversion tables is defined. The meta information is the code / code length of the prefix code, the designation of the element, the designation of the namespace, and the link information to the conversion table.
【0036】図7は、要素が占有する占有データ長を、
図4の符号データに埋め込んだものである。これによ
り、文書処理を行うクライアントは、所持する変換テー
ブルに定義されていない符号が符号データに存在する場
合、該符号を文書処理せずに、占有データ長を飛ばした
位置の符号データから文書処理することができる。FIG. 7 shows the occupied data length occupied by the element.
This is embedded in the code data of FIG. Thus, when a code that is not defined in the conversion table owned by the code data exists in the code data, the client that performs the document processing does not perform the document processing on the code, and performs the document processing from the code data at the position where the occupied data length is skipped. can do.
【0037】図8は、本発明の第1の実施形態のシステ
ム構成図である。図8によれば、サーバ4は、予めクラ
イアントA及びBへ、変換テーブルを送信する。この場
合、サーバ4の所持する変換テーブルの項目の部分集合
となる変換テーブルa及びbをそれぞれ送信する。その
後、サーバ4は、クライアントA及びBへ、文書データ
を符号化した符号データを送信する。この符号データを
受信したクライアントA及びBはそれぞれ、文書処理を
行うが、実際にブラウザに表示される情報は、異なるも
のとすることができる。FIG. 8 is a system configuration diagram of the first embodiment of the present invention. According to FIG. 8, the server 4 transmits the conversion table to the clients A and B in advance. In this case, the conversion tables a and b which are a subset of the items of the conversion table possessed by the server 4 are transmitted. After that, the server 4 transmits the encoded data obtained by encoding the document data to the clients A and B. Each of the clients A and B receiving the code data performs document processing, but the information actually displayed on the browser can be different.
【0038】図9は、符号化サーバ6を含むシステム構
成図である。サーバ4は、XML形式の文書データを符
号化サーバ6へ送信する。符号化サーバ6は、変換テー
ブルサーバ7から受信した変換テーブルを用いて、文書
データを符号化する。その符号データは、クライアント
5へ送信される。クライアント5は、変換テーブルサー
バ7から受信した変換テーブルを用いて、文書処理を行
う。図9によれば、XML形式の文書データを送信する
既存のサーバに変更を加えることなく、符号化サーバを
プロキシサーバとして利用することができる。FIG. 9 is a system configuration diagram including the encoding server 6. The server 4 transmits the XML document data to the encoding server 6. The encoding server 6 encodes the document data using the conversion table received from the conversion table server 7. The code data is transmitted to the client 5. The client 5 performs document processing using the conversion table received from the conversion table server 7. According to FIG. 9, the encoding server can be used as a proxy server without changing an existing server that transmits XML-format document data.
【0039】図10は、文書処理のフローチャートであ
る。例えば、図4の符号データを、図5の変換テーブル
に基づいて行う文書処理を説明する。FIG. 10 is a flowchart of the document processing. For example, a description will be given of a document process in which the code data of FIG. 4 is performed based on the conversion table of FIG.
【0040】(S1)変換テーブル<head><prefix bit
="2">によればヘッダ符号長2bitであるので、符号デー
タから2bitを読み込む。図4によれば"00"であるの
で、"名"を示す符号であると判断する。 (S2)次に、変換テーブル<head><root name="svg" b
it="3" code="000" />によればルート要素"svg"であ
り、次の3bitを読み込む。符号は"000"であるので、要
素svgの開始であると解釈する。 (S3)符号データからヘッダ符号長2bitを読み込む。 (S4)図4によれば"00"であり、変換テーブルの<hea
d>から"00"は"名"を示す符号であると判断する。 (S5)属性名の符号長<attlist bit=2>、子要素名の
符号長<children bit=3>、終了タグ<end name="/svg" b
it=3 code="011"/>の中で、最も短い符号長分2bitだけ
読み込む。 (S6)図4によれば"10"であるので、属性名widthと
一致することを確認する。 (S7)もし、一致しなかった場合、次に短い符号長分
3bitを読み込み、再びS6へ戻る。 (S8)"10"と一致しているので、属性名widthと解釈
する。 (S9)次の3bitが、終了タグ<end name="/svg" bit=3
code="011"/>でないことを確認する。終了タグであれ
ば、終了する。終了タグでなければ、再びS3へ戻る。(S1) Conversion table <head><prefix bit
According to = "2">, since the header code length is 2 bits, 2 bits are read from the code data. Since it is "00" according to FIG. 4, it is determined that it is a code indicating "name". (S2) Next, the conversion table <head><root name = "svg" b
According to it = "3" code = "000"/>, it is the root element "svg" and reads the next 3 bits. Since the sign is "000", it is interpreted as the start of the element svg. (S3) A header code length of 2 bits is read from the code data. (S4) According to FIG. 4, it is "00", and <hea
It is determined that “00” is a code indicating “name” from d>. (S5) Code length of attribute name <attlist bit = 2>, code length of child element name <children bit = 3>, end tag <end name = "/ svg" b
It reads only 2 bits for the shortest code length in it = 3 code = "011"/>. (S6) According to FIG. 4, since it is "10", it is confirmed that it matches the attribute name width. (S7) If they do not match, the next shorter code length
Read 3 bits and return to S6 again. (S8) Since it matches "10", it is interpreted as the attribute name width. (S9) The next 3 bits are the end tag <end name = "/ svg" bit = 3
Check that code = "011"/> is not set. If it is an end tag, the process ends. If it is not an end tag, the process returns to S3.
【0041】(S3)符号データからヘッダの符号長"
2"bitを読み込む。 (S4)図4によれば"01"であり、変換テーブル<head>
<number_prefix code="01" />によれば"01"は"数値"を
示す符号であると判断する。 (S10)変換テーブル<number bit="10" data="UI" q
t="1" />によれば、属性名widthの属性値は符号無し整
数10bitであるので、10bitを読み込む。 (S11)"0111110100"であるので、属性値"500"と解
釈する。そして、再びS3へ戻る。(S3) Code length of header from code data "
2 "bits are read. (S4) According to FIG. 4, it is" 01 ", and the conversion table <head>
According to <number_prefix code = "01"/>, it is determined that "01" is a code indicating "numerical value". (S10) Conversion table <number bit = "10" data = "UI" q
According to t = "1"/>, since the attribute value of the attribute name width is an unsigned integer of 10 bits, 10 bits are read. (S11) Since it is "0111110100", it is interpreted as the attribute value "500". Then, the process returns to S3 again.
【0042】前述したように図10のフローチャートを
繰り返すことによって、符号データを復号することなく
直接的に文書処理をすることが可能となる。As described above, by repeating the flowchart of FIG. 10, it becomes possible to directly perform document processing without decoding the code data.
【0043】前述した本発明の文書データの符号処理方
法及びシステムの種々の実施形態によれば、本発明の技
術思想及び見地の範囲の種々の変更、修正及び省略を、
当業者は容易に行うことができる。前述の説明はあくま
で例であって、何ら制約しようとするものではない。本
発明は、特許請求の範囲及びその均等物として限定する
ものにのみ制約される。According to the above-described various embodiments of the document data encoding method and system of the present invention, various changes, corrections, and omissions in the technical idea and scope of the present invention can be made.
Those skilled in the art can easily carry out the above. The foregoing description is merely an example, and is not intended to be limiting. The invention is limited only as defined by the following claims and equivalents thereof.
【0044】[0044]
【発明の効果】以上、詳細に説明したように、本発明に
よれば、拡張可能なテキスト形式の記述言語によって記
載された文書データの符号化を可能とする。このような
符号化は、データ伝送量を削減することができるので、
無線のような伝送速度が遅い通信システムに効果があ
る。As described in detail above, according to the present invention, it is possible to encode document data described in an extensible text format description language. Since such encoding can reduce the amount of data transmission,
This is effective for a communication system with a low transmission speed such as wireless.
【0045】また、本発明によれば、拡張可能なテキス
ト形式で記述された文書データに対して、符号化装置を
変更することなく、変換テーブルを置き換えるだけで、
それぞれの文書データに適した符号化を行うことが可能
となる。更に、文書データが拡張された場合でも、元の
文書データ用の符号化テーブルは変更せず、拡張部分の
みの符号化テーブルを用意するだけで、拡張された文書
データに適した符号化を行うことができる。Further, according to the present invention, the document data described in the extensible text format can be simply replaced with the conversion table without changing the encoding device.
Encoding suitable for each document data can be performed. Further, even when the document data is extended, the encoding table for the original document data is not changed, and encoding suitable for the extended document data is performed only by preparing an encoding table for only the extended portion. be able to.
【0046】また、本発明によれば、復号側装置に文書
専用処理エンジンを搭載することにより、受信した符号
データから元の文書データを復元させる必要がなく、復
号側装置にとって処理負荷が小さいという効果がある。Further, according to the present invention, by mounting the document-specific processing engine on the decoding-side device, it is not necessary to restore the original document data from the received encoded data, and the processing load on the decoding-side device is small. effective.
【図面の簡単な説明】[Brief description of the drawings]
【図1】従来の基本的な符号化及び復号化方法の説明図
である。FIG. 1 is an explanatory diagram of a conventional basic encoding and decoding method.
【図2】本発明による符号文書処理方法の説明図であ
る。FIG. 2 is an explanatory diagram of a code document processing method according to the present invention.
【図3】XML形式の文書データのサンプルである。FIG. 3 is a sample of XML format document data.
【図4】図3の文書データの符号データの一例である。FIG. 4 is an example of code data of the document data of FIG. 3;
【図5a】図3の文書データを、図4の符号データに変
換するための変換テーブルである。特にヘッダ部分のテ
ーブルである。FIG. 5A is a conversion table for converting the document data of FIG. 3 into the code data of FIG. 4; Particularly, it is a table of a header portion.
【図5b】図3の文書データを、図4の符号データに変
換するための変換テーブルである。特にルート要素のテ
ーブルである。FIG. 5B is a conversion table for converting the document data of FIG. 3 into the code data of FIG. 4; Especially the table of the root element.
【図5c】図3の文書データを、図4の符号データに変
換するための変換テーブルである。特に第1の子要素の
テーブルである。5C is a conversion table for converting the document data of FIG. 3 into the code data of FIG. Particularly, it is a table of the first child element.
【図5d】図3の文書データを、図4の符号データに変
換するための変換テーブルである。特に第2の子要素の
テーブルである。FIG. 5D is a conversion table for converting the document data of FIG. 3 into the code data of FIG. 4; Particularly, it is a table of the second child element.
【図6】他の変換テーブルのリンク情報を含む変換テー
ブルである。FIG. 6 is a conversion table including link information of another conversion table.
【図7】要素毎に該要素の占有する占有データ長を付加
した符号データである。FIG. 7 shows code data to which an occupation data length occupied by each element is added for each element.
【図8】本発明の第1の実施形態のシステム構成図であ
る。FIG. 8 is a system configuration diagram of the first embodiment of the present invention.
【図9】本発明の第2の実施形態のシステム構成図であ
る。FIG. 9 is a system configuration diagram of a second embodiment of the present invention.
【図10】本発明の文書処理のフローチャートである。FIG. 10 is a flowchart of document processing according to the present invention.
10 符号化 11、21、110、111、210、211 変換テ
ーブル 12、22、120、121 テキスト形式の文書デー
タ 23 パーサ 24 ブラウザの表示画面 30 文書処理 4 既存のサーバ 5 クライアント 6 符号データ 7 変換テーブルサーバ 8 インターネットDESCRIPTION OF SYMBOLS 10 Encoding 11, 21, 110, 111, 210, 211 Conversion table 12, 22, 120, 121 Text format document data 23 Parser 24 Browser display screen 30 Document processing 4 Existing server 5 Client 6 Code data 7 Conversion table Server 8 Internet
Claims (8)
載された変換テーブルを用いて、拡張可能なテキスト形
式の記述言語で記載された文書データを符号データに符
号化する符号化ステップと、 前記変換テーブルを用いて、前記符号データを前記文書
データとして文書処理する文書処理ステップとを有し、 前記変換テーブルは、他の変換テーブルのリンク情報を
定義し、要素名と、該要素名の要素値と、該要素名に指
定可能な属性名と、該属性名の属性値との項目に割り当
てられた符号長及び符号と、第1の要素名に対する第2
の要素名が親子関係にある論理構造を示す符号長及び符
号とを定義することを特徴とする文書データの符号処理
方法。An encoding step of encoding document data described in an extensible text format description language into code data using a conversion table described in an extensible text format description language; A document processing step of performing document processing on the code data as the document data using a conversion table, wherein the conversion table defines link information of another conversion table, and includes an element name and an element of the element name. A value, an attribute name that can be specified for the element name, a code length and a code assigned to the item of the attribute value of the attribute name, and a second element name for the first element name.
A code length and a code indicating a logical structure having a parent-child relationship with the element name of the document data.
ブルに定義されている項目は、前記符号化ステップで用
いる変換テーブルに定義されている項目の部分集合の関
係にあることを特徴とする請求項1に記載の文書データ
の符号処理方法。2. The method according to claim 1, wherein the items defined in the conversion table used in the document processing step are in a relationship of a subset of the items defined in the conversion table used in the encoding step. Code processing method for document data described in 1.
に、前記変換テーブル及び該変換テーブルにリンクされ
た他の変換テーブルに存在しない要素名、要素値、属性
名及び属性値がある場合、該要素名、要素値、属性名及
び属性値を符号化しないことを特徴とする請求項1又は
2に記載の文書データの符号処理方法。3. The encoding step, when the document data includes an element name, an element value, an attribute name, and an attribute value that do not exist in the conversion table and another conversion table linked to the conversion table. 3. The method according to claim 1, wherein the element name, the element value, the attribute name, and the attribute value are not encoded.
ルを用いて符号化した部分の占有データ長を該変換テー
ブルを指示する符号に付加し、前記項目それぞれが占有
する部分の占有データ長をそれぞれの項目の符号に付加
し、 前記文書処理ステップは、前記変換テーブルに定義され
ていない符号が、前記符号データに存在する場合、該符
号を文書処理せずに、前記占有データ長を飛ばした位置
の符号データから文書処理することを特徴とする請求項
1から3のいずれか1項に記載の文書データの符号処理
方法。4. The encoding step adds an occupied data length of a portion encoded using the conversion table to a code indicating the conversion table, and adds an occupied data length of a portion occupied by each of the items. In the document processing step, when a code not defined in the conversion table exists in the code data, the position where the occupied data length is skipped without document processing the code. 4. The document data encoding method according to claim 1, wherein the document processing is performed from the encoded data.
載された文書データを送信するサーバと、 受信した前記文書データを、変換テーブルを用いて符号
データに符号化する符号化サーバと、 受信した前記符号データを、変換テーブルを用いて文書
処理する手段を有するクライアントとを有し、 前記変換テーブルは、拡張可能なテキスト形式の記述言
語で記載されており、他の変換テーブルのリンク情報を
定義し、要素名と、該要素名の要素値と、該要素名に指
定可能な属性名と、該属性名の属性値とに割り当てられ
た符号長及び符号と、第1の要素名に対する第2の要素
名が親子関係にある論理構造を示す符号長及び符号とを
定義することを特徴とする文書データの符号処理システ
ム。5. A server for transmitting document data described in an extensible text format description language; an encoding server for encoding the received document data into encoded data using a conversion table; A client having means for processing the code data by using a conversion table, wherein the conversion table is described in an extensible text format description language and defines link information of another conversion table. And an element name, an element value of the element name, an attribute name that can be specified for the element name, a code length and a code assigned to the attribute value of the attribute name, and a second element for the first element name. Wherein the element name defines a code length and a code indicating a logical structure having a parent-child relationship.
に定義されている項目は、前記クライアントで用いる変
換テーブルに定義されている項目の部分集合の関係にあ
ることを特徴とする請求項5に記載の文書データの符号
処理システム。6. The method according to claim 5, wherein the items defined in the conversion table used by the encoding server are in a relation of a subset of the items defined in the conversion table used by the client. Document data encoding system.
に、前記変換テーブルに定義されていない他の変換テー
ブル、要素名、要素値、属性名及び属性値が存在する場
合、該要素名、要素値、属性名及び属性値を符号化しな
いことを特徴とする請求項5又は6に記載の文書データ
の符号処理システム。7. The encoding server according to claim 1, wherein the document data includes another conversion table, an element name, an element value, an attribute name, and an attribute value that are not defined in the conversion table. 7. The document data encoding system according to claim 5, wherein values, attribute names, and attribute values are not encoded.
を用いて符号化した部分の占有データ長を該変換テーブ
ルを指示する符号に付加し、前記項目それぞれが占有す
る部分の占有データ長をそれぞれの項目の符号に付加
し、前記クライアントは、前記変換テーブルに定義され
ていない符号が、前記符号データに存在する場合、該符
号を文書処理せずに、前記占有データ長を飛ばした位置
の符号データから文書処理することを特徴とする請求項
5から7のいずれか1項に記載の文書データの符号処理
システム。8. The encoding server adds an occupied data length of a portion encoded using the conversion table to a code indicating the conversion table, and adds an occupied data length of a portion occupied by each of the items. In the case where a code that is not defined in the conversion table exists in the code data, the client does not perform a document process on the code and skips the occupied data length. 8. The document data encoding system according to claim 5, wherein document processing is performed from the data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001357830A JP4122759B2 (en) | 2000-12-27 | 2001-11-22 | Document data code processing method and system |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000397002 | 2000-12-27 | ||
JP2000-397002 | 2000-12-27 | ||
JP2001357830A JP4122759B2 (en) | 2000-12-27 | 2001-11-22 | Document data code processing method and system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002259194A true JP2002259194A (en) | 2002-09-13 |
JP4122759B2 JP4122759B2 (en) | 2008-07-23 |
Family
ID=26606789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001357830A Expired - Lifetime JP4122759B2 (en) | 2000-12-27 | 2001-11-22 | Document data code processing method and system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4122759B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004227579A (en) * | 2003-01-17 | 2004-08-12 | Microsoft Corp | Method and system for converting xml code into binary code |
JPWO2005101210A1 (en) * | 2004-04-09 | 2008-03-06 | シャープ株式会社 | Data analysis apparatus and data analysis program |
JP2008287412A (en) * | 2007-05-16 | 2008-11-27 | Kddi Corp | Document data encoding method, encoding system and program thereof |
-
2001
- 2001-11-22 JP JP2001357830A patent/JP4122759B2/en not_active Expired - Lifetime
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004227579A (en) * | 2003-01-17 | 2004-08-12 | Microsoft Corp | Method and system for converting xml code into binary code |
JPWO2005101210A1 (en) * | 2004-04-09 | 2008-03-06 | シャープ株式会社 | Data analysis apparatus and data analysis program |
JP2008287412A (en) * | 2007-05-16 | 2008-11-27 | Kddi Corp | Document data encoding method, encoding system and program thereof |
Also Published As
Publication number | Publication date |
---|---|
JP4122759B2 (en) | 2008-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7043686B1 (en) | Data compression apparatus, database system, data communication system, data compression method, storage medium and program transmission apparatus | |
US7013425B2 (en) | Data processing method, and encoder, decoder and XML parser for encoding and decoding an XML document | |
US7669120B2 (en) | Method and system for encoding a mark-up language document | |
US6883137B1 (en) | System and method for schema-driven compression of extensible mark-up language (XML) documents | |
Girardot et al. | Millau: an encoding format for efficient representation and exchange of XML over the Web | |
US7155672B1 (en) | Method and system for dynamic font subsetting | |
KR101011663B1 (en) | Method and apparatus for structured streaming of WML documents | |
US7143397B2 (en) | XML data encoding and decoding | |
US8060652B2 (en) | Extensible binary mark-up language for efficient XML-based data communications and related systems and methods | |
EP1969457A2 (en) | A compressed schema representation object and method for metadata processing | |
JP2006209745A (en) | Method and system for binary serialization of document | |
US20070112810A1 (en) | Method for compressing markup languages files, by replacing a long word with a shorter word | |
CA2426496A1 (en) | Processing fixed-format data in a unicode environment | |
JP4168946B2 (en) | Document data encoding or decoding method and program thereof | |
US8819287B2 (en) | System and method for compressing URL request parameters | |
KR20020087482A (en) | Object transfer method with format adaptation | |
US20020138518A1 (en) | Method and system for code processing of document data | |
US20030182128A1 (en) | Method of encoding and decoding for multi-language applications | |
US7814408B1 (en) | Pre-computing and encoding techniques for an electronic document to improve run-time processing | |
JP2002259194A (en) | Document data encoding method and system | |
RU2294012C2 (en) | Data structure and methods for transforming stream of bits to electronic document and generation of bit stream from electronic document based on said data structure | |
JP4821287B2 (en) | Structured document encoding method, encoding apparatus, encoding program, decoding apparatus, and encoded structured document data structure | |
KR101009134B1 (en) | Mobile web service system and method | |
JP2005215950A (en) | Encoded document data search method and program thereof | |
Ferilli | Digital Formats |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040915 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080115 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080408 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080421 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4122759 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110516 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120516 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140516 Year of fee payment: 6 |
|
EXPY | Cancellation because of completion of term |