JPH06103127A - Device for managing hash file data and method thereof - Google Patents
Device for managing hash file data and method thereofInfo
- Publication number
- JPH06103127A JPH06103127A JP4252384A JP25238492A JPH06103127A JP H06103127 A JPH06103127 A JP H06103127A JP 4252384 A JP4252384 A JP 4252384A JP 25238492 A JP25238492 A JP 25238492A JP H06103127 A JPH06103127 A JP H06103127A
- Authority
- JP
- Japan
- Prior art keywords
- data
- hash
- file
- input
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims description 21
- 238000013523 data management Methods 0.000 claims description 25
- 238000007726 management method Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 10
- 238000013500 data storage Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】この発明は、ハッシング法により
データを管理するハッシュファイルデータ管理装置およ
びハッシュファイルデータ管理方法に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a hash file data management device and a hash file data management method for managing data by a hashing method.
【0002】[0002]
【従来の技術】データベースに格納される複数のレコー
ドから任意のレコードを迅速に検索する方法としてハッ
シング法(ランダマイズ法)がある。ハッシング法で
は、レコードを識別するためのキー(レコードキー)が
ある一定の関数によって別の数値に変換され、その数値
が記憶媒体上の格納番地とされる。この関数をハッシュ
関数と呼び、その関数値をハッシュ値と呼ぶ。2. Description of the Related Art There is a hashing method (randomization method) as a method for quickly searching for an arbitrary record from a plurality of records stored in a database. In the hashing method, a key for identifying a record (record key) is converted into another numerical value by a certain function, and the numerical value is used as a storage address on a storage medium. This function is called a hash function, and the function value is called a hash value.
【0003】キーをkとし、ハッシュ関数をfとすれ
ば、ハッシュ値pは次式により求められる。If the key is k and the hash function is f, the hash value p can be calculated by the following equation.
【0004】p=f(k) このようにハッシュ関数fによりキーkからハッシュ値
pを求めることをハッシング(ランダマイズ化)と呼
ぶ。各レコードはハッシュ関数により求められた格納番
地に格納され、アクセス時には同じハッシュ関数を用い
て各レコードの格納番地が決定される。したがって、ハ
ッシング法によると、レコードの迅速な検索が可能とな
る。P = f (k) Obtaining the hash value p from the key k by the hash function f in this way is called hashing (randomization). Each record is stored in the storage address obtained by the hash function, and the storage address of each record is determined using the same hash function at the time of access. Therefore, according to the hashing method, it is possible to quickly search for a record.
【0005】上式によりハッシュ値を求めると、複数の
キーについてハッシュ値が同一になる場合がある。これ
を衝突と呼び、同一のハッシュ値を有するキーをシノニ
ム(同義語)と呼ぶ。このような衝突が少なくなるよう
に、最適なハッシュ関数が選択される。When the hash value is obtained by the above equation, the hash value may be the same for a plurality of keys. This is called a collision, and keys having the same hash value are called synonyms. The optimal hash function is selected so as to reduce such collisions.
【0006】図8は、従来のハッシュファイルデータ管
理装置を示すブロック図である。入力ファイルIFには
複数のレコードが格納される。データ入力装置11は、
入力ファイルIFに格納されるレコードを1つずつ読込
む。データベース管理装置12は、データ入力装置11
から与えられるレコードのキーをハッシュ値に変換し、
そのレコードおよびハッシュ値をディスクコントローラ
13に与える。また、データベース管理装置12は、デ
ィスクコントローラ13に処理の種類を指示する。ディ
スクコントローラ13は、ハッシュ値に基づいてハッシ
ュファイル14にアクセスし、ハッシュファイル14に
対して指示された処理を実行する。FIG. 8 is a block diagram showing a conventional hash file data management device. A plurality of records are stored in the input file IF. The data input device 11 is
The records stored in the input file IF are read one by one. The database management device 12 is a data input device 11
Convert the key of the record given by
The record and hash value are given to the disk controller 13. The database management device 12 also instructs the disk controller 13 on the type of processing. The disk controller 13 accesses the hash file 14 based on the hash value, and executes the processing instructed to the hash file 14.
【0007】[0007]
【発明が解決しようとする課題】従来、ハッシュファイ
ルの設計では、論理的な構成に主眼が置かれ、あるハッ
シュ値を有するデータをどのデータ格納エリアに格納す
るかは特に意識されていない。そのため、1つのハッシ
ュファイルを複数のサブファイルに物理的に分割し、複
数のディスクコントローラを用いて多重アクセスできる
場合でも、データベース管理装置はディスクコントロー
ラに、複数のディスクコントローラを有効に活用できる
適切な順序でアクセスを指示することができず、たとえ
ばデータのキーのハッシュ値順に1件ずつアクセスを指
示していた。Conventionally, in the design of hash files, the logical structure has been the main focus, and no particular consideration has been given to which data storage area to store data having a certain hash value. Therefore, even if one hash file is physically divided into a plurality of sub-files and multiple access is possible by using a plurality of disk controllers, the database management device can appropriately use the plurality of disk controllers for the disk controller. The access cannot be instructed in order, and for example, access is instructed one by one in the order of the hash value of the data key.
【0008】そのため、特定のディスクコントローラに
集中的にアクセスが指示され、他のディスクコントロー
ラはアクセス待ちの状態となる。Therefore, a specific disk controller is intensively instructed to access the other disk controller, and the other disk controllers are in a state of waiting for access.
【0009】このように、ハッシュファイル内の個々の
データにアクセスする場合には迅速なデータ処理が可能
であるが、大量のデータにアクセスする場合には高速な
データ処理が達成されない。As described above, rapid data processing is possible when accessing individual data in the hash file, but high-speed data processing is not achieved when accessing a large amount of data.
【0010】この発明の目的は、大量のデータを高速に
保守することが可能なハッシュファイルデータ管理装置
およびハッシュファイルデータ管理方法を提供すること
である。An object of the present invention is to provide a hash file data management device and a hash file data management method capable of maintaining a large amount of data at high speed.
【0011】[0011]
【課題を解決するための手段】この発明に係るハッシュ
ファイルデータ管理装置は、ハッシュファイル手段、複
数の入力手段およびアクセス手段を備える。A hash file data management device according to the present invention comprises a hash file means, a plurality of input means and an access means.
【0012】ハッシュファイル手段には、ハッシング法
によりデータが格納される。ハッシュファイル手段は、
格納されるべきデータのハッシュ値の連続した範囲によ
って複数のサブファイルに物理的に分割されかつ1つの
論理的ファイルを構成する。複数の入力手段は、ハッシ
ュ値の異なる連続した範囲がそれぞれ割当てられ、割当
てられた範囲のハッシュ値を有するデータをそれぞれ入
力する。アクセス手段は、複数の入力手段の各々により
入力されたデータのハッシュ値を算出し、算出されたハ
ッシュ値に基づいて対応するサブファイルにアクセスす
る。アクセス手段は、少なくとも2つのサブファイルへ
の同時アクセスが可能である.この発明に係るハッシュ
ファイルデータ管理方法は次のステップを含む。Data is stored in the hash file means by the hashing method. Hash file means
It is physically divided into a plurality of sub-files and constitutes one logical file by a continuous range of hash values of the data to be stored. The plurality of input means are respectively assigned continuous ranges of different hash values, and each input data having a hash value of the assigned range. The access means calculates a hash value of the data input by each of the plurality of input means, and accesses the corresponding subfile based on the calculated hash value. The access means can simultaneously access at least two subfiles. The hash file data management method according to the present invention includes the following steps.
【0013】1つの論理的ファイルを構成するハッシュ
ファイルを、格納されるべきデータのハッシュ値の連続
した範囲によって複数のサブファイルに物理的に分割す
る。入力されるべきデータをハッシュ値の連続した範囲
によって予め複数の入力手段にそれぞれ割当てる。複数
の入力手段によってそれぞれ割当てられたデータを同時
に入力する。入力されたデータのハッシュ値をそれぞれ
算出し、算出されたハッシュ値に基づいて対応するサブ
ファイルに同時にアクセスする。A hash file that constitutes one logical file is physically divided into a plurality of subfiles according to a continuous range of hash values of data to be stored. The data to be input is assigned in advance to a plurality of input means according to a continuous range of hash values. Data assigned respectively by a plurality of input means are simultaneously input. Each hash value of the input data is calculated, and the corresponding subfiles are simultaneously accessed based on the calculated hash value.
【0014】[0014]
【作用】この発明に係るハッシュファイルデータ管理装
置およびハッシュファイルデータ管理方法においては、
1つの論理的ファイルを構成するハッシュファイルが、
格納されるべきデータのハッシュ値の範囲によって複数
のサブファイルに物理的に分割され、かつ入力されるべ
きデータがハッシュ値の範囲によって複数の入力手段に
それぞれ割当てられ、同時に入力される。それにより、
ある特定のサブファイルへの同時アクセスの集中度が減
少し、同時並行的に入力処理が行われる。In the hash file data management device and the hash file data management method according to the present invention,
The hash files that make up one logical file are
The data to be stored is physically divided into a plurality of subfiles according to the range of hash values, and the data to be input is assigned to a plurality of input means according to the range of hash values, and is input at the same time. Thereby,
Concentration of simultaneous access to a specific subfile is reduced, and input processing is performed in parallel.
【0015】したがって、大量のデータを一括して保守
する場合に処理時間が短縮される。その結果、迅速なデ
ータ検索機能を損なうことなく、大量のデータを高速に
保守することができる。Therefore, the processing time is shortened when a large amount of data is collectively maintained. As a result, a large amount of data can be maintained at high speed without impairing the quick data search function.
【0016】[0016]
【実施例】以下、この発明の実施例を図面を参照しなが
ら詳細に説明する。Embodiments of the present invention will now be described in detail with reference to the drawings.
【0017】図1は、この発明の一実施例によるハッシ
ュファイルデータ管理装置の構成を示すブロック図であ
る。このハッシュファイルデータ管理装置は、データ入
力装置1,2、データベース管理装置3、ハッシング装
置4、関連テーブル5、ディスクコントローラ6,7お
よびハッシュファイル8を含む。ハッシュファイル8
は、2つのサブファイルSF1,SF2に物理的に分割
されている。2つのサブファイルSF1,SF2が1つ
の論理的ファイルを構成する。FIG. 1 is a block diagram showing the configuration of a hash file data management device according to an embodiment of the present invention. This hash file data management device includes data input devices 1 and 2, a database management device 3, a hashing device 4, a related table 5, disk controllers 6 and 7, and a hash file 8. Hash file 8
Is physically divided into two subfiles SF1 and SF2. The two subfiles SF1 and SF2 form one logical file.
【0018】データ入力装置1は入力ファイルIF1か
らデータを読込み、それをデータベース管理装置3に与
える。データ入力装置2は入力ファイルIF2からデー
タを読込み、それをデータベース管理装置3に与える。
入力ファイルIF1にはハッシュ値“0”〜“10”を
有する複数のレコードが格納され、入力ファイルIF2
にはハッシュ値“11”〜“20”を有する複数のレコ
ードが格納されている。The data input device 1 reads data from the input file IF1 and gives it to the database management device 3. The data input device 2 reads data from the input file IF2 and gives it to the database management device 3.
The input file IF1 stores a plurality of records having hash values “0” to “10”, and the input file IF2
Stores a plurality of records having hash values “11” to “20”.
【0019】ハッシング装置4は、データ入力装置1,
2により入力された各レコードのキーを予め定められた
ハッシング手法(ハッシング関数)によりハッシング値
に変換する。The hashing device 4 is a data input device 1,
The key of each record input by 2 is converted into a hashing value by a predetermined hashing method (hashing function).
【0020】関連テーブル5は、ハッシュ値の範囲とサ
ブファイルとの対応関係を示している。図2に関連テー
ブル5の一例を示す。図2の関連テーブルでは、ハッシ
ュ値“0”〜“10”がサブファイルSF1に割当てら
れ、ハッシュ値“11”〜“20”がサブファイルSF
2に割当てられている。The relation table 5 shows the correspondence between the range of hash values and subfiles. FIG. 2 shows an example of the relation table 5. In the relation table of FIG. 2, hash values “0” to “10” are assigned to the subfile SF1, and hash values “11” to “20” are assigned to the subfile SF.
It is assigned to 2.
【0021】データベース管理装置3は、関連テーブル
5を参照して、データ入力装置1,2により与えられた
各レコードおよび関連テーブル5により変換されたハッ
シュ値を、ディスクコントローラ6,7のいずれか一方
に与える。The database management device 3 refers to the relational table 5 and sets each of the records given by the data input devices 1 and 2 and the hash value converted by the relational table 5 to one of the disk controllers 6 and 7. Give to.
【0022】ディスクコントローラ6,7は、データベ
ース管理装置3から与えられたレコードおよび対応する
ハッシュ値に基づいてハッシュファイル8内のサブファ
イルSF1,SF2にそれぞれアクセスする。The disk controllers 6 and 7 respectively access the subfiles SF1 and SF2 in the hash file 8 based on the record given from the database management device 3 and the corresponding hash value.
【0023】データベース管理装置3およびハッシング
装置4は、データ入力装置1,2から与えられたレコー
ドを同時に処理することが可能である。したがって、デ
ィスクコントローラ6,7も、それぞれ独立かつ並列に
サブファイルSF1,SF2にアクセスすることができ
る。The database management device 3 and the hashing device 4 can simultaneously process the records given from the data input devices 1 and 2. Therefore, the disk controllers 6 and 7 can also access the subfiles SF1 and SF2 independently and in parallel.
【0024】次に、図3のフローチャートを参照しなが
ら図1のハッシュファイルデータ管理装置の動作を説明
する。Next, the operation of the hash file data management device of FIG. 1 will be described with reference to the flowchart of FIG.
【0025】図4に入力ファイルIF1,IF2の一例
を示す。入力ファイルIF1,IF2の各々にはキー、
データおよび処理区分を含む8個のレコードが格納され
ている。ここで、処理区分“1”は追加を表わし、処理
区分“2”は変更を表わす。FIG. 4 shows an example of the input files IF1 and IF2. A key for each of the input files IF1 and IF2,
Eight records including data and processing classification are stored. Here, the processing division “1” represents addition and the processing division “2” represents change.
【0026】ここでは、データ入力装置1,2により図
2の入力ファイルIF1,IF2が読込まれるものとす
る。Here, it is assumed that the data input devices 1 and 2 read the input files IF1 and IF2 shown in FIG.
【0027】まず、データ入力装置1は、入力ファイル
IFからキー“5−A”を有する1番目のレコードを読
込む(ステップS11)。データベース管理装置3は、
そのレコードを格納するとともにそれをハッシング装置
4に与える。ハッシング装置4は、所定のハッシング手
法によりキー“5−A”からハッシュ値“5”を求める
(ステップS12)。First, the data input device 1 reads the first record having the key "5-A" from the input file IF (step S11). The database management device 3 is
The record is stored and given to the hashing device 4. The hashing device 4 obtains the hash value "5" from the key "5-A" by a predetermined hashing method (step S12).
【0028】データベース管理装置3は、関連テーブル
5を参照して処理対象ファイルとしてサブファイルSF
1を選択する(ステップS13)。さらに、データベー
ス管理装置3は、ハッシュ値“5”に基づいてサブファ
イルSF1内のデータ格納エリアのアドレスを求める。
そして、レコードの処理区分より処理の種類を判別す
る。この場合、処理区分は“1”であるので、処理区分
を除くレコードをディスクコントローラ6に与えるとと
もに、レコードの追加処理を指示する。The database management device 3 refers to the relational table 5 and selects the subfile SF as the file to be processed.
1 is selected (step S13). Further, the database management device 3 obtains the address of the data storage area in the subfile SF1 based on the hash value “5”.
Then, the type of processing is determined from the processing classification of the record. In this case, since the processing classification is "1", the record excluding the processing classification is given to the disk controller 6 and the record addition processing is instructed.
【0029】それにより、ディスクコントローラ6はサ
ブファイルSF1にアクセスし(ステップS14)、レ
コードの追加処理を行なう(ステップS15)。その結
果、図5に示されるように、サブファイルSF1内のハ
ッシュ値“5”に対応するデータ格納エリアにキー“5
−A”を有するレコードが追加される。As a result, the disk controller 6 accesses the sub-file SF1 (step S14) and performs record addition processing (step S15). As a result, as shown in FIG. 5, the key "5" is stored in the data storage area corresponding to the hash value "5" in the subfile SF1.
A record with -A "is added.
【0030】一方、データ入力装置2は、入力ファイル
IF2からキー“14−A”を有する1番目のレコード
を読込む(ステップS21)。データベース管理装置3
は、そのレコードを格納するとともにそれをハッシング
装置4に与える。ハッシング装置4は、所定のハッシン
グ手法によりキー“14−A”からハッシュ値“14”
を求める(ステップS22)。On the other hand, the data input device 2 reads the first record having the key "14-A" from the input file IF2 (step S21). Database management device 3
Stores the record and gives it to the hashing device 4. The hashing device 4 uses the predetermined hashing method to change the hash value “14” from the key “14-A”.
Is calculated (step S22).
【0031】データベース管理装置3は、関連テーブル
5を参照して処理対象ファイルとしてサブファイルSF
2を選択する(ステップS23)。さらに、データベー
ス管理装置3は、ハッシュ値“14”に基づいてサブフ
ァイルSF2内のデータ格納エリアのアドレスを求め
る。そして、レコードの処理区分により処理の種類を判
別する。この場合、処理区分は“2”であるので、処理
区分を除くレコードをディスクコントローラ7に与える
とともに、レコードの変更処理を指示する。The database management device 3 refers to the related table 5 and selects the subfile SF as the processing target file.
2 is selected (step S23). Further, the database management device 3 obtains the address of the data storage area in the subfile SF2 based on the hash value “14”. Then, the type of processing is determined based on the processing classification of the record. In this case, since the processing classification is “2”, the record excluding the processing classification is given to the disk controller 7 and the record changing processing is instructed.
【0032】それにより、ディスクコントローラ7はサ
ブファイルSF2にアクセスし(ステップS24)、レ
コードの変更処理を行なう(ステップS25)。その結
果、図5に示されるように、サブファイルSF2内のハ
ッシュ値“14”に対応するデータ格納エリアのレコー
ドが、キー“14−A”を有するレコードで置換され
る。As a result, the disk controller 7 accesses the sub-file SF2 (step S24) and performs a record changing process (step S25). As a result, as shown in FIG. 5, the record of the data storage area corresponding to the hash value “14” in the subfile SF2 is replaced with the record having the key “14-A”.
【0033】ステップS11〜S15の処理およびステ
ップS21〜S25の処理は独立かつ並列に行なわれ
る。したがって、サブファイルSF1,SF2への同時
アクセスが可能となる。The processing of steps S11 to S15 and the processing of steps S21 to S25 are performed independently and in parallel. Therefore, the subfiles SF1 and SF2 can be accessed simultaneously.
【0034】以下同様にして、入力ファイルIF1内の
2番目ないし8番目のレコードに基づいてサブファイル
SF1に対して処理が行なわれ、入力ファイルIF2内
の2番目ないし8番目のレコードに基づいてサブファイ
ルSF2に対して処理が行なわれる。その結果、図5に
示されるように、ハッシュファイル8内のサブファイル
SF1,SF2の内容が更新される。Similarly, the sub file SF1 is processed based on the second to eighth records in the input file IF1, and the sub file SF1 is processed based on the second to eighth records in the input file IF2. The process is performed on the file SF2. As a result, as shown in FIG. 5, the contents of the subfiles SF1 and SF2 in the hash file 8 are updated.
【0035】図1のハッシュファイルデータ管理装置で
は、サブファイルSF1,SF2に対して独立かつ並列
にアクセスすることができるので、ハッシュファイル8
内の大量のデータの保守を短時間で行なうことが可能と
なる。In the hash file data management apparatus of FIG. 1, since the sub files SF1 and SF2 can be accessed independently and in parallel, the hash file 8
It becomes possible to perform maintenance of a large amount of data in a short time.
【0036】図6は、入力ファイルIF1,IF2に分
割されたハッシュ値の範囲とサブファイルSF1,SF
2に分割されたハッシュ値の範囲とが異なる場合のハッ
シュファイルデータ管理装置の動作を示すブロック図で
ある。FIG. 6 shows a range of hash values divided into input files IF1 and IF2 and subfiles SF1 and SF2.
It is a block diagram which shows operation | movement of a hash file data management apparatus when the range of the hash value divided into 2 differs.
【0037】入力ファイルIF1にはハッシュ値“0”
〜“1010”を有する複数のレコードが格納され、入
力ファイルIF2にはハッシュ値“1011”〜“20
00”を有する複数のレコードが格納される。A hash value "0" is stored in the input file IF1.
~ A plurality of records having "1010" are stored, and hash values "1011" to "20" are stored in the input file IF2.
A plurality of records having "00" are stored.
【0038】データベース管理装置3は、基本的には、
データ入力装置1から与えられるデータをディスクコン
トローラ6に与え、データ入力装置2から与えられるデ
ータをディスクコントローラ7に与える。それにより、
通常は、サブファイルSF1にはハッシュ値“0”〜
“1010”を有するレコードが格納され、サブファイ
ルSF2にはハッシュ値“1011”〜“2000”を
有するレコードが格納される。The database management device 3 basically has
The data supplied from the data input device 1 is supplied to the disk controller 6, and the data supplied from the data input device 2 is supplied to the disk controller 7. Thereby,
Normally, the hash value “0” to the sub file SF1
A record having “1010” is stored, and a record having hash values “1011” to “2000” is stored in the subfile SF2.
【0039】しかし、データベース管理装置3は、デー
タ入力装置1から与えられるハッシュ値の範囲とサブフ
ァイルSF1のハッシュ値の範囲とが異なる場合または
データ入力装置2から与えられるハッシュ値の範囲とサ
ブファイルSF2のハッシュ値の範囲とが異なる場合
に、データ入力装置1から与えられるデータの一部をデ
ィスクコントローラ7に与えることができ、または、デ
ータ入力装置2から与えられるデータの一部をディスク
コントローラ6に与えることもできる。However, if the range of hash values given from the data input device 1 and the range of hash values of the sub-file SF1 are different, the database management device 3 receives the range of hash values given from the data input device 2 and the sub-file. When the range of the hash value of SF2 is different, a part of the data supplied from the data input device 1 can be supplied to the disk controller 7, or a part of the data supplied from the data input device 2 can be supplied to the disk controller 6. Can also be given to.
【0040】図6の例では、サブファイルSF1にハッ
シュ値“0”〜“1000”が割当てられ、サブファイ
ルSF2にハッシュ値“1001”〜“2000”が割
当てられる。この場合、データベース管理装置3は、デ
ータ入力装置1から与えられるデータのうち、ハッシュ
値“0”〜“1000”を有するデータをディスクコン
トローラ6に与え、ハッシュ値“1001”〜“101
0”を有するデータをディスクコントローラ7に与え
る。In the example of FIG. 6, hash values "0" to "1000" are assigned to the subfile SF1, and hash values "1001" to "2000" are assigned to the subfile SF2. In this case, the database management device 3 gives the data having the hash values “0” to “1000” among the data given from the data input device 1 to the disk controller 6, and makes the hash values “1001” to “101”.
Data having 0 ″ is given to the disk controller 7.
【0041】他の部分の構成および動作は図1のハッシ
ュファイルデータ管理装置の構成および動作と同様であ
る。The configuration and operation of the other parts are the same as the configuration and operation of the hash file data management device of FIG.
【0042】図6のハッシュファイルデータ管理装置に
おいても、図1のハッシュファイルデータ管理装置とほ
ぼ同様の効果が得られる。これを図7を用いて説明す
る。The hash file data management device shown in FIG. 6 has substantially the same effect as the hash file data management device shown in FIG. This will be described with reference to FIG.
【0043】図7に示すように、ハッシュファイルをハ
ッシュ値H1,H2を分割点として3つのサブファイル
SF1,SF2,SF3に分割し、入力データをハッシ
ュ値H1′,H2′を分割点として3つのグループDA
1,DA2,DA3に分割するものと仮定する。ここ
で、H1<H1′およびH2<H2′である。As shown in FIG. 7, the hash file is divided into three sub-files SF1, SF2 and SF3 using the hash values H1 and H2 as division points, and the input data is divided into three sub files SF1 to SF2 using the hash values H1 'and H2'. Group DA
1, DA2, DA3 are assumed to be divided. Here, H1 <H1 ′ and H2 <H2 ′.
【0044】各グループDA1,DA2,DA3の入力
データは3つのデータ入力装置から同時に入力され、3
つのディスクコントローラを用いてサブファイルSF
1,SF2,SF3にそれぞれ格納される。しかし、グ
ループDA1内の一部のデータHAはグループDA2内
のデータと同様にサブファイルSF2に格納される。同
様に、グループDA2内の一部のデータHBはグループ
DA3内のデータと同様にサブファイルSF3に格納さ
れる。Input data of each group DA1, DA2, DA3 are simultaneously input from three data input devices, and
Subfile SF using one disk controller
1, SF2 and SF3, respectively. However, a part of the data HA in the group DA1 is stored in the subfile SF2 like the data in the group DA2. Similarly, a part of the data HB in the group DA2 is stored in the sub-file SF3 like the data in the group DA3.
【0045】したがって、2つのディスクコントローラ
が同時に1つのサブファイルにアクセスする可能性があ
る。この場合、同時にアクセスされるサブファイルのア
クセス速度は低下する。しかし、一部のデータHA,H
Bを除く大部分のデータはそれぞれ対応するサブファイ
ルに格納される。Therefore, two disk controllers may access one subfile at the same time. In this case, the access speed of the subfiles that are accessed at the same time decreases. However, some data HA, H
Most of the data except B is stored in the corresponding subfiles.
【0046】したがって、上記の場合においても、ハッ
シュファイル内のすべてのデータを処理するために要す
る時間は、従来のハッシュファイルデータ管理装置と比
較して、ほぼ1/(分割数)となる。Therefore, even in the above case, the time required to process all the data in the hash file is about 1 / (the number of divisions) as compared with the conventional hash file data management device.
【0047】ただし、入力データおよびハッシュファイ
ルを同じハッシュ値の範囲で分割すると、最も効率よく
データを格納することができる。However, if the input data and the hash file are divided within the same hash value range, the data can be stored most efficiently.
【0048】なお、上記実施例では、入力データおよび
ハッシュファイルを2つに分割しているが、入力ファイ
ルおよびハッシュファイルを3つ以上の部分に分割して
もよい。その場合には、さらに短時間でハッシュファイ
ル内のデータを保守することが可能となる。Although the input data and the hash file are divided into two in the above embodiment, the input file and the hash file may be divided into three or more parts. In that case, the data in the hash file can be maintained in a shorter time.
【0049】[0049]
【発明の効果】以上のようにこの発明によれば、ある特
定のサブファイルへの集中した同時アクセスを減少させ
ることが可能となる。したがって、迅速なデータ検索機
能を損なうことなく、大量のデータを高速に保守するこ
とができる。As described above, according to the present invention, it is possible to reduce concentrated simultaneous access to a specific subfile. Therefore, a large amount of data can be maintained at high speed without impairing the quick data search function.
【図1】この発明の一実施例によるハッシュファイルデ
ータ管理装置の構成を示すブロック図である。FIG. 1 is a block diagram showing a configuration of a hash file data management device according to an embodiment of the present invention.
【図2】関連テーブルの一例を示す図である。FIG. 2 is a diagram showing an example of a relation table.
【図3】図1のハッシュファイルデータ管理装置の動作
を説明するためのフローチャートである。FIG. 3 is a flowchart for explaining the operation of the hash file data management device of FIG.
【図4】入力ファイルの一例を示す図である。FIG. 4 is a diagram showing an example of an input file.
【図5】ハッシュファイルの処理後の状態を示す図であ
る。FIG. 5 is a diagram showing a state after processing of a hash file.
【図6】この発明の他の実施例によるハッシュファイル
データ管理装置の構成を示すブロック図である。FIG. 6 is a block diagram showing a configuration of a hash file data management device according to another embodiment of the present invention.
【図7】図6のハッシュファイルデータ管理装置の効果
を説明するための図である。FIG. 7 is a diagram for explaining the effect of the hash file data management device of FIG.
【図8】従来のハッシュファイルデータ管理装置の構成
を示すブロック図である。FIG. 8 is a block diagram showing a configuration of a conventional hash file data management device.
1,2 データ入力装置 3 データベース管理装置 4 ハッシング装置 5 関連テーブル 6,7 ディスクコントローラ 8 ハッシュファイル IF1,IF2 入力ファイル SF1,SF2 サブファイル なお、各図中同一符号は同一または相当部分を示す。 1, 2 Data Input Device 3 Database Management Device 4 Hashing Device 5 Related Table 6, 7 Disk Controller 8 Hash File IF1, IF2 Input File SF1, SF2 Subfile In the drawings, the same reference numerals indicate the same or corresponding parts.
Claims (2)
格納されるべきデータのハッシュ値の連続した範囲によ
って複数のサブファイルに物理的に分割されかつ1つの
論理的ファイルを構成するハッシュファイル手段と、 ハッシュ値の異なる連続した範囲がそれぞれ割当てら
れ、割当てられた範囲のハッシュ値を有するデータをそ
れぞれ入力する複数の入力手段と、 前記複数の入力手段の各々により入力されたデータのハ
ッシュ値を算出し、算出されたハッシュ値に基づいて対
応するサブファイルにアクセスするアクセス手段とを備
え、 前記アクセス手段は少なくとも2つのサブファイルへの
同時アクセスが可能である、ハッシュファイルデータ管
理装置。1. Data is stored by the hashing method,
Hash file means that is physically divided into a plurality of sub-files and constitutes one logical file by a continuous range of hash values of data to be stored, and continuous ranges of different hash values are allocated and allocated. A plurality of input means for respectively inputting data having hash values in a range, and a hash value of the data input by each of the plurality of input means, and a corresponding subfile based on the calculated hash value A hash file data management device, wherein the access means is capable of simultaneously accessing at least two subfiles.
ュファイルを、格納されるべきデータのハッシュ値の連
続した範囲によって複数のサブファイルに物理的に分割
し、 入力されるべきデータをハッシュ値の連続した範囲によ
って予め複数の入力手段にそれぞれ割当て、 前記複数の入力手段によってそれぞれ割当てられたデー
タを同時に入力し、 入力されたデータのハッシュ値をそれぞれ算出し、算出
されたハッシュ値に基づいて対応するサブファイルに同
時にアクセスする、ハッシュファイルデータ管理方法。2. A hash file that constitutes one logical file is physically divided into a plurality of subfiles according to a continuous range of hash values of data to be stored, and the data to be input is divided into hash values. Assigned to a plurality of input means in advance by a continuous range, simultaneously input the data assigned respectively by the plurality of input means, calculate hash values of the input data, and respond based on the calculated hash values Hash file data management method to access sub files simultaneously.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4252384A JPH06103127A (en) | 1992-09-22 | 1992-09-22 | Device for managing hash file data and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4252384A JPH06103127A (en) | 1992-09-22 | 1992-09-22 | Device for managing hash file data and method thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06103127A true JPH06103127A (en) | 1994-04-15 |
Family
ID=17236575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4252384A Withdrawn JPH06103127A (en) | 1992-09-22 | 1992-09-22 | Device for managing hash file data and method thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06103127A (en) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08129551A (en) * | 1994-10-31 | 1996-05-21 | Fujitsu Ltd | Hash method |
JP2000112793A (en) * | 1998-10-02 | 2000-04-21 | Toshiba Corp | Method for expanding database, database retrieval system and recording medium |
US6169982B1 (en) | 1996-04-26 | 2001-01-02 | Hitachi, Ltd | Parallel data base record distribution method and parallel data base management system |
JP2003524243A (en) * | 2000-02-18 | 2003-08-12 | アヴァマー テクノロジーズ インコーポレイテッド | Hash file system and method used in commonality factoring system |
JP2008513891A (en) * | 2004-09-15 | 2008-05-01 | ディリジェント テクノロジーズ コーポレイション | System and method for retrieving and storing data |
JP2008533571A (en) * | 2005-03-11 | 2008-08-21 | ロックソフト リミテッド | Method for detecting the presence of sub-blocks in a low redundancy storage system |
JP2009020757A (en) * | 2007-07-12 | 2009-01-29 | Toshiba Corp | Data registration apparatus, data registration method and program |
JP2010277522A (en) * | 2009-06-01 | 2010-12-09 | Nippon Telegr & Teleph Corp <Ntt> | Locality-detectable hash construction device, similar neighborhood search processing device, and program |
US8275782B2 (en) | 2004-09-15 | 2012-09-25 | International Business Machines Corporation | Systems and methods for efficient data searching, storage and reduction |
US8898394B2 (en) | 2009-08-12 | 2014-11-25 | Fujitsu Limited | Data migration method |
CN116702225A (en) * | 2023-06-08 | 2023-09-05 | 重庆傲雄在线信息技术有限公司 | Method, system, equipment and medium for fast verifying electronic archive file based on hash parallel computing |
-
1992
- 1992-09-22 JP JP4252384A patent/JPH06103127A/en not_active Withdrawn
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6442553B1 (en) | 1994-10-31 | 2002-08-27 | Fujitsu Limited | Hash system and hash method for transforming records to be hashed |
JPH08129551A (en) * | 1994-10-31 | 1996-05-21 | Fujitsu Ltd | Hash method |
US6169982B1 (en) | 1996-04-26 | 2001-01-02 | Hitachi, Ltd | Parallel data base record distribution method and parallel data base management system |
US6584457B1 (en) | 1996-04-26 | 2003-06-24 | Hitachi, Ltd. | Parallel data base record distribution method and parallel data base management system |
US6745191B2 (en) | 1996-04-26 | 2004-06-01 | Hitachi, Ltd. | Parallel database record distribution method and parallel database management system |
JP2000112793A (en) * | 1998-10-02 | 2000-04-21 | Toshiba Corp | Method for expanding database, database retrieval system and recording medium |
JP4846156B2 (en) * | 2000-02-18 | 2011-12-28 | イーエムシー コーポレイション | Hash file system and method for use in a commonality factoring system |
JP2003524243A (en) * | 2000-02-18 | 2003-08-12 | アヴァマー テクノロジーズ インコーポレイテッド | Hash file system and method used in commonality factoring system |
JP4939421B2 (en) * | 2004-09-15 | 2012-05-23 | インターナショナル・ビジネス・マシーンズ・コーポレーション | System and method for retrieving and storing data |
US8275755B2 (en) | 2004-09-15 | 2012-09-25 | International Business Machines Corporation | Systems and methods for efficient data searching, storage and reduction |
US10649854B2 (en) | 2004-09-15 | 2020-05-12 | International Business Machines Corporation | Systems and methods for efficient data searching, storage and reduction |
US10282257B2 (en) | 2004-09-15 | 2019-05-07 | International Business Machines Corporation | Systems and methods for efficient data searching, storage and reduction |
JP2008513891A (en) * | 2004-09-15 | 2008-05-01 | ディリジェント テクノロジーズ コーポレイション | System and method for retrieving and storing data |
US8275782B2 (en) | 2004-09-15 | 2012-09-25 | International Business Machines Corporation | Systems and methods for efficient data searching, storage and reduction |
US8275756B2 (en) | 2004-09-15 | 2012-09-25 | International Business Machines Corporation | Systems and methods for efficient data searching, storage and reduction |
US9430486B2 (en) | 2004-09-15 | 2016-08-30 | International Business Machines Corporation | Systems and methods for efficient data searching, storage and reduction |
US8725705B2 (en) | 2004-09-15 | 2014-05-13 | International Business Machines Corporation | Systems and methods for searching of storage data with reduced bandwidth requirements |
US9400796B2 (en) | 2004-09-15 | 2016-07-26 | International Business Machines Corporation | Systems and methods for efficient data searching, storage and reduction |
US9378211B2 (en) | 2004-09-15 | 2016-06-28 | International Business Machines Corporation | Systems and methods for efficient data searching, storage and reduction |
JP2008533571A (en) * | 2005-03-11 | 2008-08-21 | ロックソフト リミテッド | Method for detecting the presence of sub-blocks in a low redundancy storage system |
JP2009020757A (en) * | 2007-07-12 | 2009-01-29 | Toshiba Corp | Data registration apparatus, data registration method and program |
JP2010277522A (en) * | 2009-06-01 | 2010-12-09 | Nippon Telegr & Teleph Corp <Ntt> | Locality-detectable hash construction device, similar neighborhood search processing device, and program |
US8898394B2 (en) | 2009-08-12 | 2014-11-25 | Fujitsu Limited | Data migration method |
CN116702225A (en) * | 2023-06-08 | 2023-09-05 | 重庆傲雄在线信息技术有限公司 | Method, system, equipment and medium for fast verifying electronic archive file based on hash parallel computing |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5826262A (en) | Parallel bottom-up construction of radix trees | |
US6216203B1 (en) | Data processing method using record division storing scheme and apparatus therefor | |
JP3510042B2 (en) | Database management method and system | |
JPH06103127A (en) | Device for managing hash file data and method thereof | |
US20080133494A1 (en) | Method and apparatus for searching forwarding table | |
JP2001331509A (en) | Relational database processing device, relational database processing method, and computer-readable recording medium recording relational database processing program | |
Liu et al. | LCKV: Learner-Cleaner Optimized Adaptive Key-Value Separated LSM-Tree Store | |
JPH1040255A (en) | Hash table control device | |
JP4785749B2 (en) | Method and apparatus for searching a database in two search steps | |
KR100489412B1 (en) | Data output method of external storage device | |
JPH0695951A (en) | Device and method for managing hash file | |
JP3616567B2 (en) | Memory use efficiency optimization method, information processing apparatus, and recording medium | |
JP2000112793A (en) | Method for expanding database, database retrieval system and recording medium | |
JPS6046456B2 (en) | data access device | |
JPH04120636A (en) | Method for exclusively controlling expanded storage medium in object-oriented data base | |
JPH04245563A (en) | Preparation of retrieving table | |
JP3238939B2 (en) | Sorting device | |
JPH07175702A (en) | File system with index table | |
JPH04299772A (en) | Data retrieving device | |
JPH0554082A (en) | Data base system | |
JPH0695933A (en) | Device and method for managing hash file data | |
JPH0695934A (en) | Device and method for managing hash file | |
JPH04140882A (en) | Content retrieving device | |
JPH0520154A (en) | Block managing system | |
JPH0540679A (en) | File managing system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 19991130 |