JP2015049542A - Distributed database system and selection unit - Google Patents
Distributed database system and selection unit Download PDFInfo
- Publication number
- JP2015049542A JP2015049542A JP2013178656A JP2013178656A JP2015049542A JP 2015049542 A JP2015049542 A JP 2015049542A JP 2013178656 A JP2013178656 A JP 2013178656A JP 2013178656 A JP2013178656 A JP 2013178656A JP 2015049542 A JP2015049542 A JP 2015049542A
- Authority
- JP
- Japan
- Prior art keywords
- data
- group
- identification information
- server
- distributed database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Computer And Data Communications (AREA)
Abstract
Description
本発明は、複数の記憶装置を備える分散データベースシステム、およびそれに用いる選択装置に関する。 The present invention relates to a distributed database system including a plurality of storage devices and a selection device used therefor.
近年、電気通信回線を通して通信する複数台の記憶装置を、データベース管理システムで統合することにより、利用者からはあたかも1台の記憶装置を用いたデータベースであるかのように扱うことができる分散データベースの技術が採用されている。 In recent years, a distributed database that can be handled by a user as if it were a database using one storage device by integrating a plurality of storage devices communicating via a telecommunication line with a database management system. Technology is adopted.
特許文献1に記載された技術は、複数のサーバ内の複数のリソースで管理されているデータを要求されたとき、データアクセス処理により、要求データを、サーバ、リソース、アイテムの順に分類した管理テーブルを作成している。さらに、データアクセス処理は、管理テーブルに基づいてデータを収集し、データを要求順に並べることにより、クライアントが要求するデータを一括して表示等ができるようにしている。 The technology described in Patent Document 1 is a management table in which, when data managed by a plurality of resources in a plurality of servers is requested, the requested data is classified in the order of servers, resources, and items by data access processing. Have created. Further, the data access process collects data based on the management table and arranges the data in the order of request so that the data requested by the client can be collectively displayed.
特許文献1に記載された技術は、クライアントがデータの配置等を意識することなくデータを一括して取得できるようにするという課題を解決している。すなわち、複数のサーバに分散して管理されているデータを収集する処理と、データを順に並べる処理とを、データアクセス処理が行っている。 The technique described in Patent Document 1 solves the problem of enabling the client to acquire data in a batch without being aware of the data arrangement or the like. That is, the data access process performs a process of collecting data managed by being distributed to a plurality of servers and a process of arranging the data in order.
しかしながら、この構成においてクライアントは、要求するデータをデータアクセス処理に指示するために、データを管理しているサーバを指定しなければならず、どのデータがどのサーバに存在しているかがわからなければ、データにアクセスできないという問題がある。 However, in this configuration, the client must specify the server that manages the data in order to instruct the requested data to the data access process, and if the client does not know which data exists on which server There is a problem that data cannot be accessed.
本発明は、データを格納している記憶装置をクライアントが意識することなくデータにアクセスすることを可能にした分散データベースシステムを提供することを目的とし、さらに分散データベースシステムに用いる選択装置を提供することを目的とする。 An object of the present invention is to provide a distributed database system that enables a client to access data without being aware of a storage device storing the data, and further provides a selection device used in the distributed database system. For the purpose.
本発明に係る分散データベースシステムは、電気通信回線を通して通信する機能を有し、格納するデータの種別ごとにグループを形成している複数台の記憶装置と、前記電気通信回線を通して通知される識別情報で特定される所要のデータにアクセスする選択装置とを備え、前記識別情報は、前記グループを識別する第1の識別情報と、前記グループの中で前記データの格納場所を識別する第2の識別情報とを含み、前記選択装置は、前記第1の識別情報を用いて前記所要のデータが格納された前記グループにアクセスする第1の抽出部と、前記第1の抽出部がアクセスした前記グループにおいて前記第2の識別情報を用いて前記所要のデータにアクセスする第2の抽出部とを備えることを特徴とする。 The distributed database system according to the present invention has a function of communicating through a telecommunication line, a plurality of storage devices forming a group for each type of data to be stored, and identification information notified through the telecommunication line And a selection device that accesses the required data specified in (1), wherein the identification information includes first identification information that identifies the group, and second identification that identifies a storage location of the data in the group And the selection device uses the first identification information to access the group storing the required data and the group accessed by the first extraction unit. And a second extraction unit that accesses the required data using the second identification information.
この分散データベースシステムにおいて、前記選択装置は、前記電気通信回線を通して前記記憶装置と通信するサーバであることが好ましい。 In this distributed database system, it is preferable that the selection device is a server that communicates with the storage device through the electric communication line.
本発明に係る選択装置は、上述した分散データベースシステムに用いられる前記サーバであることを特徴とする。 The selection device according to the present invention is the server used in the distributed database system described above.
本発明の構成によれば、複数台の記憶装置が格納するデータの種別ごとにグループを形成し、グループを識別する第1の識別情報を用いて、データが格納されている記憶装置を絞り込んでいる。さらに、グループの中でデータの格納場所を識別する第2の識別情報を用いて、グループにおいて所要のデータにアクセスしている。したがって、クライアントは、データを格納している記憶装置を意識することなくデータにアクセスすることが可能になる。 According to the configuration of the present invention, a group is formed for each type of data stored in a plurality of storage devices, and the storage devices storing the data are narrowed down using the first identification information for identifying the group. Yes. Furthermore, using the second identification information for identifying the data storage location in the group, the required data is accessed in the group. Therefore, the client can access the data without being aware of the storage device storing the data.
以下に説明する分散データベースシステム(以下、「分散データベース」と略称する)は、図1に示すように、複数台の記憶装置10と、選択装置20とを備える。記憶装置10は、電気通信回線30を通して通信する機能を有し、格納するデータの種別ごとにグループG1,G2を形成している。選択装置20は、電気通信回線30を通して通知される識別情報で特定される所要のデータにアクセスする。識別情報は、グループを識別する第1の識別情報と、グループG1,G2の中でデータの格納場所を識別する第2の識別情報とを含む。選択装置20は、第1の識別情報を用いて所要のデータが格納されたグループG1,G2にアクセスする第1の抽出部21と、第1の抽出部21がアクセスしたグループG1,G2において第2の識別情報を用いて所要のデータにアクセスする第2の抽出部22とを備える。
A distributed database system (hereinafter abbreviated as “distributed database”) described below includes a plurality of
記憶装置10を実現する構成は、データを格納できれば、ハードディスク装置のような専用のストレージ、データベース管理システムが扱うストレージ、データテーブルなどどのような構成でもよい。ただし、記憶装置10は電気通信回線30を通して通信可能でなければならない。したがって、記憶装置10は、コンピュータシステムからなるサーバとして実現される。
The configuration for realizing the
記憶装置10が形成するグループG1,G2には、グループG1,G2ごとにデータベースサーバ41(すなわち、データベース管理システムを搭載したサーバ)が設けられる。データベースサーバ41は、グループG1,G2内に複数台設けられていてもよい。選択装置20は、アプリケーションプログラムインターフェイス(Application Program InterfaceまたはApplication Programming Interface:API)を設けた専用のサーバにより実現される。すなわち、選択装置20は、電気通信回線30を通して記憶装置10と通信するサーバであることが望ましい。電気通信回線20がインターネットである場合、選択装置20は、ウェブサーバにより構成される。なお、図示例において、選択装置20は1台のみ記載しているが、必要に応じて選択装置20を複数台設けてもよいのはもちろんのことである。また、APIはデータベースサーバ41に設けられていてもよい。この場合、選択装置20はデータベースサーバ41に設けられることになる。あるいはまた、いずれかの記憶装置10にAPIを設け、選択装置20として用いることも可能である。
In the groups G1 and G2 formed by the
図示例において、選択装置20は、サーバ42を通してクライアントである端末装置43および管理対象である設備44と、電気通信回線30を通して通信する。また、選択装置20は、電気通信回線30を通してデータベースサーバ41と通信する。サーバ42は、電気通信回線30を通して設備44の監視あるいは設備44の制御を行うために設けられ、サーバ42が設備44から取得したデータは選択装置20を通して記憶装置10に格納される。また、端末装置43が記憶装置10に格納されたデータを要求すると、サーバ42が選択装置20を通して所要のデータを記憶装置10から読み出す。すなわち、選択装置20は、サーバ42からの要求に応じて記憶装置10のデータにアクセスする機能を有する。ここでは、データへのアクセスは、記憶装置10に格納されたデータを取り出すことと、記憶装置10の所要の場所にデータを格納することとの両方を意味する。
In the illustrated example, the
図1では、サーバ42が接続されている電気通信回線30と、選択装置20が接続されている電気通信回線30とは、データの内容が異なるから分けて記載しているが、2つの電気通信回線30は物理的には同じであってもよい。また、サーバ42が主としてデータの収集を行う場合、サーバ42と設備44とはM2M(Machine-to-Machine)技術を用いることが望ましい。
In FIG. 1, the
図1に示す構成例では、サーバ42と選択装置20とを分離することによって、様々なサービスを提供するサーバ42に対して分散データベースを共用可能にしているが、選択装置20をサーバ42が兼用する構成を採用することも可能である。サーバ42の機能については後述する。電気通信回線30は、インターネットを用いたVPN(Virtual Private Network)を想定しているが、専用の通信経路を用いる電気通信回線30であってもよい。
In the configuration example shown in FIG. 1, the distributed database can be shared with the
いま、15万施設の電気、ガス、水道などに関するデータを400万件以上扱うために分散データベースを用いる場合を想定する。この規模のデータを自動収集する場合、たとえば、300万ポイント以上について、合計で20テラバイト以上のデータ容量のデータを処理する性能を確保することが必要になる。施設の一例を挙げると、事業用の建物(オフィスビル、商業施設など)、住居用の建物(集合住宅など)、公園、運動施設などがある。データは、電気、ガス、水道などの使用量に関するデータ(以下、「エネルギーデータ」という)のほか、施設に設けられた設備の構成に関するデータ、設備の稼働状態に関するデータなどを含むことが望ましい。データを自動収集する周期は、より短くすることが要求されており、現状では10分程度であるが、1分以下に短縮することも要求されてきている。 Assume that a distributed database is used to handle more than 4 million data on electricity, gas, water, etc. of 150,000 facilities. When automatically collecting data of this scale, for example, it is necessary to secure the performance of processing data with a total data capacity of 20 terabytes or more for 3 million points or more. Examples of facilities include business buildings (such as office buildings and commercial facilities), residential buildings (such as apartment buildings), parks, and exercise facilities. The data preferably includes data relating to the usage of electricity, gas, water, etc. (hereinafter referred to as “energy data”), data relating to the configuration of equipment provided in the facility, data relating to the operating state of the equipment, and the like. The period for automatically collecting data is required to be shorter and is currently about 10 minutes, but it is also required to be shortened to 1 minute or less.
上述のように、エネルギーデータのほかに、設備の構成、設備の稼働状態などの種々のデータを統括して管理することができれば、これらのデータを様々に組み合わせ、またデータを加工することによって、様々なサービスを提供することが可能になる。たとえば、エネルギーデータを収集するサービス、エネルギーデータの推移を可視化するサービス、施設における電力、ガス、水道の総使用量を管理するサービス、施設に設けられた設備の稼働状態を監視するサービスなど種々のサービスが提供可能になる。 As mentioned above, in addition to energy data, if various data such as the configuration of equipment and the operating state of equipment can be managed in an integrated manner, by combining these data in various ways and processing the data, It becomes possible to provide various services. For example, various services such as a service that collects energy data, a service that visualizes the transition of energy data, a service that manages the total amount of power, gas, and water used in the facility, and a service that monitors the operating status of equipment provided in the facility Service becomes available.
分散データベースを用いて提供されるサービスの種類は、サービスを受ける利用者との契約によって決まり、サーバ42は、利用者との契約により決めたサービスを提供する。サービスは電気通信回線30を通して提供されるから、サービスを提供可能な地域は広範囲であって、国内だけではなく海外であってもサービスの提供が可能になっている。そのため、分散データベースは、クラウドを構築していることが望ましい。
The type of service provided using the distributed database is determined by a contract with the user who receives the service, and the
また、使用するデータの種類は、利用者に提供するサービスの種類により異なるから、データの種類に応じてデータを格納する記憶装置10を分けていることが望ましい。つまり、データの種類によって情報量が異なるから、複数種類のデータが混在している場合にデータを一括して扱うと、一括されたデータに含まれているデータの種類に応じて情報量に大きなばらつきが生じる。そのため、複数種類のデータが混在した状態で、この種のデータを一括して1つの記憶装置10に格納すると、記憶装置10のアクセス時間に大きなばらつきが生じる。
In addition, since the type of data to be used varies depending on the type of service provided to the user, it is desirable to divide the
本実施形態では、記憶装置10は、格納するデータの種類ごとにグループG1,G2を形成している。上述のように、エネルギーデータ、設備の構成に関するデータ、設備の稼働状態に関するデータの3種類のデータが存在する場合、3グループの記憶装置10が設けられ、各種類のデータが互いに異なるクループに格納される。このようなグループG1,G2を形成することによって、1つのグループG1,G2の中では、記憶装置10のアクセス時間のばらつきが抑制される。
In the present embodiment, the
図2に示す構成例では、記憶装置10は、マスタ管理データを格納するグループG1、エネルギーデータを格納するグループG2、設備稼働データを格納するグループG3の3グループを構成している。マスタ管理データは、設備の構成に関するデータであり、たとえば、利用者(事業者)−事業所−建物−フロア−設備などの設備の階層構造および設備の仕様などが格納されている。
In the configuration example shown in FIG. 2, the
図2に示す構成例では、種々のサーバ42が上述した分散データベースシステム(クラウド)を共通のプラットフォームに用いることによって、種々のサービスを行う場合を例示している。上段のサーバ42は、主として端末装置43にデータ(情報)を提供するサービスを行い、下段のサーバ42は、主として設備44からデータを収集するサービスを行う。
The configuration example illustrated in FIG. 2 illustrates a case where
図示例において、下段のサーバ42は、それぞれエネルギー収集、BEMS(Building and Energy Management System)監視、冷設・空調、遠隔監視のサービスを行い、上段のサーバ42は、それぞれ情報発信、総量管理、見える化、分析・診断のサービスを行う場合を示している。BEMS監視および遠隔監視は、設備44から収集したデータを用いて設備44の遠隔監視あるいは遠隔制御を行うサービスである。BEMS監視は、オフィスビルやテナントビルの照明器具、空調機器などの消費電力を抑制するための制御を支援するサービスであり、遠隔監視は、蓄電設備などの遠隔制御を行うサービスである。冷設・空調は、店舗において冷凍・冷蔵ショーケースや空調設備を対象とした遠隔監視などを行うサービスである。また、情報発信は、商品情報、省エネ事例などの情報を発信するサービスであり、総量管理は、エネルギー使用量をグラフなどで示すサービスである。見える化は、太陽光発電設備、蓄電設備などの運転状況をグラフなどで示すサービスである。分析・診断は、設備44が無駄なく効率的に運転されるように分析や診断を行うサービスである。
In the illustrated example, the
ただし、図2に示す構成例は一例であり、サービスの種類や内容は適宜に選択される。また、図3に示すように、地理的に分散して配置されている複数台の記憶装置10を備える構成において、地域ごとに1種類以上のグループの記憶装置10を配置するようにしてもよい。図示例では、一点鎖線で囲んだ3地域D1,D2,D3が示され、2地域D1,D3ではグループG2とグループG3とが組み合わせて用いられ、残りの1地域D2ではグループG2のみが用いられている。図の左端の地域D1におけるグループG3の記憶装置10は、たとえば、太陽光発電設備と蓄電設備との稼働状態に関する設備稼働データを格納する。また、図の右端の地域D3におけるグループG3の記憶装置10は、たとえば、店舗用の冷凍庫および冷蔵庫の稼働状態に関する設備稼働データを格納する。
However, the configuration example shown in FIG. 2 is an example, and the type and contents of the service are appropriately selected. In addition, as shown in FIG. 3, in a configuration including a plurality of
図3に示す例のように、同じグループG1,G2,G3の記憶装置10は、異なる地域に分散して設けられていてもよい。たとえば、エネルギーデータを格納するグループG2に属する記憶装置10が東京と大阪とにそれぞれ設けられてもよい。また、同じグループG1,G2,G3に属する複数台の記憶装置10が同じ地域に配置されてもよい。
As in the example illustrated in FIG. 3, the
一方、サービスを提供するために必要なデータが複数台の記憶装置10に分散して格納されている場合、サーバ42は、複数台の記憶装置10のデータにアクセスしなければならない。この場合でも、利用者は、データが格納されている記憶装置10の構成および場所を意識せずに、端末装置43あるいは設備44から所要のデータにアクセスすることが可能である。つまり、複数台の記憶装置10に格納されたデータにアクセスする場合であっても、端末装置43あるいは設備44から所要のデータへのアクセスは、あたかも1台のデータベースサーバにアクセスしているかのようにシームレスに行われる。
On the other hand, when data necessary for providing a service is distributed and stored in a plurality of
利用者がサービスを受けるのに必要なデータへのアクセスは、選択装置20が代行して行う。すなわち、選択装置20は、サーバ42から要求を受けると、サービスの種類に応じて記憶装置10にアクセスする。つまり、利用者はサーバ42を通してサービスを受け、サーバ42はクラウドとして構築されている分散データベースを用いることによって、サーバ42が提供するサービスに応じたデータにアクセスする。選択装置20にはサーバ42からサービスの種類に応じた識別情報が通知されるから、選択装置20は、上述のように、識別情報に含まれる第1の識別情報と第2の識別情報とを用いて所要のデータにアクセスする。
The
図2、図3において、選択装置20は、複数のグループG1,G2,G3あるいは複数の地域D1,D2,D3に跨がって設けられているが、選択装置20は、クラウドとしての分散データベースに含まれるから、適宜に分割されていてもよい。すなわち、上述したように、分散データベースにおいて、複数の選択装置20が含まれていてもよい。
2 and 3, the
以下、識別情報を「グローバルID」と呼ぶ。グローバルIDは、さらに第1の識別情報である「発行元ID」と、第2の識別情報である「ローカルID」とを含む。発行元IDは、分散データベースの範囲内でユニークになるように定められ、ローカルIDは、発行元IDの範囲内においてユニークになるように定められる。 Hereinafter, the identification information is referred to as “global ID”. The global ID further includes “issuer ID” that is first identification information and “local ID” that is second identification information. The issuer ID is determined to be unique within the range of the distributed database, and the local ID is determined to be unique within the range of the issuer ID.
発行元IDは、記憶装置10のグループを識別する情報であって、本実施形態では、グループG1,G2,G3を識別する情報に、サービスを受ける利用者(通常は事業者を想定する)の所在地域を識別する情報と、利用者を識別する情報とが結合されている。所在地および利用者には、それぞれ識別する情報になるユニークな番号が付与される。同様に、グループを識別する情報もグループごとにユニークになる番号が付与される。また、所在地は、国、県(地方)、市町村などから選択される単位で設定される。したがって、発行元IDは、たとえば、(国番号、利用者番号、グループ番号)の組で表される。なお、所在地、利用者、グループをそれぞれ識別する情報は、番号でなくてもよいのはもちろんのことである。
The issuer ID is information for identifying a group in the
一方、ローカルIDは、発行元IDの中でユニークになるように設定されていればよいから、通常は、ローカルIDの範囲内において順番を表す情報が付与される。つまり、ローカルIDは、記憶装置10にデータを格納した順番を表す番号が用いられる。ローカルIDを用いると、グループの中でデータが格納される場所が特定されるから、当該場所にデータを格納し、また当該場所に格納されたデータにアクセスすることが可能になる。言い換えると、ローカルIDは、グループの中でデータを識別すると言える。ローカルIDに順番を表す番号を用いる理由は後述する。
On the other hand, since the local ID only needs to be set so as to be unique among the issuer IDs, information indicating the order within the range of the local ID is usually given. That is, as the local ID, a number indicating the order in which data is stored in the
選択装置20は、グローバルIDを受け取ると、第1の抽出部21が発行元IDを用いて、記憶装置10のグループを特定する。すなわち、データへのアクセスが選択装置20に要求されると、第1の抽出部21は、国番号と利用者番号とグループ番号とを用いて記憶装置10のグループを識別し、該当するグループの記憶装置10をターゲットとして絞り込む。その後、第2の抽出部22がローカルIDを用いて、グループ内で所要のデータが格納されている場所を特定し、所要のデータにアクセスする。
When the
以上のように、選択装置20は、第1の抽出部21と第2の抽出部22とを用いた2段階の処理によって所要のデータが格納される場所を特定し、目的とするデータにアクセスすることになる。
As described above, the
ところで、上述のようなサービスを提供しようとすると、比較的短い時間間隔で大量のデータが発生するから、データの収集や提供のための入出力がボトルネックになる上に、排他制御が行われる頻度が高くなる。この種の問題に対処するために、分散データベースを用いることは有効である。分散データベースでは、複数の記憶装置10にデータが分散して格納されるから、1つの記憶装置10で構築されたデータベースにおけるボトルネックを回避することが可能になる。
By the way, if an attempt is made to provide such a service, a large amount of data is generated at a relatively short time interval. Therefore, input / output for data collection and provision becomes a bottleneck, and exclusive control is performed. Increases frequency. To deal with this type of problem, it is effective to use a distributed database. In a distributed database, data is distributed and stored in a plurality of
しかしながら、分散データベースを構築している物理的実体としての記憶装置10が複数存在している場合に、ハードウェア資源の異なる記憶装置10が混在することがある。データベースでは、ハードウェア資源のうち、とくにCPU(Central Processing Unit)の性能と記憶容量との相違はスループットに大きく影響する。そのため、分散データベースを構成している記憶装置10のハードウェア資源のばらつきに起因して、データを格納する際の書込時間やデータを提供する際の応答時間にばらつきが生じる。
However, when there are a plurality of
また、分散データベースを構成している複数の記憶装置10にデータを格納する際に、単一の記憶装置10にアクセスが集中する場合があり、この場合には該当する記憶装置10がボトルネックになる。すなわち、分散データベースの全体としてのスループットが低下する。
Further, when data is stored in a plurality of
本実施形態は、分散データベースを構成している複数の記憶装置10にハードウェア資源のばらつきがあってもボトルネックの発生が抑制されるように、以下の構成を採用している。すなわち、以下の構成を採用することによって、ハードウェア資源の劣る記憶装置10が混在していてもスループットの低下が生じにくい分散データベースの提供が可能になる。
The present embodiment employs the following configuration so that the occurrence of bottlenecks is suppressed even if there are variations in hardware resources among the plurality of
上述したように、分散データベースは複数台の記憶装置10を備え、分散データベースと端末装置43とがは電気通信回線30を通して通信することにより、端末装置43をクライアントとするクライアントサーバシステムを構築する。このクライアントサーバシステムは、プレゼンテーション層とアプリケーション層とデータ層とからなる3層アーキテクチャを有し、プレゼンテーション層は端末装置43により実現されている。
As described above, the distributed database includes a plurality of
記憶装置10はデータ層に対応し、選択装置20、データベースサーバ41、サーバ42はアプリケーション層に相当する。サーバ42は、端末装置43から要求された処理に対応した依頼をデータベースサーバ41に対して行い、データベースサーバ41の応答を端末装置43に返す機能を備える。
The
ところで、記憶装置10は、図4に示すように、複数台の仮想的なサーバとしてのプラットフォームモジュール(以下、「PFモジュール」という)11に分割されている。選択装置20は、複数台の記憶装置10を1つのデータベースとして扱う機能だけではなく、複数のPFモジュール11を統合する機能を備える。この機能は、複数台の記憶装置10を統合して1つのデータベースとして扱う機能と同様に、選択装置20が備えるAPIにより実現される。すなわち、選択装置20のAPIは、端末装置43からの要求に対応するPFモジュール11を選択する機能を実現するための関数ないし命令を備える。
As shown in FIG. 4, the
選択装置20がPFモジュール11を管理することにより、PFモジュール11は、サーバ42から見ると、個別のサーバと等価に機能する。すなわち、個々のPFモジュール11は、見かけ上では、データを格納する機能と、データベース管理システムの機能とを備えていることになる。また、個々のPFモジュール11は、記憶容量が等しくなるように構築されている。つまり、実体である記憶装置10の記憶容量にかかわらず、PFモジュール11は互いに記憶容量が等しくなっている。言い換えると、分散データベースは、記憶容量が等しい複数個のPFモジュール11を組み合わせて構成されていると言える。
When the
いま、ボトルネックの発生を抑制するために、分散データベースに100個のPFモジュール11を用いて負荷を分散させる場合を想定する。分散データベースの導入時には、記憶容量が50ギガバイトの記憶装置10を1台だけ用いているとすれば、100個のPFモジュール11は1台の記憶装置10に設けなければならないから、1個のPFモジュール11の記憶容量は500メガバイトになる。
Now, in order to suppress the occurrence of a bottleneck, a case is assumed in which a load is distributed using 100
ここで、格納すべきデータの量が増加するのに伴って、150ギガバイトの記憶装置10を新たに導入したとする。2台の記憶装置10の記憶容量を合計すると200ギガバイトであって、記憶装置10が1台の場合と同様に、100個のPFモジュール11を構成すると、1個のPFモジュール11の記憶容量はは2ギガバイトになる。1台目の記憶装置10の記憶容量は50ギガバイトであるから、25個のPFモジュール11を構成でき、2台目の記憶装置10の記憶容量は150ギガバイトであるから、75個のPFモジュール11を構成できる。
Here, it is assumed that a 150
さらに、格納すべきデータ同様にして、格納すべきデータの量が増加するのに伴って、記憶装置10の台数を増加させたとする。ここで、記憶容量が50ギガバイトである記憶装置10を100台設ける場合を想定する。この場合、分散データベースの全体では5テラバイトになるから、PFモジュール11を100個設けるのであれば、1個のPFモジュール11は50ギガバイトの記憶容量を持つことになる。また、PFモジュール11を100個必要とするのであれば、1台の記憶装置10が1個のPFモジュール11に対応する。
Further, it is assumed that the number of
なお、一般的な傾向として、記憶装置10は、処理能力が高いほど記憶容量が大きくなる。ここでは、PFモジュール11の記憶容量を等しくしているから、記憶装置10の処理能力にかかわらずPFモジュール11のスループットはほぼ等しくなる。PFモジュール11の記憶領域はさらに分割されるが、要旨ではないのでここでは説明しない。
As a general tendency, the storage capacity of the
選択装置20に設けられた第2の抽出部22が抽出するローカルID(第2の識別情報)は、PFモジュール11を特定する識別情報であってもよい。この場合、所要のデータが格納されている場所を特定するには、PFモジュール11の中でデータが格納されている場所を示す識別情報が必要になる。
The local ID (second identification information) extracted by the
なお、データが複数のPFモジュール11に分散して格納されるように負荷を分散させるには、たとえば、データに0を含む自然数によるデータIDを付与しておき、データIDをPFモジュール11の個数で除したときの剰余をローカルIDに用いる。すなわち、データIDをXとし、PFモジュール11の個数をKとすると、ローカルIDは、XをKで除した剰余になる(つまり、X mod K)。また、ローカルIDは、0から始まる数値とする。したがって、剰余が0になれば、ローカルIDが0であるPFモジュール11が選択される。
In order to distribute the load so that the data is distributed and stored in a plurality of
この場合、同じグループの記憶装置10に順に格納するデータのデータIDが1ずつ異なる場合、このようなデータは、異なるPFモジュール11に順に格納される。したがって、あたかも複数台のハードディスクを用いてストライピングを行う場合のように、異なるPFモジュール11にデータが振り分けて格納される。その結果、アクセスが単一のPFモジュール11に集中しなくなり、データへのアクセスが平準化される。
In this case, when the data IDs of data stored in order in the
以上説明したように、グローバルIDが、発行元IDとローカルIDとにより構成されており、発行元IDを用いてデータを格納する記憶装置10のグループが求められ、次にローカルIDを用いてデータを格納するPFモジュール11が求められる。したがって、所要のデータを抽出する際に、データの種類を指定することによって、記憶装置10のグループが絞られ、グループ内でローカルIDを用いてPFモジュール11を特定することができる。最終的には、1個のPFモジュール11の範囲内でデータにアクセスすればよいから、データへのアクセスが容易である。
As described above, the global ID is composed of the issuer ID and the local ID, and the group of the
上述した構成例ではデータを格納するPFモジュール11を決めるために、選択装置20はデータIDの除算を行って剰余を求めているが、乱数などの他の関係を用いてデータを格納するPFモジュールを分散させてもよい。
In the configuration example described above, in order to determine the
上述した例からわかるように、実体としての記憶装置10を用いて仮想的にPFモジュール11を構成しているから、負荷が平準化されるだけではなく、記憶装置10に格納するデータの量に応じて、記憶装置10の台数を段階的に増加させることが可能である。すなわち、分散データベースのスループットと記憶容量とのスケーラビリティを確保することが可能になる。また、実施形態において説明した分散データベースは、構成する機材を専門業者に委託するか(ハウジング)、専門業者の機材を利用するか(ホスティング)によらず構築可能である。したがって、分散データベースは、サーバ42が提供するサービスに適した環境で運用することができる。
As can be seen from the above-described example, since the
10 記憶装置
20 選択装置
21 第1の抽出部
22 第2の抽出部
30 電気通信回線
41 データベースサーバ
42 サーバ
43 端末装置
44 設備
G1,G2 グループ
DESCRIPTION OF
Claims (3)
前記電気通信回線を通して通知される識別情報で特定される所要のデータにアクセスする選択装置とを備え、
前記識別情報は、
前記グループを識別する第1の識別情報と、
前記グループの中で前記データを識別する第2の識別情報とを含み、
前記選択装置は、
前記第1の識別情報を用いて前記所要のデータが格納された前記グループにアクセスする第1の抽出部と、
前記第1の抽出部がアクセスした前記グループにおいて前記第2の識別情報を用いて前記所要のデータにアクセスする第2の抽出部とを備える
ことを特徴とする分散データベースシステム。 A plurality of storage devices having a function of communicating through a telecommunication line and forming a group for each type of data to be stored;
A selection device for accessing required data specified by identification information notified through the telecommunication line,
The identification information is
First identification information for identifying the group;
Second identification information for identifying the data in the group,
The selection device is:
A first extraction unit that accesses the group in which the required data is stored using the first identification information;
A distributed database system comprising: a second extraction unit that accesses the required data using the second identification information in the group accessed by the first extraction unit.
請求項1記載の分散データベースシステム。 The distributed database system according to claim 1, wherein the selection device is a server that communicates with the storage device through the telecommunication line.
ことを特徴とする選択装置。 It is the said server used for the distributed database system of Claim 2. The selection apparatus characterized by the above-mentioned.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013178656A JP2015049542A (en) | 2013-08-29 | 2013-08-29 | Distributed database system and selection unit |
| PCT/JP2014/004090 WO2015029341A1 (en) | 2013-08-29 | 2014-08-05 | Distributed database system and selection device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013178656A JP2015049542A (en) | 2013-08-29 | 2013-08-29 | Distributed database system and selection unit |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2015049542A true JP2015049542A (en) | 2015-03-16 |
Family
ID=52585937
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2013178656A Pending JP2015049542A (en) | 2013-08-29 | 2013-08-29 | Distributed database system and selection unit |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP2015049542A (en) |
| WO (1) | WO2015029341A1 (en) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018041188A (en) * | 2016-09-06 | 2018-03-15 | 大日本印刷株式会社 | Address management device, data management system and program |
| KR101919816B1 (en) | 2017-08-09 | 2018-11-19 | 네이버 주식회사 | Consistency checking in database sharding environment |
| JP2020126600A (en) * | 2018-12-14 | 2020-08-20 | スラック テクノロジーズ, インコーポレイテッド | Method, apparatus, and computer program product for managing geographically dispersed data and generating search index based thereon |
| US11184159B1 (en) | 2020-09-01 | 2021-11-23 | Slack Technologies, Inc. | Encryption key management for channels with multiple organizations |
| US11539675B2 (en) | 2018-06-06 | 2022-12-27 | Slack Technologies, Llc | Encryption key management for international data residency |
| US11799636B2 (en) | 2018-06-06 | 2023-10-24 | Salesforce, Inc. | Method, apparatus, and computer program product for encryption key management within a group-based communication system |
| US11804954B2 (en) | 2020-07-02 | 2023-10-31 | Salesforce, Inc. | Encryption key management for an automated workflow |
| US11949739B2 (en) | 2018-12-14 | 2024-04-02 | Salesforce, Inc. | Methods, apparatuses, and computer program products for management of data deletion requests based on geographically distributed data |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0387943A (en) * | 1989-08-31 | 1991-04-12 | Toshiba Corp | Data base access control system |
| JP2003016085A (en) * | 2001-06-29 | 2003-01-17 | Nippon Telegraph & Telephone West Corp | Content search system, content search method, content search program, and recording medium |
| WO2004023341A1 (en) * | 2002-09-03 | 2004-03-18 | Fujitsu Limited | Search system, search server, client, search method, program, and recording medium |
| WO2013015341A1 (en) * | 2011-07-25 | 2013-01-31 | 楽天株式会社 | Genre generation device |
| JP2013065203A (en) * | 2011-09-16 | 2013-04-11 | Panasonic Corp | Data storage system |
-
2013
- 2013-08-29 JP JP2013178656A patent/JP2015049542A/en active Pending
-
2014
- 2014-08-05 WO PCT/JP2014/004090 patent/WO2015029341A1/en not_active Ceased
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0387943A (en) * | 1989-08-31 | 1991-04-12 | Toshiba Corp | Data base access control system |
| JP2003016085A (en) * | 2001-06-29 | 2003-01-17 | Nippon Telegraph & Telephone West Corp | Content search system, content search method, content search program, and recording medium |
| WO2004023341A1 (en) * | 2002-09-03 | 2004-03-18 | Fujitsu Limited | Search system, search server, client, search method, program, and recording medium |
| WO2013015341A1 (en) * | 2011-07-25 | 2013-01-31 | 楽天株式会社 | Genre generation device |
| JP2013065203A (en) * | 2011-09-16 | 2013-04-11 | Panasonic Corp | Data storage system |
Non-Patent Citations (3)
| Title |
|---|
| G. THOMAS: "商用異種分散データベース", コンピュータ・サイエンス 1992年7月号別冊 ACM COMPUTING SURVEYS '90, JPN6014037708, 10 July 1992 (1992-07-10), JP, pages 87 - 114, ISSN: 0003552192 * |
| 山本 晋太郎: "スマートシティにおける大規模住宅ログの収集・活用プラットフォームの検討", 電子情報通信学会技術研究報告, vol. 111, no. 470, JPN6014037710, 1 March 2012 (2012-03-01), JP, pages 207 - 212, ISSN: 0003552194 * |
| 疋田 定幸, 図解分散型データベースシステム入門, vol. 第1版, JPN6014037709, 10 December 1994 (1994-12-10), JP, pages 43 - 47, ISSN: 0003552193 * |
Cited By (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018041188A (en) * | 2016-09-06 | 2018-03-15 | 大日本印刷株式会社 | Address management device, data management system and program |
| KR101919816B1 (en) | 2017-08-09 | 2018-11-19 | 네이버 주식회사 | Consistency checking in database sharding environment |
| US11539675B2 (en) | 2018-06-06 | 2022-12-27 | Slack Technologies, Llc | Encryption key management for international data residency |
| US12015699B2 (en) | 2018-06-06 | 2024-06-18 | Salesforce, Inc. | Method, apparatus, and computer program product for encryption key management within a group-based communication system |
| US11799636B2 (en) | 2018-06-06 | 2023-10-24 | Salesforce, Inc. | Method, apparatus, and computer program product for encryption key management within a group-based communication system |
| US11757852B2 (en) | 2018-06-06 | 2023-09-12 | Salesforce, Inc. | Encryption key management for international data residency |
| JP2022084778A (en) * | 2018-12-14 | 2022-06-07 | スラック テクノロジーズ, エルエルシー | Methods, equipment, and computer program products for managing geographically dispersed data and generating search indexes based on it. |
| JP7086918B2 (en) | 2018-12-14 | 2022-06-20 | スラック テクノロジーズ, エルエルシー | Methods, equipment, and computer program products for managing geographically dispersed data and generating search indexes based on it. |
| JP7428742B2 (en) | 2018-12-14 | 2024-02-06 | セールスフォース インコーポレイテッド | Methods, devices, and computer program products for managing geographically dispersed data and generating search indexes based thereon |
| JP7458565B1 (en) | 2018-12-14 | 2024-03-29 | セールスフォース インコーポレイテッド | Methods, devices, and computer program products for managing geographically dispersed data and generating search indexes based thereon |
| US11949739B2 (en) | 2018-12-14 | 2024-04-02 | Salesforce, Inc. | Methods, apparatuses, and computer program products for management of data deletion requests based on geographically distributed data |
| JP2024050693A (en) * | 2018-12-14 | 2024-04-10 | セールスフォース インコーポレイテッド | Method, apparatus, and computer program product for managing geographically distributed data and generating a search index therefrom |
| JP2020126600A (en) * | 2018-12-14 | 2020-08-20 | スラック テクノロジーズ, インコーポレイテッド | Method, apparatus, and computer program product for managing geographically dispersed data and generating search index based thereon |
| US12019607B2 (en) | 2018-12-14 | 2024-06-25 | Salesforce, Inc. | Methods, apparatuses, and computer program products for management of and search index generation based on geographically distributed data |
| US11804954B2 (en) | 2020-07-02 | 2023-10-31 | Salesforce, Inc. | Encryption key management for an automated workflow |
| US11184159B1 (en) | 2020-09-01 | 2021-11-23 | Slack Technologies, Inc. | Encryption key management for channels with multiple organizations |
| US11818250B2 (en) | 2020-09-01 | 2023-11-14 | Salesforce, Inc. | Encryption key management for channels with multiple organizations |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2015029341A1 (en) | 2015-03-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2015049542A (en) | Distributed database system and selection unit | |
| US11113150B2 (en) | Distributing data on distributed storage systems | |
| CN111931949A (en) | Communication in a federated learning environment | |
| CN106663042B (en) | Scalable Data Storage Pool | |
| TW200424928A (en) | Information processing system, information processing device, distributed information processing method and computer readable recording medium | |
| CN104283959B (en) | A kind of memory mechanism based on grading performance suitable for cloud platform | |
| US8892728B2 (en) | Automatic zone-based management of a data center | |
| CN104679591A (en) | Method and device for distributing resource in cloud environment | |
| CN102571916A (en) | Framework of leasing software of cloud storage space and operating method of framework | |
| CN111352592B (en) | Disk read-write control method, device, equipment and computer readable storage medium | |
| CN104769550B (en) | The method and system of bandwidth allocation in system for cloud computing | |
| CN112003922A (en) | Data transmission method and device | |
| CN104683450B (en) | Video service monitors cloud system | |
| CN105071994B (en) | A kind of mass data monitoring system | |
| CN104660690B (en) | cloud video service monitoring system | |
| CN112671840A (en) | Cross-department data sharing system and method based on block chain technology | |
| WO2017207049A1 (en) | A node of a network and a method of operating the same for resource distribution | |
| CN104486116A (en) | Multidimensional query method and multidimensional query system of flow data | |
| CN105554123A (en) | High-capacity-aware cloud computing platform system | |
| JP2023547895A (en) | Techniques for generating configurations for electrically isolating fault domains within data centers | |
| CN104750614B (en) | Method and apparatus for managing memory | |
| CN112261132B (en) | Processing distribution in data center clusters | |
| TW201640374A (en) | Rack space power utilization | |
| US20150188747A1 (en) | Cloud-based data center infrastructure management system and method | |
| CN116566990B (en) | Position allocation method, position allocation device, computer equipment and storage medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20141006 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160301 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170509 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170710 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20170710 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171219 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180710 |