[go: up one dir, main page]

JP2012247971A - Load information unshared type load leveling server, system with the server, and method thereof - Google Patents

Load information unshared type load leveling server, system with the server, and method thereof Download PDF

Info

Publication number
JP2012247971A
JP2012247971A JP2011118794A JP2011118794A JP2012247971A JP 2012247971 A JP2012247971 A JP 2012247971A JP 2011118794 A JP2011118794 A JP 2011118794A JP 2011118794 A JP2011118794 A JP 2011118794A JP 2012247971 A JP2012247971 A JP 2012247971A
Authority
JP
Japan
Prior art keywords
message
redirect
original
server
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011118794A
Other languages
Japanese (ja)
Inventor
Yoshinori Kitatsuji
佳憲 北辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2011118794A priority Critical patent/JP2012247971A/en
Publication of JP2012247971A publication Critical patent/JP2012247971A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)

Abstract

【課題】サーバとクライアントの間には振分けノードを導入せず、かつサーバは負荷状況を他のサーバと直接通知し合わずに、サーバ間で処理負荷を平滑化する。
【解決手段】サーバは、等確率サーバ選択機能を備えたクライアント端末からの処理要求を受け、該サーバは、処理要求のメッセージが、オリジナルメッセージであるか、リダイレクトメッセージであるかを判別し、オリジナルメッセージの場合、受付率で受け入れ、オリジナル要求キュー格納する。受け入れなかったオリジナルメッセージはリダイレクトすし、リダイレクトメッセージをリダイレクト要求キューに格納する。また、サーバは、オリジナル要求キューとリダイレクト要求キューに格納された処理要求のメッセージを動的にリダイレクトする。
【選択図】図3
An object of the present invention is to smooth the processing load between servers without introducing a distribution node between the server and the client, and without directly reporting the load status to other servers.
A server receives a processing request from a client terminal having an equiprobable server selection function, and the server determines whether the processing request message is an original message or a redirect message, and the original In the case of a message, it is accepted at the acceptance rate and stored in the original request queue. The original message that is not accepted is redirected, and the redirect message is stored in the redirect request queue. In addition, the server dynamically redirects processing request messages stored in the original request queue and the redirect request queue.
[Selection] Figure 3

Description

本発明は、複数のサーバが分散して、コンテンツを多数のクライアントに提供(送信)するときに、負荷情報を共有することなくサーバ間で処理負荷を平滑化するサーバ、該サーバを備えるシステムおよびその方法に関する。   The present invention provides a server that smoothes a processing load between servers without sharing load information when a plurality of servers are distributed and content is provided (transmitted) to a large number of clients, and a system including the server It relates to that method.

WEBサーバ間で処理負荷を平滑する手法は、数多く提案されている。例えば、特許文献1は、複数のサーバへ負荷を分散するときに振分けノードをWEBサーバの前段に配置し、サーバの負荷状況に応じてコンテンツ要求を振り分ける。特許文献1ではWEBサーバの他に振分けノードが必須となる。   Many techniques for smoothing the processing load between WEB servers have been proposed. For example, in Patent Document 1, when distributing a load to a plurality of servers, a distribution node is arranged in front of the WEB server, and content requests are distributed according to the load status of the server. In Patent Document 1, a distribution node is essential in addition to the WEB server.

また、特許文献2は、負荷の小さいWEBサーバに負荷を分散させることができるWEBサーバシステムおよび負荷分散方法を開示し、特許文献3は、コンテンツデータを記録するためのコンテンツ記録手段の空き記録容量が大きいノード装置に対して保存を指示する保存指示装置を開示する。特許文献2および特許文献3は、WEBサーバ間あるいはファイル保存ノード間で負荷状況あるいはストレージ空き状況を送受するメッセージ交換機能が必須となる。   Patent Document 2 discloses a WEB server system and a load distribution method capable of distributing a load to a WEB server with a small load, and Patent Document 3 discloses a free recording capacity of a content recording unit for recording content data. Disclosed is a storage instruction device that instructs a node device having a large storage to store. In Patent Document 2 and Patent Document 3, a message exchange function for transmitting and receiving a load status or a storage free status between WEB servers or between file storage nodes is essential.

特許文献4は、WEBサーバの負荷状況にあわあせてWEBサーバあるいはキャッシュサーバの接続先を切り替える方法を開示する。WEBサーバおよびキャッシュサーバは階層構造を構成し、ツリーの節に当たるノード間で負荷状況を交換し、クライアントが接続するWEBサーバあるいはキャッシュサーバを切り替える。   Patent Document 4 discloses a method of switching the connection destination of a WEB server or a cache server in accordance with the load status of the WEB server. The WEB server and the cache server form a hierarchical structure, and the load status is exchanged between nodes corresponding to the nodes of the tree, and the WEB server or the cache server to which the client is connected is switched.

特開2008−40718号公報Japanese Patent Laid-Open No. 2008-40718 特開2009−237835号公報JP 2009-237835 A 特開2010−67073号公報JP 2010-67073 A 特開2009−237637号公報JP 2009-237637 A

しかしながら、上述の従来技術では、負荷分散ノードあるいはWEB(キャッシュ)サーバ間で負荷状況を直接通知し合い負荷分散処理を行う。よって、構成が複雑になる。   However, in the above-described conventional technology, the load status is directly notified between the load balancing nodes or WEB (cache) servers and the load balancing processing is performed. Therefore, the configuration becomes complicated.

特許文献1では、振分けノードを用いるため、単一障害点を解消するためには振分けノードの冗長構成が必須となり、振分けノードを導入することによる複雑さが増す。さらに、サーバが障害で停止すれば、振分けノードはすぐさま振り分け候補から当該サーバを削除しなければならず、振分けノードはWEBサーバの稼働性確認を常時行わなければならない。   In Patent Document 1, since a distribution node is used, in order to eliminate a single point of failure, a redundant configuration of the distribution node is essential, and the complexity of introducing the distribution node increases. Furthermore, if the server stops due to a failure, the distribution node must immediately delete the server from the distribution candidates, and the distribution node must always check the operability of the WEB server.

特許文献2、3および4は、サーバ間の負荷状況を通知し合うために、互いにWEBサーバ間を関連付ける機能が不可欠になる。サーバの稼働状況監視と負荷状況通知の関連付けが密接に動作しなければならず、システム全体が複雑になる。   In Patent Documents 2, 3 and 4, in order to notify each other of the load status between servers, a function for associating WEB servers with each other is indispensable. The operation status monitoring of the server and the association of the load status notification must work closely, and the entire system becomes complicated.

また、サーバ負荷の分散に、インターネットで常套手段となっているDNS(Domain Name
System)の負荷分散を用いる場合には、上記特許文献はサーバ間で適切に負荷を分散できない欠点がある。例えば、DNSの負荷分散では、WEBサーバN台に均等に要求を分散するため、WEBサーバの処理性能が均一でない場合には、負荷に偏りが生じる。
In addition, DNS (Domain Name), which is a common means on the Internet, is used to distribute server load.
In the case of using System) load balancing, the above-mentioned patent document has a drawback that the load cannot be appropriately distributed among servers. For example, in the DNS load distribution, requests are distributed evenly to N WEB servers. Therefore, when the processing performance of the WEB server is not uniform, the load is biased.

なお、DNSの負荷分散では、クライアントがサーバへ接続する前にWEBサーバ名からIPアドレスを得る名前解決を、DNSを用いて行う。DNSは同一WEBサーバ名に複数のIPアドレスを対応付け、対応づく全てのIPアドレスをクライアントへ応答することができる。複数のIPアドレスの通知を受けたクライアントは、多くの場合、等確率で一つのIPアドレスを選択しWEBサーバへ接続する。このDNSとクライアントの動作は、WEBサービスに特化したものではなく、インターネットの多様なサービスで用いられている。   In the DNS load distribution, the DNS performs name resolution to obtain an IP address from the WEB server name before the client connects to the server. The DNS can associate a plurality of IP addresses with the same WEB server name, and can respond to all the corresponding IP addresses to the client. In many cases, a client that has received notification of a plurality of IP addresses selects one IP address with equal probability and connects to the WEB server. The operations of the DNS and the client are not specific to the WEB service, but are used in various services on the Internet.

したがって、本発明は、サーバとクライアントの間には振分けノードを導入せず、かつサーバは負荷状況を他のサーバと直接通知し合わずに、複数のサーバが分散して、コンテンツを多数のクライアントに提供するときに、サーバ間で処理負荷を平滑化するサーバ、該サーバを備えるシステムおよびその方法を提供することを目的とする。   Therefore, the present invention does not introduce a distribution node between the server and the client, and the server does not directly notify the load status with other servers, so that a plurality of servers are distributed and contents are distributed to many clients. An object of the present invention is to provide a server that smoothes the processing load between servers, a system including the server, and a method thereof.

上記目的を実現するため処理要求の負荷を平滑化するサーバは、等確率サーバ選択機能を備えたクライアント端末からの処理要求の負荷を平滑化するサーバであって、前記処理要求のメッセージが、リダイレクトされていないオリジナルメッセージであるか、リダイレクトされたリダイレクトメッセージであるかを判別する判別手段と、前記オリジナルメッセージを受付率で受け入れ、受け入れなかった前記オリジナルメッセージをリダイレクトするオリジナル受入手段と、受け入れられたオリジナルメッセージを格納するオリジナル要求キューと、前記リダイレクトメッセージを格納するリダイレクト要求キューと、前記オリジナル要求キューと前記リダイレクト要求キューに格納された処理要求のメッセージを動的にリダイレクトする動的リダイレクト手段とを備える。   The server that smoothes the processing request load to achieve the above object is a server that smoothes the processing request load from the client terminal having the equiprobable server selection function, and the processing request message is redirected. A determination means for determining whether the original message is a redirected message or a redirected redirect message; an original acceptance means for accepting the original message at a reception rate and redirecting the original message that was not accepted; An original request queue for storing an original message, a redirect request queue for storing the redirect message, and a process for dynamically redirecting messages of processing requests stored in the original request queue and the redirect request queue And a redirection means.

また、前記動的リダイレクト手段は、リダイレクトレートに基づく時間間隔で動作することも好ましい。   The dynamic redirect means preferably operates at time intervals based on a redirect rate.

また、前記オリジナルメッセージ受付率および前記リダイレクトレートは、該サーバのリダイレクトメッセージ送信数および他のサーバからのリダイレクトメッセージ受信数に基づいて、一定時間毎に更新されることも好ましい。   The original message acceptance rate and the redirect rate are preferably updated at regular intervals based on the number of redirect messages transmitted by the server and the number of redirect messages received from other servers.

また、前記オリジナルメッセージ受付率は、該サーバの隣接サーバを求め、該隣接サーバからのリダイレクトメッセージ受信数の増加分に、該サーバのリダイレクトメッセージ送信数を全サーバ数で除算した数を加え、受付バイアスを加えることにより、要求数インデックスを算出し、該要求数インデックスに受付ファクターを掛け、この結果が0以上最大受付率未満である場合、この結果をオリジナルメッセージ受付率とし、0未満の場合は0を、最大受付率以上の場合は最大受付率を、オリジナルメッセージ受付率とすることで算出し、前記リダイレクトレートは、前記要求数インデックスが負の場合、該要求数インデックスにリダイレクト応答ファクターおよび−1を掛け、この結果が前記時間間隔の逆数以上である時、この結果をリダイレクトレートとし、前記要求数インデックスが非負、または前記結果が前記時間間隔の逆数より小さい場合、前記時間間隔の逆数をリダイレクトレートとして算出することも好ましい。   The original message acceptance rate is obtained by obtaining an adjacent server of the server, and adding the number of redirect message transmissions from the adjacent server divided by the number of redirect message transmissions of the server divided by the total number of servers. By applying a bias, a request number index is calculated, and the request number index is multiplied by an acceptance factor. If this result is 0 or more and less than the maximum acceptance rate, this result is regarded as the original message acceptance rate. 0 is calculated by setting the maximum acceptance rate as the original message acceptance rate when the maximum acceptance rate is equal to or greater than the maximum acceptance rate, and when the request number index is negative, the redirect rate includes a redirect response factor and − Multiply by 1 and when this result is greater than or equal to the reciprocal of the time interval, And Irekutoreto, the request index number if non-negative or the result is less than the inverse of the time interval, it is also preferable to calculate the reciprocal of the time interval as a redirect rate.

また、処理要求メッセージを処理するサービス処理手段をさらに備え、前記動的リダイレクト手段は、前記オリジナル要求キューに処理要求メッセージが格納されている場合、前記オリジナル要求キューの処理要求メッセージを優先してリダイレクトし、前記サービス処理手段は、前記リダイレクト要求キューにメッセージが格納されている場合、前記リダイレクト要求キューのメッセージを優先して処理することも好ましい。   In addition, service processing means for processing a processing request message is further provided, and the dynamic redirecting means redirects the processing request message in the original request queue with priority when the processing request message is stored in the original request queue. Preferably, the service processing means preferentially processes the message in the redirect request queue when the message is stored in the redirect request queue.

上記目的を実現するため処理要求の負荷を平滑化するクライアント・サーバシステムは、等確率サーバ選択機能を備えたクライアント端末と、前記クライアント端末からの処理要求メッセージが、リダイレクトされていないオリジナルメッセージであるか、リダイレクトされたリダイレクトメッセージであるかを判別する判別手段と、前記オリジナルメッセージを受付率で受け入れ、受け入れなかった前記オリジナルメッセージをリダイレクトするオリジナル受入手段と、受け入れられたオリジナルメッセージを格納するオリジナル要求キューと、前記リダイレクトメッセージを格納するリダイレクト要求キューと、前記オリジナル要求キューと前記リダイレクト要求キューに格納された処理要求メッセージを動的にリダイレクトする動的リダイレクト手段とを備えるサーバとを備える。   A client / server system that smoothes the load of processing requests to achieve the above object is a client terminal having an equiprobable server selection function and a processing request message from the client terminal is an original message that is not redirected. Determining means for determining whether the message is a redirected redirect message, an original acceptance means for accepting the original message at a reception rate and redirecting the original message that was not accepted, and an original request for storing the accepted original message A queue, a redirect request queue for storing the redirect message, and a dynamic request for dynamically redirecting the processing request messages stored in the original request queue and the redirect request queue. And a server and a Irekuto means.

上記目的を実現するため処理要求の負荷を平滑化する方法は、等確率サーバ選択機能を備えたクライアント端末からの処理要求の負荷を平滑化する方法であって、前記処理要求のメッセージが、リダイレクトされていないオリジナルメッセージであるか、リダイレクトされたリダイレクトメッセージであるかを判別する判別ステップと、前記オリジナルメッセージを受付率で受け入れ、受け入れなかった前記オリジナルメッセージをリダイレクトするオリジナル受入ステップと、受け入れられたオリジナルメッセージをオリジナル要求キューに格納するステップと、前記リダイレクトメッセージをリダイレクト要求キューに格納するステップと、前記オリジナル要求キューと前記リダイレクト要求キューに格納された処理要求のメッセージを動的にリダイレクトする動的リダイレクトステップとを有する。   A method of smoothing a processing request load to achieve the above object is a method of smoothing a processing request load from a client terminal having an equiprobable server selection function, wherein the processing request message is redirected A determination step for determining whether the message is an original message that has not been redirected or a redirected redirect message; an original acceptance step for accepting the original message at a reception rate and redirecting the original message that has not been accepted; Storing an original message in an original request queue; storing the redirect message in a redirect request queue; and processing request messages stored in the original request queue and the redirect request queue. Manner and a dynamic redirection step to redirecting.

上記本発明は、サーバのコンテンツ要求のリダイレクトを用いることにより、サーバとクライアントの間には振分けノードを導入することなく、さらにサーバは負荷状況を他のサーバと直接通知し合わずに、サーバ間で処理負荷を平滑化することが可能になる。   The above-described present invention uses server content request redirection, so that a distribution node is not introduced between the server and the client, and the server does not notify the load status directly with other servers. Thus, it is possible to smooth the processing load.

クライアント端末によるコンテンツ要求の等確率分散を示す。The equal probability distribution of content requests by client terminals is shown. クライアント端末によるリダイレクトメッセージの等確率分散を示す。The equal probability distribution of the redirect message by the client terminal is shown. 本発明のWEBサーバの構成を示す。The structure of the WEB server of this invention is shown. 本発明のWEBサーバによるコンテンツ要求メッセージ受け入れ処理フローを示す。The flow of content request message acceptance processing by the WEB server of the present invention is shown. 本発明のWEBサーバによるキュー内メッセージリダイレクト処理フローを示す。4 shows a message redirection process flow in a queue by the WEB server of the present invention.

本発明を実施するための最良の実施形態について、以下では図面を用いて詳細に説明する。本実施形態では、全ての複数WEBサーバが同一コンテンツの提供を可能とし、複数のクライアントがコンテンツを要求する状況を想定する。また、WEBサーバが提供するWEBコンテンツには静的なページのみが用いられ、同WEBコンテンツはサーバの背後にあるデータベースから取得される。   The best mode for carrying out the present invention will be described in detail below with reference to the drawings. In the present embodiment, it is assumed that all the plurality of WEB servers can provide the same content and a plurality of clients request the content. Also, only static pages are used for WEB content provided by the WEB server, and the WEB content is acquired from a database behind the server.

また、WEBサーバとクライアント端末の間には振分けノードを導入せず、処理要求の分散にはクライアントの等確率サーバ選択を用いる。図1は、クライアント端末によるコンテンツ要求の等確率分散を示す。   In addition, a distribution node is not introduced between the WEB server and the client terminal, and the equiprobable server selection of the client is used for distributing processing requests. FIG. 1 shows equal probability distribution of content requests by client terminals.

背景技術に記載されたように、クライアント端末にはDNSを用いた等確率サーバ選択機能が設けられている。
(1)クライアント端末は、WEBサーバに接続する前に、DNSを用いてWEBサーバ名からIPアドレスへの名前解決を行う。DNSからのIPアドレスのリストがクライアント端末に応答され、クライアント端末は、サーバ数nを認識する。なお、WEBサーバの台数が変更になる場合には、DNSが扱うWEBサーバのIPアドレスが変更される。
(2)クライアント端末は、上記IPアドレスのリストから等確率1/nで一つのIPアドレスを選択し、WEBサーバへ接続する。なお、選択した一台のサーバから応答がない場合には、別のサーバを選択して、WEBコンテンツの取得を試みる。この処理により、サーバが障害で応答しない場合にも、クライアント端末が自律的に他のサーバへの接続を行うことを可能になる。
(3)クライアント端末のコンテンツ要求は、WEBサーバの処理待ちキューに格納され、キューに先に格納された要求から処理される。
As described in the background art, the client terminal is provided with an equal probability server selection function using DNS.
(1) The client terminal performs name resolution from the WEB server name to the IP address using DNS before connecting to the WEB server. A list of IP addresses from the DNS is returned to the client terminal, and the client terminal recognizes the number of servers n. When the number of WEB servers is changed, the IP address of the WEB server handled by DNS is changed.
(2) The client terminal selects one IP address with equal probability 1 / n from the list of IP addresses and connects to the WEB server. If there is no response from the selected server, another server is selected and an attempt is made to acquire WEB content. This processing enables the client terminal to autonomously connect to another server even when the server does not respond due to a failure.
(3) The content request of the client terminal is stored in the processing waiting queue of the WEB server, and is processed from the request previously stored in the queue.

本発明では、WEBサーバは負荷状況を他のサーバと直接通知し合わない。WEBサーバには、自らの処理負荷に応じて、コンテンツ要求メッセージをリダイレクトする動的リダイレクト機能が設けられる。このリダイレクトは、HTTPプロトコルで用いられるリダイレクト処理を用いることで実現される。クライアント端末は、サーバからのリダイレクトメッセージに対しても等確率でサーバを選択する。図2は、クライアント端末によるリダイレクトメッセージの等確率分散を示す。
(1)WEBサーバが、クライアント端末のコンテンツ要求メッセージをリダイレクトするときに、WEBサーバは自身のIPアドレスをメッセージに付加する。
(2)リダイレクトメッセージを受けたクライアント端末は、再度、等確率でWEBサーバを選択し、選択されたサーバへリダイレクトコンテンツ要求を送信する。なお、この時、再び同じWEBサーバが選択されることがある。
In the present invention, the WEB server does not directly notify the load status with other servers. The WEB server is provided with a dynamic redirect function for redirecting a content request message according to its processing load. This redirection is realized by using a redirection process used in the HTTP protocol. The client terminal selects the server with equal probability even for the redirect message from the server. FIG. 2 shows equal probability distribution of redirect messages by client terminals.
(1) When the WEB server redirects the content request message of the client terminal, the WEB server adds its own IP address to the message.
(2) The client terminal that has received the redirect message again selects the WEB server with equal probability and transmits a redirect content request to the selected server. At this time, the same WEB server may be selected again.

図3は、本発明のWEBサーバの構成を示す。本WEBサーバは、判別部1、オリジナル受入部2、リダイレクト要求キュー3、オリジナル要求キュー4、動的リダイレクト部5およびサービス処理部6を備えている。   FIG. 3 shows the configuration of the WEB server of the present invention. The WEB server includes a determination unit 1, an original reception unit 2, a redirect request queue 3, an original request queue 4, a dynamic redirect unit 5, and a service processing unit 6.

判別部1は、コンテンツ要求がオリジナル(未リダイレクト)か、リダイレクトされたかを判別する。オリジナル受入部2は、オリジナルメッセージを受付率rでメッセージを受け入れ、受け入れなかったオリジナルメッセージをリダイレクトする。リダイレクト要求キュー3は、リダイレクトメッセージを格納し、オリジナル要求キュー4は、オリジナルメッセージを格納する。動的リダイレクト部5は、リダイレクト要求キュー3およびオリジナル要求キュー4に格納されたメッセージを動的にリダイレクトする手段である。サービス処理部6は、クライアント端末からの処理要求を処理する。 The determination unit 1 determines whether the content request is original (not redirected) or redirected. Original receiving portion 2, accept the message the original message at the reception rate r t, to redirect did not accept the original message. The redirect request queue 3 stores redirect messages, and the original request queue 4 stores original messages. The dynamic redirect unit 5 is means for dynamically redirecting messages stored in the redirect request queue 3 and the original request queue 4. The service processing unit 6 processes a processing request from a client terminal.

図4は、本発明のWEBサーバによるコンテンツ要求メッセージ受け入れ処理フローを示す。本処理フローにより、WEBサーバの受け入れ処理を説明する。
(S41)処理要求メッセージが到着すると、まずリダイレクトメッセージかどうかを検査する。リダイレクトメッセージの場合、無条件に受け入れるため、S45に進む。オリジナルメッセージの場合、S42に進む。
(S42)オリジナルメッセージを受付率rでメッセージを受け入れる。メッセージを受け入れるとき、S44に進む。受け入れないとき、S43に進む。
(S43)オリジナルメッセージをリダイレクトする。この際、サーバのIPアドレスを格納したメッセージをクライアントへ応答する。また、リダイレクト回数を更新する。
(S44)オリジナルメッセージをオリジナル要求キューへ格納する。この際、オリジナルメッセージ到着数を更新する。
(S45)リダイレクトメッセージをリダイレクト要求キューへ格納する。この際、リダイレクト元サーバを区別することができるように、サーバ毎のリダイレクトメッセージ到着数を更新する。
FIG. 4 shows a content request message acceptance processing flow by the WEB server of the present invention. The processing of accepting a WEB server will be described with this processing flow.
(S41) When the processing request message arrives, it is first checked whether it is a redirect message. In the case of a redirect message, the process proceeds to S45 in order to accept it unconditionally. In the case of an original message, the process proceeds to S42.
(S42) accept the message the original message at the reception rate r t. When accepting the message, the process proceeds to S44. If not accepted, the process proceeds to S43.
(S43) The original message is redirected. At this time, a message storing the server IP address is returned to the client. Also, the number of redirects is updated.
(S44) The original message is stored in the original request queue. At this time, the number of original message arrivals is updated.
(S45) Store the redirect message in the redirect request queue. At this time, the number of redirect message arrivals for each server is updated so that the redirect source server can be distinguished.

また、WEBサーバは、上記処理S41からS45とは独立にキュー内メッセージを、リダイレクトレートqでリダイレクトする。図5は、本発明のWEBサーバによるキュー内メッセージリダイレクト処理フローを示す。本処理フローにより、WEBサーバのリダイレクト処理を説明する。 Further, WEB server, a queue message independently of S45 from the processing S41, the redirect redirect rate q t. FIG. 5 shows an in-queue message redirection processing flow by the WEB server of the present invention. With this processing flow, the redirect processing of the WEB server will be described.

(S51)本リダイレクト処理は、リダイレクトレートqに対して、時間間隔1/qで処理をループする。なお、qが0のときは、リダイレクト時間間隔をI(パラメータ更新間隔)とする。処理時刻になった場合、S52に進む。
(S52)キュー内メッセージリダイレクト処理を行う。この時、オリジナル要求メッセージが格納される場合、オリジナル要求メッセージをリダイレクトし、オリジナル要求メッセージが格納されない場合、リダイレクトメッセージをリダイレクトし、リダイレクト回数を1増加させる。
(S53)次の処理時刻を更新する。
(S51) This redirect process loops over the redirect rate q t at a time interval 1 / q t . When q t is 0, the redirect time interval is I (parameter update interval). When the processing time comes, the process proceeds to S52.
(S52) In-queue message redirection processing is performed. At this time, when the original request message is stored, the original request message is redirected. When the original request message is not stored, the redirect message is redirected and the number of redirects is incremented by one.
(S53) The next processing time is updated.

また、WEBサーバは、上記処理S41からS45およびS51からS53とは独立に、サービス処理(図3)を行う。この際、WEBサーバは、リダイレクト要求キューの要求を優先して処理し、リダイレクト要求キューにメッセージが格納されていない場合にはオリジナルメッセージを処理する。サービス処理を行った場合、処理済み数を更新する。   Further, the WEB server performs a service process (FIG. 3) independently of the processes S41 to S45 and S51 to S53. At this time, the WEB server preferentially processes the request in the redirect request queue, and processes the original message when the message is not stored in the redirect request queue. When service processing is performed, the processed number is updated.

また、WEBサーバは、パラメータ更新間隔Iの時間が経過するごとに、オリジナルメッセージ受付率r、およびキュー内メッセージリダイレクトレートqを次のように更新する。 The WEB server updates the original message reception rate r t and the in-queue message redirection rate q t as follows each time the parameter update interval I elapses.

(1)前更新から現在までにリダイレクトメッセージを送信してきた隣接サーバを、リダイレクトメッセージに格納されたIPアドレスにより特定する。これらの隣接サーバをサーバのIPアドレスを基に数直線に並べる。ここで、本WEBサーバの前後のサーバをSprev,Snextとする。なお、本WEBサーバが最小IPアドレスもしくは最大IPアドレスである場合、数直線が環状になっているものとし、隣接サーバを最大IPアドレスもしくは最小IPアドレスのサーバと読み替える。また、リダイレクトメッセージを送ってきたサーバ数Nを控える。
(2)SprevおよびSnextの前周期のリダイレクトメッセージ受信数と今周期のリダイレクトメッセージ受信数の差分をgprev,gnextとする。この差分の計算では、今周期のリダイレクト数から前周期のリダイレクト数を減算する。
(3)本WEBサーバからのリダイレクトメッセージ送信数をgoutとする。
(4)まず、要求数インデックスu=gprev+gnext−gout/N+Aを求める。なお、A(非負の数)は、受付バイアスとしてサーバ管理者によって与えられる。
(5)もしuが正なら、r=αuとして受付率を求める。ここでr>Rであった場合、r=Rとする。つまり、0≦r<Rとする。
もしuが非正なら、r=0とする。なお、α(正の数)は、受付ファクターとしてサーバ管理者によって与えられる。R(R<1)も、最大受付率として、サーバ管理者によって与えられる。
(6)今週期のリダイレクトメッセージ受信数を前周期のリダイレクトメッセージ受信数として保存する。
(7)もしuが負なら、キュー内メッセージリダイレクトレートをq=−βuとして求める。もしuが非負もしくは1/I>qの場合はq=1/Iとし、1/I≦qとする(最小周期Iでリダイレクトを実施するため)。なお、β(正の値)は、リダイレクト応答ファクターとして、サーバ管理者によって与えられる。
(8)今周期のサーバ毎のリダイレクトメッセージ受信数、本WEBサーバのリダイレクトメッセージ受信数をリセット(ゼロに)する。
(1) The adjacent server that has transmitted the redirect message from the previous update to the present is identified by the IP address stored in the redirect message. These adjacent servers are arranged in a number line based on the IP address of the server. Here, the front and back of the server of the WEB server S prev, and S next. When the WEB server has the minimum IP address or the maximum IP address, the number line is assumed to be circular, and the adjacent server is read as the server with the maximum IP address or the minimum IP address. Also, refrain from the number N of servers that have sent redirect messages.
(2) Let g prev and g next be the difference between the number of redirect messages received in the previous cycle of S prev and S next and the number of redirect messages received in the current cycle. In calculating this difference, the number of redirects in the previous period is subtracted from the number of redirects in the current period.
(3) Let g out be the number of redirect message transmissions from this WEB server.
(4) First, the request number index u t = g prev + g next −g out / N + A is obtained. A (non-negative number) is given by the server administrator as an acceptance bias.
(5) If u t is, if positive, seek the acceptance rate as r t = αu t. Here, if r t > R m , r t = R m is set. That, and 0 ≦ r t <R m.
If u t is non-positive, let r t = 0. Α (positive number) is given by the server administrator as a reception factor. R m (R m <1) is also given by the server administrator as the maximum acceptance rate.
(6) Store the number of redirect messages received this week as the number of redirect messages received in the previous period.
(7) If u t is negative, determine the in-queue message redirect rate as q t = −βu t . If u t is non-negative or 1 / I> q t , q t = 1 / I and 1 / I ≦ q t (to perform redirection with the minimum period I). Note that β (positive value) is given by the server administrator as a redirect response factor.
(8) Reset (return to zero) the number of redirect messages received for each server in this cycle and the number of redirect messages received by this WEB server.

以上のように、本発明は、コンテンツ要求のリダイレクトを、サーバ間の負荷状況の情報交換と位置付けて、リダイレクトメッセージの送受信数に基づいてWEBサーバのオリジナルメッセージ受付率r、およびキュー内メッセージリダイレクトレートqを更新する。 As described above, according to the present invention, redirection of a content request is positioned as information exchange of load status between servers, and the original message acceptance rate r t of the WEB server and in-queue message redirection based on the number of redirect messages transmitted and received. to update the rate q t.

このため、WEBサーバの処理性能が異なる場合には、処理待ちキューの格納数に違いが現れ、処理性能が低いサーバの処理待ち数は多くなり易い。このときは、goutが増大してリダイレクトが増えるため、さらなる処理待ち数の増大を抑制する。また、格納数が多いにも関わらず、オリジナルメッセージの到着が減少すれば、処理待ちキューから要求待ちをリダイレクトして、処理待ち数を削減する。パラメータβを大きくすることで、処理待ち数削減の応答性能を高めることが可能である。 For this reason, when the processing performance of the WEB server is different, a difference appears in the number of stored processing queues, and the processing waiting number of a server with low processing performance tends to increase. At this time, since g out increases and redirects increase, further increase in the number of waiting processes is suppressed. Also, if the arrival of original messages decreases despite the large number of stored messages, the waiting for requests is redirected from the queue for processing to reduce the number of queues for processing. By increasing the parameter β, it is possible to improve the response performance for reducing the number of processing waits.

本発明は、リダイレクトメッセージを全て受け入れるため、処理待ち数が隣接サーバより少なくなった場合の処理待ち数増大化は、迅速に行うことが可能である。さらに、オリジナルメッセージの受付率を高くする(パラメータαを大きくする)ことでより早く増大化できる。   Since the present invention accepts all redirect messages, it is possible to quickly increase the number of processing waits when the number of processing waits is smaller than that of the adjacent server. Furthermore, it can be increased more quickly by increasing the acceptance rate of the original message (increasing the parameter α).

受付バイアスAは受付率の増減およびリダイレクトレートの減増へ影響し、キュー長の大小へ影響する。Aを大きくすればキュー長は長くなる。   The acceptance bias A affects the increase / decrease of the acceptance rate and the decrease / increase of the redirect rate, and affects the size of the queue length. If A is increased, the queue length becomes longer.

本発明ではリダイレクトメッセージをWEBサーバが受けることで他のWEBサーバのキュー長を見積もることができる。最大受付率Rを1より小さくすることで、オリジナルメッセージをあるレベルでリダイレクトすることができ、方式の精度を維持することが可能である。 In the present invention, when a WEB server receives a redirect message, the queue length of another WEB server can be estimated. The maximum reception rate R m to be smaller than 1, it is possible to redirect levels in the original message, it is possible to maintain the accuracy of methods.

なお、上記で、サーバはWEBサーバであり、クライアント端末はWEBサーバからコンテンツを要求する形態で本発明の実施形態が説明されてきた。しかしながら、本発明は、WEBサービスに特化したものではなく、クライアント端末がDNS等を用いた等確率サーバ選択機能と要求のリダイレクトに対しても再度サーバを等確率で選択するを備え、複数のサーバが同一のサービスを提供できるシステムであれば、WEBサービス以外の他のサービスにも適用可能である。   In the above description, the embodiment of the present invention has been described in the form where the server is a WEB server and the client terminal requests content from the WEB server. However, the present invention is not specialized for the WEB service, and the client terminal includes an equiprobable server selection function using DNS and the like, and selects a server again with an equal probability for request redirection. If the server can provide the same service, it can be applied to other services other than the WEB service.

また、以上述べた実施形態は全て本発明を例示的に示すものであって限定的に示すものではなく、本発明は他の種々の変形態様および変更態様で実施することができる。従って本発明の範囲は特許請求の範囲およびその均等範囲によってのみ規定されるものである。   Moreover, all the embodiments described above are illustrative of the present invention and are not intended to limit the present invention, and the present invention can be implemented in other various modifications and changes. Therefore, the scope of the present invention is defined only by the claims and their equivalents.

1 判別部
2 オリジナル受入部
3 リダイレクト要求キュー
4 オリジナル要求キュー
5 動的リダイレクト部
6 サービス処理部
DESCRIPTION OF SYMBOLS 1 Discriminating part 2 Original acceptance part 3 Redirect request queue 4 Original request queue 5 Dynamic redirect part 6 Service processing part

Claims (7)

等確率サーバ選択機能を備えたクライアント端末からの処理要求の負荷を平滑化するサーバであって、
前記処理要求のメッセージが、リダイレクトされていないオリジナルメッセージであるか、リダイレクトされたリダイレクトメッセージであるかを判別する判別手段と、
前記オリジナルメッセージを受付率で受け入れ、受け入れなかった前記オリジナルメッセージをリダイレクトするオリジナル受入手段と、
受け入れられたオリジナルメッセージを格納するオリジナル要求キューと、
前記リダイレクトメッセージを格納するリダイレクト要求キューと、
前記オリジナル要求キューと前記リダイレクト要求キューに格納された処理要求のメッセージを動的にリダイレクトする動的リダイレクト手段と
を備えることを特徴とするサーバ。
A server that smoothes the load of a processing request from a client terminal having an equal probability server selection function,
Determining means for determining whether the message of the processing request is an original message not redirected or a redirected redirect message;
An original receiving means for accepting the original message at an acceptance rate and redirecting the original message that was not accepted;
An original request queue to store accepted original messages;
A redirect request queue for storing the redirect message;
A server comprising: the original request queue; and dynamic redirect means for dynamically redirecting a message of a processing request stored in the redirect request queue.
前記動的リダイレクト手段は、リダイレクトレートに基づく時間間隔で動作することを特徴とする請求項1に記載のサーバ。   The server according to claim 1, wherein the dynamic redirect unit operates at time intervals based on a redirect rate. 前記オリジナルメッセージ受付率および前記リダイレクトレートは、該サーバのリダイレクトメッセージ送信数および他のサーバからのリダイレクトメッセージ受信数に基づいて、一定時間毎に更新されることを特徴とする請求項2に記載のサーバ。   The original message acceptance rate and the redirect rate are updated at regular intervals based on the number of redirect messages transmitted by the server and the number of redirect messages received from other servers. server. 前記オリジナルメッセージ受付率は、
該サーバの隣接サーバを求め、該隣接サーバからのリダイレクトメッセージ受信数の増加分に、該サーバのリダイレクトメッセージ送信数を全サーバ数で除算した数を加え、受付バイアスを加えることにより、要求数インデックスを算出し、該要求数インデックスに受付ファクターを掛け、この結果が0以上最大受付率未満である場合、この結果をオリジナルメッセージ受付率とし、0未満の場合は0を、最大受付率以上の場合は最大受付率を、オリジナルメッセージ受付率とすることで算出し、
前記リダイレクトレートは、
前記要求数インデックスが負の場合、該要求数インデックスにリダイレクト応答ファクターおよび−1を掛け、この結果が前記時間間隔の逆数以上である時、この結果をリダイレクトレートとし、前記要求数インデックスが非負、または前記結果が前記時間間隔の逆数より小さい場合、前記時間間隔の逆数をリダイレクトレートとして算出することを特徴とする請求項3に記載のサーバ。
The original message acceptance rate is
A request number index is obtained by obtaining an adjacent server of the server, adding a number obtained by dividing the number of redirect message transmissions of the server by the total number of servers to the increase in the number of redirect message receptions from the adjacent server, and adding an acceptance bias. When the request number index is multiplied by the acceptance factor, and this result is 0 or more and less than the maximum acceptance rate, this result is taken as the original message acceptance rate. Calculates the maximum acceptance rate as the original message acceptance rate,
The redirect rate is
When the request number index is negative, the request number index is multiplied by a redirect response factor and −1. When the result is equal to or larger than the reciprocal of the time interval, the result is set as a redirect rate, and the request number index is non-negative. The server according to claim 3, wherein when the result is smaller than the reciprocal of the time interval, the reciprocal of the time interval is calculated as a redirect rate.
処理要求メッセージを処理するサービス処理手段をさらに備え、
前記動的リダイレクト手段は、前記オリジナル要求キューに処理要求メッセージが格納されている場合、前記オリジナル要求キューの処理要求メッセージを優先してリダイレクトし、
前記サービス処理手段は、前記リダイレクト要求キューにメッセージが格納されている場合、前記リダイレクト要求キューのメッセージを優先して処理することを特徴とする請求項1から4のいずれか1項に記載のサーバ。
Service processing means for processing the processing request message is further provided,
The dynamic redirect means preferentially redirects the processing request message of the original request queue when the processing request message is stored in the original request queue,
5. The server according to claim 1, wherein, when a message is stored in the redirect request queue, the service processing unit preferentially processes the message in the redirect request queue. 6. .
等確率サーバ選択機能を備えたクライアント端末と、
前記クライアント端末からの処理要求メッセージが、リダイレクトされていないオリジナルメッセージであるか、リダイレクトされたリダイレクトメッセージであるかを判別する判別手段と、
前記オリジナルメッセージを受付率で受け入れ、受け入れなかった前記オリジナルメッセージをリダイレクトするオリジナル受入手段と、
受け入れられたオリジナルメッセージを格納するオリジナル要求キューと、
前記リダイレクトメッセージを格納するリダイレクト要求キューと、
前記オリジナル要求キューと前記リダイレクト要求キューに格納された処理要求メッセージを動的にリダイレクトする動的リダイレクト手段と
を備えるサーバと
を備えることを特徴とするクライアント・サーバシステム。
A client terminal having an equal probability server selection function;
Determining means for determining whether the processing request message from the client terminal is an unredirected original message or a redirected redirect message;
An original receiving means for accepting the original message at an acceptance rate and redirecting the original message that was not accepted;
An original request queue to store accepted original messages;
A redirect request queue for storing the redirect message;
A client / server system comprising: a server comprising: the original request queue; and a dynamic redirection means for dynamically redirecting a processing request message stored in the redirect request queue.
等確率サーバ選択機能を備えたクライアント端末からの処理要求の負荷を平滑化する方法であって、
前記処理要求のメッセージが、リダイレクトされていないオリジナルメッセージであるか、リダイレクトされたリダイレクトメッセージであるかを判別する判別ステップと、
前記オリジナルメッセージを受付率で受け入れ、受け入れなかった前記オリジナルメッセージをリダイレクトするオリジナル受入ステップと、
受け入れられたオリジナルメッセージをオリジナル要求キューに格納するステップと、
前記リダイレクトメッセージをリダイレクト要求キューに格納するステップと、
前記オリジナル要求キュー前記とリダイレクト要求キューに格納された処理要求のメッセージを動的にリダイレクトする動的リダイレクトステップと
を有することを特徴とする方法。
A method of smoothing a load of a processing request from a client terminal having an equal probability server selection function,
A determining step of determining whether the message of the processing request is an original message that has not been redirected or a redirected redirect message;
An original acceptance step of accepting the original message at an acceptance rate and redirecting the original message that was not accepted;
Storing the accepted original message in the original request queue;
Storing the redirect message in a redirect request queue;
A dynamic redirection step for dynamically redirecting said original request queue and a message of a processing request stored in the redirect request queue.
JP2011118794A 2011-05-27 2011-05-27 Load information unshared type load leveling server, system with the server, and method thereof Withdrawn JP2012247971A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011118794A JP2012247971A (en) 2011-05-27 2011-05-27 Load information unshared type load leveling server, system with the server, and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011118794A JP2012247971A (en) 2011-05-27 2011-05-27 Load information unshared type load leveling server, system with the server, and method thereof

Publications (1)

Publication Number Publication Date
JP2012247971A true JP2012247971A (en) 2012-12-13

Family

ID=47468362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011118794A Withdrawn JP2012247971A (en) 2011-05-27 2011-05-27 Load information unshared type load leveling server, system with the server, and method thereof

Country Status (1)

Country Link
JP (1) JP2012247971A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013092867A (en) * 2011-10-25 2013-05-16 Nippon Telegr & Teleph Corp <Ntt> Service provision system, file update method and distribution management device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013092867A (en) * 2011-10-25 2013-05-16 Nippon Telegr & Teleph Corp <Ntt> Service provision system, file update method and distribution management device

Similar Documents

Publication Publication Date Title
US10567303B2 (en) System and method for routing service requests
US7979563B2 (en) Method and system for dynamic client/server network management using proxy servers
US20150106431A1 (en) Method and system for distributing load by redirecting traffic
US8386575B2 (en) Method of realizing uniqueness assurance and method of determining message destination
EP1762069B1 (en) Method of selecting one server out of a server set
US20190097933A1 (en) Intelligent load shedding of traffic based on current load state of target capacity
US20080235384A1 (en) Web service for coordinating actions of clients
US10536368B2 (en) Network-aware routing in information centric networking
EP4115580B1 (en) Hostname pre-localization
US12143441B2 (en) Systems and methods for server failover and load balancing
JP2012247971A (en) Load information unshared type load leveling server, system with the server, and method thereof
US20240113959A1 (en) Instance-affine service scheduling
JPWO2022251324A5 (en)
US20240056382A1 (en) Determining a best destination over a best path using multifactor path selection
US11831707B2 (en) Redirect processing for content delivery networks
JP2007219637A (en) Load balancing system and program thereof
US20250280049A1 (en) Dynamic scaling of a distributed computing system
US12294528B2 (en) Resource reservation protocol resource notification messages
Akbar et al. A comparative study on load balancing algorithms for sip servers
Yu et al. Discovering resources in an intercloud environment
US20250247335A1 (en) Resource reservation protocol resource notification messages
Manfredi et al. Optimised balancing algorithm for content delivery networks
WO2025052463A1 (en) System and method for routing a request to a network function
Kimmatkar et al. Applications sharing using binding server for distributed environment
JP2008234536A (en) Node device, forwarding node determination method and program

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130408

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130531

A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140805