[go: up one dir, main page]

JP5493575B2 - Information processing apparatus and information processing apparatus control method - Google Patents

Information processing apparatus and information processing apparatus control method Download PDF

Info

Publication number
JP5493575B2
JP5493575B2 JP2009185893A JP2009185893A JP5493575B2 JP 5493575 B2 JP5493575 B2 JP 5493575B2 JP 2009185893 A JP2009185893 A JP 2009185893A JP 2009185893 A JP2009185893 A JP 2009185893A JP 5493575 B2 JP5493575 B2 JP 5493575B2
Authority
JP
Japan
Prior art keywords
packet
crossbar
information processing
processing apparatus
crossbar switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009185893A
Other languages
Japanese (ja)
Other versions
JP2011039744A (en
Inventor
悠造 ▲高▼木
隆志 豊島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009185893A priority Critical patent/JP5493575B2/en
Priority to EP20100171928 priority patent/EP2288084B1/en
Priority to US12/805,588 priority patent/US8589614B2/en
Publication of JP2011039744A publication Critical patent/JP2011039744A/en
Application granted granted Critical
Publication of JP5493575B2 publication Critical patent/JP5493575B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/10Packet switching elements characterised by the switching fabric construction
    • H04L49/101Packet switching elements characterised by the switching fabric construction using crossbar or matrix
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/25Routing or path finding in a switch fabric

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Multi Processors (AREA)
  • Bus Control (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Use Of Switch Circuits For Exchanges And Methods Of Control Of Multiplex Exchanges (AREA)

Description

本発明は、ネットワークシステム、情報処理装置及びネットワークシステムの制御方法に関する。   The present invention relates to a network system, an information processing apparatus, and a network system control method.

計算機(又は、コンピュータ)等の情報処理装置の性能は年々向上し続けているが、半導体回路の微細化限界の到来等に伴う動作クロック周波数の上昇カーブの飽和により、CPU(Central Processing Unit)等のプロセッサの性能を向上するのには限界がある。このため、近年では複数のプロセッサを備えた並列計算機により更なる性能の向上が図られている。   The performance of information processing devices such as computers (or computers) continues to improve year by year, but due to the saturation of the rising curve of the operating clock frequency accompanying the arrival of miniaturization limits of semiconductor circuits, the CPU (Central Processing Unit), etc. There is a limit to improving the performance of these processors. For this reason, in recent years, further improvement in performance has been achieved by a parallel computer having a plurality of processors.

並列計算機の性能は、プロセッサ単体の演算速度だけでなく、プロセッサ間の通信に要する時間、即ち、通信速度にも依存する。プロセッサ単体の性能を向上するのには限界があるため、現在の状況では並列計算機の更なる性能向上を図るためにはプロセッサ間の通信速度の向上が要求される。並列計算機における通信速度は、大きく分けて2つの要素に分けることができる。一つはデータ転送時間たるレイテンシであり、もう一つはデータ転送の帯域幅たるバンド幅である。   The performance of a parallel computer depends not only on the calculation speed of a single processor but also on the time required for communication between processors, that is, the communication speed. Since there is a limit to improving the performance of a single processor, in the current situation, an improvement in communication speed between processors is required to further improve the performance of parallel computers. The communication speed in a parallel computer can be roughly divided into two elements. One is the latency that is the data transfer time, and the other is the bandwidth that is the bandwidth of the data transfer.

レイテンシは、データの通信開始から通信終了までにかかる時間であり、レイテンシが短い程通信速度は向上する。しかし、並列計算機の性能向上のために並列計算機の構造を複雑にすると、論理が複雑になり結果として使用するトランジスタの数が増大して信号遅延が発生するため、レイテンシが低下してしまう。又、レイテンシの影響は、並列計算機の規模が大きくなる程蓄積され、並列計算機システム全体の更なる性能向上を難しくしている。   The latency is the time taken from the start of data communication to the end of communication. The shorter the latency, the higher the communication speed. However, if the structure of the parallel computer is complicated in order to improve the performance of the parallel computer, the logic becomes complex, resulting in an increase in the number of transistors used and a signal delay, resulting in a decrease in latency. In addition, the influence of latency is accumulated as the scale of the parallel computer increases, making it difficult to further improve the performance of the entire parallel computer system.

バンド幅は、一度に転送できるデータ量を示す尺度であり、当然ながら一度に多くのデータ量を転送可能であることが望ましい、しかし、単純に一度に転送可能なデータ量を増加すると、一度に転送するビット数が増加するためにデータの転送及び保持等に用いるトランジスタ数も増加し、結果として並列計算機を構成する大規模集積回路(LSI:Large Scale Integrated circuit)の半導体チップの面積が増加してしまう。このため、一度に転送するビット数を増加させたことによりデータ転送の同期に時間がかかり、結果的に上記レイテンシを低下させてしまう。   Bandwidth is a measure of the amount of data that can be transferred at one time, and of course it is desirable that a large amount of data can be transferred at one time, but simply increasing the amount of data that can be transferred at one time Since the number of bits to be transferred increases, the number of transistors used for data transfer and retention also increases, resulting in an increase in the area of a semiconductor chip of a large scale integrated circuit (LSI) constituting a parallel computer. End up. For this reason, increasing the number of bits transferred at one time takes time to synchronize the data transfer, resulting in a decrease in the latency.

図1は、従来のネットワークシステム(又は、ネットワークアーキテクチャ)の一例を説明する図である。図1は、2次元メッシュトーラス(Mesh Torus)トポロジー等の2次元メッシュトポロジーを用いるネットワークシステム1を示す。図1に示すように、ネットワークシステム1は、クロスバスイッチ(Crossbar Switch)2と、クロスバスイッチ2に接続されたクロスバインタフェース3−1〜3−4を有する。各クロスバインタフェース3−1〜3−4からのデータは、全てクロスバスイッチ2を経由してクロスバインタフェース3−1〜3−4へ再分配される。   FIG. 1 is a diagram illustrating an example of a conventional network system (or network architecture). FIG. 1 shows a network system 1 that uses a two-dimensional mesh topology such as a two-dimensional mesh torus topology. As illustrated in FIG. 1, the network system 1 includes a crossbar switch 2 and crossbar interfaces 3-1 to 3-4 connected to the crossbar switch 2. All data from the crossbar interfaces 3-1 to 3-4 are redistributed to the crossbar interfaces 3-1 to 3-4 via the crossbar switch 2.

各クロスバインタフェース3−1〜3−4には、ノード5が接続されている。ノード5は、プロセッサ等の計算ノード5、或いは、入出力(I/O:Input and Output)ノードであり、少なくとも1個のノード5が計算ノードである。ネットワークシステム1及び4個のノード5は、情報処理装置を形成しており、2以上のノード5が計算ノードの場合には並列計算機が形成される。   A node 5 is connected to each of the crossbar interfaces 3-1 to 3-4. The node 5 is a calculation node 5 such as a processor or an input / output (I / O) node, and at least one node 5 is a calculation node. The network system 1 and the four nodes 5 form an information processing apparatus. When two or more nodes 5 are calculation nodes, a parallel computer is formed.

図1からもわかるように、計算機に限らず、ネットワークシステムにおいてもレイテンシ及びバンド幅がトレードオフの関係にあり、レイテンシ及びバンド幅の両方を向上することは難しい。   As can be seen from FIG. 1, the latency and the bandwidth are in a trade-off relationship not only in the computer but also in the network system, and it is difficult to improve both the latency and the bandwidth.

特開平11−212866号公報JP-A-11-212866 特開2002−328838号公報JP 2002-328838 A 特開平10−215266号公報JP-A-10-215266

従来の計算機やネットワークシステムでは、レイテンシ及びバンド幅の両方を向上することが難しいという問題があった。   Conventional computers and network systems have a problem that it is difficult to improve both latency and bandwidth.

そこで、本発明は、レイテンシ及びバンド幅の両方を向上可能なネットワークシステム、情報処理装置及びネットワークシステムの制御方法を提供することを目的とする。   Accordingly, an object of the present invention is to provide a network system, an information processing apparatus, and a network system control method capable of improving both latency and bandwidth.

本発明の一観点によれば、クロスバスイッチと、前記クロスバスイッチに接続されたポートを有する複数のクロスバインタフェースと、前記複数のクロスバインタフェースのうち、使用頻度が所定値以上のポートの組を形成するクロスバインタフェース同士を直接接続するバイパスルートを備えたネットワークシステムが提供される。   According to one aspect of the present invention, a crossbar switch, a plurality of crossbar interfaces having ports connected to the crossbar switch, and a set of ports having a use frequency equal to or higher than a predetermined value among the plurality of crossbar interfaces are formed. A network system including a bypass route for directly connecting crossbar interfaces is provided.

本発明の一観点によれば、第1の計算を行った結果に基づき、パケットを送信する第1の計算ノードと、前記第1の計算ノードに接続され、前記第1の計算ノードからのパケットに含まれるヘッダを解析する第1の解析部と、前記第1の解析部に接続され、第1の要求を出力するとともに、出力した前記第1の要求に対する第1の許可を入力するまで前記第1の計算ノードからのパケットを第1のバッファに保持するとともに、前記第1の許可を入力した場合、前記第1の解析部によるヘッダの解析結果に応じて、前記第1のバッファに保持した前記第1の計算ノードからのパケットに基づき、第1のパケットと第2のパケットとを送信する第1の送信部と、前記第1の送信部に接続され、前記第1の送信部から入力した前記第1の要求に基づき、前記第1の許可を出力するとともに、前記第1の送信部からの第1のパケットを受信し、受信した第1のパケットの経路を切り換えるクロスバスイッチと、前記クロスバスイッチと前記第1の送信部とに接続され、前記クロスバスイッチからの第1のパケットと前記第1の送信部からの第2のパケットとを並列に受信する第2の受信部と、接続された前記第2の受信部から受信した第1のパケットと第2のパケットとに基づき、計算を行う第2の計算ノードを有する情報処理装置が提供される。 According to one aspect of the present invention , based on a result of the first calculation, a first calculation node that transmits a packet, and a packet that is connected to the first calculation node and that is connected to the first calculation node. A first analysis unit for analyzing a header included in the first analysis unit, and the first analysis unit connected to the first analysis unit, outputting a first request, and inputting a first permission for the output first request The packet from the first computation node is held in the first buffer, and when the first permission is input, the packet is held in the first buffer according to the analysis result of the header by the first analysis unit. Based on the packet from the first computing node, the first transmitter that transmits the first packet and the second packet, and the first transmitter that is connected to the first transmitter, Based on the first request entered A crossbar switch that outputs the first permission, receives the first packet from the first transmitter, and switches a path of the received first packet; the crossbar switch; and the first bar A second reception unit connected to the transmission unit for receiving in parallel the first packet from the crossbar switch and the second packet from the first transmission unit; and the second reception connected. An information processing apparatus having a second calculation node that performs a calculation based on the first packet and the second packet received from the unit is provided.

本発明の一観点によれば、情報処理装置の制御方法において、前記情報処理装置が有する第1の計算ノードが、第1の計算を行った結果に基づき、パケットを送信し、前記情報処理装置が有する、前記第1の計算ノードに接続された第1の解析部が、前記第1の計算ノードからのパケットに含まれるヘッダを解析し、前記情報処理装置が有する、前記第1の解析部に接続された第1の送信部が、第1の要求を出力し、前記情報処理装置が有する、前記第1の送信部に接続されたクロスバスイッチが、前記第1の送信部から入力した前記第1の要求に基づき、第1の許可を出力し、前記第1の送信部が、出力した前記第1の要求に対する前記第1の許可を入力するまで前記第1の計算ノードからのパケットを第1のバッファに保持するとともに、前記第1の許可を入力した場合、前記第1の解析部によるヘッダの解析結果に応じて、前記第1のバッファに保持した前記第1の計算ノードからのパケットに基づき、第1のパケットと第2のパケットとを送信し、前記クロスバスイッチが、前記第1の送信部からの第1のパケットを受信し、受信した第1のパケットの経路を切り換え、前記情報処理装置が有する、前記クロスバスイッチと前記第1の送信部とに接続された第2の受信部が、前記クロスバスイッチからの第1のパケットと前記第1の送信部からの第2のパケットとを並列に受信し、前記情報処理装置が有する第2の計算ノードが、接続された前記第2の受信部から受信した第1のパケットと第2のパケットとに基づき、計算を行う情報処理装置の制御方法が提供される。 According to an aspect of the present invention, in a method for controlling an information processing device, a first calculation node included in the information processing device transmits a packet based on a result of performing a first calculation, and the information processing device It has the first analysis unit connected to the first computing node, before Symbol analyzes the header included in the packet from the first computing node, the information processing apparatus having the first analysis The first transmission unit connected to the unit outputs the first request, and the crossbar switch connected to the first transmission unit included in the information processing apparatus inputs from the first transmission unit Based on the first request, a first permission is output, and packets from the first computing node are output until the first transmitter inputs the first permission for the output first request. In the first buffer When the first permission is input, the first packet is determined based on the packet from the first calculation node held in the first buffer according to the analysis result of the header by the first analysis unit. The crossbar switch receives the first packet from the first transmitter, switches the path of the received first packet, and the crossbar has the information processing apparatus. A second receiver connected to the switch and the first transmitter receives in parallel the first packet from the crossbar switch and the second packet from the first transmitter; Provided is a method for controlling an information processing apparatus that performs a calculation based on a first packet and a second packet received by the second calculation node of the information processing apparatus from the connected second receiving unit. .

開示のネットワークシステム、情報処理装置及びネットワークシステムの制御方法によれば、レイテンシ及びバンド幅の両方を向上することができる。   According to the disclosed network system, information processing apparatus, and network system control method, both latency and bandwidth can be improved.

従来のネットワークシステムの一例を説明する図である。It is a figure explaining an example of the conventional network system. 実施例におけるネットワークシステムの一例を説明する図である。It is a figure explaining an example of the network system in an Example. クロスバスイッチの一例を説明する図である。It is a figure explaining an example of a crossbar switch. 同時通信の性能評価のシミュレーション結果を示す図である。It is a figure which shows the simulation result of the performance evaluation of simultaneous communication. 実施例におけるネットワークシステムの他の例を説明する図である。It is a figure explaining the other example of the network system in an Example. 実施例におけるネットワークシステムの他の例を説明する図である。It is a figure explaining the other example of the network system in an Example. 実施例におけるネットワークシステムの他の例を説明する図である。It is a figure explaining the other example of the network system in an Example. 実施例におけるネットワークシステムの他の例を説明する図である。It is a figure explaining the other example of the network system in an Example. クロスバインタフェースの一例を説明する図である。It is a figure explaining an example of a crossbar interface. クロスバスイッチの動作を説明するフローチャートである。It is a flowchart explaining operation | movement of a crossbar switch.

開示のネットワークシステム、情報処理装置及びネットワークシステムの制御方法では、通信経路の偏り、即ち、ポートの使用頻度(又は、データ通信頻度)の偏りに注目して、レイテンシ及びバンド幅の両方を向上させる。レイテンシとバンド幅両方を向上させることによって、並列計算機等の情報処理装置の性能を向上することができる。   In the disclosed network system, information processing apparatus, and network system control method, attention is paid to the bias of the communication path, that is, the bias of the use frequency (or data communication frequency) of the port, and both the latency and the bandwidth are improved. . By improving both latency and bandwidth, the performance of an information processing apparatus such as a parallel computer can be improved.

以下に、開示のネットワークシステム、情報処理装置及びネットワークシステムの制御方法の各実施例を図面と共に説明する。   Embodiments of the disclosed network system, information processing apparatus, and network system control method will be described below with reference to the drawings.

多くの並列計算機では、デッドロック(Deadlock)を回避するために次元オーダルーティング(DOR:Dimension Order Routing)等のデッドロックを論理的に回避する通信経路選択アルゴリズムが採用されている。このような通信経路選択アルゴリズムを採用すると、通信経路の偏り、即ち、使用頻度(又は、データ通信頻度)の高いポートの組と使用頻度がそれほど高くないポートの組が発生する。   In many parallel computers, a communication path selection algorithm that logically avoids deadlock such as Dimension Order Routing (DOR) is employed in order to avoid deadlock. When such a communication path selection algorithm is employed, communication path bias, that is, a pair of ports having a high use frequency (or data communication frequency) and a set of ports having a low use frequency are generated.

例えば、2次元メッシュトポロジーで次元オーダルーティング(DOR)を採用すると、クロスバスイッチ(Crossbar Switch)等の分配型スイッチネットワーク(Distributed Switched Network)を経由するデータは、目的とする(又は、宛先となる)ノード座標のX座標を一致させてからY座標を一致させるような通信経路を選択して転送される。全てのデータは、各々が目的とするノード座標のX座標を一致させる際に同じ順序でX座標を横切り、目的とするノード座標のY座標を一致させる際に同じ順序でY座標を横切るので、デッドロックが回避できる。説明の便宜上、例えば2次元メッシュ上の座標を(x、y)として、座標(0,0)から座標(n,n)にデータを転送する場合、X軸のポート同士の通信がn回、Y軸のポート同士の通信がn−1回、X軸のポートとY軸のポートの通信が1回となり、X軸のポート同士又はY軸のポート同士といった同軸のポート同士の通信の回数が、それ以外のX軸のポートとY軸のポート間である異なる軸のポート間の通信の回数と比べて多い。   For example, when dimensional order routing (DOR) is adopted in a two-dimensional mesh topology, data passing through a distributed switch network such as a crossbar switch is a target (or a destination). A communication path that matches the X coordinate of the node coordinates and then the Y coordinate is selected and transferred. All data crosses the X coordinate in the same order when matching the X coordinate of the target node coordinate, and crosses the Y coordinate in the same order when matching the Y coordinate of the target node coordinate. Deadlock can be avoided. For convenience of explanation, for example, when the data on the two-dimensional mesh is (x, y) and data is transferred from the coordinate (0, 0) to the coordinate (n, n), the communication between the X-axis ports is n times, Communication between Y-axis ports is n-1 times, communication between X-axis ports and Y-axis ports is once, and the number of communication between coaxial ports such as X-axis ports or Y-axis ports is The number of times of communication between the ports of different axes between the other ports of the X axis and the Y axis is larger.

そこで、本発明の一実施例では、使用頻度の偏りに注目して、レイテンシ及びバンド幅の両方を向上させる。レイテンシ及びバンド幅の両方を向上させることにより、例えば並列計算機等の情報処理装置の性能を向上可能となる。   Therefore, in one embodiment of the present invention, paying attention to the uneven usage frequency, both the latency and the bandwidth are improved. By improving both latency and bandwidth, it is possible to improve the performance of an information processing apparatus such as a parallel computer.

図2は、実施例におけるネットワークシステム(又は、ネットワークアーキテクチャ)の一例を説明する図である。図2は、2次元メッシュトーラス(Mesh Torus)トポロジー、2次元ライントーラス(Line Torus)トポロジー、2次元メッシュリング(Mesh Ring)トポロジー、2次元ラインリング(Line Ring)トポロジーのいずれかのトポロジーを用いるネットワークシステム11を示す。図2に示すように、ネットワークシステム11は、クロスバスイッチ(Crossbar Switch)12と、クロスバスイッチ12に接続されたクロスバインタフェース(又は、スイッチインタフェース)13−1〜13−4と、バイパスルート14−1,14−2を有する。ポートを形成する各クロスバインタフェース13−1〜13−4は、クロスバスイッチ12と対応するノード50−1〜50−4との間に接続される。ノード50−1〜50−4は、例えば各種計算(又は、演算)を実行するCPU、プロセッサ等の計算ノード、或いは、入出力(I/O:Input and Output)ノードであり、ノード50−1〜50−4のうち少なくとも1個のノードが計算ノードである。ネットワークシステム11及び4個のノード50−1〜50−4は、情報処理装置を形成しており、ノード50−1〜50−4のうち2個以上のノードが計算ノードの場合には並列計算機が形成される。つまり、情報処理装置は、クロスバスイッチ12と、クロスバインタフェース13−1〜13−4と、バイパスルート14−1,14−2と、ノード50−1〜50−4を有する。   FIG. 2 is a diagram illustrating an example of a network system (or network architecture) in the embodiment. FIG. 2 uses one of two-dimensional mesh torus topology, two-dimensional line torus topology, two-dimensional mesh ring topology, and two-dimensional line ring topology. 1 shows a network system 11. As illustrated in FIG. 2, the network system 11 includes a crossbar switch 12, crossbar interfaces (or switch interfaces) 13-1 to 13-4 connected to the crossbar switch 12, and a bypass route 14-1. , 14-2. The crossbar interfaces 13-1 to 13-4 forming the ports are connected between the crossbar switch 12 and the corresponding nodes 50-1 to 50-4. The nodes 50-1 to 50-4 are, for example, calculation nodes such as a CPU and a processor that execute various calculations (or operations), or input / output (I / O) nodes, and the node 50-1 ˜50-4, at least one node is a computation node. The network system 11 and the four nodes 50-1 to 50-4 form an information processing apparatus. When two or more of the nodes 50-1 to 50-4 are calculation nodes, a parallel computer is used. Is formed. That is, the information processing apparatus includes the crossbar switch 12, the crossbar interfaces 13-1 to 13-4, the bypass routes 14-1 and 14-2, and the nodes 50-1 to 50-4.

各クロスバインタフェース13−1〜13−4からのデータは、データの経路を切り替えるクロスバスイッチ12を経由してクロスバインタフェース13−1〜13−4へ再分配されか、或いは、クロスバスイッチ12を経由することなくバイパスルート14−1,14−2を経由して対応するクロスバインタフェースへ転送される。   Data from each of the crossbar interfaces 13-1 to 13-4 is redistributed to the crossbar interfaces 13-1 to 13-4 via the crossbar switch 12 that switches the data path, or passes through the crossbar switch 12. Without being transferred to the corresponding crossbar interface via the bypass routes 14-1 and 14-2.

図3は、クロスバスイッチ12の一例を説明する図である。この例では、クロスバスイッチ12はX軸方向に配置されたn個(nは2以上の自然数)のスイッチ(SW)121と、Y軸方向に配置されたn個のスイッチ121を有する。このようなクロスバスイッチ12において、2次元メッシュトーラストポロジー、2次元ライントーラストポロジー、2次元メッシュリングトポロジー、2次元ラインリングトポロジーのいずれかのトポロジーで通信経路選択アルゴリズムとして次元オーダルーティング(DOR)を採用し、例えば2次元メッシュ上の座標を(x、y)として、座標(0,0)から座標(n,n)にデータを転送する場合、X軸のポート同士の通信がn回、Y軸のポート同士の通信がn−1回、X軸のポートとY軸のポートの通信が1回となる。このように、X軸のポート同士又はY軸のポート同士といった同軸のポート同士の通信の回数が、それ以外のX軸のポートとY軸のポート間である異なる軸のポート間の通信の回数と比べて多い。そこで、この例では、使用頻度が所定値以上で高いポートの組を形成するX軸同士のクロスバインタフェース13−1,13−2がバイパスルート14−1により接続されており、使用頻度が所定値以上で高いポートの組を形成するY軸同士のクロスバインタフェース13−3,13−4がバイパスルート14−2により接続されているが、バイパスルートにより接続されるクロスバインタフェースはこれに限定されない。   FIG. 3 is a diagram illustrating an example of the crossbar switch 12. In this example, the crossbar switch 12 has n switches (SW) 121 (n is a natural number of 2 or more) arranged in the X-axis direction and n switches 121 arranged in the Y-axis direction. In such a crossbar switch 12, a two-dimensional mesh torus topology, a two-dimensional line torus topology, a two-dimensional mesh ring topology, or a two-dimensional line ring topology employs dimensional order routing (DOR) as a communication route selection algorithm. For example, when the data on the two-dimensional mesh is (x, y) and data is transferred from the coordinates (0, 0) to the coordinates (n, n), the communication between the X-axis ports is n times, the Y-axis The communication between the ports is n−1 times, and the communication between the X-axis port and the Y-axis port is once. In this way, the number of communications between coaxial ports, such as between X-axis ports or between Y-axis ports, is the number of communications between ports on different axes between the other X-axis ports and Y-axis ports. More than Therefore, in this example, the X-axis crossbar interfaces 13-1 and 13-2 that form a set of ports having a usage frequency higher than or equal to a predetermined value are connected by the bypass route 14-1, and the usage frequency is a predetermined value. The Y-axis crossbar interfaces 13-3 and 13-4 forming the high port pair are connected by the bypass route 14-2 as described above, but the crossbar interface connected by the bypass route is not limited to this.

尚、X軸のポートがn個でY軸のポートがn個のクロスバスイッチ12は、図3のようにn個のスイッチ121を用いる構成に限定されるものではないことは言うまでもない。 Needless to say, the crossbar switch 12 having n X-axis ports and n Y-axis ports is not limited to the configuration using n 2 switches 121 as shown in FIG.

例えば、採用する通信経路選択アルゴリズムが互いに異なる軸のポート同士の通信の回数が同軸同士の通信の回数と比べて多い場合には、クロスバインタフェース13−1,13−4がバイパスルートにより接続され、クロスバインタフェース13−2,13−2がバイパスルートにより接続されていても良い。   For example, when the number of communication between ports of different axes adopting different communication path selection algorithms is larger than the number of communication between coaxials, the crossbar interfaces 13-1 and 13-4 are connected by a bypass route, The crossbar interfaces 13-2 and 13-2 may be connected by a bypass route.

このように、使用頻度(又は、データ通信頻度)が所定値以上で高いポートの組を形成する例えばクロスバインタフェース13−1,13−2間のデータ転送を、クロスバスイッチ12を経由せずに直接バイパスルート14−1を経由して行う。これにより、バイパスルート14−1を通るデータに関しては、クロスバスイッチ12を経由せずに直接クロスバインタフェース13−1,13−2のポート間でデータ転送が行われるので、クロスバスイッチ12を経由する場合と比べて低いレイテンシでデータ転送を行うことができる。又、クロスバインタフェース13−1,13−2を経由するデータ転送の大多数がバイパスルート14−1を経由するデータ転送となるため、レイテンシが実質的に低下する。   In this way, data transfer between, for example, the crossbar interfaces 13-1 and 13-2 that form a set of ports whose usage frequency (or data communication frequency) is higher than a predetermined value is directly transferred without passing through the crossbar switch 12. This is done via the bypass route 14-1. As a result, data passing through the bypass route 14-1 is directly transferred between the ports of the crossbar interfaces 13-1 and 13-2 without going through the crossbar switch 12. Data transfer can be performed with low latency compared to the above. In addition, since the majority of data transfer via the crossbar interfaces 13-1 and 13-2 is data transfer via the bypass route 14-1, the latency is substantially reduced.

更に、バイパスルートを設けることで、クロスバインタフェースが仮想チャネルを有する場合には、バイパスルートを経由するデータとそれ以外のクロスバスイッチ12を経由するデータとを同時に、即ち、並列に転送することも可能であり、バンド幅を実質的に増加させることができる。例えば、クロスバインタフェース13−1からクロスバインタフェース13−2へパケットを転送する際に、バイパスルート14−1を経由してデータを転送すると共に、同時にクロスバスイッチ12を経由してデータを転送することにより、バンド幅を2倍にすることができる。尚、パケットの形式(又は、フォーマット)は特に限定されないが、分配型(又は、分散型)ルーティング(Distributed Routing)の場合、パケットには宛先情報やパケットの発行元(ソース)の情報を含むルーティング情報が含まれる。例えばヘッダとデータ部で形成されるパケットの場合、ルーティング情報はパケットのヘッダに含まれており、データはデータ部に含まれている。   Furthermore, by providing a bypass route, when the crossbar interface has a virtual channel, it is also possible to transfer data via the bypass route and data via the other crossbar switch 12 simultaneously, that is, in parallel. The bandwidth can be substantially increased. For example, when a packet is transferred from the crossbar interface 13-1 to the crossbar interface 13-2, the data is transferred via the bypass route 14-1, and at the same time, the data is transferred via the crossbar switch 12. The bandwidth can be doubled. The packet format (or format) is not particularly limited. In the case of distributed (or distributed) routing, the packet includes destination information and packet source (source) information. Contains information. For example, in the case of a packet formed of a header and a data part, routing information is included in the packet header, and data is included in the data part.

尚、図2は、ネットワークシステム11内の接続を説明するためのものであり、クロスバインタフェース13−1〜13−4のクロスバスイッチ12に対する物理的位置は図2の位置に限定されるものではない。又、後述する図5〜図8においても、図示された各クロスバインタフェースのクロスバスイッチに対する位置は、物理的な位置を示すものではない。   FIG. 2 is for explaining connections in the network system 11, and the physical positions of the crossbar interfaces 13-1 to 13-4 with respect to the crossbar switch 12 are not limited to the positions in FIG. . Also in FIGS. 5 to 8 described later, the positions of the illustrated crossbar interfaces with respect to the crossbar switch do not indicate physical positions.

図4は、同時通信の性能評価のシミュレーション結果を示す図である。図4中、縦軸は未到達パケット数を示し、横軸は経過時間をCPUサイクル数で示す。例えば、図2のクロスバインタフェース13−1からクロスバインタフェース13−2へパケットを転送する際に、データは目的とする(又は、宛先となる)ノード座標のX座標を一致させてからY座標を一致させるような通信経路を選択する。図4において、Axはクロスバスイッチ12を経由する場合のX座標を一致させる処理の性能評価のシミュレーション結果、Ayはクロスバスイッチ12を経由する場合のY座標を一致させる処理の性能評価のシミュレーション結果、A−1はクロスバインタフェース13−1からクロスバインタフェース13−2へクロスバスイッチ12を経由してパケットを転送した場合の性能評価のシミュレーション結果を示し、図1の従来例においてクロスバインタフェース3−1からクロスバインタフェース3−2へクロスバスイッチ2を経由してパケットを転送した場合の性能評価のシミュレーション結果に相当する。又、Bxはクロスバスイッチ12を経由せずに直接バイパスルート14−1を経由する場合のX座標を一致させる処理の性能評価のシミュレーション結果、Byはクロスバスイッチ12を経由せずに直接バイパスルート14−1を経由する場合のY座標を一致させる処理の性能評価のシミュレーション結果、B−1はクロスバインタフェース13−1からクロスバインタフェース13−2へクロスバスイッチ12を経由せずに直接バイパスルート14−1を経由してパケットを転送した場合の性能評価のシミュレーション結果を示す。図4のシミュレーション結果B−1とシミュレーション結果A−1の比較から、シミュレーション結果B−1について10%の性能向上が確認された。尚、図4のシミュレーション結果は、正規化されたパケット転送速度について算出されている。   FIG. 4 is a diagram illustrating a simulation result of performance evaluation of simultaneous communication. In FIG. 4, the vertical axis indicates the number of unreached packets, and the horizontal axis indicates the elapsed time as the number of CPU cycles. For example, when a packet is transferred from the crossbar interface 13-1 to the crossbar interface 13-2 in FIG. 2, the data matches the X coordinate of the target (or destination) node coordinate and then the Y coordinate. Select the communication path to be used. In FIG. 4, Ax is a simulation result of the performance evaluation of the process of matching the X coordinate when passing through the crossbar switch 12, Ay is a simulation result of the performance evaluation of the process of matching the Y coordinate when passing through the crossbar switch 12, A-1 shows a simulation result of performance evaluation when a packet is transferred from the crossbar interface 13-1 to the crossbar interface 13-2 via the crossbar switch 12, and in the conventional example of FIG. This corresponds to a simulation result of performance evaluation when a packet is transferred to the interface 3-2 via the crossbar switch 2. Also, Bx is a simulation result of performance evaluation of the process of matching the X coordinate when passing directly through the bypass route 14-1 without going through the crossbar switch 12, and By is directly bypassing the bypass route 14 without going through the crossbar switch 12. As a result of the simulation of the performance evaluation of the process of matching the Y coordinate when passing through -1, B-1 is directly bypassed from the crossbar interface 13-1 to the crossbar interface 13-2 without passing through the crossbar switch 12. The simulation result of the performance evaluation when the packet is transferred via is shown. From a comparison between the simulation result B-1 and the simulation result A-1 in FIG. 4, a 10% performance improvement was confirmed for the simulation result B-1. Note that the simulation result of FIG. 4 is calculated for the normalized packet transfer rate.

図5は、実施例におけるネットワークシステムの他の例を説明する図である。図5は、2次元メッシュトーラストポロジー、2次元ライントーラストポロジー、2次元メッシュリングトポロジー、2次元ラインリングトポロジーのいずれかのトポロジーを用いるネットワークシステム11を示す。図5中、図2と同一部分には同一符号を付し、その説明は省略する。この例では、同軸のポート同士の通信の回数がそれ以外の通信の回数と比べて多い通信経路選択アルゴリズムが採用されているので、+X軸のポートを有するクロスバインタフェース13−1と−X軸のポートを有するクロスバインタフェース13−2がバイパスルート14−1により接続されている。又、+Y軸のポートを有するクロスバインタフェース13−3と−Y軸のポートを有するクロスバインタフェース13−4がバイパスルート14−2により接続されている。尚、クロスバインタフェース13−1,13−2の+X軸,−X軸のポートとは、クロスバスイッチ11の対応するX軸のポートに接続されたポートであり、クロスバインタフェース13−3,13−4の+Y軸,−Y軸のポートとは、クロスバスイッチ11の対応するY軸のポートに接続されたポートであり、+X,−X,+Y,−Y軸のポートとは便宜上付けられたポート名である。   FIG. 5 is a diagram illustrating another example of the network system in the embodiment. FIG. 5 shows a network system 11 using any one of a two-dimensional mesh torus topology, a two-dimensional line torus topology, a two-dimensional mesh ring topology, and a two-dimensional line ring topology. In FIG. 5, the same parts as those in FIG. 2 are denoted by the same reference numerals, and the description thereof is omitted. In this example, a communication path selection algorithm is employed in which the number of communications between coaxial ports is larger than the number of communications other than that, so the crossbar interface 13-1 having a + X axis port and the -X axis A crossbar interface 13-2 having ports is connected by a bypass route 14-1. A crossbar interface 13-3 having a + Y axis port and a crossbar interface 13-4 having a -Y axis port are connected by a bypass route 14-2. The + X-axis and -X-axis ports of the crossbar interfaces 13-1 and 13-2 are ports connected to the corresponding X-axis ports of the crossbar switch 11, and the crossbar interfaces 13-3 and 13-4. + Y-axis and -Y-axis ports are ports connected to the corresponding Y-axis ports of the crossbar switch 11, and + X, -X, + Y, and -Y-axis ports are port names given for convenience. It is.

図6は、実施例におけるネットワークシステムの他の例を説明する図である。図6は、3次元メッシュトーラストポロジー、3次元ライントーラストポロジー、3次元メッシュリングトポロジー、3次元ラインリングトポロジーのいずれかのトポロジーを用いるネットワークシステム21を示す。クロスバスイッチ12Aには、クロスバインタフェース13−1〜13−4に加え、更にクロスバインタフェース13−5,13−6が接続されている。図6中、図5と同一部分には同一符号を付し、その説明は省略する。この例では、同軸のポート同士の通信の回数がそれ以外の通信の回数と比べて多い通信経路選択アルゴリズムが採用されているので、+Z軸のポートを有するクロスバインタフェース13−5と−Z軸のポートを有するクロスバインタフェース13−6がバイパスルート14−3により接続されている。   FIG. 6 is a diagram illustrating another example of the network system in the embodiment. FIG. 6 shows a network system 21 that uses any one of a three-dimensional mesh torus topology, a three-dimensional line torus topology, a three-dimensional mesh ring topology, and a three-dimensional line ring topology. In addition to the crossbar interfaces 13-1 to 13-4, crossbar interfaces 13-5 and 13-6 are connected to the crossbar switch 12A. In FIG. 6, the same parts as those in FIG. In this example, a communication path selection algorithm is employed in which the number of communications between coaxial ports is larger than the number of communications other than that, so the crossbar interface 13-5 having a + Z axis port and the −Z axis A crossbar interface 13-6 having ports is connected by a bypass route 14-3.

ポートを形成するクロスバインタフェース13−5,13−6は、クロスバスイッチ12Aと対応するノード50−5〜50−6との間に接続される。ノード50−5,〜50−6は、計算ノード、或いは、I/Oノードであり、ノード50−1〜50−6のうち少なくとも1個のノードが計算ノードである。ネットワークシステム21及び6個のノード50−1〜50−6は、情報処理装置を形成しており、ノード50−1〜50−6のうち2個以上のノードが計算ノードの場合には並列計算機が形成される。つまり、情報処理装置は、クロスバスイッチ12Aと、クロスバインタフェース13−1〜13−6と、バイパスルート14−1〜14−3と、ノード50−1〜50−6を有する。   The crossbar interfaces 13-5 and 13-6 forming the ports are connected between the crossbar switch 12A and the corresponding nodes 50-5 to 50-6. The nodes 50-5 to 50-6 are calculation nodes or I / O nodes, and at least one of the nodes 50-1 to 50-6 is a calculation node. The network system 21 and the six nodes 50-1 to 50-6 form an information processing apparatus, and when two or more of the nodes 50-1 to 50-6 are calculation nodes, a parallel computer Is formed. That is, the information processing apparatus includes a crossbar switch 12A, crossbar interfaces 13-1 to 13-6, bypass routes 14-1 to 14-3, and nodes 50-1 to 50-6.

図7は、実施例におけるネットワークシステムの他の例を説明する図である。図7は、2次元メッシュトーラストポロジー、2次元ライントーラストポロジー、2次元メッシュリングトポロジー、2次元ラインリングトポロジーのいずれかのトポロジーを用いるネットワークシステム31を示す。図7中、図5と同一部分には同一符号を付し、その説明は省略する。この例では、互いに異なる軸のポート同士の通信の回数が同軸のポート同士の通信の回数と比べて多い通信経路選択アルゴリズムが採用されているので、+X軸のポートを有するクロスバインタフェース13−1と+Y軸のポートを有するクロスバインタフェース13−3がバイパスルート14−4により接続されている。又、−X軸のポートを有するクロスバインタフェース13−2と−Y軸のポートを有するクロスバインタフェース13−4がバイパスルート14−5により接続されている。   FIG. 7 is a diagram illustrating another example of the network system in the embodiment. FIG. 7 shows a network system 31 that uses any one of a two-dimensional mesh torus topology, a two-dimensional line torus topology, a two-dimensional mesh ring topology, and a two-dimensional line ring topology. In FIG. 7, the same parts as those in FIG. In this example, a communication path selection algorithm is employed in which the number of communications between ports on different axes is greater than the number of communications between coaxial ports, so the crossbar interface 13-1 having a + X axis port A crossbar interface 13-3 having a + Y axis port is connected by a bypass route 14-4. A crossbar interface 13-2 having a -X axis port and a crossbar interface 13-4 having a -Y axis port are connected by a bypass route 14-5.

図8は、実施例におけるネットワークシステムの他の例を説明する図である。図8は、ツリー型トポロジーを用いるネットワークシステム41を示す。クロスバスイッチ12Bには、親のクロスバインタフェース13A−1及び子のクロスバインタフェース13B−1,13B−2が接続されている。親のクロスバインタフェース13A−1からクロスバスイッチ12Bを介して子のクロスバインタフェース13B−1,13B−2が分岐することでツリー型が形成されている。この例では、子のクロスバインタフェース13B−1,13B−2のポートから親のクロスバインタフェース13A−1のポートへ通信の回数が子のクロスバインタフェース13B−1,13B−2のポート同士の通信の回数と比べて多い通信経路選択アルゴリズムが採用されているので、子のクロスバインタフェース13B−1のポートと親のクロスバインタフェース13A−1のポートがバイパスルート14B−1により接続されている。又、子のクロスバインタフェース13B−2のポートと親のクロスバインタフェース13A−1のポートがバイパスルート14B−2により接続されている。尚、この例では、子のクロスバインタフェース13B−1,13B−2のポートから親のクロスバインタフェース13A−1のポートへのバイパスルート14B−1,14B−2が設けられているが、親のクロスバインタフェース13A−1から子のクロスバインタフェース13B−1,13B−2のポートへのバイパスルートを更に設けても良いことは言うまでもない。   FIG. 8 is a diagram illustrating another example of the network system in the embodiment. FIG. 8 shows a network system 41 using a tree topology. A parent crossbar interface 13A-1 and child crossbar interfaces 13B-1 and 13B-2 are connected to the crossbar switch 12B. A tree type is formed by branching the child crossbar interfaces 13B-1 and 13B-2 from the parent crossbar interface 13A-1 via the crossbar switch 12B. In this example, the number of communications from the ports of the child crossbar interfaces 13B-1 and 13B-2 to the ports of the parent crossbar interface 13A-1 is the number of communications between the ports of the child crossbar interfaces 13B-1 and 13B-2. Therefore, the port of the child crossbar interface 13B-1 and the port of the parent crossbar interface 13A-1 are connected by the bypass route 14B-1. Further, the port of the child crossbar interface 13B-2 and the port of the parent crossbar interface 13A-1 are connected by a bypass route 14B-2. In this example, bypass routes 14B-1 and 14B-2 from the ports of the child crossbar interfaces 13B-1 and 13B-2 to the ports of the parent crossbar interface 13A-1 are provided. Needless to say, a bypass route from the interface 13A-1 to the ports of the child crossbar interfaces 13B-1 and 13B-2 may be further provided.

ポートを形成するクロスバインタフェース13A−1,13B−1,13B−2は、クロスバスイッチ12Bと対応するノード50A−1,50B−1,50B−2との間に接続される。ノード50−A−1,50B−1,50B−2は、計算ノード、或いは、I/Oノードであり、ノード50A−1,50B−1,50B−2のうち少なくとも1個のノードが計算ノードである。ネットワークシステム41及び3個のノード50A−1,50B−1,50B−2は、情報処理装置を形成しており、ノードノード50A−1,50B−1,50B−2のうち2個以上のノードが計算ノードの場合には並列計算機が形成される。つまり、情報処理装置は、クロスバスイッチ12Bと、クロスバインタフェース13A−1,13B−1,13B−2と、バイパスルート14B−1,14B−2と、ノードノード50A−1,50B−1,50B−2を有する。   The crossbar interfaces 13A-1, 13B-1, and 13B-2 forming the ports are connected between the crossbar switch 12B and the corresponding nodes 50A-1, 50B-1, and 50B-2. The nodes 50-A-1, 50B-1, and 50B-2 are calculation nodes or I / O nodes, and at least one of the nodes 50A-1, 50B-1, and 50B-2 is a calculation node. It is. The network system 41 and the three nodes 50A-1, 50B-1, and 50B-2 form an information processing apparatus, and two or more nodes among the node nodes 50A-1, 50B-1, and 50B-2 If is a compute node, a parallel computer is formed. That is, the information processing apparatus includes the crossbar switch 12B, the crossbar interfaces 13A-1, 13B-1, 13B-2, the bypass routes 14B-1, 14B-2, and the node nodes 50A-1, 50B-1, 50B-. 2

ツリー型トポロジーにおいて、例えば孫及びひ孫のクロスバインタフェースを更に設ける場合には、図8に示すようにノード50B−1に孫のクロスバインタフェース13C−1が接続され、孫のクロスバインタフェース13C−1はクロスバスイッチ12Cを介してひ孫のクロスバインタフェース(図示せず)に接続される。孫のクロスバインタフェース13C−1及びひ孫のクロスバインタフェースの構成は、クロスバインタフェース13A−1,13B−1,13B−2と同様の構成で良い。又、クロスバスイッチ12Cの構成も、クロスバスイッチ12Bと同様の構成で良い。   In the tree topology, for example, when a grandbar and great-grandchild crossbar interface is further provided, as shown in FIG. 8, the grandchild crossbar interface 13C-1 is connected to the node 50B-1, and the grandchild crossbar interface 13C-1 is connected to the crossbar interface. It is connected to the great grandchild's crossbar interface (not shown) via the switch 12C. The grandchild crossbar interface 13C-1 and the great grandchild crossbar interface may have the same configuration as the crossbar interfaces 13A-1, 13B-1, and 13B-2. The configuration of the crossbar switch 12C may be the same as that of the crossbar switch 12B.

尚、上記ネットワークシステム11,21,31,41においては、1つのクロスバインタフェースに対して接続されるバイパスルートは1つであるが、採用する通信経路選択アルゴリズムに応じて、1つのクロスバインタフェースに対して2以上のクロスバインタフェースを接続するために2以上のバイパスルートを接続するようにしても良い。例えば、図6に示すネットワークシステム21において、+X軸のポートを有するクロスバインタフェース13−1と+Z軸のポートを有するクロスバインタフェース13−5をバイパスルートにより接続しても良い。   In the network systems 11, 21, 31, and 41, there is one bypass route connected to one crossbar interface, but one crossbar interface is connected depending on the communication path selection algorithm employed. In order to connect two or more crossbar interfaces, two or more bypass routes may be connected. For example, in the network system 21 shown in FIG. 6, the crossbar interface 13-1 having a + X axis port and the crossbar interface 13-5 having a + Z axis port may be connected by a bypass route.

図9は、クロスバインタフェースの一例を説明する図である。説明の便宜上、図9に示すクロスバインタフェース13に接続されるバイパスルート14は1つであるものとする。クロスバインタフェース13は、図9に示す如く接続されたクロスバ受信部131、外部インタフェース132、ヘッダ解析部133、及びクロスバ送信部134を有する。   FIG. 9 is a diagram illustrating an example of the crossbar interface. For convenience of explanation, it is assumed that there is one bypass route 14 connected to the crossbar interface 13 shown in FIG. The crossbar interface 13 includes a crossbar reception unit 131, an external interface 132, a header analysis unit 133, and a crossbar transmission unit 134 which are connected as shown in FIG.

クロスバ受信部131には、クロスバスイッチ12からのパケットと、バイパスルート14からのパケットが入力される。使用する通信プロトコルに応じてパケットをクロスバスイッチ12を経由するかバイパスルート14を経由するかのいずれか1つを選択する排他制御がクロスバインタフェース13に対して予め行われているので、クロスバ受信部131はクロスバスイッチ12からのパケット又はバイパスルート14からのパケットを外部インタフェース132へ供給する。   A packet from the crossbar switch 12 and a packet from the bypass route 14 are input to the crossbar receiving unit 131. Since exclusive control for selecting any one of the packet via the crossbar switch 12 or the bypass route 14 according to the communication protocol to be used is performed in advance on the crossbar interface 13, the crossbar receiver 131 supplies a packet from the crossbar switch 12 or a packet from the bypass route 14 to the external interface 132.

外部インタフェース132は、ノード50に接続される。ノード50は、計算ノード又はI/Oノードである。外部インタフェース132は、クロスバ受信部131からのパケットをノード50へ出力し、ノード50からのパケットをヘッダ解析部133へ供給する。ノード50は、メモリ(図示せず)等と共に例えば並列計算機を形成するシステムボード(図示せず)に搭載されたCPUであっても良い。又、ノード50は、上記システムボードとは別体のI/Oボードに搭載されたI/Oインタフェースであっても良い。   The external interface 132 is connected to the node 50. The node 50 is a calculation node or an I / O node. The external interface 132 outputs the packet from the crossbar reception unit 131 to the node 50 and supplies the packet from the node 50 to the header analysis unit 133. The node 50 may be a CPU mounted on a system board (not shown) that forms, for example, a parallel computer together with a memory (not shown). The node 50 may be an I / O interface mounted on an I / O board separate from the system board.

ヘッダ解析部133は、外部インタフェース132からのパケットのヘッダに含まれるルーティング情報に基づいて目的とする(又は、宛先となる)ノード座標、即ち、パケットの宛先情報を認識し、パケットを転送するべきポートのX座標及びY座標を決定する。ヘッダに含まれるルーティング情報は、パケットの宛先情報(例えば、デスティネーションアドレス)に加え、パケットの発行元の情報(例えば、ソースアドレス)を含んでも良い。   The header analysis unit 133 should recognize the target (or destination) node coordinates based on the routing information included in the packet header from the external interface 132, that is, the packet destination information, and transfer the packet. Determine the X and Y coordinates of the port. The routing information included in the header may include packet issuer information (for example, source address) in addition to packet destination information (for example, destination address).

クロスバ送信部134は、リクエストを発行してクロスバスイッチ12からパケットの送信を許可するグラント(Grant)が与えられると、外部インタフェース132からヘッダ解析部133を介して得られるパケットをクロスバスイッチ12へ出力する。一方、リクエストを発行してもクロスバスイッチ12からグラントが与えられないと、クロスバ送信部134は、外部インタフェース132からヘッダ解析部133を介して得られるパケットをクロスバスイッチ12へ出力することなくバイパスルート14へ出力する。   When the crossbar transmission unit 134 issues a request and receives a grant granting the packet transmission from the crossbar switch 12, the crossbar transmission unit 134 outputs the packet obtained from the external interface 132 via the header analysis unit 133 to the crossbar switch 12. To do. On the other hand, if a grant is not given from the crossbar switch 12 even if a request is issued, the crossbar transmission unit 134 bypasses the packet obtained from the external interface 132 via the header analysis unit 133 without outputting the packet to the crossbar switch 12. 14 to output.

クロスバ送信部134は、FIFO(First-In-First-Out)等で形成されたバッファ(図示せず)が複数個並列接続された構成を有しても良い。この場合、クロスバ送信部134は、発行したリクエストに対してクロスバスイッチ12からグラントが与えられるまではパケットをバッファ内に保持することができる。このように、クロスバインタフェース13がバッファを用いた仮想チャネルを有する場合には、バイパスルート14を経由するデータとそれ以外のクロスバスイッチ12を経由するデータとを同時に、即ち、並列に転送することも可能であり、バンド幅を実質的に増加させることができる。   The crossbar transmission unit 134 may have a configuration in which a plurality of buffers (not shown) formed by FIFO (First-In-First-Out) or the like are connected in parallel. In this case, the crossbar transmission unit 134 can hold the packet in the buffer until a grant is given from the crossbar switch 12 to the issued request. Thus, when the crossbar interface 13 has a virtual channel using a buffer, the data passing through the bypass route 14 and the data passing through the other crossbar switch 12 may be transferred simultaneously, that is, in parallel. Yes, the bandwidth can be substantially increased.

クロスバインタフェースに接続されるバイパスルートが2以上の場合には、図9と同様の構成が各バイパスルートに対して設けられることは言うまでもない。   Needless to say, when there are two or more bypass routes connected to the crossbar interface, the same configuration as that of FIG. 9 is provided for each bypass route.

並列計算機は、一般的にはネットワーク用のポートとCPUのポートを有し、場合によってはI/Oノードのポートを有する。ここでは説明の便宜上、CPUのポート名をCPU0,CPU1とし、I/Oノードのポート名をIO0、IO1とする。次元オーダルーティング(DOR)を採用している場合、CPUのポートCPU0,CPU1は+X軸、−X軸のポートと通信する可能性が高いので、図5又は図6の場合のようにCPU0と+X軸のポート、CPU1と−X軸のポートを組にしてバイパスルートを設けることができる。この場合、CPU側で+X軸のポートに出力されるものはCPUのポートCPU0に入れるようにするアルゴリズムを加えるとより効果的である。   A parallel computer generally has a network port and a CPU port, and in some cases, an I / O node port. Here, for convenience of explanation, the CPU port names are CPU0 and CPU1, and the I / O node port names are IO0 and IO1. When dimensional order routing (DOR) is adopted, the CPU ports CPU0 and CPU1 are likely to communicate with the + X-axis and -X-axis ports, so that CPU0 and + X as in the case of FIG. 5 or FIG. A bypass route can be provided by combining the port of the axis, the CPU 1 and the port of the −X axis. In this case, it is more effective to add an algorithm that causes the CPU output to the CPU port CPU0 to be output to the + X axis port.

又、次元オーダルーティング(DOR)を採用している場合は、I/OノードはZ軸のポートと通信する可能性が高い。そこで、IO0と+Z軸のポート、IO1と−Z軸のポートを組にしてバイパスルートを設けることができる。   When dimensional order routing (DOR) is adopted, the I / O node is likely to communicate with the Z-axis port. Thus, a bypass route can be provided by combining IO0 and + Z-axis ports and IO1 and −Z-axis ports.

尚、言うまでもなく、上記実施例のネットワークシステムは、並列計算機の通信のみに対して適用可能なものではなく、汎用的に利用できる。   Needless to say, the network system of the above embodiment is not applicable only to communication of parallel computers, and can be used for general purposes.

図10は、クロスバスイッチの動作、即ち、調停処理を説明するフローチャートである。ここでは説明の便宜上、図5に示すクロスバスイッチ12の動作を例に取って説明する。   FIG. 10 is a flowchart for explaining the operation of the crossbar switch, that is, the arbitration process. Here, for convenience of explanation, the operation of the crossbar switch 12 shown in FIG. 5 will be described as an example.

図10において、ステップS21は、+X,−X,+Y,−Y軸のポートからのリクエスト(要求)を確認し、ステップS22は、+X,−X,+Y,−Y軸のポートのいずれかの軸からパケットを受け取っているか否かを判定する。リクエストは、クロスバスイッチ12がポート(入力ポート)から受け取ったパケットを出力するべきポート(出力ポート)を示す。ステップS22の判定結果がYESであると、ステップS23は+X,−X,+Y,−Y軸のポートへはパケットの送信を許可するグラントを与えることなく、処理はステップS34へ進む。ステップS34は、受け取っているパケットが終了したか否かを判定し、判定結果がYESになると処理はステップS21へ戻る。   In FIG. 10, step S21 confirms the request (request) from the ports of + X, -X, + Y, and -Y axes, and step S22 is one of the ports of + X, -X, + Y, and -Y axes. Determine whether a packet is received from the axis. The request indicates a port (output port) to which the crossbar switch 12 should output a packet received from the port (input port). If the decision result in the step S22 is YES, the process advances to a step S34 without giving a grant permitting packet transmission to the ports of the + X, -X, + Y, and -Y axes. In step S34, it is determined whether or not the received packet is completed. If the determination result is YES, the process returns to step S21.

ステップS22の判定結果がNOであると、ステップS24は、+X軸のポートからのリクエストがあるか否かを判定し、判定結果がYESであると処理はステップS25へ進み、判定結果がNOであれば処理はステップS26へ進む。ステップS25は、+X軸のポートへグラントを与え、処理は後述するステップS33へ進む。ステップS26は、−X軸のポートからのリクエストがあるか否かを判定し、判定結果がYESであると処理はステップS27へ進み、判定結果がNOであれば処理はステップS28へ進む。ステップS27は、−X軸のポートへグラントを与え、処理は後述するステップS33へ進む。ステップS28は、+Y軸のポートからのリクエストがあるか否かを判定し、判定結果がYESであると処理はステップS29へ進み、判定結果がNOであれば処理はステップS30へ進む。ステップS29は、+Y軸のポートへグラントを与え、処理は後述するステップS33へ進む。ステップS30は、−Y軸のポートからのリクエストがあるか否かを判定し、判定結果がYESであると処理はステップS31へ進み、判定結果がNOであれば処理はステップS32へ進む。ステップS31は、−Y軸のポートへグラントを与え、処理はステップS33へ進む。   If the decision result in the step S22 is NO, a step S24 decides whether or not there is a request from the + X axis port. If the decision result is YES, the process advances to a step S25, and the determination result is NO. If so, the process proceeds to step S26. In step S25, a grant is given to the + X-axis port, and the process proceeds to step S33 described later. In step S26, it is determined whether or not there is a request from the -X axis port. If the determination result is YES, the process proceeds to step S27, and if the determination result is NO, the process proceeds to step S28. In step S27, a grant is given to the port on the -X axis, and the process proceeds to step S33 described later. Step S28 determines whether or not there is a request from the + Y axis port. If the determination result is YES, the process proceeds to step S29, and if the determination result is NO, the process proceeds to step S30. In step S29, a grant is given to the + Y-axis port, and the process proceeds to step S33 described later. In step S30, it is determined whether or not there is a request from the -Y axis port. If the determination result is YES, the process proceeds to step S31, and if the determination result is NO, the process proceeds to step S32. In step S31, a grant is given to the port on the -Y axis, and the process proceeds to step S33.

ステップS33は、リクエストの処理が終了したか否かを判定し、判定結果がYESになると処理はステップS21へ戻る。又、ステップS32の後、処理はステップS21へ戻る。   In step S33, it is determined whether or not the processing of the request has been completed. If the determination result is YES, the processing returns to step S21. Further, after step S32, the process returns to step S21.

このようにして、クロスバスイッチ12は、パケットを受け取っていないときにリクエストがきたらこのリクエストのソースへグラントを与える。上記調停処理は、クロスバスイッチ12内の出力ポートの部分で実行可能である。   In this way, the crossbar switch 12 grants a grant to the source of this request when a request is received when no packet is received. The arbitration process can be executed at the output port in the crossbar switch 12.

以上の実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
クロスバスイッチと、
前記クロスバスイッチに接続されたポートを有する複数のクロスバインタフェースと、
前記複数のクロスバインタフェースのうち、使用頻度が所定値以上のポートの組を形成するクロスバインタフェース同士を直接接続するバイパスルートを備えた、ネットワークシステム。
(付記2)
前記バイパスルートで直接接続されるクロスバインタフェースは、通信経路選択アルゴリズムに基づいて決定されている、付記1記載のネットワークシステム。
(付記3)
前記通信経路選択アルゴリズムは次元オーダルーティングであり、前記バイパスルートで直接接続されるクロスバインタフェースは、データの宛先となるノード座標と同軸のポートを形成する、付記2記載のネットワークシステム。
(付記4)
前記バイパスルートで直接接続されるクロスバインタフェースは、データの宛先となるノード座標と互いに異なる軸のポートを形成する、付記2記載のネットワークシステム。
(付記5)
各クロスバインタフェースは、前記クロスバスイッチとプロセッサ又は入出力ノードとの間に接続されている、付記1乃至4のいずれか1項記載のネットワークシステム。
(付記6)
各クロスバインタフェースは、前記クロスバスイッチ及び前記バイパスルートに接続されたクロスバ送信部を有し、
前記クロスバ送信部は、リクエストを発行して前記クロスバスイッチからパケットの送信を許可するグラントが与えられると前記プロセッサ又は入出力ノードからのパケットを前記クロスバスイッチへ出力すると共に、前記リクエストを発行して前記クロスバスイッチからグラントが与えられないと前記プロセッサ又は入出力ノードからのパケットを前記クロスバスイッチへ出力することなく前記バイパスルートへ出力する、付記5記載のネットワークシステム。
(付記7)
第1の計算を行い、パケットを送信する第1の計算ノードと、
前記第1の計算ノードに接続され、前記第1の計算ノードが送信するパケットを転送する第1のクロスバインタフェースと、
接続された前記第1の計算ノードからのパケットを受信し、パケットの経路を切り替えるクロスバスイッチと、
前記クロスバスイッチと前記第1のクロスバインタフェースに接続され、前記クロスバスイッチ又は前記第1のクロスバインタフェースからのパケットを転送する第2のクロスバインタフェースと、
接続された前記第2のクロスバインタフェースからのパケットを受信し、第2の計算を行う第2の計算ノードを有する情報処理装置。
(付記8)
前記第2のクロスバインタフェースは、前記クロスバスイッチからのパケットと、前記第1のクロスバインタフェースからのパケットを同時に受信する付記7記載の情報処理装置。
(付記9)
前記第2のクロスバインタフェースは、前記クロスバスイッチ及び前記第2のクロスバインタフェースに接続されたクロスバ送信部を有し、
前記クロスバ送信部は、パケット送信の要求を発行して前記クロスバスイッチからパケットの送信の許可が与えられた場合、前記計算ノードからのパケットを前記クロスバスイッチへ出力するとともに、前記要求を発行して前記クロスバスイッチから前記許可が与えられない場合、前記第1のクロスバインタフェースへ出力する付記7記載の情報処理装置。
(付記10)
クロスバスイッチと、
複数のノードと、
ポートを有すると共に前記クロスバスイッチと前記複数のノードの間に接続された複数のクロスバインタフェースと、
前記複数のクロスバインタフェースのうち、使用頻度が所定値以上のポートの組を形成するクロスバインタフェース同士を直接接続するバイパスルートを備え、
前記複数のノードは、少なくとも1つの計算ノードと少なくとも1つの入出力ノードで形成される、情報処理装置。
(付記11)
前記バイパスルートで直接接続されるクロスバインタフェースは、通信経路選択アルゴリズムに基づいて決定されている、付記10記載の情報処理装置。
(付記12)
前記通信経路選択アルゴリズムは次元オーダルーティングであり、前記バイパスルートで直接接続されるクロスバインタフェースは、データの宛先となるノード座標と同軸のポートを形成する、付記11記載の情報処理装置。
(付記13)
前記バイパスルートで直接接続されるクロスバインタフェースは、データの宛先となるノード座標と互いに異なる軸のポートを形成する、付記11記載の情報処理装置。
(付記14)
各クロスバインタフェースは、前記クロスバスイッチ及び前記バイパスルートに接続されたクロスバ送信部を有し、
前記クロスバ送信部は、リクエストを発行して前記クロスバスイッチからパケットの送信を許可するグラントが与えられると前記ノードからのパケットを前記クロスバスイッチへ出力すると共に、前記リクエストを発行して前記クロスバスイッチからグラントが与えられないと前記ノードからのパケットを前記クロスバスイッチへ出力することなく前記バイパスルートへ出力する、付記10乃至13のいずれか1項記載の情報処理装置。
(付記15)
各クロスバインタフェースは、前記クロスバスイッチ及び前記バイパスルートに接続されたクロスバ受信部を有し、
前記クロスバ受信部は、前記クロスバスイッチからのパケットと、前記クロスバインタフェースからのパケットを入力し、使用する通信プロトコルに応じた排他制御によりいずれか一方のパケットを選択出力する、付記10乃至13記載の情報処理装置。
(付記16)
各クロスバインタフェースは、仮想チャネルを有すると共に前記クロスバスイッチ及び前記バイパスルートに接続されたクロスバ受信部を有し、
前記クロスバ受信部は、前記クロスバスイッチからのパケットと、前記クロスバインタフェースからのパケットを同時に入力し、両方のデータとを仮想チャネルを用いて並列に転送する、付記10乃至13記載の情報処理装置。
(付記17)
第1の計算を行う第1の計算ノードが、パケットを送信するステップと、
前記第1の計算ノードに接続された第1のクロスバインタフェースが、前記第1の計算ノードが送信するパケットを転送するステップと、
クロスバスイッチが、前記クロスバスイッチに接続された前記第1の計算ノードからのパケットを受信し、パケットの経路を切り替えるステップと、
前記クロスバスイッチと前記第1のクロスバインタフェースに接続された第2のクロスバインタフェースが、前記クロスバスイッチ又は前記第1のクロスバインタフェースからのパケットを転送するステップと、
第2の計算を行う第2の計算ノードが、前記第2の計算ノードに接続された前記第2のクロスバインタフェースからのパケットを受信するステップを含むネットワークシステムの制御方法。
(付記18)
前記第2のクロスバインタフェースは、前記クロスバスイッチからのパケットと、前記第1のクロスバインタフェースからのパケットを同時に受信する付記17記載のネットワークシステムの制御方法。
(付記19)
前記第2のクロスバインタフェースは、前記クロスバスイッチ及び前記第2のクロスバインタフェースに接続されたクロスバ送信部を有し、
前記クロスバ送信部は、パケット送信の要求を発行して前記クロスバスイッチからパケットの送信の許可が与えられた場合、前記計算ノードからのパケットを前記クロスバスイッチへ出力するとともに、前記要求を発行して前記クロスバスイッチから前記許可が与えられない場合、前記第1のクロスバインタフェースへ出力する付記17記載のネットワークシステムの制御方法。
(付記20)
第1のクロスバインタフェースが受信したパケットをクロスバスイッチへ転送するステップと、
前記クロスバスイッチが前記第1のクロスバスイッチからのパケットの経路を通信経路選択アルゴリズムに基づいて決定された経路に切り替えて転送するステップと、
前記クロスバスイッチと前記第1のクロスバインタフェースに接続された第2のクロスバインタフェースが、前記クロスバスイッチからのパケット又は前記第1のクロスバインタフェースからのパケットをバイパスルートを介して受信するステップを含む、ネットワークシステムの制御方法。
(付記21)
前記第1のクロスバインタフェースからリクエストを発行して前記クロスバスイッチからパケットの送信を許可するグラントが与えられると前記第1のクロスバインタフェースが受信したパケットを前記クロスバスイッチへ出力すると共に、前記リクエストを発行して前記クロスバスイッチからグラントが与えられないと前記第1のクロスバインタフェースが受信したパケットを前記クロスバスイッチへ出力することなく前記バイパスルートを介して前記第2のクロスバインタフェースへ出力するステップを含む、付記20記載のネットワークシステムの制御方法。
(付記22)
前記第2のクロスバインタフェースが前記クロスバスイッチからのパケットと前記クロスバインタフェースからのパケットを入力し、使用する通信プロトコルに応じた排他制御によりいずれか一方のパケットを前記第2のクロスバインタフェースに接続されたノードに選択出力するステップを含む、付記20記載のネットワークシステムの制御方法。
(付記23)
前記第2のクロスバインタフェースが前記クロスバスイッチからのパケットと前記バイパスルートを介した前記第1のクロスバインタフェースからのパケットを同時に入力し、両方のデータとを仮想チャネルを用いて前記第2のクロスバインタフェースに接続されたノードに並列に転送する、付記20記載のネットワークシステムの制御方法。
The following additional notes are further disclosed with respect to the embodiment including the above examples.
(Appendix 1)
Crossbar switch,
A plurality of crossbar interfaces having ports connected to the crossbar switch;
A network system comprising a bypass route for directly connecting crossbar interfaces forming a set of ports having a usage frequency equal to or higher than a predetermined value among the plurality of crossbar interfaces.
(Appendix 2)
The network system according to appendix 1, wherein the crossbar interface directly connected by the bypass route is determined based on a communication route selection algorithm.
(Appendix 3)
The network system according to appendix 2, wherein the communication path selection algorithm is dimension order routing, and a crossbar interface directly connected by the bypass route forms a port coaxial with a node coordinate serving as a data destination.
(Appendix 4)
The network system according to appendix 2, wherein the crossbar interface directly connected by the bypass route forms a port having an axis different from the node coordinate serving as a data destination.
(Appendix 5)
The network system according to any one of appendices 1 to 4, wherein each crossbar interface is connected between the crossbar switch and a processor or an input / output node.
(Appendix 6)
Each crossbar interface has a crossbar transmitter connected to the crossbar switch and the bypass route,
The crossbar transmission unit issues a request and outputs a packet from the processor or an input / output node to the crossbar switch when a grant for permitting packet transmission is given from the crossbar switch, and issues the request. 6. The network system according to appendix 5, wherein when no grant is given from the crossbar switch, a packet from the processor or an input / output node is output to the bypass route without being output to the crossbar switch.
(Appendix 7)
A first computation node that performs a first computation and transmits a packet;
A first crossbar interface connected to the first computing node and forwarding a packet transmitted by the first computing node;
A crossbar switch that receives a packet from the connected first computing node and switches a path of the packet;
A second crossbar interface connected to the crossbar switch and the first crossbar interface and transferring packets from the crossbar switch or the first crossbar interface;
An information processing apparatus having a second calculation node that receives a packet from the connected second crossbar interface and performs a second calculation.
(Appendix 8)
The information processing apparatus according to appendix 7, wherein the second crossbar interface simultaneously receives a packet from the crossbar switch and a packet from the first crossbar interface.
(Appendix 9)
The second crossbar interface has a crossbar transmitter connected to the crossbar switch and the second crossbar interface,
When the crossbar transmission unit issues a packet transmission request and is permitted to transmit a packet from the crossbar switch, the crossbar transmission unit outputs the packet from the calculation node to the crossbar switch and issues the request. The information processing apparatus according to appendix 7, wherein when the permission is not given from the crossbar switch, the crossbar switch outputs to the first crossbar interface.
(Appendix 10)
Crossbar switch,
Multiple nodes,
A plurality of crossbar interfaces having ports and connected between the crossbar switch and the plurality of nodes;
Among the plurality of crossbar interfaces, comprising a bypass route for directly connecting crossbar interfaces that form a set of ports whose use frequency is a predetermined value or more,
The information processing apparatus, wherein the plurality of nodes are formed of at least one computation node and at least one input / output node.
(Appendix 11)
The information processing apparatus according to appendix 10, wherein the crossbar interface directly connected by the bypass route is determined based on a communication route selection algorithm.
(Appendix 12)
The information processing apparatus according to appendix 11, wherein the communication path selection algorithm is dimension order routing, and the crossbar interface directly connected by the bypass route forms a port coaxial with a node coordinate serving as a data destination.
(Appendix 13)
The information processing apparatus according to appendix 11, wherein the crossbar interface directly connected by the bypass route forms a port having an axis different from a node coordinate serving as a data destination.
(Appendix 14)
Each crossbar interface has a crossbar transmitter connected to the crossbar switch and the bypass route,
The crossbar transmission unit issues a request and outputs a packet from the node to the crossbar switch when a grant for permitting packet transmission is given from the crossbar switch, and issues the request from the crossbar switch. 14. The information processing apparatus according to any one of appendices 10 to 13, wherein if no grant is given, the packet from the node is output to the bypass route without being output to the crossbar switch.
(Appendix 15)
Each crossbar interface has a crossbar receiver connected to the crossbar switch and the bypass route,
The crossbar receiving unit receives a packet from the crossbar switch and a packet from the crossbar interface, and selectively outputs one of the packets by exclusive control according to a communication protocol to be used. Information processing device.
(Appendix 16)
Each crossbar interface has a virtual channel and a crossbar receiver connected to the crossbar switch and the bypass route,
14. The information processing apparatus according to appendices 10 to 13, wherein the crossbar receiving unit inputs a packet from the crossbar switch and a packet from the crossbar interface at the same time and transfers both data in parallel using a virtual channel.
(Appendix 17)
A first computing node performing a first computation transmitting a packet;
A first crossbar interface connected to the first computing node transfers a packet transmitted by the first computing node;
A crossbar switch receiving a packet from the first computing node connected to the crossbar switch and switching a path of the packet;
A second crossbar interface connected to the crossbar switch and the first crossbar interface transfers a packet from the crossbar switch or the first crossbar interface;
A method of controlling a network system, comprising: a second computing node that performs a second computation receives a packet from the second crossbar interface connected to the second computing node.
(Appendix 18)
The network system control method according to supplementary note 17, wherein the second crossbar interface simultaneously receives a packet from the crossbar switch and a packet from the first crossbar interface.
(Appendix 19)
The second crossbar interface has a crossbar transmitter connected to the crossbar switch and the second crossbar interface,
When the crossbar transmission unit issues a packet transmission request and is permitted to transmit a packet from the crossbar switch, the crossbar transmission unit outputs the packet from the calculation node to the crossbar switch and issues the request. 18. The network system control method according to appendix 17, wherein when the permission is not given from the crossbar switch, the crossbar switch outputs to the first crossbar interface.
(Appendix 20)
Forwarding the packet received by the first crossbar interface to the crossbar switch;
The crossbar switch switching the packet path from the first crossbar switch to a path determined based on a communication path selection algorithm and transferring the packet path;
And a second crossbar interface connected to the crossbar switch and the first crossbar interface receives a packet from the crossbar switch or a packet from the first crossbar interface via a bypass route. How to control the system.
(Appendix 21)
When a request is issued from the first crossbar interface and a grant permitting packet transmission is given from the crossbar switch, the packet received by the first crossbar interface is output to the crossbar switch and the request is issued. And outputting a packet received by the first crossbar interface to the second crossbar interface via the bypass route without outputting the packet to the crossbar switch unless a grant is given from the crossbar switch. The network system control method according to appendix 20.
(Appendix 22)
The second crossbar interface inputs a packet from the crossbar switch and a packet from the crossbar interface, and one of the packets is connected to the second crossbar interface by exclusive control according to a communication protocol to be used. The network system control method according to appendix 20, comprising a step of selectively outputting to a node.
(Appendix 23)
The second crossbar interface simultaneously inputs a packet from the crossbar switch and a packet from the first crossbar interface via the bypass route, and uses the virtual channel to transmit both data to the second crossbar interface. The network system control method according to appendix 20, wherein the network system is transferred in parallel to nodes connected to the network.

以上、開示のネットワークシステム及び情報処理装置を実施例により説明したが、本発明は上記実施例に限定されるものではなく、本発明の範囲内で種々の変形及び改良が可能であることは言うまでもない。   Although the disclosed network system and information processing apparatus have been described with the embodiments, it is needless to say that the present invention is not limited to the above-described embodiments, and various modifications and improvements can be made within the scope of the present invention. Yes.

11 ネットワークシステム
12 クロスバスイッチ
13−1〜13−4 クロスバインタフェース
14−1,14−2 バイパスルート
50,50−1〜50−6 ノード
11 Network system 12 Crossbar switch 13-1 to 13-4 Crossbar interface 14-1, 14-2 Bypass route 50, 50-1 to 50-6 Node

Claims (8)

第1の計算を行った結果に基づき、パケットを送信する第1の計算ノードと、
前記第1の計算ノードに接続され、前記第1の計算ノードからのパケットに含まれるヘッダを解析する第1の解析部と、
前記第1の解析部に接続され、第1の要求を出力するとともに、出力した前記第1の要求に対する第1の許可を入力するまで前記第1の計算ノードからのパケットを第1のバッファに保持するとともに、前記第1の許可を入力した場合、前記第1の解析部によるヘッダの解析結果に応じて、前記第1のバッファに保持した前記第1の計算ノードからのパケットに基づき、第1のパケットと第2のパケットとを送信する第1の送信部と、
前記第1の送信部に接続され、前記第1の送信部から入力した前記第1の要求に基づき、前記第1の許可を出力するとともに、前記第1の送信部からの第1のパケットを受信し、受信した第1のパケットの経路を切り換えるクロスバスイッチと、
前記クロスバスイッチと前記第1の送信部とに接続され、前記クロスバスイッチからの第1のパケットと前記第1の送信部からの第2のパケットとを並列に受信する第2の受信部と、
接続された前記第2の受信部から受信した第1のパケットと第2のパケットとに基づき、計算を行う第2の計算ノードを有する情報処理装置。
A first computing node that transmits a packet based on a result of the first computation;
A first analysis unit connected to the first calculation node and analyzing a header included in a packet from the first calculation node;
Connected to the first analysis unit and outputs a first request, and a packet from the first computing node is input to a first buffer until a first permission for the output first request is input. And holding the first permission, based on the header analysis result by the first analysis unit, based on the packet from the first calculation node held in the first buffer, A first transmitter for transmitting one packet and a second packet;
Based on the first request input from the first transmitter and connected to the first transmitter, the first permission is output, and the first packet from the first transmitter is A crossbar switch that receives and switches the path of the received first packet;
A second receiver connected to the crossbar switch and the first transmitter for receiving in parallel the first packet from the crossbar switch and the second packet from the first transmitter;
An information processing apparatus having a second calculation node that performs calculation based on the first packet and the second packet received from the connected second receiving unit.
前記第2の受信部は、前記クロスバスイッチからの第1のパケットと前記第1の送信部からの第2のパケットとを同時に受信する請求項1記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the second reception unit receives a first packet from the crossbar switch and a second packet from the first transmission unit simultaneously. 前記第2の計算ノードはさらに、第2の計算を行った結果に基づき、パケットを送信し、
前記情報処理装置はさらに、前記第2の計算ノードに接続され、前記第2の計算ノードからのパケットに含まれるヘッダを解析する第2の解析部と、
前記第2の解析部に接続され、第2の要求を出力するとともに、出力した前記第2の要求に対する第2の許可を入力するまで前記第2の計算ノードからのパケットを第2のバッファに保持するとともに、前記第2の許可を入力した場合、前記第2の解析部によるヘッダの解析結果に応じて、前記第2のバッファに保持した前記第2の計算ノードからのパケットに基づき、第3のパケットと第4のパケットとを送信する第2の送信部と、
前記第2の送信部から入力した前記第2の要求に基づき、前記第2の許可を出力するとともに、前記第2の送信部からの第3のパケットを受信し、受信した第3のパケットの経路を切り換える前記クロスバスイッチと前記第2の送信部とに接続され、前記クロスバスイッチからの第3のパケットと前記第2の送信部からの第4のパケットとを並列に受信する第1の受信部とを有し、
前記第1の計算ノードはさらに、接続された前記第1の受信部から受信した第3のパケットと第4のパケットとに基づき、計算を行う請求項1又は2記載の情報処理装置。
The second calculation node further transmits a packet based on the result of the second calculation,
The information processing apparatus is further connected to the second calculation node and analyzes a header included in a packet from the second calculation node;
The second analysis unit is connected to the second analysis unit and outputs a second request, and a packet from the second calculation node is input to a second buffer until a second permission for the output second request is input. And holding the second permission, based on the header analysis result by the second analysis unit, based on the packet from the second calculation node held in the second buffer, A second transmitter for transmitting the third packet and the fourth packet;
Based on the second request input from the second transmitter, the second permission is output, the third packet from the second transmitter is received, and the received third packet The first reception is connected to the crossbar switch for switching the route and the second transmission unit, and receives the third packet from the crossbar switch and the fourth packet from the second transmission unit in parallel. And
The information processing apparatus according to claim 1, wherein the first calculation node further performs calculation based on a third packet and a fourth packet received from the connected first reception unit.
前記第1の受信部は、前記クロスバスイッチからの第3のパケットと前記第2の送信部からの第4のパケットとを同時に受信する請求項3記載の情報処理装置。   The information processing apparatus according to claim 3, wherein the first reception unit receives a third packet from the crossbar switch and a fourth packet from the second transmission unit simultaneously. 情報処理装置の制御方法において、
前記情報処理装置が有する第1の計算ノードが、第1の計算を行った結果に基づき、パケットを送信し、
前記情報処理装置が有する、前記第1の計算ノードに接続された第1の解析部が、前記第1の計算ノードからのパケットに含まれるヘッダを解析し、
前記情報処理装置が有する、前記第1の解析部に接続された第1の送信部が、第1の要求を出力し、
前記情報処理装置が有する、前記第1の送信部に接続されたクロスバスイッチが、前記第1の送信部から入力した前記第1の要求に基づき、第1の許可を出力し、
前記第1の送信部が、出力した前記第1の要求に対する前記第1の許可を入力するまで前記第1の計算ノードからのパケットを第1のバッファに保持するとともに、前記第1の許可を入力した場合、前記第1の解析部によるヘッダの解析結果に応じて、前記第1のバッファに保持した前記第1の計算ノードからのパケットに基づき、第1のパケットと第2のパケットとを送信し、
前記クロスバスイッチが、前記第1の送信部からの第1のパケットを受信し、受信した第1のパケットの経路を切り換え、
前記情報処理装置が有する、前記クロスバスイッチと前記第1の送信部とに接続された第2の受信部が、前記クロスバスイッチからの第1のパケットと前記第1の送信部からの第2のパケットとを並列に受信し、
前記情報処理装置が有する第2の計算ノードが、接続された前記第2の受信部から受信した第1のパケットと第2のパケットとに基づき、計算を行う情報処理装置の制御方法。
In the control method of the information processing apparatus,
The first calculation node of the information processing apparatus transmits a packet based on the result of the first calculation,
The information processing apparatus having a first analysis unit connected to the first computing node analyzes the previous SL header included in the packet from the first computing node,
A first transmission unit connected to the first analysis unit included in the information processing apparatus outputs a first request,
The crossbar switch connected to the first transmission unit of the information processing device outputs a first permission based on the first request input from the first transmission unit,
The first transmission unit holds the packet from the first computing node in a first buffer until the first permission for the output first request is input, and the first permission is granted. When input, the first packet and the second packet are determined based on the packet from the first calculation node held in the first buffer according to the header analysis result by the first analysis unit. Send
The crossbar switch receives the first packet from the first transmitter, and switches the path of the received first packet;
A second reception unit connected to the crossbar switch and the first transmission unit included in the information processing apparatus includes a first packet from the crossbar switch and a second packet from the first transmission unit. Receive packets in parallel,
A control method for an information processing apparatus, in which a second calculation node included in the information processing apparatus performs a calculation based on a first packet and a second packet received from the connected second reception unit.
前記第2の受信部は、前記クロスバスイッチからの第1のパケットと前記第1の送信部からの第2のパケットとを同時に受信する請求項5記載の情報処理装置の制御方法。   The method according to claim 5, wherein the second reception unit receives the first packet from the crossbar switch and the second packet from the first transmission unit at the same time. 前記第2の計算ノードはさらに、第2の計算を行った結果に基づき、パケットを送信し、
前記情報処理装置が有する、前記第2の計算ノードに接続された第2の解析部が、前記第2の計算ノードからのパケットに含まれるヘッダを解析し、
前記情報処理装置が有する、前記第2の解析部に接続された第2の送信部が、第2の要求を出力し、
前記クロスバスイッチが、前記第2の送信部から入力した前記第2の要求に基づき、第2の許可を出力し、
前記第2の送信部が、出力した前記第2の要求に対する前記第2の許可を入力するまで前記第2の計算ノードからのパケットを第2のバッファに保持するとともに、前記第2の許可を入力した場合、前記第2の解析部によるヘッダの解析結果に応じて、前記第2のバッファに保持した前記第2の計算ノードからのパケットに基づき、第3のパケットと第4のパケットとを送信し、
前記クロスバスイッチが、前記第2の送信部からの第3のパケットを受信し、受信した第3のパケットの経路を切り換え、
前記情報処理装置が有する第1の受信部が、前記クロスバスイッチからの第3のパケットと前記第2の送信部からの第4のパケットとを並列に受信し、
前記第1の計算ノードはさらに、接続された前記第1の受信部から受信した第3のパケットと第4のパケットとに基づき、計算を行う請求項5又は6記載の情報処理装置の制御方法。
The second calculation node further transmits a packet based on the result of the second calculation,
A second analysis unit connected to the second calculation node of the information processing apparatus analyzes a header included in a packet from the second calculation node;
A second transmission unit connected to the second analysis unit of the information processing apparatus outputs a second request,
The crossbar switch outputs a second permission based on the second request input from the second transmitter;
The second transmission unit holds the packet from the second computing node in a second buffer until the second permission for the output second request is input, and the second permission is granted. When input, the third packet and the fourth packet are determined based on the packet from the second calculation node held in the second buffer according to the analysis result of the header by the second analysis unit. Send
The crossbar switch receives the third packet from the second transmitter, and switches the path of the received third packet;
A first reception unit of the information processing apparatus receives a third packet from the crossbar switch and a fourth packet from the second transmission unit in parallel;
7. The information processing apparatus control method according to claim 5, wherein the first calculation node further performs calculation based on the third packet and the fourth packet received from the connected first receiving unit. .
前記第1の受信部は、前記クロスバスイッチからの第3のパケットと前記第2の送信部からの第4のパケットとを同時に受信する請求項7記載の情報処理装置の制御方法。   The control method of the information processing apparatus according to claim 7, wherein the first reception unit receives a third packet from the crossbar switch and a fourth packet from the second transmission unit simultaneously.
JP2009185893A 2009-08-10 2009-08-10 Information processing apparatus and information processing apparatus control method Active JP5493575B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009185893A JP5493575B2 (en) 2009-08-10 2009-08-10 Information processing apparatus and information processing apparatus control method
EP20100171928 EP2288084B1 (en) 2009-08-10 2010-08-04 Network system, information processing apparatus, and control method for network system
US12/805,588 US8589614B2 (en) 2009-08-10 2010-08-06 Network system with crossbar switch and bypass route directly coupling crossbar interfaces

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009185893A JP5493575B2 (en) 2009-08-10 2009-08-10 Information processing apparatus and information processing apparatus control method

Publications (2)

Publication Number Publication Date
JP2011039744A JP2011039744A (en) 2011-02-24
JP5493575B2 true JP5493575B2 (en) 2014-05-14

Family

ID=42797073

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009185893A Active JP5493575B2 (en) 2009-08-10 2009-08-10 Information processing apparatus and information processing apparatus control method

Country Status (3)

Country Link
US (1) US8589614B2 (en)
EP (1) EP2288084B1 (en)
JP (1) JP5493575B2 (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5493575B2 (en) * 2009-08-10 2014-05-14 富士通株式会社 Information processing apparatus and information processing apparatus control method
JP5499902B2 (en) * 2010-05-26 2014-05-21 セイコーエプソン株式会社 Processor system
JP2012146201A (en) 2011-01-13 2012-08-02 Toshiba Corp On-chip router and multi-core system using the same
WO2012127619A1 (en) * 2011-03-22 2012-09-27 富士通株式会社 Parallel computing system and control method of parallel computing system
US8983218B2 (en) 2012-04-11 2015-03-17 Texas Instruments Incorporated Virtual boundary processing simplification for adaptive loop filtering (ALF) in video coding
US9081891B2 (en) * 2012-07-31 2015-07-14 Hewlett-Packard Development Company, L.P. Reconfigurable crossbar networks
CN109714294B (en) * 2017-10-25 2020-07-14 华为技术有限公司 Physical layer chip, network security device and data forwarding method
US11502934B2 (en) * 2018-08-21 2022-11-15 The George Washington Univesity EZ-pass: an energy performance-efficient power-gating router architecture for scalable on-chip interconnect architecture
US20250112876A1 (en) * 2023-10-03 2025-04-03 Hewlett Packard Enterprise Development Lp Network switch with hybrid architecture
US12475079B1 (en) * 2024-07-26 2025-11-18 International Business Machines Corporation Bidirectional ring-based interconnection networks having a cross bar for multiprocessors

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6373460A (en) * 1986-09-17 1988-04-04 Fujitsu Ltd Configuration method for network of multiprocessor at broadcasting time
JPS63289666A (en) * 1987-05-21 1988-11-28 Toyo Commun Equip Co Ltd Computer system
US5179715A (en) * 1987-03-11 1993-01-12 Toyo Communication Co., Ltd. Multiprocessor computer system with process execution allocated by process managers in a ring configuration
JP2543878B2 (en) * 1987-03-31 1996-10-16 株式会社東芝 Parallel processing system
JPH02100151A (en) * 1988-10-06 1990-04-12 Nec Corp Storage access controller
US5175824A (en) * 1989-05-08 1992-12-29 Trw Inc. Crossbar switch connected modular multiprocessor system with processor timing relationship selected and synchronized to be appropriate for function being performed
JP2770936B2 (en) * 1990-12-18 1998-07-02 インターナショナル・ビジネス・マシーンズ・コーポレイション Method of creating communication network and communication channel
US5822605A (en) * 1994-03-24 1998-10-13 Hitachi, Ltd. Parallel processor system with a broadcast message serializing circuit provided within a network
JP3504033B2 (en) * 1994-06-29 2004-03-08 株式会社日立製作所 Data transfer method between processors and parallel computer
JP2607851B2 (en) * 1994-09-17 1997-05-07 株式会社東芝 Inter-processor routing method
US5721842A (en) * 1995-08-25 1998-02-24 Apex Pc Solutions, Inc. Interconnection system for viewing and controlling remotely connected computers with on-screen video overlay for controlling of the interconnection switch
US6728258B1 (en) * 1995-11-15 2004-04-27 Hitachi, Ltd. Multi-processor system and its network
US5898826A (en) * 1995-11-22 1999-04-27 Intel Corporation Method and apparatus for deadlock-free routing around an unusable routing component in an N-dimensional network
US6094434A (en) 1996-12-30 2000-07-25 Compaq Computer Corporation Network switch with separate cut-through buffer
US6285679B1 (en) * 1997-08-22 2001-09-04 Avici Systems, Inc. Methods and apparatus for event-driven routing
JP3037254B2 (en) 1998-01-29 2000-04-24 甲府日本電気株式会社 Multi-stage crossbar and computer device
DE19815097C2 (en) * 1998-04-03 2002-03-14 Siemens Ag bus master
KR100277167B1 (en) * 1998-06-05 2001-01-15 윤덕용 Distributed computing system having a connection network using virtual buses and data communication method for the same
JP3721283B2 (en) * 1999-06-03 2005-11-30 株式会社日立製作所 Main memory shared multiprocessor system
US6751698B1 (en) * 1999-09-29 2004-06-15 Silicon Graphics, Inc. Multiprocessor node controller circuit and method
US6751699B1 (en) * 2000-07-07 2004-06-15 Systran Corporation Fibre channel mini-hub powered by and supported within a host computer and directly controlled over a bus of the host computer
US6973078B2 (en) * 2001-04-20 2005-12-06 Sun Microsystems, Inc. Method and apparatus for implementing low latency crossbar switches with integrated storage signals
JP3607638B2 (en) * 2001-05-01 2005-01-05 エヌイーシーコンピュータテクノ株式会社 Crossbar device and computer device
US7088678B1 (en) * 2001-08-27 2006-08-08 3Com Corporation System and method for traffic shaping based on generalized congestion and flow control
US6912612B2 (en) * 2002-02-25 2005-06-28 Intel Corporation Shared bypass bus structure
JP4338068B2 (en) * 2002-03-20 2009-09-30 株式会社日立製作所 Storage system
US8001266B1 (en) * 2003-03-31 2011-08-16 Stretch, Inc. Configuring a multi-processor system
US20050044320A1 (en) * 2003-08-19 2005-02-24 Sun Microsystems, Inc. Cache bank interface unit
US20050100035A1 (en) * 2003-11-11 2005-05-12 Avici Systems, Inc. Adaptive source routing and packet processing
US8223778B2 (en) * 2003-11-19 2012-07-17 Intel Corporation Routing table architecture
US7873693B1 (en) * 2004-02-13 2011-01-18 Habanero Holdings, Inc. Multi-chassis fabric-backplane enterprise servers
US7486619B2 (en) * 2004-03-04 2009-02-03 International Business Machines Corporation Multidimensional switch network
TWI274255B (en) * 2004-11-08 2007-02-21 Asustek Comp Inc Motherboard
US7502378B2 (en) * 2006-11-29 2009-03-10 Nec Laboratories America, Inc. Flexible wrapper architecture for tiled networks on a chip
US8151088B1 (en) * 2008-07-08 2012-04-03 Tilera Corporation Configuring routing in mesh networks
JP4868255B2 (en) * 2008-09-24 2012-02-01 日本電気株式会社 Processor, processor control method, and information processing apparatus
JP2010218364A (en) * 2009-03-18 2010-09-30 Fujitsu Ltd Information processing system, communication control apparatus and method
US8306042B1 (en) * 2009-06-19 2012-11-06 Google Inc. Class-based deterministic packet routing
JP5493575B2 (en) * 2009-08-10 2014-05-14 富士通株式会社 Information processing apparatus and information processing apparatus control method

Also Published As

Publication number Publication date
JP2011039744A (en) 2011-02-24
US20110035530A1 (en) 2011-02-10
EP2288084B1 (en) 2014-04-09
US8589614B2 (en) 2013-11-19
EP2288084A2 (en) 2011-02-23
EP2288084A3 (en) 2011-08-03

Similar Documents

Publication Publication Date Title
JP5493575B2 (en) Information processing apparatus and information processing apparatus control method
US9742630B2 (en) Configurable router for a network on chip (NoC)
US8819616B2 (en) Asymmetric mesh NoC topologies
US7889725B2 (en) Computer cluster
EP2280513B1 (en) Router, information processing device having said router, and packet routing method
JP5083464B2 (en) Network-on-chip and network routing methods and systems
CN101834789B (en) Packet-circuit exchanging on-chip router oriented rollback steering routing algorithm and router used thereby
US9258358B2 (en) Parallel computing system and control method of parallel computing system
KR100758983B1 (en) BALS-based network on chip and data transmission method
CN114679423B (en) A deadlock-free scalable interconnect die architecture for flow control mechanisms
US7552270B2 (en) Signal transmission method, bridge unit, and information processing apparatus
US20250202838A1 (en) Network-on-chip architecture for handling different data sizes
EP2405362B1 (en) A connection arrangement
Nambinina et al. Extension of the lisnoc (network-on-chip) with an axi-based network interface
CN115580572B (en) Routing method, routing node, routing device, and computer-readable storage medium
Wu et al. Design and simulation of a torus structure and route algorithm for network on chip
Zulkefli et al. A efficacy of different buffer size on latency of network on chip (NoC)
CN115955429B (en) Routing method, device, system and electronic equipment of network on chip
JP2011193258A (en) Semiconductor integrated circuit device, route determination circuit and route determination method
CN119739671A (en) Data transmission method, device, electronic device and readable storage medium
Kumar et al. Design of five port router for 3× 3 mesh network using Verilog
Veena et al. Design and Implementation of Five Port Label Switched NoC Router Using FPGA
JP2017120542A (en) Parallel information processor, data transmission method, and data transmission program
Prasad et al. Efasbran: Error free adaptive shared buffer router architecture for network on chip
Sahu Bidirectional Network-on-Chip Router Implementation Using VHDL

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120405

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131001

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140217

R150 Certificate of patent or registration of utility model

Ref document number: 5493575

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150