JP2017091460A - Compute node network system - Google Patents
Compute node network system Download PDFInfo
- Publication number
- JP2017091460A JP2017091460A JP2015224988A JP2015224988A JP2017091460A JP 2017091460 A JP2017091460 A JP 2017091460A JP 2015224988 A JP2015224988 A JP 2015224988A JP 2015224988 A JP2015224988 A JP 2015224988A JP 2017091460 A JP2017091460 A JP 2017091460A
- Authority
- JP
- Japan
- Prior art keywords
- grid
- network system
- node network
- nodes
- calculation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Multi Processors (AREA)
Abstract
【課題】ネットワークの直径が極力小さい計算ノードネットワークシステムを提供する。【解決手段】計算ノードネットワークシステム(100A)は、矩形領域(30)に収まるように2次元配置された複数の計算ノード(10)と、複数の計算ノード(10)の任意のものどうしを接続する複数の通信リンク(20)とを備え、複数の計算ノード(10)のそれぞれが仮想的な第1のグリッド(40)の格子点に配置されており、複数の通信リンク(20)のそれぞれが仮想的な第2のグリッド(50)に沿って配線されており、第1のグリッド(40)の向きと第2のグリッド(50)の向きとが一致しており、第1のグリッド(40)および第2のグリッド(50)が矩形領域(30)に対して45°傾いている。【選択図】図1[Problem] To provide a computation node network system with a network diameter as small as possible. [Solution] The computation node network system (100A) comprises a plurality of computation nodes (10) arranged two-dimensionally to fit within a rectangular area (30), and a plurality of communication links (20) connecting any of the plurality of computation nodes (10), each of the plurality of computation nodes (10) being arranged at a lattice point of a virtual first grid (40), each of the plurality of communication links (20) being wired along a virtual second grid (50), the orientation of the first grid (40) and the orientation of the second grid (50) being the same, and the first grid (40) and the second grid (50) being inclined at 45° with respect to the rectangular area (30). [Selected Figure] Figure 1
Description
本発明は、複数の計算ノードを通信リンクで接続した計算ノードネットワークシステムに関する。 The present invention relates to a computing node network system in which a plurality of computing nodes are connected by communication links.
プロセッサのメニーコア化、計算機システムの大規模並列化(チップ内:数十コア、チップ間:10万ノード規模)が進むにつれて、計算機システムのメモリ、ストレージ、プロセッサコアなどの構成要素間を接続するネットワークである相互結合網(Interconnection Networks)の通信遅延が、計算システム全体に与える性能の割合が大きくなってきている。例えば、次世代の高性能システムにおける多くのマルチコア並列アプリケーションは、数百ナノ秒〜1マイクロ秒のMPI(Message Passing Interface)通信遅延を必要とすることが予測されている。また、そのメニーコアプロセッサチップ内の(パケット)ネットワークに関しては、プロセッサコア間通信遅延、およびL2キャッシュとの通信遅延が高々数サイクルであることが求められている。これらの設計では、コア間をどのように効率的に相互接続すべきか?というネットワーク構成(以下、ネットワークトポロジと呼ぶ)の設計の問題に直面している。 A network that connects components such as memory, storage, and processor cores of a computer system as processor cores and computer system massively parallel (within a chip: tens of cores, between chips: 100,000 nodes) The ratio of the performance given to the entire computing system by the communication delay of the interconnection network is increasing. For example, many multi-core parallel applications in next-generation high performance systems are expected to require Message Passing Interface (MPI) communication delays of several hundred nanoseconds to 1 microsecond. Further, regarding the (packet) network in the many-core processor chip, the communication delay between the processor cores and the communication delay with the L2 cache are required to be several cycles at most. How should these designs interconnect efficiently between cores? We are faced with the problem of designing the network configuration (hereinafter referred to as network topology).
チップ間、チップ内ともに、相互結合網の通信遅延を削減する有効な1つの方法は、直径・平均最短パス長の小さいネットワークトポロジを採用することである。実際に、チップ内、チップ間とも直径、平均最短パス長の小さなネットワークトポロジを採用することにより、多くの並列アプリケーションの性能が向上することがシミュレーション、解析結果から報告されている。現在、興味深いことに、有力なグラフはランダム性を持つグラフ(例:リンクにランダムなショートカットリンクを加えたトポロジ)である。 One effective method for reducing the communication delay of the interconnection network between chips and within the chip is to employ a network topology having a small diameter and average shortest path length. In fact, it has been reported from simulation and analysis results that the performance of many parallel applications is improved by adopting a network topology with a small diameter and average shortest path length both inside and between chips. Interestingly, the dominant graphs are those with randomness (eg, topologies with random shortcut links added to links).
実際にランダムトポロジをチップ内ネットワーク、スパコンで用いる場合、通信リンク長に関する制約がある。例えば、チップ内ネットワークにおいて、メタル配線のリンク遅延は、65nmプロセスにおいて、理想的には50ps/mm以下となる。そのため動作周波数に合った配線長に抑える必要がある。また、チップ間ネットワークでは、40Gbps以上のリンクバンド幅が標準となりつつある。この場合、電気ケーブルは、InfiniBandの場合7m、イーサネット(登録商標)の場合5mまでに限定される。ビット化けなどのソフトエラー率を重視した場合、さらにケーブル長が短くなる。下記非特許文献1には、ランダムトポロジの生成アルゴリズムが開示されている。 When a random topology is actually used in an on-chip network or a supercomputer, there are restrictions on the communication link length. For example, in an on-chip network, the link delay of metal wiring is ideally 50 ps / mm or less in a 65 nm process. Therefore, it is necessary to keep the wiring length suitable for the operating frequency. In addition, in a chip-to-chip network, a link bandwidth of 40 Gbps or more is becoming a standard. In this case, the electric cable is limited to 7 m for InfiniBand and 5 m for Ethernet (registered trademark). When emphasizing the soft error rate such as bit corruption, the cable length becomes even shorter. Non-Patent Document 1 below discloses a random topology generation algorithm.
図7は、従来の計算ノードネットワークシステムを模式的に示す平面図である。従来の計算ノードネットワークシステムでは、複数の計算ノード10が矩形領域30において仮想的なグリッド40の格子点に配置され、任意の計算ノード10どうしが仮想的なグリッド50(実質的にグリッド40と同じグリッド)に沿って配線された通信リンク20によって接続されている。例えば、図7では、8×8=64個の計算ノード10が格子状に並んでいる。
FIG. 7 is a plan view schematically showing a conventional computing node network system. In the conventional computing node network system, a plurality of
一般に、計算ノードネットワークシステムにおいて対角に位置する計算ノード間のリンク距離が最も長くなるという問題がある。例えば、図7に示した計算ノードネットワークシステムでは、左上の計算ノード10と右下の計算ノード10との間のリンク距離が最も長くなる。そのため、通信リンク長に厳しい制限がある場合、これらノード間のホップ数が直径(ネットワークの直径ともいう)となる可能性が極めて高い。ネットワークの直径が大きくなると最大通信遅延が大きくなるため、ネットワークの直径はできるだけ小さいことが望ましい。
In general, there is a problem that the link distance between the calculation nodes located diagonally is the longest in the calculation node network system. For example, in the calculation node network system shown in FIG. 7, the link distance between the upper
上記問題に鑑み、本発明は、ネットワークの直径が極力小さい計算ノードネットワークシステムを提供することを目的とする。 In view of the above problems, an object of the present invention is to provide a computation node network system in which the network diameter is as small as possible.
本発明の一局面に従った計算ノードネットワークシステムは、矩形領域に収まるように2次元配置された複数の計算ノードと、複数の計算ノードの任意のものどうしを接続する複数の通信リンクとを備え、複数の計算ノードのそれぞれが仮想的な第1のグリッドの格子点に配置されており、複数の通信リンクのそれぞれが仮想的な第2のグリッドに沿って配線されており、矩形領域の縦横方向、第1のグリッドの向き、および第2のグリッドの向きの三つのうち少なくとも二つが互いに異なるものである。 A calculation node network system according to one aspect of the present invention includes a plurality of calculation nodes arranged two-dimensionally so as to fit in a rectangular area, and a plurality of communication links connecting any of the plurality of calculation nodes. Each of the plurality of calculation nodes is arranged at a lattice point of the virtual first grid, each of the plurality of communication links is wired along the virtual second grid, and the rectangular area is vertically and horizontally At least two of the three directions, the direction of the first grid and the direction of the second grid, are different from each other.
これによると、計算ノード間の最長リンク距離を従来よりも短くすることができ、ネットワークの直径を低減することができる。 According to this, the longest link distance between calculation nodes can be made shorter than before, and the diameter of the network can be reduced.
例えば、第1のグリッドの向きと第2のグリッドの向きとが一致しており、第1のグリッドおよび第2のグリッドが矩形領域に対して45°傾いている。 For example, the direction of the first grid and the direction of the second grid coincide with each other, and the first grid and the second grid are inclined by 45 ° with respect to the rectangular region.
あるいは、矩形領域の縦横方向と第1のグリッドの向きとが一致しており、第2のグリッドが矩域領域および第1のグリッドに対して45°傾いている。 Alternatively, the vertical and horizontal directions of the rectangular area coincide with the orientation of the first grid, and the second grid is inclined 45 ° with respect to the rectangular area and the first grid.
あるいは、矩形領域の縦横方向と第2のグリッドの向きとが一致しており、第1のグリッドが矩形領域および第2のグリッドに対して45°傾いている。 Alternatively, the vertical and horizontal directions of the rectangular area coincide with the orientation of the second grid, and the first grid is inclined 45 ° with respect to the rectangular area and the second grid.
また、複数の通信リンクが、ランダムにネットワークを構成した後、ネットワークの直径および平均ホップ数が小さくなるように局所的に任意の通信リンクを置き換えることを繰り返して得られたものであることが好ましい。 In addition, it is preferable that a plurality of communication links are obtained by repeatedly replacing any communication link locally so that the network diameter and the average number of hops are reduced after the network is randomly configured. .
本発明によると、ネットワークの直径が極力小さい計算ノードネットワークシステムを実現することができる。これにより、計算ノードネットワークシステムにおける計算ノード間の通信遅延を小さくすることができる。 According to the present invention, it is possible to realize a computation node network system in which the network diameter is as small as possible. Thereby, the communication delay between the calculation nodes in a calculation node network system can be made small.
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。ただし、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。 Hereinafter, embodiments will be described in detail with reference to the drawings as appropriate. However, more detailed explanation than necessary may be omitted. For example, detailed descriptions of already well-known matters and repeated descriptions for substantially the same configuration may be omitted. This is to avoid the following description from becoming unnecessarily redundant and to facilitate understanding by those skilled in the art.
なお、発明者らは、当業者が本発明を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって特許請求の範囲に記載の主題を限定することを意図するものではない。また、図面に描かれた各要素の大きさ、細部の詳細形状などは実際のものとは異なることがある。 In addition, the inventors provide the accompanying drawings and the following description in order for those skilled in the art to fully understand the present invention, and these are intended to limit the subject matter described in the claims. is not. Moreover, the size of each element drawn in the drawings, the detailed shape of the details, and the like may differ from the actual ones.
≪第1の実施形態≫
図1は、本発明の第1の実施形態に係る計算ノードネットワークシステムを模式的に示す平面図である。本実施形態に係る計算ノードネットワークシステム100Aは、矩形領域30に収まるように2次元配置された複数の計算ノード10と、これら計算ノード10の任意のものどうしを接続する複数の通信リンク20とを備える。なお、便宜上、図1では通信リンク20を数本しか描いていないが、実際にはもっと多くの通信リンク20が配線される。また、計算ノード10の上を通過する通信リンク20はその計算ノード10に接続されていないことを表す。
<< First Embodiment >>
FIG. 1 is a plan view schematically showing a computation node network system according to the first embodiment of the present invention. The computing
計算ノードネットワークシステム100Aは、具体的にはスーパーコンピュータやNoC(ネットワーク・オン・チップ)などである。スーパーコンピュータの場合、計算ノード10は、CPUやメモリなどが搭載されたシステムボード、磁気ディスク装置、電源装置、I/Oシステムボード(スイッチ装置)、冷却機構等を収容した個々のラックに相当する。スーパーコンピュータは、計算機室にこのようなラックを数百個規則的に並べて構成される。NoCの場合、計算ノード10は、演算回路、論理回路、キャッシュメモリ、通信ポート(スイッチ回路)等が実装された個々のプロセッサコアに相当する。NoCは、半導体基板上にこのようなプロセッサコアを数百個規則的に並べて構成される。
The computing
計算ノードネットワーク100Aにおいて、各計算ノード10(具体的にはラックやプロセッサコア)は仮想的なグリッド40の格子点に配置されている。ここで、グリッド40は、矩形領域30の縦横方向に対して45°傾いている。
In the
通信リンク20は、仮想的なグリッド50に沿って配線されている。スーパーコンピュータの場合、通信リンク20は、光ファイバーや電気ケーブルなどに相当する。NoCの場合、通信リンク20は、メタル配線などに相当する。ここで、グリッド50もまた矩形領域30の縦横方向に対して45°傾いており、グリッド50とグリッド40は実質的に同じグリッドである。
The
すなわち、計算ノードネットワーク100Aでは、計算ノード10の配置の基準となるグリッド40の向きと通信リンク20の配線の基準となるグリッド50の向きとが一致しており、グリッド40およびグリッド50が矩形領域30に対して45°傾いている。
That is, in the
本実施形態によると、計算ノードネットワークシステム100Aにおいて最も距離が離れた対角の2つの計算ノード10を対角線で接続することができる。これにより、計算ノード間の最長リンク距離を従来比で1/√2(約70%)に低減することができる。
According to the present embodiment, the two
また、本実施形態では、いずれの計算ノード10も平面視略正方形の縦辺または横辺、すなわち、計算ノード10の側方辺部に通信リンク20を接続することができる。一般に、計算ノード10において通信リンク20の引き出し口は計算ノード10の辺部に配置されているため、上記のように通信リンク20は計算ノード10の側方辺部に接続可能にすることは好ましいことである。
In the present embodiment, any of the
≪第2の実施形態≫
図2は、第2の実施形態に係る計算ノードネットワークシステム100Bを模式的に示す平面図である。本実施形態に係る計算ノードネットワークシステム100Bは、矩形領域30に収まるように2次元配置された複数の計算ノード10と、これら計算ノード10の任意のものどうしを接続する複数の通信リンク20とを備える。なお、便宜上、図2では通信リンク20を数本しか描いていないが、実際にはもっと多くの通信リンク20が配線される。また、計算ノード10の上を通過する通信リンク20はその計算ノード10に接続されていないことを表す。
<< Second Embodiment >>
FIG. 2 is a plan view schematically showing a computation
計算ノードネットワークシステム100Bは、具体的にはスーパーコンピュータやNOCなどである。計算ノードネットワーク100Bにおいて、各計算ノード10(具体的にはラックやプロセッサコア)は仮想的なグリッド40の格子点に配置されている。ここで、グリッド40の向きは、矩形領域30の縦横方向と一致している。
The computing
通信リンク20は、仮想的なグリッド50に沿って配線されている。ここで、グリッド50は、グリッド40の格子点を斜めに結ぶようなグリッドであり、矩形領域30およびグリッド40に対して45°傾いている。
The
すなわち、計算ノードネットワーク100Bでは、複数の計算ノード10が配置される矩形領域30の縦横方向と計算ノード10の配置の基準となるグリッド40の向きとが一致しており、通信リンク20の配線の基準となるグリッド50が矩形領域30およびグリッド40に対して45°傾いている。
That is, in the
本実施形態では、計算ノード10の角部に通信リンク20を接続する必要があるため、第1の実施形態と比較して、計算ノード10への通信リンク20の接続が複雑になるものの、計算ノードネットワークシステム100Bにおいて最も距離が離れた対角の2つの計算ノード10を対角線で接続することができる。これにより、計算ノード間の最長リンク距離を従来比で1/√2(約70%)に低減することができる。
In this embodiment, since it is necessary to connect the
特に、本実施形態では計算ノード10の配置自体は従来の構成と同じ格子状であるから、従来の計算ノードネットワークシステムにおける計算ノード10の配列はそのままで通信リンク20の配線パターンを変えるだけで、従来の計算ノードネットワークシステムを本実施形態に係る計算ノードネットワークシステム100Bに変更することができる。例えば、既存のスーパーコンピュータにおいてラックの配置を変えることなく、通信リンク20を本実施形態のように配線するだけで計算ノード間の最長リンク距離を低減する効果が得られる。
In particular, in this embodiment, since the arrangement of the
≪第3の実施形態≫
図3は、本発明の第3の実施形態に係る計算ノードネットワークシステムを模式的に示す平面図である。本実施形態に係る計算ノードネットワークシステム100Cは、矩形領域30に収まるように2次元配置された複数の計算ノード10と、これら計算ノード10の任意のものどうしを接続する複数の通信リンク20とを備える。なお、便宜上、図3では通信リンク20を数本しか描いていないが、実際にはもっと多くの通信リンク20が配線される。また、計算ノード10の上を通過する通信リンク20はその計算ノード10に接続されていないことを表す。
<< Third Embodiment >>
FIG. 3 is a plan view schematically showing a computation node network system according to the third embodiment of the present invention. The computation
計算ノードネットワークシステム100Cは、具体的にはスーパーコンピュータやNOCなどである。計算ノードネットワーク100Cにおいて、各計算ノード10(具体的にはラックやプロセッサコア)は仮想的なグリッド40の格子点に配置されている。ここで、グリッド40は、矩形領域30の縦横方向に対して45°傾いている。
The computing
通信リンク20は、仮想的なグリッド50に沿って配線されている。ここで、グリッド50は、グリッド40の格子点を斜めに結ぶようなグリッドであり、グリッド50の向きは、矩形領域30の縦横方向と一致している。
The
すなわち、計算ノードネットワーク100Cでは、複数の計算ノード10が配置される矩形領域30の縦横方向と通信リンク20の配線の基準となるグリッド50の向きとが一致しており、計算ノード10の配置の基準となるグリッド40が矩形領域30およびグリッド50に対して45°傾いている。
In other words, in the
本実施形態では、計算ノード10の角部に通信リンク20を接続する必要があるため、第1の実施形態と比較して、計算ノード10への通信リンク20の接続が複雑になるものの、最小の通信リンク長で接続できる計算ノード10の数を増やすことができる。すなわち、本実施形態および第1の実施形態のいずれにおいてもある計算ノード10の周りに8個の計算ノード10が配置されているが、第1の実施形態では最小の通信リンク長で接続できる計算ノード10は4個であるのに対して、本実施形態では周りの8個すべての計算ノード10に最小の通信リンク長で接続可能となる。これにより、平均ホップ数を低減することができる。
In this embodiment, since it is necessary to connect the
≪第4の実施形態≫
図4は、本発明の第4の実施形態に係る計算ノードネットワークシステムを模式的に示す平面図である。本実施形態に係る計算ノードネットワークシステム100Dは、矩形領域30に収まるように2次元配置された複数の計算ノード10と、これら計算ノード10の任意のものどうしを接続する複数の通信リンク20とを備える。なお、便宜上、図4では通信リンク20を数本しか描いていないが、実際にはもっと多くの通信リンク20が配線される。また、計算ノード10の上を通過する通信リンク20はその計算ノード10に接続されていないことを表す。
<< Fourth Embodiment >>
FIG. 4 is a plan view schematically showing a computation node network system according to the fourth embodiment of the present invention. The computation
計算ノードネットワークシステム100Dは、具体的にはスーパーコンピュータやNOCなどである。計算ノードネットワーク100Dにおいて、各計算ノード10(具体的にはラックやプロセッサコア)は仮想的なグリッド40の格子点に配置されている。ここで、グリッド40は、矩形領域30の縦横方向に対しておよそ18.5°傾いている。
Specifically, the computation
通信リンク20は、仮想的なグリッド50に沿って配線されている。ここで、グリッド50は、グリッド40の格子点を斜めに結ぶようなグリッドであり、グリッド40に対して45°傾き、かつ、矩形領域30に対しておよそ26.5°傾いている。
The
すなわち、計算ノードネットワーク100Dでは、複数の計算ノード10が配置される矩形領域30の縦横方向、計算ノード10の配置の基準となるグリッド40の向き、および通信リンク20の配線の基準となるグリッド50の向きの三つが互いに異なっている。
That is, in the
本実施形態では、第1の実施形態と同様に、いずれの計算ノード10も平面視略正方形の縦辺または横辺、すなわち、計算ノード10の側方辺部に通信リンク20を接続することができる。さらに、本実施形態では、最小の通信リンク長で接続できる計算ノード10の数を、第1の実施形態よりも増やすことができる。すなわち、本実施形態および第1の実施形態のいずれにおいてもある計算ノード10の周りに8個の計算ノード10が配置されているが、第1の実施形態では最小の通信リンク長で接続できる計算ノード10は4個であるのに対して、本実施形態では周りの8個すべての計算ノード10に最小の通信リンク長で接続可能となる。これにより、平均ホップ数を低減することができる。
In the present embodiment, as in the first embodiment, any of the
以上のように、第1ないし第4の各実施形態によると、計算ノードネットワークにおいて、計算ノード間の最長リンク距離を短くしたり、平均ホップ数を低減したりすることができる。これにより、計算ノードネットワークシステムにおけるネットワークの直径を極力小さくすることができる。 As described above, according to the first to fourth embodiments, it is possible to shorten the longest link distance between computation nodes or reduce the average number of hops in the computation node network. Thereby, the diameter of the network in a calculation node network system can be made as small as possible.
≪配線最適化≫
一般に、計算ノードネットワークシステムは計算ノードと通信リンクで定義され、グラフ理論ではそれぞれノードとエッジで表される。そして、計算ノードネットワークシステムの性能は、ネットワークの直径とASPL(Average Shortest Path Length)(平均最短パス長あるいは平均ホップ数)で評価される。直径は、ノード間の最小ホップ数の最大値である。平均ホップ数は、全ノード間の最小ホップ数の平均値である。
≪Wiring optimization≫
In general, a computing node network system is defined by computing nodes and communication links, and is represented by nodes and edges, respectively, in graph theory. The performance of the computing node network system is evaluated by the network diameter and ASPL (Average Shortest Path Length) (average shortest path length or average number of hops). The diameter is the maximum value of the minimum number of hops between nodes. The average number of hops is an average value of the minimum number of hops between all nodes.
通信リンクが長いと通信遅延が大きくなるため、通信リンク長には上限が設けられる。例えば、スーパーコンピュータにおいて電気ケーブルを用いて伝送速度40Gbpsを実現するには、通信リンク長は7mが限界だと言われている。したがって、通信リンクで直接つながっていない遠く離れたノード間で通信を行う場合、他のノードを経由(ホップ)して通信を行う必要がある。しかし、経由数(ホップ数)が多いほどノード間遅延が大きくなり、また、消費電力も大きくなる。したがって、計算ノードネットワークシステムでは直径および平均ホップ数をともに少なくすることが望まれる。 Since the communication delay becomes large when the communication link is long, an upper limit is set for the communication link length. For example, in order to achieve a transmission speed of 40 Gbps using an electric cable in a supercomputer, it is said that the limit of the communication link length is 7 m. Therefore, when communication is performed between remote nodes that are not directly connected by a communication link, it is necessary to perform communication via another node (hop). However, as the number of vias (the number of hops) increases, the delay between nodes increases and the power consumption also increases. Therefore, it is desirable to reduce both the diameter and the average number of hops in the computation node network system.
そこで、計算ノードネットワークシステムにおいて直径および平均ホップ数をともに少なくするような配線最適化アルゴリズムを開示する。図5は、配線最適化処理のフローチャートである。なお、当該配線最適化処理は、図略のコンピュータを用いて実行することができる。 Therefore, a wiring optimization algorithm that reduces both the diameter and the average number of hops in the computation node network system is disclosed. FIG. 5 is a flowchart of the wiring optimization process. The wiring optimization process can be executed using a computer (not shown).
まず、計算ノードネットワークシステムにおいて通信リンクをランダムに設定する(S1)。ただし、通信リンク長の上限および計算ノードのポート数は超えないようにする。一般に、通信リンクに長さ制限がなければこのようなランダムネットワークは優れた配線であることが知られている、しかし、通信リンクに強い長さ制限があればランダムネットワークはさほどよくない。 First, a communication link is randomly set in the computation node network system (S1). However, the upper limit of the communication link length and the number of ports of the calculation node should not be exceeded. In general, it is known that such a random network is an excellent wiring if there is no length restriction on the communication link, but if the communication link has a strong length restriction, the random network is not so good.
ランダムネットワークが完了すると、任意の2つの通信リンクを選択する(S2)。そして、選択した2つの通信リンクの代替候補となる2つの通信リンクを設定する(S3)。 When the random network is completed, any two communication links are selected (S2). Then, two communication links that are alternative candidates for the two selected communication links are set (S3).
図6は、2つの通信リンクの入れ替えを説明する図である。ステップS2で2つの通信リンクL1、L2を選択したとする。通信リンクL1は、計算ノードAと計算ノードBとを繋ぐリンクである。通信リンクL2は、計算ノードCと計算ノードDとを繋ぐリンクである。この場合、代替候補として2つの通信リンクL3、L4が設定される。通信リンクL3は、計算ノードAと計算ノードCとを繋ぐリンクである。通信リンクL4は、計算ノードBと計算ノードDとを繋ぐリンクである。 FIG. 6 is a diagram for explaining replacement of two communication links. Assume that two communication links L1 and L2 are selected in step S2. The communication link L1 is a link that connects the calculation node A and the calculation node B. The communication link L2 is a link connecting the calculation node C and the calculation node D. In this case, two communication links L3 and L4 are set as alternative candidates. The communication link L3 is a link that connects the calculation node A and the calculation node C. The communication link L4 is a link that connects the calculation node B and the calculation node D.
図5へ戻り、ステップS2で選択した2つの通信リンクをステップS3で設定した代替候補の2つの通信リンクに置換した場合に、通信リンクの長さ制限の条件を満たすか否かを判定する。なお、各計算ノードには接続可能な通信リンク数、すなわちポート数の制限もあるが、図6に示したように通信リンクを置換するのであれば置換前後で各計算ノードに接続された通信リンク数は変化しないため、ポート数の制限については考慮しなくてもよくなる。 Returning to FIG. 5, when the two communication links selected in step S <b> 2 are replaced with two alternative communication links set in step S <b> 3, it is determined whether the communication link length restriction condition is satisfied. Each calculation node has a limit on the number of communication links that can be connected, that is, the number of ports. However, if the communication link is replaced as shown in FIG. 6, the communication link connected to each calculation node before and after the replacement. Since the number does not change, it is not necessary to consider the limitation on the number of ports.
もし、通信リンクの長さ制限の条件を満たしていない、すなわち、代替候補の2つの通信リンクに置換することで、通信リンクの上限を超えるようであれば(S4でNO)、ステップS2に戻り、別の2つの通信リンクを選択する。一方、通信リンクの長さ制限の条件を満たしていれば(S4でYES)、代替候補の2つの通信リンクに置換後の計算ノードネットワークシステムについて、ネットワークの直径と平均ホップ数を計算する(S5)。 If the communication link length restriction condition is not satisfied, i.e., replacement with two alternative communication links exceeds the upper limit of the communication link (NO in S4), the process returns to step S2. , Select another two communication links. On the other hand, if the communication link length restriction condition is satisfied (YES in S4), the network diameter and the average number of hops are calculated for the calculation node network system after replacement with the two alternative communication links (S5). ).
そして、ステップS5で計算したネットワークの直径と平均ホップ数が、代替候補の2つの通信リンクに置換前の計算ノードネットワークシステムのネットワークの直径と平均ホップ数よりも小さくなるか否かを判定する。もし、小さくならなければ(S6でNO)、ステップS2に戻り、別の2つの通信リンクを選択する。一方、2つの通信リンクを置換することでネットワークの直径と平均ホップ数がともに以前よりも小さくなるようであれば(S6でYES)、ステップS2で選択した2つの通信リンク(図6の例では通信リンクL1、L2)を削除して、ステップS3で設定した代替候補の2つの通信リンク(図6の例では通信リンクL3、L4)を採用し、ステップS2に戻って新たな2つの通信リンクを選択する。 Then, it is determined whether or not the network diameter and average hop count calculated in step S5 are smaller than the network diameter and average hop count of the calculation node network system before replacement with the two alternative communication links. If not smaller (NO in S6), the process returns to step S2 to select another two communication links. On the other hand, if the two communication links are replaced so that both the network diameter and the average number of hops are smaller than before (YES in S6), the two communication links selected in step S2 (in the example of FIG. 6) The communication links L1 and L2) are deleted, two alternative communication links (communication links L3 and L4 in the example of FIG. 6) set in step S3 are adopted, and the process returns to step S2 and two new communication links Select.
以上のステップを繰り返すことで計算ノードネットワークシステムの直径と平均ホップ数はローカルミニマム値に収束する。 By repeating the above steps, the diameter and average hop count of the computation node network system converge to the local minimum value.
次に、従来構成(図7参照)、第1の実施形態、および第2の実施形態の各タイプの計算ノードネットワークシステムを上記の配線最適化アルゴリズムで配線した例を示す。なお、各例において、隣接する2つの計算ノードを接続するときの通信リンク長を1単位として、通信リンクの長さ上限を4単位とする。また、各計算ノードの最大ポート数を4とする。 Next, an example is shown in which each type of calculation node network system of the conventional configuration (see FIG. 7), the first embodiment, and the second embodiment is wired with the above-described wiring optimization algorithm. In each example, the communication link length when two adjacent calculation nodes are connected is assumed to be 1 unit, and the upper limit of the communication link length is assumed to be 4 units. In addition, the maximum number of ports of each calculation node is four.
≪比較例≫
比較例では、32×32=1024個の計算ノードを用いて従来タイプ(図7参照)の計算ノードネットワークシステムを構成した。比較例に係る計算ノードネットワークシステムにおいてランダムネットワークを形成したところ、直径が23、平均ホップ数が9.576506であった。このようなランダムネットワークに上記の配線最適化アルゴリズムを適用すると、直径が16、平均ホップ数が6.685486に低下した。この直径は、32×32=1024個の計算ノードからなる計算ノードネットワークシステムにおける最適値である。
≪Comparative example≫
In the comparative example, a conventional type (see FIG. 7) computing node network system is configured using 32 × 32 = 1024 computing nodes. When a random network was formed in the computation node network system according to the comparative example, the diameter was 23 and the average number of hops was 9.576506. When the above wiring optimization algorithm was applied to such a random network, the diameter decreased to 16 and the average number of hops decreased to 6.68486. This diameter is an optimum value in a computation node network system composed of 32 × 32 = 1024 computation nodes.
≪実施例1≫
実施例1では、23×46=1058個の計算ノードを用いて第1の実施形態のタイプの計算ノードネットワークシステムを構成した。実施例1に係る計算ノードネットワークシステムを上記の配線最適化アルゴリズムで配線したところ、直径が12、平均ホップ数が6.790274であった。
Example 1
In Example 1, the computation node network system of the type of the first embodiment was configured using 23 × 46 = 1058 computation nodes. When the computation node network system according to Example 1 was wired with the above-described wiring optimization algorithm, the diameter was 12 and the average number of hops was 6.790274.
実施例1と比較例とを比較すると、計算ノード数が比較例よりもわずかに多いにもかかわらず直径が小さくなっている。この直径は、23×46=1058個の計算ノードからなる第1の実施形態のタイプの計算ノードネットワークシステムにおける最適値である。 When Example 1 is compared with the comparative example, the diameter is small although the number of calculation nodes is slightly larger than that of the comparative example. This diameter is an optimum value in the calculation node network system of the type of the first embodiment composed of 23 × 46 = 1058 calculation nodes.
≪実施例2≫
実施例1では、32×32=1024個の計算ノードを用いて第2の実施形態のタイプの計算ノードネットワークシステムを構成した。実施例2に係る計算ノードネットワークシステムを上記の配線最適化アルゴリズムで配線したところ、直径が11、平均ホップ数が6.604497であった。なお、厳密に言うと、実施例2では通信リンクを斜めに配線する都合上、通信リンクの長さ上限は3√2(およそ4.2)単位となる。
<< Example 2 >>
In Example 1, the computation node network system of the type of the second embodiment was configured using 32 × 32 = 1024 computation nodes. When the computation node network system according to Example 2 was wired with the above-described wiring optimization algorithm, the diameter was 11 and the average hop count was 6.604497. Strictly speaking, in the second embodiment, the upper limit of the length of the communication link is 3√2 (approximately 4.2) for convenience of wiring the communication link diagonally.
実施例2と比較例とを比較すると、計算ノード数が比較例と同じでも直径が小さくなっている。この直径は、32×32=1024個の計算ノードからなる第2の実施形態のタイプの計算ノードネットワークシステムにおける最適値である。 When Example 2 is compared with the comparative example, the diameter is small even if the number of calculation nodes is the same as that of the comparative example. This diameter is the optimum value in the calculation node network system of the type of the second embodiment composed of 32 × 32 = 1024 calculation nodes.
以上のように、本発明における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。 As described above, the embodiments have been described as examples of the technology in the present invention. For this purpose, the accompanying drawings and detailed description are provided.
したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。 Accordingly, among the components described in the accompanying drawings and the detailed description, not only the components essential for solving the problem, but also the components not essential for solving the problem in order to illustrate the above technique. May also be included. Therefore, it should not be immediately recognized that these non-essential components are essential as those non-essential components are described in the accompanying drawings and detailed description.
例えば、計算ノード10の平面視形状は略正方形である必要はなく矩形であってもよい。また、計算ノード10の配置間隔は等間隔でなくてもよい。例えば、行間隔よりも列間隔を広めにしてもよい。したがって、グリッド40の傾きも45度である必要はない。計算ノード10の平面視形状や配置間隔に応じてグリッド40の傾きを変えてもよい。
For example, the planar view shape of the
また、上述の実施の形態は、本発明における技術を例示するためのものであるから、特許請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。 Moreover, since the above-mentioned embodiment is for demonstrating the technique in this invention, a various change, replacement, addition, abbreviation, etc. can be performed in a claim or its equivalent range.
100A、100B、100C 計算ノードネットワークシステム
10 計算ノード
20 通信リンク
30 矩形領域
40 グリッド(第1のグリッド)
50 グリッド(第2のグリッド)
100A, 100B, 100C Computing
50 grid (second grid)
Claims (7)
前記複数の計算ノードの任意のものどうしを接続する複数の通信リンクとを備え、
前記複数の計算ノードのそれぞれが仮想的な第1のグリッドの格子点に配置されており、
前記複数の通信リンクのそれぞれが仮想的な第2のグリッドに沿って配線されており、
前記矩形領域の縦横方向、前記第1のグリッドの向き、および前記第2のグリッドの向きの三つのうち少なくとも二つが互いに異なる
ことを特徴とする計算ノードネットワークシステム。 A plurality of calculation nodes arranged two-dimensionally to fit in a rectangular area;
A plurality of communication links connecting any one of the plurality of computing nodes;
Each of the plurality of computation nodes is arranged at a grid point of a virtual first grid;
Each of the plurality of communication links is wired along a virtual second grid;
A computing node network system, wherein at least two of three directions of a vertical and horizontal directions of the rectangular region, a direction of the first grid, and a direction of the second grid are different from each other.
前記第1のグリッドおよび前記第2のグリッドが前記矩形領域に対して45°傾いている、請求項1に記載の計算ノードネットワークシステム。 The orientation of the first grid and the orientation of the second grid match,
The computing node network system according to claim 1, wherein the first grid and the second grid are inclined by 45 ° with respect to the rectangular region.
前記第2のグリッドが前記矩形領域および前記第1のグリッドに対して45°傾いている、請求項1に記載の計算ノードネットワークシステム。 The vertical and horizontal directions of the rectangular area coincide with the orientation of the first grid,
The computing node network system according to claim 1, wherein the second grid is inclined at 45 ° with respect to the rectangular area and the first grid.
前記第1のグリッドが前記矩形領域および前記第2のグリッドに対して45°傾いている、請求項1に記載の計算ノードネットワークシステム。 The vertical and horizontal directions of the rectangular area coincide with the orientation of the second grid,
The computing node network system according to claim 1, wherein the first grid is inclined by 45 ° with respect to the rectangular area and the second grid.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015224988A JP2017091460A (en) | 2015-11-17 | 2015-11-17 | Compute node network system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015224988A JP2017091460A (en) | 2015-11-17 | 2015-11-17 | Compute node network system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2017091460A true JP2017091460A (en) | 2017-05-25 |
Family
ID=58768722
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015224988A Pending JP2017091460A (en) | 2015-11-17 | 2015-11-17 | Compute node network system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2017091460A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114175003A (en) * | 2019-08-07 | 2022-03-11 | 香港大学 | System and method for determining a routing net in a multi-core processor and related multi-core processor |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS63149757A (en) * | 1986-12-15 | 1988-06-22 | Mitsui Eng & Shipbuild Co Ltd | Inter-processor communicating method |
| JPS63501663A (en) * | 1985-09-27 | 1988-06-23 | シュラムバ−ガ−・テクノロジ−・コ−ポレ−ション | multiprocessor communication device |
| JP2005208961A (en) * | 2004-01-23 | 2005-08-04 | Hitachi Kokusai Electric Inc | Software defined radio |
| JP2006506703A (en) * | 2002-11-14 | 2006-02-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Apparatus for parallel data processing and camera system comprising the apparatus |
| US20060049468A1 (en) * | 2002-09-10 | 2006-03-09 | Chung-Kuan Cheng | Interconnection architecture and method of assessing interconnection architecture |
| JP2012528416A (en) * | 2009-06-19 | 2012-11-12 | ボード オブ レジェンツ,ユニヴァーシティ オブ テキサス システム | On-chip interconnect network based on expandable bus |
-
2015
- 2015-11-17 JP JP2015224988A patent/JP2017091460A/en active Pending
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS63501663A (en) * | 1985-09-27 | 1988-06-23 | シュラムバ−ガ−・テクノロジ−・コ−ポレ−ション | multiprocessor communication device |
| JPS63149757A (en) * | 1986-12-15 | 1988-06-22 | Mitsui Eng & Shipbuild Co Ltd | Inter-processor communicating method |
| US20060049468A1 (en) * | 2002-09-10 | 2006-03-09 | Chung-Kuan Cheng | Interconnection architecture and method of assessing interconnection architecture |
| JP2006506703A (en) * | 2002-11-14 | 2006-02-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Apparatus for parallel data processing and camera system comprising the apparatus |
| JP2005208961A (en) * | 2004-01-23 | 2005-08-04 | Hitachi Kokusai Electric Inc | Software defined radio |
| JP2012528416A (en) * | 2009-06-19 | 2012-11-12 | ボード オブ レジェンツ,ユニヴァーシティ オブ テキサス システム | On-chip interconnect network based on expandable bus |
Non-Patent Citations (1)
| Title |
|---|
| 鯉渕道紘,外5名: "低遅延相互結合網のための交換ランダムトポロジ", 電子情報通信学会技術研究報告, vol. Vol.114,No.302,(CPSY2014-54〜71), JPN6019027318, 6 November 2014 (2014-11-06), JP, pages 57 - 62, ISSN: 0004209055 * |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114175003A (en) * | 2019-08-07 | 2022-03-11 | 香港大学 | System and method for determining a routing net in a multi-core processor and related multi-core processor |
| CN114175003B (en) * | 2019-08-07 | 2023-10-10 | 香港大学 | Systems and methods for determining routing networks in multi-core processors and related multi-core processors |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20130073814A1 (en) | Computer System | |
| EP3226490B1 (en) | Optical network-on-chip, optical router and signal transmission method | |
| CN110495137A (en) | Expansible data center network topology on distribution switch | |
| Xu et al. | Optimal placement of vertical connections in 3D network-on-chip | |
| CN104320341B (en) | Adaptive and asynchronous routing network system on 2D-Torus chip and design method thereof | |
| CN102780628B (en) | On-chip interconnection network routing method oriented to multi-core microprocessor | |
| CN104883224B (en) | Method and node device for constructing data center switching network | |
| Chen et al. | An evaluation of network architectures for next generation supercomputers | |
| CN105051717B (en) | Parallel annulus network interconnection system and the wherein method of propagation data business | |
| US20240311323A1 (en) | Fanout connections on a high-performance computing device | |
| Koibuchi et al. | Optical network technologies for HPC: computer-architects point of view | |
| CN105049362A (en) | Topological structure of network on two-dimension surrounding grid sheet and routing method | |
| JP2017091460A (en) | Compute node network system | |
| Matos et al. | Performance evaluation of hierarchical NoC topologies for stacked 3D ICs | |
| Wang et al. | An efficient topology reconfiguration algorithm for NoC based multiprocessor arrays | |
| Fasiku et al. | Effect of routing algorithm on wireless network-on-chip performance | |
| Lei et al. | Galaxyfly: A novel family of flexible-radix low-diameter topologies for large-scales interconnection networks | |
| CN104683263B (en) | Alleviate the Survey on network-on-chip topology of focus | |
| Gagan et al. | Long-distance communication via pseudo-3d networks-on-chip | |
| US10644958B2 (en) | All-connected by virtual wires network of data processing nodes | |
| Halavar et al. | Accurate performance analysis of 3d mesh network on chip architectures | |
| Azimi et al. | FLEXIBLE AND ADAPTIVE ON-CHIP INTERCONNECT FOR TERA-SCALE ARCHITECTURES. | |
| US10447584B2 (en) | Memory network and system including the same | |
| Eberle et al. | High-radix crossbar switches enabled by proximity communication | |
| Rogulina et al. | Classification of networks-on-chip in the context of analysis of promising self-organizing routing algorithms |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20151201 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20151201 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181022 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20181022 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190626 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190723 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190909 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200212 |