JPH0721781B2

JPH0721781B2 - マルチプロセツサ・システム

Info

Publication number: JPH0721781B2
Application number: JP1057761A
Authority: JP
Inventors: 尚松本
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1989-03-13
Filing date: 1989-03-13
Publication date: 1995-03-08
Anticipated expiration: 2010-03-08
Also published as: EP0388032A2; EP0388032A3; JPH02238534A

Description

【発明の詳細な説明】 A.産業上の利用分野この発明は複数のプロセッサがプライベート・キャッシ
ュを介して共有バスおよび共有メモリに接続されている
マルチプロセッサ・システムに関し、とくに各プライベ
ート・キャッシュがわに制御装置を設け共有バス上の信
号を監視することによりキャッシュにおけるデータの操
作、たとえばプライベート・キャッシュ間のデータの一
貫性を維持する操作を行う、いわゆるスヌープ・キャッ
シュを有するマルチプロセッサ・システムに関する。

B.従来技術共有メモリ、共有バス型のマルチプロセッサ・システム
においては、バスおよびメモリへのアクセスの競合を減
ずるために各プロセッサにプライベート・キャッシュを
付加する方法が広く用いられている。このような方法に
おいては複数キャッシュ間のデータの一貫性を保証する
機構が必要になる。またこのような機構により、バス・
トラフィックを一層効率よく行えれば好都合である。そ
してその機構のひとつとしてスヌープ・キャッシュとよ
ばれるものがある。

第１図はスヌープ・キャッシュ方式のマルチプロセッサ
・システムを示す。第１図において複数のプロセッサP₁
P₂…Pnはそれぞれプライベート・キャッシュC₁C…Cnを
介して共有バス１および共有メモリＭに接続されてい
る。そして各プライベート・キャッシュがわに制御装置
を設けて共有バス１上の信号を監視させ、分散制御方式
によりデータの一貫性を実現する。すなわちこの方式で
は各制御装置が共有バス１上のプロトコールにしたがっ
て動作することによりデータの一貫性を実現する。

従来のプロトコールは、共有データに関する書込み時の
手順の観点から、インバリデート・タイプ（invalidate
type）とアップデート・タイプ（update type）とに分
類できる。インバリデート・タイプにおいては所定のプ
ライベート・キャッシュの共有データに書込みが行なわ
れると、当該共有データを有する他のプライベート・キ
ャッシュでその共有データを無効化する。他方アップデ
ート・タイプにおいては書き込んだデータの複製を他の
プライベート・キャッシュに送出し、共有データの更新
を実行する。

ところで以上のプロトコールには一長一短があり、すべ
てのタイプの共有データに対して適しているわけではな
い。メモリがあるタイプの共有データに割り付けられた
とき、どういうプロトコールが一番適しているか、イン
バリデート・タイプとアップデート・タイプタイプの
プロトコールについて例を挙げて説明する。

１）ある変数がセマフォやプロセッサ間のデータの受
渡しに使用されている場合はその変数は頻繁に複数のプ
ロセッサから参照されるので、参照の際のキャッシュ・
ヒットの可能性を高めるためにアップデート・タイプ
タイプのプロトコールで処理されることが望ましい。

２）ある変数がローカル変数で１つのプロセッサのみ
が使用する場合（ローカル変数でもページ管理の都合で
他のキャッシュにもその変数の物理アドレスが張り付い
たままで、共有データになる可能性がある場合）や、あ
る変数またはワークエリアがクリティカル・セクション
内にあり１つのプロセッサが長期にわたって独占使用す
る場合は、共有データのまま複数のキャッシュ内に存在
し続けると、データの書き込みの度にアクセスがキャッ
シュの外側の共有バスまで出てしまい効率が悪い。よっ
て、これらの時はインバリデート・タイプとして他のキ
ャッシュ内のデータ・エントリを無効化すると効率が上
がる。

なおキャッシュのプロトコールという言葉は、データ書
込みの扱い方やデータの置き換えの方式等、かなり広い
意味で使われることがある。しかし、本文章では共有デ
ータの取扱い方に的を絞っているので、特に断らない限
りプロトコールと言えば、共有データの取扱い方を指す
ものとする。

以上のようにデータのタイプ毎のプロトコールの最適化
を考慮したときには従来のマルチプロセッサ・システム
では十分ではないことがわかる。以下検討する。

ａ）多くのシステムではプロトコールが一種類に固定さ
れている。または、システムの立上げ時にプロトコール
を選択し、その後は一種類に固定されている。これでは
ある種の共有データについては効率が悪く、通常、様々
なタイプの共有データが混在するので、そのタイプによ
ってプロトコールが動的に選択可能な方が効率が良い。

ｂ）日本アイ・ビー・エム株式会社東京基礎研究所で試
作したTOP−１（プロトタイプ名）では、プロセッサ毎
（キャッシュ毎）にアップデート・タイプかインバリデ
ート・タイプかを決定できる。しかし、前述のように変
数またはワークエリア毎に適合するプロトコールが異な
っている。そこで、プロセッサ毎にプロトコールを決め
るよりも、変数またはワークエリア毎にどのプロトコー
ルでアクセスするかを決める方が効率の向上が望める。
TOP−１ではキャッシュ内のレジスターの変更でプロト
コールのタイプを選択するようになっているが、これで
はきめ細かく制御するためにはレジスタを書換える命令
をデータのアクセスの度に挿入しなければならない。こ
れについては特願平１−4799号を参照されたい。

C.発明が解決しようとする問題点この発明は以上の事情を考慮してなされたものであり、
効率のよいマルチプロセッサ・システムを実現するため
に、簡易な構成で変数またはワークエリア毎につまり共
有データのタイプによってプロトコールをオーバーヘッ
ドなしに切替可能なキャッシュの制御機構を提供するこ
とを目的としている。

また、ある特定のプロセッサ群の中でのみ効力を働かせ
たいプロトコールをサポートするためのキャッシュの制
御機構を提供することを目的としている。

D.問題点を解決するための手段共有バス，共有メモリ型でスヌープ・キャッシュを持っ
たマルチプロセッサ・システムにおいて、ある特定の記
憶領域毎にこの領域に属するデータをアクセスする時に
キャッシュが用いるプロトコールを指定する情報を付加
しておく。プロセッサ（またはメモリ管理ユニット）は
メモリアクセス時に操作対象のメモリの属する領域に対
応するその付加情報を信号として出力する。メモリアク
セスが共有バスを用いて実行される際は、その付加情報
の信号は共有バス上にも出力される。共有バスに接続さ
れているすべてのキャッシュは共有バス上のその信号で
プロトコールを選択して、バス・スヌープ（バス監視）
を実行する。

また、共有バスを拡張して、プロセッサ群を指定するた
めのバスを新たに設けて、バスアクセス時にプロセッサ
群の識別信号がバスを使用しているプロセッサから出力
されるようにしておくこともできる。ある種のプロトコ
ールの際にはその信号を基に、同じプロセッサ群に属し
ているかどうかによってキャッシュのスヌープ動作を制
御する。

E.実施例以下この発明の実施例について第２図以降の図面を参照
して説明する。

第２図は記憶領域毎にアップデート・タイプタイプ、
インバリデート・タイプおよびオール・リード・タイプ
（all−read type）のプロトコールの設定を行える１実
施例を全体として示している。なお第２図において第１
図と対応する箇所には対応する番号を付して詳細な説明
を省略する。またオール・リード・タイプのプロトコー
ルについては後に詳述する。

第２図においてプロセッサP₁P₂…Pnはプロトコール・タ
イプを表示する信号T0、T1およびT2を対応するプライベ
ート・キャッシュC₁C…Cnを介してプロトコール・タイ
プ・バス２に送出している。信号T0、T1およびT2は共有
バス１上のデータに対するプロトコール・タイプがそれ
ぞれアップデート・タイプ、インバリデート・タイプお
よびオール・リード・タイプであることを示す。プライ
ベート・キャッシュC₁C…Cnは図示しないがキャッシュ
制御機構をそれぞれ有しており、このキャッシュ制御機
構がプロトコール・タイプ・バス２を監視して共有バス
１上のデータに対するプロトコールを判別し、必要に応
じて（該当する共有データを保持するとき）そのプロト
コールの手順を実行する。

この実施例ではデータのアドレス毎にプロトコール・タ
イプ表示情報を付加するのでなく、一定の記憶領域毎に
この情報を割り当てている。すなわち、従来技術に関連
して説明したように、メモリ毎（変数やワークエリア
毎）に適したキャッシュのプロトコールが異なってい
る。よって、メモリ毎にプロトコールを制御することが
パフォーマンスを向上する上で重要である。しかし、各
アドレス毎にプロトコールのタイプを表す情報を付加し
たのでは、その情報のための記憶領域や管理のハードゥ
ェアがかなりの量となり、効率的ではない。そこで一定
の記憶領域ごとにプロトコールのタイプを表す情報を付
加し管理する。ここでは実現の容易さから、従来型のプ
ロセッサ（またはその専用MMU）にすでにインプリメン
トされているページ管理機構に注目し、ページ毎にその
情報を付加することにする。

第３図は第２図のプロセッサＰに関連する入出力信号を
示し、第４図は第２図実施例のページ管理機構とページ
・エントリの構成例を示す。

第３図および第４図において（とくに第４図におい
て）、ページ管理機構はメモリをページという単位（図
では4Kバイト単位）で管理しており、ページ毎にそのペ
ージを実メモリのどこに配置するか、どのような保護を
行うかといったことを記述したページ・エントリを持っ
ている。プロセッサのメモリ・アクセスの際は論理アド
レスの上位ビットで選択されたページ・エントリ（また
はページ・エントリをプロセッサ内にコピーしたトラン
スレーション・ルックアサイド・バッファ:TLB）が必ず
参照されてアクセス権がチェックされ、ページ・エント
リの頁・フレーム・アドレスを基に実メモリのアドレス
が算出される。そして、アクセス権を満たしていると実
メモリへのアクセスが行なわれる。

第４図のページ・エントリのP₁,P₀はアクセス権を示す
ビットで、次表のようにプロテクション・レベルに対応
している。

ページ・エントリのA,D,Eは仮想記憶の管理に用いられ
るビットで、それぞれページ内がアクセスされたか、書
き替えられたか、ページが実メモリに存在するかを示
す。

さて、T₂,T₁,T₀が本発明の特徴であるページのプロトコ
ールのタイプを表すビットである。つまり、このページ
に属するデータはどのタイプのプロトコールを使ってア
クセスするかを示す情報である。ここでは３ビットでプ
ロトコールのタイプを表わすことにしているが、この数
はシステムがサポートするプロトコールの数に対応して
いる（３ビットでは2³＝８種類までのプロトコールに対
応）。プロセッサ（またはMMU）がメモリ・アクセスす
る際に、このアクセスはどのプロトコールで処理しなけ
ればならないかを示すため、このプロトコールのタイプ
を示すビットを外部に出力する信号線をプロセッサに設
ける（第３図）。そして、第２図のようにマルチプロセ
ッサを構成し、キャッシュC₁C…Cnから共有バス１上に
アクセスが出るとき、つまり共有バス１のトラフィック
が必要なときには、共有バス１にもプロトコールのタイ
プを示す信号が出力され、他のキャッシュC₁C…Cnはこ
の信号でプロトコールを選択しながらバス・スヌープ
（バス監視）を行う。

第５図は第４図のプロトコール制御を従来型のCPUやMMU
でインプリメントした変形例を示す。第５図の変形例で
は、ページ・エントリ内にT₂,T₁,T₀のようなビットはな
いので、アドレスの上位２〜３ビットをプロトコールの
タイプを示すビットとして使用する（第５図）。32ビッ
トの実アドレス線があれば、２〜３ビットこの用途に使
用しても512Mバイト〜1Gバイトの実メモリ空間が使用可
能で実用上問題ないと思われる。

次にオール・リード（all read）・タイプのプロトコ
ールについて説明しておく。

以上のように効率的にプロトコールを切替る機構を実現
することが可能となると、ある種のデータにのみ有効だ
が、他のデータに用いると効率が悪くなるため今まで使
われなかったようなプロトコールも有効に使えるように
なる。そのようなプロトコールに対してはその適合する
データにのみ選択的に用いられるように制御する。この
ようなプロトコールの例がall readというプロトコー
ルである。このプロトコールはバス・スヌープを行って
いるキャッシュが他のキャッシュによる共有バスを使っ
ての読み出しの際に積極的にバス上のデータを取り込む
プロトコールである。

このプロトコールは以下のような場合に適している。全
プロセッサが同じデータを参照する必要があるときに各
プロセッサが個別にリードを行ない、メモリからキャッ
シュにデータを張り付けるとすると、キャッシュ内にデ
ータが持ってこられるまでに、データ数×プロセッサ数
のバス・トラフィックスが共有バスで発生する。そこ
で、all readをこのデータに対するプロトコールとし
て用いれば、データ数だけのバス・トラフィックで済み
効率が良い。

つぎにアップデート・タイプ、インバリデート・タイプ
およびオール・リード・タイプのプロトコールを例に用
いて、キャッシュのスヌープ時の動作を説明する。バス
・スヌープの結果のキャッシュの動作を箇条書きにする
と以下のようになる。

アップデート・タイプ・書込みアクセスでキャッシュ・ヒットなら、バス上の
データでキャッシュ内のデータを更新する。

・他の場合なら、何もしない（注参照）。

（注）ここでは、キャッシュの動作のうち、プロトコー
ルをデータ毎に更新することで効率が上がるようなもの
のみに注目している。そこで、この箇条書きでは書込み
動作がどんな方式で行なわれるかということを簡単のた
めに考慮していない。書込み動作の方式がwrite back等
の場合は、データのオウナーシップ（誰が一番最新の正
しいデータを持っており、バスに供給する責任がある
か）によりキャッシュのスヌープ時の動作はもう少し複
雑になる。

インバリデート・タイプ・書込みアクセスでキャッシュ・ヒットなら、キャッシ
ュ内のデータを無効化（invalidate）する。

・他の場合なら何もしない（上記注参照）。

オール・リード・タイプ・読み出しアクセスでキャッシュ・ヒットではなく、か
つデータのリプレイスによるライト・バック（write ba
ck、つまりシステム・バスへのアクセス）を引き起こす
ことなしにデータを取り込めるなら、バス上のデータを
キャッシュ内に取り込む。

・書込みアクセスでキャッシュ・ヒットなら、アップデ
ート・タイプの書込みアクセス時と同じ処理を行う。

・他の場合なら何もしない（上記注参照）。

また、キャッシュのプロトコールの種類としては、他の
プロセッサの共有バスを使った読み出しアクセスでキャ
ッシュ・ヒットしたら、スヌープしているキャッシュは
キャッシュ内のデータを無効化するインバリート・リー
ド（invalidate read）等他にも色々考えられるが、こ
こでは上記の３種を列挙するに留めておく。

ページ毎の変数やワークエリアの振り分けの例を第６図
に示す。コンパイラによるアクセス・パターンの解析や
プログラマによりプロトコール・タイプの指示等によっ
て、変数やワークエリアをそれに適したプロトコールの
タイプを持つページ内に割り振る。また、プロセッサの
命令コードについても、全プロセッサが同じコードを共
有するときはall readタイプのページに割り付けるの
が効率上得策である。

つぎにオール・リード・タイプの有効に利用する実施例
について第７図を参照して説明する。なお第７図におい
て第１図および第２図に対応する個所には対応する符号
を付して詳細な説明を省略する。

第７図実施例はつぎの点を考慮したものである。

すなわちall readタイプのプロトコールを指定したバ
ス・アクセスにおいて、関係のないキャッシュにまでデ
ータを取り込ませることがないように、データを取り込
んで欲しいキャッシュ群（プロセッサ群）を指定できる
ことが望ましい。時に,OS上でアプリケーション・プロ
グラムとしてプログラムが走るようなときには、複数の
お互いに無関係なタスクがマルチプロプセッサ・システ
ム上で同時に走ることが想定され、このような機能が望
まれる。この機能な実現のためには、システム・バス上
でキャッシュ群を指定する情報を伝えるためのバスとそ
の情報を蓄えておいてall readタイプのアクセス時に
外部に出力するようなハードウェアがあればよい。そし
て、各キャッシュはスヌープ動作で、バスのアクセスが
all readタイプの際に、プロセッサ群を指定するバス
も監視して自分のプロセッサが選択されているときのみ
前記の動作を行うようにする。このプロセッサ群の指定
にもきめ細かい制御が要求されるのであれば、この指定
の情報はページ・エントリ内に記憶され、ページ毎に指
定が変えられるインプリメントが望ましい。しかし、そ
れではプロセッサ（またはMMU）のピン数がかなり増大
してしまう。また、all readはあるタスクを一緒に処
理しているプロセッサ群のすべてのキャッシュにデータ
を張り付けるというのが基本的な考えなので、この同一
のタスクを処理するプロセッサ群を指定する情報は各キ
ャッシュに１つ記憶できれば良い。そこで、キャッシュ
毎に１つのレジスターを用意する（第７図）。

第７図のプロセッサ群指定回路3₁3₂…3nとプロセッサ群
指定バス４がこの処理を実現するためのキャッシュ制御
機構である。プロセッサ指定バス４のバス幅はlog₂（ｎ
＋２）−１本（ｎはプロセッサ台数）である。その動作
は以下の通りである。

・プロセッサ群指定回路3₁3₂…3nは自分の担当するプロ
セッサP₁P₂…Pnが共有バス１を使ってall readタイプ
のアクセスをするときに、内部のレジスタに保持したプ
ロセッサ群を指定する識別番号をプロセッサ群指定バス
４上に出力する。

・プロセッサ群指定回路3₁3₂…3nは自分の担当するプロ
セッサP₁P₂…Pnが共有バス１を使用していないときは、
プロセッサ群指定バス４を監視（スヌープ）し、レジス
ターの値と比較して、自分の担当するプロセッサP₁P₂…
Pnが選択されているかどうかの信号をキャッシュC₁C…C
nに出力する。キャッシュC₁C…Cnは共有バス１のアクセ
スがall readタイプの場合、その信号によってスヌー
プ動作を切替る。

プロセッサ群指定回路3₁3₂…3n内部のレジスタにプロセ
ッサ群を指定する識別番号を設定するのはプロセッサが
ソフトウェアで行う。OSが存在する時はOSがタスクにプ
ロセッサを割り付ける毎にこのレジスタの設定を行えば
よい。第７図中のキャッシュC₁C…Cnとプロセッサ群指
定回路3₁3₂…3n間の信号線A,Eはそれぞれ、プロセッサP
₁P₂…Pnがall readタイプのアクセスを行っていること
を示す信号線とプロセッサP₁P₂…Pnが選択されているこ
とを示す信号線である。

もちろん、このプロセッサ群指定バス４は操作対象とす
るプロセッサ群（キャッシュ群）を指定するために用い
ているだけなので、all readのプロトコール以外でも
使用できる。

データ（変数）の中にプログラムのある部分では全プロ
セッサP₁P₂…Pnに参照され、ある部分では１つのプロセ
ッサが独占使用するというようなものが存在する、つま
り望ましいプロトコール・タイプが１つのプログラム中
で大きく変化するデータが存在するときは、同じように
変化するデータを１つのページに集めて途中でそのペー
ジ・エントリのプロトコール・タイプを書換えることで
対応できる。

F.発明の効果本発明によれば、共有データのタイプによってキャッシ
ュのプロトコールをオーバーヘッドなしに切替可能とな
る。これにより、共有データ毎に最適なプロトコールを
選択でき、共有バスの使用頻度を減らすことができる。
そして、マルチプロセッサ・システムの性能の向上を図
ることができる。

【図面の簡単な説明】

第１図は共有バス，共有メモリ型でスヌープ・キャッシ
ュを持った従来のマルチプロセッサ・システムを示すブ
ロック図、第２図は本発明の１実施例の全体構成を示す
ブロック図、第３図は第２図実施例のプロセッサに関連
する信号を説明する図、第４図は第２図実施例で用いる
ページ管理機構およびページ・エントリの構成例を説明
する図、第５図は第４図構成例を従来型のプロセッサで
実現するように変形した他の構成例を説明する図、第６
図はプロトコールのタイプによるページの割り付けを説
明する図、第７図はプロセッサ群の指定を可能にする、
この発明の他の実施例の全体構成図を示すブロック図で
ある。 P₁P₂…Pn……プロセッサ、C₁C…Cn……キャッシュ、Ｍ
……共有メモリ、１……共有バス、２……プロトコール
・タイプ・バス、3₁3₂…3n……プロセッサ群指定回路、
４……プロセッサ群指定バス。

Claims

【特許請求の範囲】

【請求項１】複数のプロセッサをそれぞれプライベート
・キャッシュを介して共有バスおよび共有メモリに接続
し、この共有バスへのアクセスを監視して所定のタイプ
のプロトコールにしたがって上記プライベート・キャッ
シュにおけるデータの操作を実行するマルチプロセッサ
・システムにおいて、複数種類のプロトコール・タイプのうちから上記所定の
プロトコール・タイプを特定するためのプロトコール・
タイプ信号を受け取るプロトコール・タイプ・バスと、上記プライベート・キャッシュ毎に設けられるとともに
上記プロトコール・タイプ・バスに共通して接続された
キャッシュ制御機構とを有し、各制御機構は、所定の単位のデータの記憶領域毎に割り当てられたプロ
トコール・タイプを記憶するプロトコール・タイプ記憶
手段と、データがアクセスされたときにそのデータの属する記憶
領域のプロトコール・タイプを上記プロトコール・タイ
プ記憶手段から取り出し、対応するプロトコール・タイ
プ信号を上記プロトコール・タイプ・バスに送出するプ
ロトコール・タイプ信号生成手段と、上記プロトコール・タイプ・バス上のプロトコール・タ
イプ信号を監視して当該信号に応じたプロトコールで対
応するプライベート・キャッシュにおいてデータの操作
を実行する手段とを有することを特徴とするマルチプロ
セッサ・システム。
【請求項２】上記データの記憶領域の単位をページとし
た特許請求の範囲第１項記載のマルチプロセッサ・シス
テム。
【請求項３】上記プロトコール・タイプ記憶手段および
プロトコール・タイプ信号生成手段をページ管理機構に
より構成した特許請求の範囲第２項記載のマルチプロセ
ッサ・システム。
【請求項４】複数のプロセッサをそれぞれプライベート
・キャッシュを介して共有バスおよび共有メモリに接続
し、この共有バスへのアクセスを監視して所定のタイプ
のプロトコールにしたがって上記プライベート・キャッ
シュにおけるデータの操作を実行するマルチプロセッサ
・システムにおいて、複数種類のプロトコール・タイプのうちから上記所定の
プロトコール・タイプを特定するためのプロトコール・
タイプ信号を受け取るプロトコール・タイプ・バスと、特定されたプロトコールに応じてデータの操作を実行す
るプロセッサを限定的に指定するプロセッサ限定信号を
受け取るプロセッサ限定バスと、上記プライベート・キャッシュ毎に設けられるとともに
上記プロトコール・タイプ・バスおよびプロセッサ限定
バスに共通して接続されたキャッシュ制御機構とを有
し、各制御機構は、所定の単位のデータの記憶領域毎に割り当てられたプロ
トコール・タイプを記憶するプロトコール・タイプ記憶
手段と、データがアクセスされたときにそのデータの属する記憶
領域のプロトコール・タイプを上記プロトコール・タイ
プ記憶手段から取り出し、対応するプロトコール・タイ
プ信号を上記プロトコール・タイプ・バスに送出するプ
ロトコール・タイプ信号生成手段と、上記プロトコール・タイプ信号が、上記プロセッサを限
定するプロトコール・タイプを表示するときに、上記プ
ロセッサ限定信号を上記プロセッサ限定バスに送出する
プロセッサ限定信号生成手段と、上記プロトコール・タイプ・バス上のプロトコール・タ
イプ信号および上記プロセッサ限定バス上のプロセッサ
限定信号を監視して、対応するプライベート・キャッシ
ュにおいてデータの操作が必要かどうかを判別するとと
もに、必要なときには上記プロトコール・タイプ信号に
応じたプロトコールで対応するプライベート・キャッシ
ュにおいてデータの操作を実行する手段とを有すること
を特徴とするマルチプロセッサ・システム。