[go: up one dir, main page]

JPH11203200A - 並列プロセッサおよびメモリ制御方法 - Google Patents

並列プロセッサおよびメモリ制御方法

Info

Publication number
JPH11203200A
JPH11203200A JP10004324A JP432498A JPH11203200A JP H11203200 A JPH11203200 A JP H11203200A JP 10004324 A JP10004324 A JP 10004324A JP 432498 A JP432498 A JP 432498A JP H11203200 A JPH11203200 A JP H11203200A
Authority
JP
Japan
Prior art keywords
stored
memory
subpage
page
requested
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10004324A
Other languages
English (en)
Inventor
Yoshihiko Imamura
義彦 今村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP10004324A priority Critical patent/JPH11203200A/ja
Publication of JPH11203200A publication Critical patent/JPH11203200A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Memory System Of A Hierarchy Structure (AREA)

Abstract

(57)【要約】 【課題】 高い演算性能を発揮できる並列プロセッサを
提供する。 【解決手段】 サブバンク41〜44に記憶されている
サブページのそれぞれについてライトバックの必要性の
有無を示すタグデータがタグデータ領域120に記憶さ
れている。プロセッサエレメントから要求があったサブ
ページがメモリセル領域90に記憶されていない場合
に、外部アクセスバス26を介してメインメモリから読
み出された要求があったサブページを含む連続したアド
レスを持つ複数のサブページからなるページと、ライト
バックを必要とするサブページの数が少なくなるように
タグデータを参照して決定されたバンク800 〜80
m-1 に記憶されたページとを入れ替える。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は、複数のプロセッサ
エレメントおよび共有メモリがコモンバスを介して接続
された並列プロセッサ、メモリ制御方法およびプロセッ
サに関する。
【0002】
【従来の技術】コンピュータでは、プロセッサエレメン
ト(PE:Processor Element) のデータアクセス速度を
高めるために、プロセッサエレメントは高速メモリに対
してのみアクセスを行う構成になっている。しかし、高
速メモリは高価であるため、高速小容量のメモリと低速
大容量のメモリとを階層的に構築したメモリ構造が採用
されている。このようなメモリ構造では、例えば、キャ
ッシュメモリ、メインメモリおよび2次記憶媒体を順に
階層的に構築し、プロセッサエレメントからのデータア
クセスにアドレスの局所性があることを利用して、プロ
セッサエレメントからのアクセス要求に応じて異なる層
のメモリ相互間で所定のラインまたはブロック(ペー
ジ)を単位としてデータを転送している。例えば、プロ
セッサエレメントのアクセス要求に応じて、キャッシュ
メモリとメインメモリとの間で、データをライン単位で
転送し、プロセッサエレメントが要求するデータがキャ
ッシュメモリに高い確率で存在するようにしている。
【0003】このようなキャッシュメモリでは、プロセ
ッサエレメントからデータアクセスがあった場合に、キ
ャッシュメモリに記憶されているメインメモリのデータ
を管理するタグデータを参照して、当該要求があったデ
ータを含むラインがキャッシュメモリに存在するかを判
断している。キャッシュメモリでは、要求があったデー
タを含むラインがキャッシュメモリに記憶されていない
場合に、例えば、キャッシュメモリに記憶されているラ
インのうち最近アクセスされた時刻が最も古いものをメ
インメモリに退避し、要求があったデータを含むライン
をキャッシュメモリに読み出している。なお、キャッシ
ュメモリは、メインメモリとの間のデータ転送に関して
はライン単位でデータを管理しているが、一般的に、記
憶領域自体は物理的に連続している。
【0004】また、メインメモリとハードディスクなど
の2次記憶媒体との間でのデータ転送では、例えば、物
理アドレスを固定長のページと呼ばれる単位に分割して
管理するページング機構が採用されている。このような
ページング機構では、論理アドレスから物理アドレスへ
の変換をページテーブルと呼ばれるアドレス変換テーブ
ルを用いて行っている。
【0005】例えば、連想記憶方式のページテーブルで
は、そのページテーブル内に登録されているページアド
レスを用いて、要求があったページがメインメモリに記
憶されているか否かを判断するために、要求があったペ
ージのページセレクタ(識別番号)と、登録されている
ページのページセレクタとを比較する。また、2次記憶
媒体からメインメモリに、プロセッサエレメントから要
求されたページをページインするときに、ページテーブ
ルに登録されている複数のページから、それらのページ
の有効性を考慮して、無効なページを選択し、これをペ
ージ入れ替えの対象とする。そして、この選択したペー
ジが記憶されてる記憶領域に、プロセッサエレメントか
ら要求のあったページを2次記憶媒体から読み出して記
憶する。
【0006】また、ページテーブルに登録されているペ
ージに無効なページが存在しない場合には、例えば、ペ
ージテーブルに登録されているページのうち、例えば最
近のアクセスが最も古いページをページ入れ替えの対象
としている。
【0007】ところで、近年、プログラム中の同時に実
行可能な複数の命令を1チップ内に組み込まれた複数の
プロセッサエレメントで並列に実行し、プログラム全体
の実行時間の短縮を図る並列プロセッサの開発が行われ
ている。このような並列プロセッサのアーキテクチャと
して種々のものが提案されているが、それらの一つとし
て、1組のコモンバス(共有バス)に、複数のプロセッ
サエレメントおよび共有メモリを接続したものがある。
【0008】図15は、従来の一般的な並列プロセッサ
1のシステム構成図である。図15に示すように、並列
プロセッサ1は、1チップ内にコモンバス2、n個のプ
ロセッサエレメント31 〜3n 、共有メモリ4およびバ
スユニット5が組み込まれており、コモンバス2にプロ
セッサエレメント31 〜3n 、共有メモリ4およびバス
ユニット5が接続されている。また、バスユニット5
は、外部のチップインタフェース6を介してメインメモ
リ7に接続されている。また、共有メモリ4のメモリセ
ル領域4aには、1個のデータポートI/Oが備えられ
ている。並列プロセッサ1では、プロセッサエレメント
1 〜3n が、共有メモリ4に記憶されているデータに
アクセスするときに、コモンバス2およびデータポート
I/Oを介してデータが伝送される。
【0009】
【発明が解決しようとする課題】しかしながら、上述し
た並列プロセッサ1では、プロセッサエレメント31
n と共有メモリ4との間のデータ転送および共有メモ
リ4とメインメモリ7との間のデータ転送が共にコモン
バス2を介して行われ、しかも、共有メモリ4のメモリ
セル領域4aが1個のデータポートI/Oしか備えてい
ないため、以下に示すような理由から、プロセッサエレ
メント31 〜3n の待ち時間が長くなる可能性が高いと
いう問題がある。すなわち、共有メモリ4にページフォ
ルトが発生し、共有メモリ4とメインメモリ7との間で
ページの入れ替えを行っている間は、コモンバス2が使
用中であるため、プロセッサエレメント31 〜3n は共
有メモリ4にアクセスできない。従って、プロセッサエ
レメント31 〜3n から共有メモリ4に対してのアクセ
ス要求は、ページ入れ替え処理が終了するまで待たされ
てしまい、並列プロセッサ1の演算性能が低下してしま
う。
【0010】このような問題を解決するために、図16
に示すように、共有メモリ4のメモリセル領域4bに複
数個のデータポートI/O(1)〜I/O(k)を設け
ることが考えられる。これらのデータポートは、それぞ
れ対応するコモンバス10に接続されている。しかしな
がら、共有メモリ4の記憶領域全域を対象として複数の
データポートを設けると、メモリセル領域4bの面積が
大幅に増大し、並列プロセッサ1に要求されるチップ面
積との関係で、共有メモリ4のメモリ容量を削減しなけ
ればならない。その結果、共有メモリ4に十分なメモリ
容量を持たせることができず、ページフォルトの発生頻
度が高くなり、並列プロセッサ1の演算性能を低下させ
てしまうという問題が生じる。
【0011】また、並列プロセッサ1では、プロセッサ
エレメント31 〜3n による共有メモリに対してのアク
セスが遅延しないように、プロセッサエレメントからの
アクセス要求に応じてメインメモリ7と共有メモリ4と
の間でのページ入れ替えを行う手法は重要である。しか
しながら、並列プロセッサのメモリ構造として特殊なも
のを用いたときには、前述した従来のメモリ階層構造で
採用した層相互間でのデータ転送手法をそのまま用いる
ことが高い演算性能を得るためには適切でない場合もあ
る。同様なことは、単数のプロセッサエレメントを用い
たプロセッサについても言える。
【0012】本発明は上述した従来技術の問題点に鑑み
てなされ、高い演算性能を発揮できる並列プロセッサ、
メモリ制御方法およびプロセッサを提供することを目的
とする。
【0013】
【課題を解決するための手段】上述した従来技術の問題
点を解決し、上述した目的を達成するために、本発明の
並列プロセッサは、それぞれ単数または複数のサブペー
ジを記憶する内部メモリを備え、当該内部メモリに記憶
されたデータを用いて演算処理を行う複数のプロセッサ
エレメントと、それぞれ複数のサブページからなる複数
のページを記憶するメインメモリと、前記複数のプロセ
ッサエレメントからアクセスされる共有メモリとを有す
る。ここで、前記共有メモリは、前記メインメモリに記
憶された前記複数のページのうち一部のページを読み出
して記憶する第1の記憶手段と、前記第1の記憶手段に
記憶されたサブページのそれぞれについて、前記メイン
メモリへの書き戻しの必要性の有無を示す特性データを
記憶する第2の記憶手段と、前記プロセッサエレメント
から要求があったサブページが前記第1の記憶手段に記
憶されていない場合に、前記メインメモリへの書き戻し
が必要なサブページの数が少なくなるように前記第1の
記憶手段に記憶されている複数のページのなかから置き
換え対象とするページを前記特性データを参照して決定
し、当該決定されたページが記憶されている前記第1の
記憶手段の記憶領域に、前記メインメモリに記憶されて
いる前記プロセッサエレメントから要求があったサブペ
ージを含むページを読み出して記憶するように制御する
制御手段とを有する。
【0014】本発明の並列プロセッサでは、プロセッサ
エレメントによる演算処理が実行されているときに、必
要なデータを含むサブページが内部メモリに記憶されて
いないと判断されると、プロセッサエレメントから共有
メモリに当該サブページが要求される。そして、前記共
有メモリの制御手段によって、プロセッサエレメントか
ら要求があったサブページが前記複数のサブバンクの何
れにも記憶されていないと判断された場合には、前記第
2の記憶手段に記憶された特性データが参照され、前記
メインメモリへの書き戻しが必要なサブページの数が少
なくなるように前記第1の記憶手段に記憶されている複
数のページのなかから置き換え対象とするページが決定
される。そして、前記制御手段によって、前記決定され
たページが記憶されている前記第1の記憶手段の記憶領
域に、前記メインメモリに記憶されている前記プロセッ
サエレメントから要求があったサブページを含むページ
を読み出して記憶するように制御される。そして、前記
第1の記憶手段から前記要求を出したプロセッサエレメ
ントの内部メモリに、前記要求があったサブページが転
送および記憶される。当該要求があったサブページのデ
ータは、プロセッサエレメントによる演算処理に用いら
れる。
【0015】また、本発明の並列プロセッサでは、前記
共有メモリの制御手段において、当該要求があったサブ
ページが第1の記憶手段に記憶されているか否かが判断
され、記憶されていると判断された場合には、当該要求
があったサブページが前記第1の記憶手段から前記要求
があったプロセッサエレメントの内部メモリに転送およ
び記憶される。当該要求があったサブページのデータ
は、プロセッサエレメントによる演算処理に用いられ
る。
【0016】また、本発明の第1の観点のメモリ制御方
法は、メインメモリに記憶されたそれぞれ複数のサブペ
ージからなる複数のページのうち一部のページを、複数
のプロセッサエレメントからアクセスされる共有メモリ
に記憶し、前記複数のプロセッサエレメントのうち任意
のプロセッサエレメントから要求があったサブページを
前記共有メモリから読み出して前記要求を出したプロセ
ッサエレメントに出力するメモリ制御方法であって、前
記プロセッサエレメントから要求があったサブページが
前記共有メモリに記憶されていない場合に、前記メイン
メモリへの書き戻しが必要なサブページの数が少なくな
るように前記共有メモリに記憶されている複数のページ
のなかから置き換え対象とするページを、前記共有メモ
リに記憶されたサブページのそれぞれについて前記メイ
ンメモリへの書き戻しの必要性の有無を示す前記特性デ
ータを参照して決定する。そして、当該決定されたペー
ジが記憶されている前記共有メモリの記憶領域に、前記
メインメモリに記憶されている前記プロセッサエレメン
トから要求があったサブページを含むページを読み出し
て記憶する。そして、前記共有メモリから前記要求があ
ったサブページを読み出して前記要求を出したプロセッ
サエレメントに出力する。
【0017】また、本発明のプロセッサは、単数または
複数のサブページを記憶する内部メモリを備え、当該内
部メモリに記憶されたデータを用いて演算処理を行う単
数のプロセッサエレメントと、それぞれ複数のサブペー
ジからなる複数のページを記憶するメインメモリと、前
記プロセッサエレメントからアクセスされる中間メモリ
とを有する。ここで、前記中間メモリは、前記メインメ
モリに記憶された前記複数のページのうち一部のページ
を読み出して記憶する第1の記憶手段と、前記第1の記
憶手段に記憶されたサブページのそれぞれについて、前
記メインメモリへの書き戻しの必要性の有無を示す特性
データを記憶する第2の記憶手段と、前記プロセッサエ
レメントから要求があったサブページが前記第1の記憶
手段に記憶されていない場合に、前記メインメモリへの
書き戻しが必要なサブページの数が少なくなるように前
記第1の記憶手段に記憶されている複数のページのなか
から置き換え対象とするページを前記特性データを参照
して決定し、当該決定されたページが記憶されている前
記第1の記憶手段の記憶領域に、前記メインメモリに記
憶されている前記プロセッサエレメントから要求があっ
たサブページを含むページを読み出して記憶するように
制御する制御手段とを有する。
【0018】本発明のプロセッサは、単数のプロセッサ
エレメントの場合にも適用される。本発明のプロセッサ
では、プロセッサエレメントによる演算処理が実行され
ているときに、必要なデータを含むサブページが内部メ
モリに記憶されていないと判断されると、プロセッサエ
レメントから中間メモリに当該サブページが要求され
る。そして、前記中間メモリの制御手段によって、プロ
セッサエレメントから要求があったサブページが前記複
数のサブバンクの何れにも記憶されていないと判断され
た場合には、前記第2の記憶手段に記憶された特性デー
タが参照され、前記メインメモリへの書き戻しが必要な
サブページの数が少なくなるように前記第1の記憶手段
に記憶されている複数のページのなかから置き換え対象
とするページが決定される。そして、前記制御手段によ
って、前記決定されたページが記憶されている前記第1
の記憶手段の記憶領域に、前記メインメモリに記憶され
ている前記プロセッサエレメントから要求があったサブ
ページを含むページを読み出して記憶するように制御さ
れる。そして、前記第1の記憶手段から前記プロセッサ
エレメントの内部メモリに、前記要求があったサブペー
ジが転送および記憶される。当該要求があったサブペー
ジのデータは、プロセッサエレメントによる演算処理に
用いられる。
【0019】また、本発明の第2の観点のメモリ制御方
法は、メインメモリに記憶されたそれぞれ複数のサブペ
ージからなる複数のページのうち一部のページを中間メ
モリに記憶し、プロセッサエレメントから要求があった
サブページを前記中間メモリから読み出して前記プロセ
ッサエレメントに出力するメモリ制御方法であって、前
記プロセッサエレメントから要求があったサブページが
前記中間メモリに記憶されていない場合に、前記メイン
メモリへの書き戻しが必要なサブページの数が少なくな
るように前記中間メモリに記憶されている複数のページ
のなかから置き換え対象とするページを、前記中間メモ
リに記憶されたサブページのそれぞれについて前記メイ
ンメモリへの書き戻しの必要性の有無を示す前記特性デ
ータを参照して決定する。そして、当該決定されたペー
ジが記憶されている前記中間メモリの記憶領域に、前記
メインメモリに記憶されている前記プロセッサエレメン
トから要求があったサブページを含むページを読み出し
て記憶する。そして、前記中間メモリから前記要求があ
ったサブページを読み出して前記プロセッサエレメント
に出力する。
【0020】
【発明の実施の形態】以下、本発明の実施形態に係わる
並列プロセッサ、プロセッサおよびメモリ制御方法につ
いて詳細に説明する。図1は、本実施形態の並列プロセ
ッサ21のシステム構成図である。図1に示すように、
並列プロセッサ21は、例えば、第1のバスとしてのコ
モンバス22、プロセッサエレメント231 〜23n
共有メモリ24、バスユニット25および第2のバスと
しての外部アクセスバス26を有する。
【0021】並列プロセッサ21では、コモンバス22
に、プロセッサエレメント231 〜23n および共有メ
モリ24が接続されている。また、外部アクセスバス2
6に、共有メモリ24およびバスユニット25が接続さ
れている。
【0022】コモンバス22は128ビットのバス幅を
有し、外部アクセスバス26は32ビットのバス幅を有
している。コモンバス22は、外部アクセスバス26に
比べて4倍以上のデータ転送速度を持つ。なお、コモン
バス22と外部アクセスバス26とのバス幅を同じにす
ることも可能である。プロセッサエレメント231 〜2
n は、例えば、並列プロセッサ1がMIMD(Multipl
e Instruction Multiple Data)型の並列プロセッサの場
合には、個々にプログラムカウンタを持ち、当該プログ
ラムカウンタによって指し示される図示しないインスト
ラクションメモリのアドレスに記憶された命令に応じた
処理を相互に独立して行う。プロセッサエレメント23
1 〜23n としては、例えば、RISC(Reduced Instr
uction Set Computer)型の汎用プロセッサが用いられ
る。
【0023】プロセッサエレメント231 〜23n は、
それぞれ複数のサブページ、例えば、3個のサブページ
を記憶可能な内部メモリとしてのサブバンク271 ,2
2,273 を備えている。ここで、サブページは、メ
インメモリ7上の連続したアドレスの記憶領域に記憶さ
れた512バイトのデータであり、4個の連続したアド
レスのサブページによって1ページが構成される。な
お、プロセッサエレメント231 〜23n が備えている
サブバンクの数を、相互に異なるようにすることも可能
である。プロセッサエレメント231 〜23n は、後述
するように、共有メモリ24からサブページを読み込ん
でサブバンク271 〜273 に記憶するが、プロセッサ
エレメント231 〜23n の相互間およびサブバンク2
1 〜273 の相互間で異なるページのサブページを記
憶できる。バスユニット25は、並列プロセッサ21の
外部に設けられたチップインタフェース6を介してメイ
ンメモリ7に接続されている。メインメモリ7は、4G
バイトの連続したアドレスを持つメモリ空間を有する。
【0024】図2は、図1に示す共有メモリ24の構成
図である。図2に示すように、共有メモリ24は、例え
ば、コモンバス用制御回路31、外部バス用制御回路3
2、制御回路33、メモリ内部バス51,52、マルチ
プレクサ(MUX)53,54,55,56、第1の記
憶手段としてのメモリセル領域90、アドレスデコーダ
57,58,59,60、第2の記憶手段としてのタグ
データ領域120およびリクエストキュー125を有す
る。
【0025】なお、本実施形態では、コモンバス用制御
回路31、外部バス用制御回路32および制御回路33
が本発明の制御手段として機能する。制御回路33は、
コモンバス用制御回路31、外部バス用制御回路32、
マルチプレクサ53〜56、アドレスデコーダ57〜6
0を制御する。また、制御回路33は、プロセッサエレ
メント231 〜23n からサブページ置き換え要求信号
(アクセス要求)を入力した場合に、要求があったサブ
ページがメモリセル領域90に記憶されているか否か
(ページヒットの有無)をタグデータ領域120に記憶
された特性データとしてタグデータを参照して判断し、
ページフォルトが発生したと判断した場合には、図4を
用いて後述する方法で、メモリセル領域90に記憶され
ている複数のページの中から、メインメモリ7からペー
ジインするページと置き換えを行う対象とするページを
決定する。また、制御回路33は、プロセッサエレメン
ト231 〜23n から要求があったサブページを最初に
メインメモリ7から共有メモリ24に転送するように、
共有メモリ24とメインメモリ7との間のページ転送を
制御する。
【0026】コモンバス用制御回路31は、メモリ内部
バス51およびコモンバス22を介したプロセッサエレ
メント231 〜23n とメモリサブバンク41〜44と
の間のサブページの転送を制御する。具体的には、コモ
ンバス用制御回路31は、制御回路33から制御信号に
基づいて、制御信号S31を出力してアドレスデコーダ
57〜60を制御すると共に、マルチプレクサ53〜5
4の切り換え制御を行う。
【0027】外部バス用制御回路32は、メモリ内部バ
ス52および外部アクセスバス26を介したメモリサブ
バンク41〜44とメインメモリ7との間のページの転
送を制御する。具体的には、外部バス用制御回路32
は、制御回路33からの制御信号に基づいて、制御信号
S32を出力してアドレスデコーダ57〜60を制御す
ると共に、マルチプレクサ53〜54の切り換え制御を
行う。
【0028】マルチプレクサ53〜56は、制御信号S
31,S32および制御回路33からの制御信号に基づ
いて、それぞれメモリサブバンク41〜44を、メモリ
内部バス51および52の何れか一方と接続する。
【0029】アドレスデコーダ57〜60は、制御信号
S31,S32をデコードして、それぞれメモリサブバ
ンク41〜44に対してのアクセスを制御する。
【0030】メモリセル領域90は、4個のメモリサブ
バンク41〜44に物理的に等分に分割されている。メ
モリサブバンク41〜44は、それぞれ単数のデータポ
ートを備えている。また、メモリセル領域90は、それ
ぞれメモリサブバンク41〜44に対して等分に跨がる
ように、m個のバンク800 〜80m-1 によって区切ら
れている。メモリサブバンク41〜44は、例えば、そ
れぞれm個のサブページを記憶可能な記憶容量を有す
る。なお、サブページは、例えば、画像データである。
メモリサブバンク41〜44は、それぞれマルチプレク
サ53〜56、メモリ内部バス51およびコモンバス2
2を介して、プロセッサエレメント231 〜23n との
間で、データ転送をサブページ単位で行う。ここで、デ
ータ転送には、プロセッサエレメント231 〜23n
らメモリサブバンク41〜44にデータを書き込む動
作、メモリサブバンク41〜44からプロセッサエレメ
ント231〜23n にデータを読み出す動作、および、
その両方の動作が含まれる。
【0031】コモンバス22は128ビットのバス幅を
有することから、サブページが1回当たりのデータ転送
の単位となるコモンバス22を介したバスオペレーショ
ンでは、512バイトのサブページを転送するには、3
2(=512×8/128)回分のバストランザクショ
ンが最低限必要である。
【0032】また、メモリサブバンク41〜44は、マ
ルチプレクサ53〜56、メモリ内部バス52および外
部アクセスバス26を介して、各バンク800 〜80
m-1 に記憶されるページ単位で、メインメモリ7との間
でデータ転送を行う。ここで、1ページは2Kバイトで
あり、4個のサブページからなる。従って、プロセッサ
エレメント231 〜23n がアクセスしようとするサブ
ページの先頭アドレスが、図3に示すA番地、(A+5
12)番地、(A+1024)番地あるいは(A+15
36)番地である場合には、メインメモリ7からA番地
から2Kバイトの連続したアドレスに記憶された1ペー
ジ分のデータを共有メモリ24に転送し、この1ページ
分のデータを4個のサブページに分割して、各バンク8
0 〜80m に記憶する。本実施形態では、メインメモ
リ7の4Gバイトのメモリ空間を、32ビットのアドレ
スで指し示している。ここで、この32ビットのアドレ
スのうち、31〜11ビット目がページの先頭アドレス
を示し、10〜0ビット目がページ内のアドレスを示し
ている。また、10ビット目および9ビット目がサブバ
ンクを示している。
【0033】メモリサブバンク41〜44に記憶されて
いるサブページは、全てのプロセッサエレメント231
〜23n で共有できるように、システム全体で、サブペ
ージのデータ量を統一することが望ましい。本実施形態
では、プロセッサエレメント231 〜23n のサブバン
ク271 のメモリ容量を512バイトとし、サブページ
のデータ量も512バイトとしている。ここで、外部ア
クセスバス26は32ビットのバス幅を有するため、ペ
ージがデータ転送の単位となる外部アクセスバス26を
介した1回当たりのバスオペレーションでは、2Kバイ
トのページを転送するために、512(=2048×8
/32)回分のバストランザクションが最低限必要であ
る。
【0034】タグデータ領域120は、図2に示すよう
に、メモリサブバンク41〜44からなるメモリセル領
域90に記憶されたサブページの特性データとしてのタ
グデータを記憶する。タグデータ領域120は、バンク
800 〜80m-1 に対応したタグバンク1300 〜13
m-1 を有し、タグバンク1300 〜130m-1 には、
それぞれバンク800 〜80m に記憶されているサブペ
ージの特性を示すデータが記憶されている。タグデータ
は、バリッド識別領域121、ダーディ識別領域122
およびページセレクタ領域123から構成される。
【0035】バリッド識別領域121は、各サブページ
のデータの有効性を示す1ビットのバリッドビットを、
サブページの数だけ備えている。例えば、バリッド識別
領域121には、有効なサブページに対応するバリッド
ビットにバリッドを示す「1」がセットされ、有効でな
い(無効な)サブページに対応するバリッドビットにイ
ンバリッドを示す「0」がセットされている。
【0036】ダーディ識別領域122は、各サブページ
のデータがダーティであるか否かを示す1ビットのダー
ティビットを、サブページの数だけ備えている。ここ
で、ダーティであるとは、当該サブページに、プロセッ
サエレメント231 〜23n から書き込みがあったこと
を意味し、当該サブページが記憶されている記憶領域を
開放するときに、当該サブページをメインメモリ7に書
き戻す必要がある。すなわち、ライトバックを行う必要
がある。例えば、ダーディ識別領域122には、ダーテ
ィなサブページに対応するダーティビットにバリッドを
示す「1」がセットされ、ダーティでないサブページに
対応するダーティビットにインバリッドを示す「0」が
セットされている。
【0037】ページセレクタ領域123は、バンク80
0 〜80m に記憶されているページの識別番号(例え
ば、ページの先頭アドレス)を示すページセレクタを有
する。
【0038】また、リクエストキュー125は、コモン
バス22およびメモリ内部バス51を介して発生した共
有メモリ4に対してのプロセッサエレメント231 〜2
nからのアクセス要求が競合した場合に、アクセス要
求をキューに蓄え、順に処理する。
【0039】以下、並列プロセッサ21の動作について
説明する。図4は、並列プロセッサ21の動作を説明す
るためのフローチャートである。以下、プロセッサエレ
メント231 〜23n から共有メモリ24にアクセスが
あった場合に、共有メモリ24がページヒットした場合
とページミスした場合との並列プロセッサ21の動作を
図4を参照しながら説明する。なお、図6、図8、図1
0、図11および図12に示すタグデータにおいて、本
実施形態の説明に関係のないビットは空白になってい
る。但し、実際のタグデータでは、これらの空白になっ
ているビットに「1」または「0」がセットされてい
る。
【0040】ページヒットした場合 〔ページ置き換えが不要な場合〕図5では、メモリセル
領域90におけるメモリサブバンク41〜44のバンク
806 に、それぞれサブページ91〜94が記憶されて
いる。また、図6では、タグデータ領域120に記憶さ
れたタグデータにおける、バンク806 に対応するタグ
バンク1306 に記憶されたバリッド識別領域121の
うち、メモリサブバンク42についてのバリッドビット
が「1」、すなわち、有効(バリッド)であることを示
している。図5および図6に示す場合に、例えば、プロ
セッサエレメント233 において、読み出し要求が発生
したアドレスを含むサブページ92が、プロセッサエレ
メント233 内のサブバンク271 〜273 に記憶され
ていないときに、サブページ92についてのサブページ
置き換え要求信号がプロセッサエレメント233 から共
有メモリ24に出力される(ステップS1)。
【0041】そして、制御回路33において、サブペー
ジ置き換え要求信号に示されるサブページ92がメモリ
サブバンク41〜44に記憶されているか否かが、タグ
データ領域120に記憶されているタグデータのページ
セレクタ領域123を参照して判断される(ステップS
2)。具体的には、サブページ置き換え要求信号に示さ
れるサブページ92のページセレクタと、タグバンク1
300 〜130m-1 の全てに記憶されているページセレ
クタ領域123のページセレクタとが比較される。そし
て、例えば、サブページ92のページセレクタとタグバ
ンク1306 に記憶されているページセレクタとが一致
した場合には、タグバンク1306 に対応するバンク8
6 に当該要求があったサブページ92が記憶されてい
ると判断される。また、サブページ置き換え要求信号に
よって示されるサブページ92のアドレスの9ビット目
および10ビット目から、サブページ92がメモリサブ
バンク42に記憶されていると判断される。
【0042】次に、制御回路33によって、タグデータ
のバリッド識別領域121におけるタグバンク1306
のメモリサブバンク42についてのバリッドビットがバ
リッド「1」およびインバリッド「0」の何れであるか
が判断される(ステップS3)。このとき、図6に示す
ように、タグバンク1306 のサブバンク42ついての
バリッドビットが「1」、すなわち有効であると判断さ
れる。
【0043】次に、制御回路33からの制御に応じて、
コモンバス用制御回路31から制御信号S31がアドレ
スデコーダ58に出力される。これにより、例えば、ア
ドレスデコーダ58によって、マルチプレクサ54がメ
モリ内部バス51に接続され、サブページ92がコモン
バス22を介してプロセッサエレメント233 に転送さ
れる。サブページ92は、プロセッサエレメント233
の例えばサブバンク271 に記憶される。その後、プロ
セッサエレメント233 において、サブバンク271
記憶されたサブページ92から、読み出し要求が発生し
たアドレスのデータが読み出され、この読み出されたデ
ータを用いて演算(画像演算)処理が行われる(ステッ
プS4)。
【0044】〔ステップS13が実行される場合〕ステ
ップS13は、プロセッサエレメント233 〜23n
ら要求があったサブページが共有メモリ24に記憶され
ているが、当該サブページが無効である場合に実行され
る。制御回路33によって、ステップS3において、タ
グデータのバリッド識別領域121におけるタグバンク
1306 のメモリサブバンク42についてのバリッドビ
ットが「0」、すなわち無効であると判断された場合
に、プロセッサエレメント233 から要求があったサブ
ページ92を含むページが、メインメモリ7からメモリ
セル領域90のバンク806 に転送および記憶される。
【0045】次に、制御回路33からの制御に応じて、
コモンバス用制御回路31から制御信号S31がアドレ
スデコーダ58に出力される。これにより、例えば、ア
ドレスデコーダ58によって、マルチプレクサ54がメ
モリ内部バス51に接続され、サブページ92がコモン
バス22を介してプロセッサエレメント233 に転送さ
れる。サブページ92は、プロセッサエレメント233
の例えばサブバンク271 に記憶される。その後、プロ
セッサエレメント233 において、サブバンク271
記憶されたサブページ92から、読み出し要求が発生し
たアドレスのデータが読み出され、この読み出されたデ
ータを用いて演算処理が行われる(ステップS4)。
【0046】ページフォルトが発生した場合 〔ステップS7が実行される場合〕ステップS7は、プ
ロセッサエレメント233 〜23n から要求があったサ
ブページが共有メモリ24に記憶されておらず、当該要
求があったサブページを記憶するサブバンクに既に記憶
されているサブページのなかに無効なものが1個存在す
る場合に実行される。
【0047】図7では、メモリセル領域90におけるメ
モリサブバンク41〜44のバンク809 に、それぞれ
サブページ201〜204が記憶されている。また、図
8では、タグデータ領域120に記憶されたタグデータ
おけるバンク809 に対応するタグバンク1309 に記
憶されているバリッドビットのうち、メモリサブバンク
42についてのバリッドビットが「0」、すなわち、無
効(インバリッド)であることを示している。また、タ
グバンク1309 以外のタグバンクに記憶されているメ
モリサブバンク42についてのバリッドビットが全て
「1」、すなわち有効(バリッド)になっている。
【0048】図7および図8に示す場合に、例えば、プ
ロセッサエレメント233 において、読み出し要求が発
生したアドレスを含むサブページが、プロセッサエレメ
ント233 に内蔵されたサブバンク271 〜273 に記
憶されていないときに、このサブページについてのサブ
ページ置き換え要求信号が共有メモリ24に出力される
(ステップS1)。そして、制御回路33において、サ
ブページ置き換え要求信号に示されるサブページがメモ
リサブバンク41〜44に記憶されているか否かが、タ
グデータ領域120に記憶されているタグデータのペー
ジセレクタ領域123を参照して判断される(ステップ
S2)。具体的には、制御回路33において、サブペー
ジ置き換え要求信号に示されるサブページのページセレ
クタと、ページセレクタ領域123のページセレクタと
が比較され、サブページ置き換え要求信号に示されるサ
ブページのページセレクタとタグバンク1300 〜13
m-1 に記憶されているページセレクタとが不一致であ
ると判断される。すなわち、サブページ置き換え要求信
号に示されるサブページがメモリサブバンク41〜44
に記憶されていると判断される。
【0049】次に、制御回路33において、タグデータ
におけるタグバンク1300 〜130m-1 に記憶されて
いるバリッドビットのうち、サブページ置き換え要求信
号に示されるサブページが記憶されるメモリサブバンク
についてのバリッドビットが、「0」、すなわち無効を
示すものが検索される(ステップS5)。ここでは、サ
ブページ置き換え要求信号に示されるサブページのアド
レスの9ビット目および10ビット目から、当該サブペ
ージがメモリサブバンク42に記憶されると判断され、
バリッド識別領域121のうち、メモリサブバンク42
についてのバリッドビットが無効、すなわち「0」を示
すものが検索される。そして、この検索の結果、タグバ
ンク1309 のサブバンク42についてのバリッドビッ
トのみが、無効を示していると判断される(ステップS
6)。
【0050】次に、制御回路33からの制御に応じて、
外部バス用制御回路32から制御信号S32が、アドレ
スデコーダ58に出力される(ステップS7)。これに
より、例えば、アドレスデコーダ58によって、マルチ
プレクサ54がメモリ内部バス52に接続され、図9に
示すように、サブページ置き換え要求信号に示されるサ
ブページ212がメインメモリ7から読み出され、外部
アクセスバス26およびメモリ内部バス52を介して、
メモリサブバンク42のバンク809 に記憶される。こ
れにより、図10に示すように、タグバンク1309
メモリサブバンク42に対応するバリッドビットが
「1」にセットされる。
【0051】サブページ212がサブバンク42のバン
ク809 に記憶された後に、制御回路33からの制御に
応じて、コモンバス用制御回路31から制御信号S31
が、アドレスデコーダ58に出力される。これにより、
例えば、アドレスデコーダ58によって、マルチプレク
サ54がメモリ内部バス51に接続され、サブページ2
12がメモリ内部バス51およびコモンバス22を介し
て、プロセッサエレメント233 に転送される。
【0052】また、メインメモリ7と共有メモリ24と
の間のデータ転送はページ単位であるため、サブページ
212がサブバンク42のバンク809 に記憶された後
に、サブページ212を含むページの他のサブページ2
13,214,211が、それぞれメモリサブバンク4
3,44,41のバンク809 に順に記憶される。な
お、サブページ212をメモリサブバンク42からコモ
ンバス22を介してプロセッサエレメント233 に転送
する処理と、サブページ211,213,214をメイ
ンメモリ7から外部アクセスバス26を介してメモリサ
ブバンク41,43,44に転送して記憶する処理とは
並行(多重化)して行われる。ここで、制御回路33
は、サブページ203,204,201のうち、ダーデ
ィ識別領域122のダーティビットがバリッドのサブペ
ージについては、メインメモリ7にライトバックした
(書き戻した)後に、置き換えを行う。
【0053】サブページ212は、コモンバス22を介
してプロセッサエレメント233 に転送されると、プロ
セッサエレメント233 の例えばサブバンク271 に記
憶される。その後、プロセッサエレメント233 におい
て、サブバンク271 に記憶されたサブページ212か
ら、読み出し要求が発生したアドレスのデータが読み出
され、当該読み出したデータを用いて演算処理が行われ
る(ステップS4)。
【0054】〔ステップS10が実行される場合〕ここ
では、メモリサブバンク41〜44の記憶状態が図9に
示され、タグデータ領域120に記憶されているタグデ
ータが図11に示す場合について説明する。この場合、
図4に示すステップS1,S2およびステップS5で
は、前述した処理が行われる。但し、制御回路33にお
けるステップS5の検索の結果、タグデータにおけるタ
グバンク1306 ,1309 ,13012のメモリサブバ
ンク42についてのバリッドビットが「0」、すなわち
無効を示していると判断される(ステップS6)。
【0055】次に、制御回路33において、タグデータ
におけるタグバンク1306 ,1309 ,13012のバ
リッドビットのうち、サブページ置き換え要求信号に示
されるサブページの次に置き換えが行われるサブページ
が記憶されているメモリサブバンク43についてのバリ
ッドビットに「0」、すなわち無効を示すものがあるか
否か、および、メモリサブバンク43についてのダーテ
ィビットに「0」、すなわち無効を示すものがあるか否
かが検索される(ステップS8)。図11に示す例で
は、このような条件を満たすタグバンク1306 ,13
9 ,13012は存在しない(ステップS9)。そのた
め、タグバンク1306 ,1309 ,13012に対応す
るバンク806,809 ,8012に記憶されているペー
ジのうち、任意のページを置き換え対象とできる。例え
ば、LRU方式などで、バンク809 に記憶されている
ページを置き換え対象とする。
【0056】そして、プロセッサエレメント233 から
のサブページ置き換え要求信号に示されるサブページが
メインメモリ7から読み出され、外部アクセスバス26
およびメモリ内部バス52を介して、バンク809 のメ
モリサブバンク42に記憶される(ステップS10)。
そして、制御回路33からの制御に応じて、コモンバス
用制御回路31から制御信号S31が、アドレスデコー
ダ58に出力される。これにより、例えば、アドレスデ
コーダ58によって、マルチプレクサ54がメモリ内部
バス51に接続され、バンク809 のメモリサブバンク
42に記憶されたサブページがメモリ内部バス51およ
びコモンバス22を介して、プロセッサエレメント23
3 に転送される。このサブページは、プロセッサエレメ
ント233 の例えばサブバンク271 に記憶される。そ
の後、プロセッサエレメント233 において、サブバン
ク271 に記憶されたサブページから、読み出し要求が
発生したアドレスのデータが読み出される(ステップS
4)。
【0057】このとき、メインメモリ7と共有メモリ2
4との間のデータ転送はページ単位であるため、要求が
あったサブページが属するページの他の3個のサブペー
ジが、それぞれメモリサブバンク41,43,44のバ
ンク809 に記憶される。また、タグバンク1309
記憶されているタグデータのダーディ識別領域122の
うちメモリサブバンク43に対応するダーティビットが
「1」、すなわち有効になっているため、メモリサブバ
ンク43のバンク809 に記憶されていたサブページを
メインメモリ7にライトバックした後に、メインメモリ
7から対応するサブページをメモリサブバンク43のバ
ンク809 に記憶する。なお、バンク809 のメモリサ
ブバンク42に記憶されたサブページをメモリ内部バス
51およびコモンバス22を介してプロセッサエレメン
ト233 に転送する処理と、外部アクセスバス26を介
したメモリサブバンク41,43,44とメインメモリ
7との間のサブページ転送処理およびライトバック処理
は並行して行われる。
【0058】〔ステップS11が実行される場合〕ここ
では、メモリサブバンク41〜44の記憶状態が図9に
示され、タグデータ領域120に記憶されているタグデ
ータの記憶状態が図12に示す場合について説明する。
この場合には、図4に示すステップS1,S2,S5,
S6およびS8では、前述した処理が行われる。但し、
ステップS8の検索の結果、タグデータにおけるタグバ
ンク1309 に記憶されているバリッドビットについ
て、サブページ置き換え要求信号に示されるサブページ
の次に置き換えが行われるサブページが記憶されている
メモリサブバンク43についてのバリッドビットが無効
であると判断される。また、タグデータにおけるタグバ
ンク13012に記憶されているダーティビットについ
て、メモリサブバンク43についてのダーティビットが
無効であると判断される。そして、タグバンク13
9 ,13012に対応するバンク809 ,8012のう
ち、任意のバンクに記憶されているページが置き換えた
対象となる。例えば、LRU方式などで、バンク809
に記憶されているページが置き換え対象となる。
【0059】次に、プロセッサエレメント233 からの
サブページ置き換え要求信号に示されるサブページがメ
インメモリ7から読み出され、外部アクセスバス26お
よびメモリ内部バス52を介して、バンク809 のメモ
リサブバンク42に記憶される(ステップS11)。そ
して、制御回路33からの制御に応じて、コモンバス用
制御回路31から制御信号S31が、アドレスデコーダ
58に出力される。これにより、例えば、アドレスデコ
ーダ58によって、マルチプレクサ54がメモリ内部バ
ス51に接続され、バンク809 のメモリサブバンク4
2に記憶されたサブページがメモリ内部バス51および
コモンバス22を介して、プロセッサエレメント233
に転送される。このサブページは、プロセッサエレメン
ト233 の例えばサブバンク271 に記憶される。その
後、プロセッサエレメント233 において、サブバンク
271 に記憶されたサブページから、読み出し要求が発
生したアドレスのデータが読み出される(ステップS
4)。
【0060】このとき、メインメモリ7と共有メモリ2
4との間のデータ転送はページ単位であるため、要求が
あったサブページが属するページの他の3個のサブペー
ジが、それぞれメモリサブバンク43,44,41のバ
ンク809 に順に記憶される。また、タグデータにおけ
るタグバンク1309 のメモリサブバンク43に対応す
るバリッドビットが「0」、すなわち無効になっている
ため、メモリサブバンク43のバンク809 に記憶され
ていたサブページをメインメモリ7にライトバックせず
に、メインメモリ7から対応するサブページをメモリサ
ブバンク43のバンク809 に記憶する。なお、バンク
809 のメモリサブバンク42に記憶されたサブページ
をメモリ内部バス51およびコモンバス22を介してプ
ロセッサエレメント233 に転送する処理と、外部アク
セスバス26を介したメモリサブバンク41,43,4
4とメインメモリ7との間のサブページ転送処理とは並
行して行われる。
【0061】〔ステップS12が選択される場合〕制御
回路33によるステップS5の検索の結果、タグデータ
におけるプロセッサエレメント233 から要求があった
サブページが記憶されているサブバンクに対応するバッ
リッドビットの全てが「1」、すなわち有効を示してい
る場合に、バンク800 〜80m に記憶されている全て
のページを対象として、例えば、LRU方式などを採用
して、最近のアクセスが最も古いページを置き換え対象
とし、必要に応じてメインメモリ7にライトバックを行
った後に、プロセッサエレメント233 から要求のあっ
たサブページを含むページをメインメモリ7から転送し
てメモリセル領域90に記憶する。
【0062】多重アクセス 次に、図13に示すように、プロセッサエレメント23
3 からの読み出し要求に応じて、共有メモリ24のバン
ク801 に記憶されたサブページ91〜94が、メモリ
内部バス52および外部アクセスバス26を介して転送
されたメインメモリ7に記憶されたサブページ101〜
104と置き換えられている最中に、プロセッサエレメ
ント233 以外のプロセッサエレメント234 から共有
メモリ24のバンク806 に記憶されたサスページ11
2に対しての読み出し要求が発生した場合の並列プロセ
ッサ21の処理について説明する。
【0063】この場合には、サブページ112に対して
の読み出し要求が、プロセッサエレメント234 からコ
モンバス22を介して共有メモリ24に出力され、この
読み出し要求が制御信号S70としてコモンバス用制御
回路31に出力される。このとき、サブページ112は
メモリサブバンク42に記憶されているため、コモンバ
ス用制御回路31からアドレスデコーダ58に制御信号
S31が出力され、マルチプレクサ54がメモリ内部バ
ス51に接続される。これによって、サブページ112
が、メモリ内部バス51およびコモンバス22を介し
て、プロセッサエレメント234 に出力される。
【0064】並列プロセッサ21では、上述したサブペ
ージ112の転送処理と並行して、共有メモリ24のバ
ンク801 に記憶されたサブページ91〜94とメイン
メモリ7に記憶されたサブページ101〜104との入
れ替え処理が行われる。すなわち、並列プロセッサ21
では、プロセッサエレメント231 〜23n と共有メモ
リ24との間でのサブページの転送処理と、共有メモリ
24とメインメモリ7との間でのページ転送処理とを多
重化できる。
【0065】以上説明したように、並列プロセッサ21
によれば、共有メモリ24にページフォルトが発生した
場合に、図4に示すステップS8およびS9のように、
プロセッサエレメント231 〜23n が要求しているサ
ブページが記憶されるサブバンクの他に、当該サブバン
クに続いてサブページの置き換え対象となるサブバンク
のバリッドビッドおよびダーティビッドを考慮して、ラ
イトバックの発生をできるだけ抑えるように、ページの
置き換え対象となるバンクを決定する。そのため、ライ
トバック処理が発生する確率を低減でき、ライトバック
処理によるプロセッサエレメント231 〜23n の待ち
時間が短縮され、高性能な演算処理を実現できる。
【0066】特に、並列プロセッサ21のように、コモ
ンバス22のデータ転送能力が外部アクセスバス26の
データ転送能力の4倍あり、メモリセル領域90が4個
のメモリサブバンク41〜44に分割されている場合に
は、1ページ全体で、1個のサブページをライトバック
する場合と、4個のサブページをライトバックする場合
とで、ライトバックに伴う処理時間が4倍以上異なる。
従って、ライトバックの必要があるサブページを多く含
むページを置き換えの対象にした場合と、そうでない場
合とで、ページ置き換えに伴う時間が7倍以上も異なる
場合がある。すなわち、並列プロセッサ21のように、
ライトバックの必要があるサブページの数が少ないペー
ジをページ置き換えの対象とすることは、プロセッサエ
レメント231 〜23n による共有メモリ24に対して
のアクセスに伴う待ち時間を短縮する上で非常に効果的
である。
【0067】また、並列プロセッサ21では、共有メモ
リ24にページフォルトが発生した場合に、当該ページ
の全てが、メインメモリ7から共有メモリ24に読み込
まれる前でも、必要なサブページが読み込まれた時点
で、プロセッサエレメント231 〜23n は当該読み込
まれたサブページにアクセスすることができる。そのた
め、ページフォルトに伴うプロセッサエレメント231
〜23n の待ち時間を大幅に短縮でき、その結果、高速
処理が実現される。
【0068】また、画像処理などの分野では、同一のペ
ージ内のデータが、プロセッサエレメント231 〜23
n から連続してアクセスされる場合が多いが、並列プロ
セッサ21では、ページフォルトが発生した場合に、要
求が生じたサブページの他に当該サブページと連続した
アドレスを持つ他の3個のサブページもメインメモリ7
から共有メモリ24に読み込むため、次にページフォル
トが発生する可能性を低減できる。すなわち、画像処理
の特性から、要求があったサブページと連続したアドレ
スのサブページについても近い将来、プロセッサエレメ
ント231 〜23n からアクセスが発生する可能性が高
いため、これらのサブページを要求があったサブページ
と共にメインメモリ7から共有メモリ24に読み込むこ
とは、将来のページフォルトの発生率を低下させるのに
有効である。
【0069】また、並列プロセッサ21によれば、共有
メモリ24のメモリセルのサブバンクとして単数のデー
タポートを備えたものを用いて、プロセッサエレメント
231 〜23n と共有メモリ24との間でのサブページ
転送処理と、共有メモリ24とメインメモリ7との間で
のページ転送処理とを並行して行うことができるため、
高速処理を実現できる。すなわち、共有メモリ24は、
シングルポートであるにも係わらずに、機能的に、2ポ
ートと略同じ性能を実現できる。
【0070】また、並列プロセッサ21によれば、図2
に示すように、メモリセル領域90を4個のメモリサブ
バンク41〜44に物理的に分割して、メモリサブバン
ク41〜44に単数のデータポートを設けることで、従
来の図16に示す従来の共有メモリ4のようにメモリセ
ル領域全体を対象として4個のデータポートを設けた場
合に比べて、配線数を大幅に削減でき、メモリセル領域
90の小規模化を図ることができる。その結果、並列プ
ロセッサ21内の限られた領域に、従来より多くの容量
のメモリセル領域を設けることができる。
【0071】本発明は上述した実施形態には限定されな
い。例えば、上述した実施形態では、図1に示すよう
に、n個のプロセッサエレメント231 〜23n をコモ
ンバス22に接続した並列プロッサを例示したが、本発
明は、例えば、図14に示すように、コモンバス22に
単数のプロセッサエレメント231 を接続したプロセッ
サ200にも適用できる。図14に示すプロセッサ20
0でも、前述した並列プロセッサ21と同様に、プロセ
ッサエレメント231 によるサブページの要求に応じ
て、前述した図4に示す処理によって、コモンバス22
を介したプロセッサエレメント231 と中間メモリ20
4との間のサブページの転送、および、外部アクセスバ
ス26を介した中間メモリ204とメインメモリ7との
間のページの転送を行う。ここで、中間メモリ204
は、前述した図2に示す共有メモリ4と同じ構成をして
いる。プロセッサ200によれば、図4に示すデータ転
送処理を採用することで、ページフォルトが発生した場
合に、中間メモリ204に記憶されているページをメイ
ンメモリ7にライトバックされる回数を低減でき、プロ
セッサエレメント231 の待ち時間を短縮できる。
【0072】また、上述した図1に示す実施形態では、
プロセッサエレメント233 から要求があったサブペー
ジが記憶されているメモリサブバンク42の次にメモリ
サブバンク43がサブページの置き換えの対象になる場
合を例示したが、メモリサブバンク42の次にメモリサ
ブバンク41をサブページの置き換えの対象にするよう
にしてもよい。この場合には、図4に示すステップS8
において、タグバンク1309 および13012のうち、
メモリサブバンク41に対応するバリッドビットおよび
ダーティビットの少なくとも一方が無効であるものが検
索される。
【0073】また、上述した実施形態では、図4のステ
ップS8において、プロセッサエレメント233 から要
求があったサブページが記憶されているメモリサブバン
クの次にサブページの置き換え対象となるメモリサブバ
ンク43に対応するサブページの置き換えの対象になる
場合を例示したが、要求があったサブページに属するペ
ージに含まれる他のサブページの全てあるいは一部が記
憶されているメモリサブバンクに対応するバリッドビッ
トおよびダーティビットを考慮するようにしてもよい。
このとき、例えば、要求があったサブページに属するペ
ージに含まれる他のサブページの全てが記憶されている
メモリサブバンクに対応するバリッドビットおよびダー
ティビットを考慮した場合には、バリッドビットおよび
ダーティビットの少なくとも一方が無効であるものの数
が多いバンクをページ置き換えの対象とする。並列プロ
セッサ21によれば、メインメモリ7から読み込むペー
ジを記憶する共有メモリ24のバンクを決定するとき
に、当該バンクに既に記憶されているページを構成する
4個のサブページの全てについてライトバックの必要性
を考慮することで、ライトバック処理によるメモリアク
セス速度の低下を4倍程度に抑えることが可能である。
【0074】また、上述した実施形態では、図4に示す
ステップS11,S12,S13において、LRU方式
でぺージ置き換え対象とするバンクを決定したが、その
他の方式でバンクを決定してもよい。
【0075】また、上述した実施形態では、図1に示す
プロセッサエレメント231 〜23n および図14に示
すプロセッサエレメント231 がサブページからデータ
を読み出す場合を例示したが、サブページにデータを書
き込む場合でも、コモンバス22を介したサブページの
転送処理および外部アクセスバス26を介したページの
転送処理は同じである。
【0076】また、上述した実施形態では、共有メモリ
24のメモリセル領域を4個のメモリサブバンク41〜
44に分割した場合を例示したが、メモリサブバンクの
数は任意である。従って、例えば、共有メモリ24のメ
モリセル領域を8個のメモリサブバンクに分割してもよ
い。この場合には、1ページは8個のサブページで構成
される。また、上述した実施形態では、単数のサブペー
ジのデータ量を512バイトとしたが、このデータ量は
特に限定されず、256バイトあるいは1024バイト
などであってもよい。
【0077】また、図13を用いて説明した共有メモリ
24とメインメモリ7との間のページ置き換え処理は、
最初にサブバンク42に記憶されたサブページ92につ
いての置き換え処理を行えば、その後、サブバンク4
1,43,44に記憶されたサブページ91,93,9
4をメインメモリ7との間でどの順序で置き換えてもよ
い。例えば、上述した実施形態では、要求があったサブ
ページ92の次にアドレスをインクリメントする方向
に、サブページ93,94,91の順で置き換えを行っ
たが、アドレスをデクリメントする方向に、サブページ
92の次にサブページ91,94,93の順で置き換え
てもよい。
【0078】また、図13を用いて説明した共有メモリ
24とメインメモリ7との間のページ置き換え処理で
は、サブページ91〜94を置き換える順序のパターン
は、24(=4×3×2×1)通りある。従って、並列
プロセッサ21では、共有メモリ24とメインメモリ7
との間で、この24通りのうちいずれの順序でサブペー
ジを置き換えてもよい。例えば、プロセッサエレメント
231 〜23n からのアクセス要求を考慮せず、例え
ば、常に、サブページ91,92,93,94の順でサ
ブページを置き換えてもよい。
【0079】また、本発明は、例えば、プロセッサエレ
メント231 〜23n の動作モードを判断したり、各プ
ロセッサエレメント231 〜23n のデータアクセスパ
ターンがメモリアドレスを増加および減少する方向の何
れであるかを判断する判断回路を設けることも可能であ
る。この場合には、当該判断回路の判断結果に基づい
て、共有メモリ24とメインメモリ7との間でのサブペ
ージの置き換え順序を、プロセッサエレメント231
23n のアクセス待ち時間が短くなるように、柔軟に設
定するように構成することができる。ここで、共有メモ
リ24におけるサブページの置き換え順序を制御する手
段として、固定された論理回路の他に、条件に応じて置
き換え順序を柔軟に変更できるシーケンサなどのプログ
ラム可能な回路を設けることが望ましい。
【0080】また、上述した並列プロセッサ21では、
図2に示すように、1組のメモリ内部バス51およびコ
モンバス22を用いた場合を例示したが、メモリサブバ
ンクの数以下の複数組のメモリ内部バス51およびコモ
ンバス22を設けてもよい。この場合には、当該組の数
に応じて、プロセッサエレメント231 〜23n から共
有メモリ24の異なるサブバンクに同時にアクセスが可
能となり、さらなる高速処理を実現できる。
【0081】
【発明の効果】以上説明したように、本発明の並列プロ
セッサによれば、複数のプロセッサエレメントが共有メ
モリにアクセスするときの待ち時間を短縮でき、高い演
算性能を実現できる。また、本発明の並列プロセッサに
よれば、第1の記憶手段をそれぞれ単数のデータポート
を持つ複数のサブバンクに分割したことで、単位面積当
たりの第1の記憶手段の記憶容量を増大できる。また、
本発明のプロセッサによれば、プロセッサエレメントが
中間メモリにアクセスするときの待ち時間を短縮でき、
高い演算性能を実現できる。また、本発明のプロセッサ
によれば、第1の記憶手段をそれぞれ単数のデータポー
トを持つ複数のサブバンクに分割したことで、単位面積
当たりの第1の記憶手段の記憶容量を増大できる。ま
た、本発明の第1の観点のメモリ制御方法によれば、プ
ロセッサエレメントが共有メモリにアクセスするときの
待ち時間を短縮でき、プロセッサエレメントに高い演算
性能を実現させることが可能になる。本発明の第2の観
点のメモリ制御方法によれば、プロセッサエレメントが
中間メモリにアクセスするときの待ち時間を短縮でき、
プロセッサエレメントに高い演算性能を実現させること
が可能になる。
【図面の簡単な説明】
【図1】図1は、本発明の実施形態の並列プロセッサの
システム構成図である。
【図2】図2は、図1に示す共有メモリの構成図であ
る。
【図3】図3は、図2に示すメモリサブバンクに記憶さ
れるサブページを説明するための図である。
【図4】図4は、図1に示す並列プロセッサにおける共
有メモリの制御回路における処理を説明するためのフロ
ーチャートである。
【図5】図5は、メモリサブバンクの記憶状態を説明す
るための図である。
【図6】図6は、図4のページ置き換えを行わない場合
のタグバンクの記憶状態を説明するための図である。
【図7】図7は、メモリサブバンクの記憶状態を説明す
るための図である。
【図8】図7は、図4のステップS7の処理が実行され
る場合のタグバンクの記憶状態を説明するための図であ
る。
【図9】図9は、メモリサブバンクの記憶状態を説明す
るための図である。
【図10】図10は、図4のステップS7の処理が実行
され、要求があったサブページがメインメモリからメモ
リセル領域に記憶された後のタグバンクの記憶状態を説
明するための図である。
【図11】図11は、図4のステップS10の処理が実
行される場合のタグバンクの記憶状態を説明するための
図である。
【図12】図12は、図4のステップS11の処理が実
行される場合のタグバンクの記憶状態を説明するための
図である。
【図13】図13は、図1に示す並列プロセッサの多重
化処理を説明するための図である。
【図14】本発明のその他の実施形態に係わるプロセッ
サのシステム構成図である。
【図15】図15は、従来の一般的な並列プロセッサの
システム構成図である。
【図16】図16は、従来のその他の並列プロセッサの
システム構成図である。
【符号の説明】
6…チップインタフェース、7…メインメモリ、22…
コモンバス、231 〜23n …プロセッサエレメント、
24…共有メモリ、25…バスユニット、26…外部ア
クセスバス、271 〜273 ,41〜44…サブバン
ク、31…コモンバス用制御回路、32…外部バス用制
御回路、33…制御回路、53〜56…マルチプレク
サ、57〜60…アドレスデコーダ、800 〜80m
バンク、120…タグデータ領域、121…バリッド識
別領域、122…ダーディ識別領域、123…ページセ
レクタ領域、1300 〜130m-1 …タグバンク、20
4…中間メモリ

Claims (34)

    【特許請求の範囲】
  1. 【請求項1】それぞれ単数または複数のサブページを記
    憶する内部メモリを備え、当該内部メモリに記憶された
    データを用いて演算処理を行う複数のプロセッサエレメ
    ントと、 それぞれ複数のサブページからなる複数のページを記憶
    するメインメモリと、 前記複数のプロセッサエレメントからアクセスされる共
    有メモリとを有し、 前記共有メモリは、 前記メインメモリに記憶された前記複数のページのうち
    一部のページを読み出して記憶する第1の記憶手段と、 前記第1の記憶手段に記憶されたサブページのそれぞれ
    について、前記メインメモリへの書き戻しの必要性の有
    無を示す特性データを記憶する第2の記憶手段と、 前記プロセッサエレメントから要求があったサブページ
    が前記第1の記憶手段に記憶されていない場合に、前記
    メインメモリへの書き戻しが必要なサブページの数が少
    なくなるように前記第1の記憶手段に記憶されている複
    数のページのなかから置き換え対象とするページを前記
    特性データを参照して決定し、当該決定されたページが
    記憶されている前記第1の記憶手段の記憶領域に、前記
    メインメモリに記憶されている前記プロセッサエレメン
    トから要求があったサブページを含むページを読み出し
    て記憶するように制御する制御手段とを有する並列プロ
    セッサ。
  2. 【請求項2】前記制御手段は、前記決定されたページが
    記憶されている前記第1の記憶手段の記憶領域に、前記
    メインメモリに記憶されている前記プロセッサエレメン
    トから要求があったサブページを含むページを読み出し
    て記憶した後に、前記プロセッサエレメントから要求の
    あったサブページを、前記第1の記憶手段から読み出し
    て前記要求を出したプロセッサエレメントの前記内部メ
    モリに記憶するように制御する請求項1に記載の並列プ
    ロセッサ。
  3. 【請求項3】前記制御手段は、前記プロセッサエレメン
    トから要求があったサブページが前記第1の記憶手段に
    記憶されている場合に、前記要求があったサブページを
    前記第1の記憶手段から読み出して前記要求を出したプ
    ロセッサエレメントの前記内部メモリに記憶するように
    制御する請求項1に記載の並列プロセッサ。
  4. 【請求項4】前記制御手段は、前記決定されたページが
    記憶されている前記第1の記憶手段の記憶領域に、前記
    メインメモリに記憶されている前記プロセッサエレメン
    トから要求があったサブページを含むページを読み出し
    て記憶する際に、前記要求があったサブページを最初に
    前記メインメモリから読み出して前記第1の記憶手段に
    記憶するように制御する請求項1に記載の並列プロセッ
    サ。
  5. 【請求項5】前記第1の記憶手段は、前記メインメモリ
    に比べて高速アクセスが可能である請求項1に記載の並
    列プロセッサ。
  6. 【請求項6】前記第1の記憶手段は、それぞれデータポ
    ートを持つ複数のサブバンクに記憶領域が分割されてお
    り、各サブバンクに単数または複数のサブページを記憶
    する請求項1に記載の並列プロセッサ。
  7. 【請求項7】前記複数のプロセッサエレメントと前記第
    1の記憶手段とを接続する第1のバスと、 前記第1の記憶手段と前記メインメモリとを接続する第
    2のバスとを有する請求項6に記載の並列プロセッサ。
  8. 【請求項8】前記第1の記憶手段は、複数の異なるサブ
    バンクの単数のサブページを記憶する記憶領域からそれ
    ぞれ構成され、それぞれ単数のページを記憶する複数の
    バンクを有し、 前記制御手段は、前記メインメモリから読み出したペー
    ジを、前記第1の記憶手段にバンク単位で記憶するよう
    に制御する請求項6に記載の並列プロセッサ。
  9. 【請求項9】前記制御手段は、前記プロセッサエレメン
    トから要求があったサブページが前記第1の記憶手段に
    記憶されていない場合に、前記要求があったサブページ
    の次に前記メインメモリから読み出すサブページを記憶
    しようとする前記第1の記憶手段のサブバンクに既に記
    憶されているサブページの特性データを参照し、前記第
    1の記憶手段の複数のバンクのうち、前記既に記憶され
    ているサブページが前記メインメモリへの書き戻しが必
    要でないバンクに、前記要求があったサブページを含む
    ページを記憶するように制御する請求項8に記載の並列
    プロセッサ。
  10. 【請求項10】前記第2の記憶手段は、前記第1の記憶
    手段に記憶されているサブページのそれぞれについて、
    前記メインメモリへの書き戻しの必要性の有無を示すデ
    ータの他に、対応するサブページの有効性を示す特定デ
    ータを記憶し、 前記制御手段は、前記プロセッサエレメントから要求が
    あったサブページが前記第1の記憶手段に記憶されてい
    ない場合に、当該要求があったサブページを記憶しよう
    とする前記第1の記憶手段のサブバンクに既に記憶され
    ているサブページの特性データを参照し、前記既に記憶
    されているサブページが有効でない記憶領域を含むバン
    クを検索し、当該バンクが1つ存在する場合に、前記検
    索されたバンクに、前記要求があったサブページを含む
    ページを記憶し、 前記要求があったサブページを記憶しようとする前記第
    1の記憶手段のサブバンクに記憶されたサブページが有
    効でない記憶領域を含むバンクが複数存在する場合に、
    前記特定データを参照して、当該複数のバンクのうち、
    前記要求があったサブページを記憶しようとするサブバ
    ンクに既に記憶されているサブページが前記メインメモ
    リへの書き戻しが必要でないバンクを検索し、当該検索
    されたバンクに、前記要求があったサブページを含むペ
    ージを記憶するように制御する請求項8に記載の並列プ
    ロセッサ。
  11. 【請求項11】前記サブバンクに対応して設けられ、前
    記サブバンクの各々と、前記第1のバスおよび第2のバ
    スのうち選択した一方とをそれぞれ接続する複数の選択
    手段をさらに有する請求項7に記載の並列プロセッサ。
  12. 【請求項12】前記制御手段は、前記第1の記憶手段と
    前記プロセッサエレメントとの間で転送されるサブペー
    ジと、前記第1の記憶手段と前記メインメモリとの間で
    転送されるサブページとが異なる場合に、前記第1の記
    憶手段と前記プロセッサエレメントとの間での前記第1
    のバスを介したサブページの転送処理と、前記第1の記
    憶手段と前記メインメモリとの間での前記第2のバスを
    介したサブページの転送処理とを並行して行うように制
    御する請求項7に記載の並列プロセッサ。
  13. 【請求項13】前記第1のバスのデータ転送速度は、前
    記第2のバスのデータ転送速度と同一、または、前記第
    2のバスのデータ転送速度より速い請求項7に記載の並
    列プロセッサ。
  14. 【請求項14】前記第1の記憶手段の記憶領域の各サブ
    バンクに、それぞれ単数のデータポートが設けられてい
    る請求項6に記載の並列プロセッサ。
  15. 【請求項15】前記第1の記憶手段の複数のサブバンク
    は、同じ記憶容量を有する請求項6に記載の並列プロセ
    ッサ。
  16. 【請求項16】前記第1の記憶手段のサブバンクの数
    と、前記ページを構成するサブページの数とは同じであ
    る請求項6に記載の並列プロセッサ。
  17. 【請求項17】前記プロセッサエレメントの前記内部メ
    モリは、複数のサブページを記憶する請求項1に記載の
    並列プロセッサ。
  18. 【請求項18】前記ページを構成する複数のサブページ
    は、前記メインメモリのアドレス空間で連続したアドレ
    スを持つ請求項1に記載の並列プロセッサ。
  19. 【請求項19】前記サブページのデータは、画像データ
    であり、 前記複数のプロセッサエレメントは、前記画像データを
    用いて画像処理を行う請求項1に記載の並列プロセッ
    サ。
  20. 【請求項20】メインメモリに記憶されたそれぞれ複数
    のサブページからなる複数のページのうち一部のページ
    を、複数のプロセッサエレメントからアクセスされる共
    有メモリに記憶し、前記複数のプロセッサエレメントの
    うち任意のプロセッサエレメントから要求があったサブ
    ページを前記共有メモリから読み出して前記要求を出し
    たプロセッサエレメントに出力するメモリ制御方法であ
    って、 前記プロセッサエレメントから要求があったサブページ
    が前記共有メモリに記憶されていない場合に、前記メイ
    ンメモリへの書き戻しが必要なサブページの数が少なく
    なるように前記共有メモリに記憶されている複数のペー
    ジのなかから置き換え対象とするページを、前記共有メ
    モリに記憶されたサブページのそれぞれについて前記メ
    インメモリへの書き戻しの必要性の有無を示す前記特性
    データを参照して決定し、 当該決定されたページが記憶されている前記共有メモリ
    の記憶領域に、前記メインメモリに記憶されている前記
    プロセッサエレメントから要求があったサブページを含
    むページを読み出して記憶し、 前記共有メモリから前記要求があったサブページを読み
    出して前記要求を出したプロセッサエレメントに出力す
    るメモリ制御方法。
  21. 【請求項21】前記決定されたページが記憶されている
    前記共有メモリの記憶領域に、前記メインメモリに記憶
    されている前記プロセッサエレメントから要求があった
    サブページを含むページを読み出して記憶した後に、前
    記プロセッサエレメントから要求のあったサブページ
    を、前記共有メモリから読み出して前記要求を出したプ
    ロセッサエレメントの前記内部メモリに記憶する請求項
    20に記載のメモリ制御方法。
  22. 【請求項22】前記プロセッサエレメントから要求があ
    ったサブページが前記共有メモリに記憶されている場合
    に、前記要求があったサブページを前記共有メモリから
    読み出して前記要求を出したプロセッサエレメントの前
    記内部メモリに記憶する請求項20に記載のメモリ制御
    方法。
  23. 【請求項23】前記決定されたページが記憶されている
    前記共有メモリの記憶領域に、前記メインメモリに記憶
    されている前記プロセッサエレメントから要求があった
    サブページを含むページを読み出して記憶する際に、前
    記要求があったサブページを最初に前記メインメモリか
    ら読み出して前記共有メモリに記憶する請求項20に記
    載のメモリ制御方法。
  24. 【請求項24】前記共有メモリは、前記メインメモリに
    比べて高速アクセスが可能である請求項20に記載のメ
    モリ制御方法。
  25. 【請求項25】前記共有メモリの記憶領域を、それぞれ
    データポートを持つ複数のサブバンクに分割し、各サブ
    バンクに単数または複数のサブページを記憶する請求項
    20に記載のメモリ制御方法。
  26. 【請求項26】第1のバスを介して、前記複数のプロセ
    ッサエレメントと前記共有メモリとの間のサブページの
    転送を行い第2のバスを介して、前記共有メモリと前記
    メインメモリとの間のサブページの転送を行う請求項2
    0に記載のメモリ制御方法。
  27. 【請求項27】前記共有メモリの記憶領域を、複数の異
    なるサブバンクの単数のサブページを記憶する記憶領域
    からそれぞれ構成され、それぞれ単数のページを記憶す
    る複数のバンクに分割し、 前記メインメモリから読み出したページを、前記共有メ
    モリにバンク単位で記憶する請求項25に記載のメモリ
    制御方法。
  28. 【請求項28】前記プロセッサエレメントから要求があ
    ったサブページが前記共有メモリに記憶されていない場
    合に、前記要求があったサブページの次に前記メインメ
    モリから読み出すサブページを記憶しようとする前記共
    有メモリのサブバンクに既に記憶されているサブページ
    の特性データを参照し、前記共有メモリの複数のバンク
    のうち、前記既に記憶されているサブページが前記メイ
    ンメモリへの書き戻しが必要でないバンクに、前記要求
    があったサブページを含むページを記憶する請求項27
    に記載のメモリ制御方法。
  29. 【請求項29】前記特定データは、前記共有メモリに記
    憶されているサブページのそれぞれについて、前記メイ
    ンメモリへの書き戻しの必要性の有無を示すデータの他
    に、対応するサブページの有効性を示すデータを含み前
    記プロセッサエレメントから要求があったサブページが
    前記共有メモリに記憶されていない場合に、当該要求が
    あったサブページを記憶しようとする前記共有メモリの
    サブバンクに既に記憶されているサブページの特性デー
    タを参照し、前記既に記憶されているサブページが有効
    でない記憶領域を含むバンクを検索し、当該バンクが1
    つ存在する場合に、前記検索されたバンクに、前記要求
    があったサブページを含むページを記憶し、 前記要求があったサブページを記憶しようとする前記共
    有メモリのサブバンクに記憶されたサブページが有効で
    ない記憶領域を含むバンクが複数存在する場合に、前記
    特定データを参照して、当該複数のバンクのうち、前記
    要求があったサブページを記憶しようとするサブバンク
    に既に記憶されているサブページが前記メインメモリへ
    の書き戻しが必要でないバンクを検索し、当該検索され
    たバンクに、前記要求があったサブページを含むページ
    を記憶する請求項27に記載のメモリ制御方法。
  30. 【請求項30】前記共有メモリと前記プロセッサエレメ
    ントとの間で転送されるサブページと、前記共有メモリ
    と前記メインメモリとの間で転送されるサブページとが
    異なる場合に、前記共有メモリと前記プロセッサエレメ
    ントとの間での前記第1のバスを介したサブページの転
    送処理と、前記共有メモリと前記メインメモリとの間で
    の前記第2のバスを介したサブページの転送処理とを並
    行して行う請求項20に記載のメモリ制御方法。
  31. 【請求項31】前記ページを構成する複数のサブページ
    は、前記メインメモリのアドレス空間で連続したアドレ
    スを持つ請求項20に記載のメモリ制御方法。
  32. 【請求項32】前記サブページのデータは、画像データ
    であり、 前記複数のプロセッサエレメントは、前記画像データを
    用いて画像処理を行う請求項20に記載のメモリ制御方
    法。
  33. 【請求項33】単数または複数のサブページを記憶する
    内部メモリを備え、当該内部メモリに記憶されたデータ
    を用いて演算処理を行う単数のプロセッサエレメント
    と、 それぞれ複数のサブページからなる複数のページを記憶
    するメインメモリと、 前記プロセッサエレメントからアクセスされる中間メモ
    リとを有し、 前記中間メモリは、 前記メインメモリに記憶された前記複数のページのうち
    一部のページを読み出して記憶する第1の記憶手段と、 前記第1の記憶手段に記憶されたサブページのそれぞれ
    について、前記メインメモリへの書き戻しの必要性の有
    無を示す特性データを記憶する第2の記憶手段と、 前記プロセッサエレメントから要求があったサブページ
    が前記第1の記憶手段に記憶されていない場合に、前記
    メインメモリへの書き戻しが必要なサブページの数が少
    なくなるように前記第1の記憶手段に記憶されている複
    数のページのなかから置き換え対象とするページを前記
    特性データを参照して決定し、当該決定されたページが
    記憶されている前記第1の記憶手段の記憶領域に、前記
    メインメモリに記憶されている前記プロセッサエレメン
    トから要求があったサブページを含むページを読み出し
    て記憶するように制御する制御手段とを有するプロセッ
    サ。
  34. 【請求項34】メインメモリに記憶されたそれぞれ複数
    のサブページからなる複数のページのうち一部のページ
    を中間メモリに記憶し、プロセッサエレメントから要求
    があったサブページを前記中間メモリから読み出して前
    記プロセッサエレメントに出力するメモリ制御方法であ
    って、 前記プロセッサエレメントから要求があったサブページ
    が前記中間メモリに記憶されていない場合に、前記メイ
    ンメモリへの書き戻しが必要なサブページの数が少なく
    なるように前記中間メモリに記憶されている複数のペー
    ジのなかから置き換え対象とするページを、前記中間メ
    モリに記憶されたサブページのそれぞれについて前記メ
    インメモリへの書き戻しの必要性の有無を示す前記特性
    データを参照して決定し、 当該決定されたページが記憶されている前記中間メモリ
    の記憶領域に、前記メインメモリに記憶されている前記
    プロセッサエレメントから要求があったサブページを含
    むページを読み出して記憶し、 前記中間メモリから前記要求があったサブページを読み
    出して前記プロセッサエレメントに出力するメモリ制御
    方法。
JP10004324A 1998-01-12 1998-01-12 並列プロセッサおよびメモリ制御方法 Pending JPH11203200A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10004324A JPH11203200A (ja) 1998-01-12 1998-01-12 並列プロセッサおよびメモリ制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10004324A JPH11203200A (ja) 1998-01-12 1998-01-12 並列プロセッサおよびメモリ制御方法

Publications (1)

Publication Number Publication Date
JPH11203200A true JPH11203200A (ja) 1999-07-30

Family

ID=11581282

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10004324A Pending JPH11203200A (ja) 1998-01-12 1998-01-12 並列プロセッサおよびメモリ制御方法

Country Status (1)

Country Link
JP (1) JPH11203200A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010205083A (ja) * 2009-03-04 2010-09-16 Canon Inc 並列処理プロセッサシステム
JP2022031959A (ja) * 2017-06-22 2022-02-22 マイクロン テクノロジー,インク. 不揮発性のメモリシステム又はサブシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010205083A (ja) * 2009-03-04 2010-09-16 Canon Inc 並列処理プロセッサシステム
JP2022031959A (ja) * 2017-06-22 2022-02-22 マイクロン テクノロジー,インク. 不揮発性のメモリシステム又はサブシステム

Similar Documents

Publication Publication Date Title
US5640534A (en) Method and system for concurrent access in a data cache array utilizing multiple match line selection paths
US5826052A (en) Method and apparatus for concurrent access to multiple physical caches
US6629205B2 (en) System and method for increasing the snoop bandwidth to cache tags in a cache memory subsystem
JP2554449B2 (ja) キャッシュ・メモリを有するデータ処理システム
JPH11203192A (ja) 並列プロセッサおよび演算処理方法
US7809889B2 (en) High performance multilevel cache hierarchy
US5805855A (en) Data cache array having multiple content addressable fields per cache line
JPH09259036A (ja) ライトバックキャッシュおよびライトバックキャッシュ内で整合性を維持する方法
JP2000010860A (ja) キャッシュメモリ制御回路及びプロセッサ及びプロセッサシステム及び並列プロセッサシステム
US8621152B1 (en) Transparent level 2 cache that uses independent tag and valid random access memory arrays for cache access
JPH04233050A (ja) キャッシュメモリ交換プロトコル
US11520706B2 (en) Dram-aware caching
US5761714A (en) Single-cycle multi-accessible interleaved cache
US5905997A (en) Set-associative cache memory utilizing a single bank of physical memory
EP0470739B1 (en) Method for managing a cache memory system
JP2000501539A (ja) アドレス競合検出を持つ多重ポート・キャッシュメモリ
US6240487B1 (en) Integrated cache buffers
US6901450B1 (en) Multiprocessor machine and cache control method for providing higher priority to shared cache that is accessed by multiprocessors
JPH11203200A (ja) 並列プロセッサおよびメモリ制御方法
EP0310446A2 (en) Cache memory management method
JPH11316744A (ja) 並列プロセッサおよび演算処理方法
US20030188105A1 (en) Management of caches in a data processing apparatus
US20090164732A1 (en) Cache memory system and cache memory control method
US6581139B1 (en) Set-associative cache memory having asymmetric latency among sets
JPH04315235A (ja) キャッシュメモリにおけるキャッシュデータリプレース方法及びキャッシュデータリプレース装置