JP2000047995A - Parallel processing method and apparatus, and visual inspection apparatus using the same - Google Patents
Parallel processing method and apparatus, and visual inspection apparatus using the sameInfo
- Publication number
- JP2000047995A JP2000047995A JP10212785A JP21278598A JP2000047995A JP 2000047995 A JP2000047995 A JP 2000047995A JP 10212785 A JP10212785 A JP 10212785A JP 21278598 A JP21278598 A JP 21278598A JP 2000047995 A JP2000047995 A JP 2000047995A
- Authority
- JP
- Japan
- Prior art keywords
- data
- input
- unit
- processor
- parallel processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Multi Processors (AREA)
Abstract
(57)【要約】
【課題】 各プロセッサへのデータ分配を効率良く行な
い、プロセッサの高稼働率を維持する。
【解決手段】 入力データDはデータ入力部1で部分デ
ータAに区分され、バス2を介してPE(プロセッサエ
レメント)6に転送される。各PE6、例えばPE6b
は、優先順位で上位のPE6aの送信部9から送信され
るデータ入力許可信号Cを受信しており、このデータ入
力許可信号Cがデータ取込み許可を表しているとき、デ
ータバス2からの部分データAを入力I/F11から取
り込み、プロセッサ7でメモリ8を用いて演算処理す
る。処理された部分データAは、出力I/F12からバ
ス3を介してデータ出力部5に転送される。PE6b
は、データ入力待ち状態やデータ取込み状態,データ処
理状態などの自己の状態を表わすデータ入力許可信号C
を送信部9から優先順位が下位のPE6cに送信する。
(57) [Problem] To efficiently distribute data to each processor and maintain a high operation rate of the processor. SOLUTION: Input data D is divided into partial data A at a data input unit 1 and transferred to a PE (processor element) 6 via a bus 2. Each PE6, for example PE6b
Receives the data input permission signal C transmitted from the transmission unit 9 of the PE 6a having a higher priority, and when the data input permission signal C indicates the permission of data capture, the partial data from the data bus 2 A is fetched from the input I / F 11 and is processed by the processor 7 using the memory 8. The processed partial data A is transferred from the output I / F 12 to the data output unit 5 via the bus 3. PE6b
Is a data input enable signal C indicating its own state such as a data input wait state, a data fetch state, and a data processing state.
Is transmitted from the transmission unit 9 to the PEs 6c of lower priority.
Description
【0001】[0001]
【発明の属する技術分野】本発明は、データ処理を並列
に行なうことができるようにした並列処理装置及びそれ
を用いた外観検査装置に係り、特に、複数個の信号処理
プロセッサ(以下、プロセッサ)を備え、夫々にデータ
処理を割り当てて並列にデータ処理を行なわせることに
より、高速なデータ処理を実現し、画像データのように
高速に、かつ大量に検出されるデータを取り込みなが
ら、それと同時に、そのデータの処理をする必要がある
場合に好適な並列処理方法及び装置、並びにそれを用い
た外観検査装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a parallel processing device capable of performing data processing in parallel and a visual inspection device using the same, and more particularly, to a plurality of signal processing processors (hereinafter, processors). By realizing high-speed data processing by allocating data processing to each and performing data processing in parallel, high-speed data such as image data and capturing a large amount of detected data, at the same time, The present invention relates to a parallel processing method and apparatus suitable for the case where it is necessary to process the data, and a visual inspection apparatus using the same.
【0002】[0002]
【従来の技術】従来、複数のプロセッサを用いてデータ
の並列処理を行なう並列処理装置として、かかるプロセ
ッサの稼働率を向上させて演算性能を高めるために、各
プロセッサの稼働状態などの情報を集中管理し、その情
報を基に、次に処理されるべきデータをどのプロセッサ
に処理させるかを決定する管理部を有する並列処理装置
が、例えば、特開平3−177961号公報などで提案
されている。各プロセッサの稼働状態などの情報とは、
例えば、プロセッサが処理中であるのか、処理データを
待っているのか、演算結果を出力中であるのかといった
状態を示す情報であり、また、現在行なっているデータ
処理があとどの位で終了するかといった、その時点で予
測される情報も含むものとしている。2. Description of the Related Art Conventionally, as a parallel processing apparatus for performing parallel processing of data using a plurality of processors, information such as the operating state of each processor is concentrated in order to improve the operation rate of such processors and thereby enhance the operation performance. For example, Japanese Patent Laid-Open Publication No. 3-177951 has proposed a parallel processing apparatus having a management unit for managing and determining which processor should process data to be processed next based on the information. . Information such as the operating status of each processor
For example, information that indicates whether the processor is processing, waiting for processing data, or outputting a calculation result, and how long the data processing currently being performed will end. And information predicted at that time.
【0003】図11はかかる従来の並列処理装置を示す
ブロック図であって、100はデータ入力部、101は
入力バス、102は出力バス、103はデータ出力部、
104はプロセッサ、105はメモリ、106は状態レ
ジスタ、107は管理部である。FIG. 11 is a block diagram showing such a conventional parallel processing apparatus, in which 100 is a data input unit, 101 is an input bus, 102 is an output bus, 103 is a data output unit,
104 is a processor, 105 is a memory, 106 is a status register, and 107 is a management unit.
【0004】同図において、データ入力部100は外部
からデータを入力するものであって、入力されたデータ
は入力バス101を介してプロセッサ104に転送され
る。プロセッサ104では、メモリ105を用いてこの
データが処理される。各プロセッサ104でのデータの
処理結果は出力バス102を介して転送され、データ出
力部103に記憶される。プロセッサ104は取り込ん
だデータを処理し、メモリはプロセッサ104が行なう
処理に必要となるデータを格納する。In FIG. 1, a data input unit 100 is for inputting data from the outside, and the input data is transferred to a processor 104 via an input bus 101. The processor 104 processes this data using the memory 105. The data processing result in each processor 104 is transferred via the output bus 102 and stored in the data output unit 103. The processor 104 processes the received data, and the memory stores data necessary for the processing performed by the processor 104.
【0005】状態レジスタ106は各プロセッサ104
の動作状態を記憶するためのものであり、各プロセッサ
104に接続されている。管理部107は、状態レジス
タ909の内容を参照することにより、次に入力される
データをどのプロセッサ104に処理させるべきかを決
定し、その結果を各プロセッサ104に通知する。The status register 106 stores information for each processor 104.
And is connected to each processor 104. The management unit 107 determines which processor 104 should process the next input data by referring to the contents of the status register 909, and notifies each processor 104 of the result.
【0006】かかる構成では、プロセッサ104は、管
理部107より、次に転送されるデータを取り込んで処
理するように命令された場合にのみ、入力バス101か
らデータを取り込んで処理を行ない、そのデータの処理
が終了すると、その演算結果を出力バスを介してデータ
出力部103に転送し、しかる後に、状態レジスタ10
6に対し、演算結果の転送を終了して次のデータを取り
込むことができる旨の通知を送る。In such a configuration, the processor 104 fetches data from the input bus 101 and performs processing only when instructed by the management unit 107 to fetch and process the next data to be transferred. Is completed, the operation result is transferred to the data output unit 103 via the output bus, and thereafter, the status register 10
6 is notified that the transfer of the operation result has been completed and that the next data can be fetched.
【0007】一方、管理部107は、状態レジスタ10
6を常時監視しており、次のデータを取り込むことが可
能な状態にあるプロセッサ104を見つけると、そのプ
ロセッサ104に対して次のデータを取り込んで処理す
るべき旨を伝える。On the other hand, the management unit 107
6 is constantly monitored, and when it finds a processor 104 that is ready to take in the next data, it informs the processor 104 that the next data should be taken in and processed.
【0008】このように、管理部107によって各プロ
セッサ104の状態を管理することにより、処理時間が
他のプロセッサ104の処理時間よりも短いために先に
処理が終了したプロセッサ104に対し、優先的に次の
データを与えることができ、これにより、プロセッサ1
04の空き時間を減少させることができて、並列処理装
置全体のプロセッサの稼働率を向上されることができ
る。As described above, by managing the state of each processor 104 by the management unit 107, priority is given to the processor 104 which has completed the processing earlier because the processing time is shorter than the processing time of the other processors 104. Can be given the following data,
04 can be reduced, and the operating rate of the processor of the entire parallel processing apparatus can be improved.
【0009】[0009]
【発明が解決しようとする課題】しかしながら、上記従
来技術では、高速に入力される大量のデータ、例えば、
ビデオカメラやイメージセンサなどの画像検出器で検出
されるような大量のデータをリアルタイムに処理する場
合に問題がある。However, in the above-mentioned prior art, a large amount of data input at high speed, for example,
There is a problem when processing a large amount of data detected by an image detector such as a video camera or an image sensor in real time.
【0010】即ち、このような場合、処理対象はビデオ
カメラやイメージセンサなどの画像検出器に与える同期
信号に基づいて一定の時間間隔で入力される画像データ
であり、かかるデータを全て取りこぼすことなく確実に
処理し、所定の時間内で演算結果の出力までの過程を終
了する必要がある。図11に示した従来技術では、各プ
ロセッサ104が自己の状態を状態レジスタ106に通
知する必要があるが、複数のプロセッサ104が同時に
状態レジスタ106にアクセスする状態が起こらないよ
うにするために、プロセッサ104間の調停を行ない、
唯1つのプロセッサ104のみが状態レジスタ106に
アクセスできるように排他制御が行なわなければならな
い。しかし、この調停に要する時間はプロセッサ104
にとって無駄な時間であり、これがプロセッサ104の
稼働率を低下させる原因となる。That is, in such a case, the processing target is image data that is input at a fixed time interval based on a synchronization signal given to an image detector such as a video camera or an image sensor. It is necessary to perform processing without fail and to finish the process up to output of the calculation result within a predetermined time. In the prior art shown in FIG. 11, each processor 104 needs to notify its own status to the status register 106. In order to prevent a situation in which a plurality of processors 104 access the status register 106 at the same time, Arbitrates between the processors 104,
Exclusive control must be performed so that only one processor 104 can access the status register 106. However, the time required for this arbitration depends on the processor 104.
Is a wasteful time for the processor 104, which causes a decrease in the operation rate of the processor 104.
【0011】また、管理部107では、状態レジスタ1
06の情報を参照し、次に処理すべきデータをどのプロ
セッサ104に割り当てるかを決定するための時間が必
要であるが、プロセッサ数が増加するにつれてこの決定
に要する時間が増加するために、多数のプロセッサ10
4を搭載して並列処理を行なった場合には、次のデータ
が転送されるまでにそのデータを取り込むべきプロセッ
サ104の決定が間に合わず、データの取りこぼしが発
生するおそれがある。In the management unit 107, the status register 1
06, it is necessary to determine the processor 104 to which the data to be processed next is to be allocated. However, as the number of processors increases, the time required for this determination increases. Processor 10
4 and the parallel processing is carried out, the decision of the processor 104 to take in the data before the next data is transferred cannot be made in time, and data may be missed.
【0012】本発明の目的は、かかる問題を解消し、画
像データのような高速にかつ大量に入力されるデータを
取りこぼすことなく確実に処理し、かつ搭載した各プロ
セッサの稼働率を向上させて処理効率の良い並列処理方
法及び装置、並びにそれを用いた外観検査装置を提供す
ることにある。SUMMARY OF THE INVENTION An object of the present invention is to solve such a problem, to surely process high-speed and large-volume input data such as image data without dropping it, and to improve the operating rate of each processor mounted. Another object of the present invention is to provide a parallel processing method and apparatus having high processing efficiency and a visual inspection apparatus using the same.
【0013】[0013]
【課題を解決するための手段】上記目的を達成するため
に、本発明は、データを処理するプロセッサや該プロセ
ッサを制御する回路などを含むプロセッサエレメント夫
々毎に、他のプロセッサエレメントへデータの取込みを
行なってもよいか否かを知らせる第1のデータ入力許可
信号を送信する送信部と、他のプロセッサエレメントか
らのデータの取込みを許可するか否か示す第2のデータ
入力許可信号を受信する受信部とを付加し、プロセッサ
エレメント相互間で送信部と受信部とを接続することに
より、複数のプロセッサエレメントを配列状に接続し、
また、入力バスに全てのプロセッサエレメントを接続
し、かつ、データ入力部では、入力されたデータを該入
力バスに転送すると同時に、各プロセッサエレメントが
取り込むべきデータ単位を規定するデータ転送情報を各
プロセッサエレメントに送信し、各プロセッサエレメン
トでは、自己が受信した該第2のデータ入力許可受信信
号とこのデータ転送情報とそのときの自己の状態とに基
づいて、データ入力を行なうか否かを判断し、その判断
結果を基に、他のプロセッサエレメントへ第1のデータ
入力許可送信信号を転送する構成とした。SUMMARY OF THE INVENTION In order to achieve the above object, the present invention provides a method of acquiring data into another processor element for each processor element including a processor for processing data and a circuit for controlling the processor. And a second data input permission signal indicating whether or not to permit taking in of data from another processor element. By adding a receiving unit and connecting the transmitting unit and the receiving unit between the processor elements, a plurality of processor elements are connected in an array,
In addition, all the processor elements are connected to the input bus, and the data input unit transfers the input data to the input bus and, at the same time, transmits the data transfer information defining the data unit to be captured by each processor element to each processor. Each processor element determines whether or not to input data based on the second data input permission reception signal received by itself, this data transfer information and its own state at that time. The first data input permission transmission signal is transferred to another processor element based on the determination result.
【0014】これにより、各プロセッサエレメントが自
己及び他のプロセッサエレメントの状態に依存して自律
的にデータの入力を行なうことを可能とするものであ
り、全てのプロセッサエレメントの動作状態を管理する
管理部を不要として、プロセッサエレメント間の調停な
どの無駄時間を生じさせずに、各プロセッサエレメント
の稼働率を向上させることができる。This enables each processor element to autonomously input data depending on the state of itself and other processor elements, and manages the operation state of all processor elements. The operation rate of each processor element can be improved without the need for a unit and without causing a dead time such as arbitration between the processor elements.
【0015】[0015]
【発明の実施の形態】以下、本発明の実施形態を図面を
用いて説明する。図1は本発明による並列処理方法及び
装置の一実施形態の全体構成を示すブロック図であっ
て、1はデータ入力部、2は入力バス、3は出力バス、
4は制御バス、5はデータ出力部、6a,6b,6cは
プロセッサエレメント(以下、PEという)、7はプロ
セッサ(P)、8はローカルメモリ(M)、9はデータ
入力許可送信部(T)、10はデータ入力許可受信部
(R)、11は入力I/F部、12は出力I/F部であ
る。Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing an overall configuration of an embodiment of a parallel processing method and apparatus according to the present invention, wherein 1 is a data input unit, 2 is an input bus, 3 is an output bus,
4 is a control bus, 5 is a data output unit, 6a, 6b and 6c are processor elements (hereinafter referred to as PEs), 7 is a processor (P), 8 is a local memory (M), and 9 is a data input permission transmission unit (T ), 10 is a data input permission receiving section (R), 11 is an input I / F section, and 12 is an output I / F section.
【0016】同図において、外部からデータ入力部1に
入力されたデータDは、入力バス2を介して複数のPE
6に転送される(ここでは、3個のPE6a,6b,6
cが示されているが、この個数に限定されるものではな
い。また、PEを特定しない場合には、「PE6」とい
う)。各PE6の処理結果は出力バス3を介して転送さ
れ、データ出力部5に蓄積される。In FIG. 1, data D input from the outside to a data input unit 1 is transmitted to a plurality of PEs through an input bus 2.
6 (here, three PEs 6a, 6b, 6
Although c is shown, it is not limited to this number. If the PE is not specified, it is referred to as “PE6”.) The processing result of each PE 6 is transferred via the output bus 3 and stored in the data output unit 5.
【0017】PE6は、プロセッサ7とこのプロセッサ
7がデータ処理に使用するローカルメモリ8とその他の
制御回路などを含む1つの処理単位をなすものである。
ここで、ローカルメモリ8はプロセッサ7がデータ処理
のときに用いるメモリであって、処理に必要なデータの
ほか、処理のプログラムなども格納されている。データ
入力許可送信部9は、他のPE6が入力データの取込み
を行なうことが可能か否かを示す情報を送信する機能を
有し、データ入力許可受信部10は、自PE6がデータ
の取込みを行なってよいか否かを示す情報を他のPEか
ら受信する機能を有する。入力I/F部11はデータ入
力のための制御を行ない、出力I/F部12は演算結果
の出力制御を行なう。The PE 6 forms one processing unit including a processor 7, a local memory 8 used by the processor 7 for data processing, and other control circuits.
Here, the local memory 8 is a memory used when the processor 7 performs data processing, and stores data necessary for processing as well as processing programs. The data input permission transmitting section 9 has a function of transmitting information indicating whether or not another PE 6 can take in the input data. The data input permission receiving section 10 allows the own PE 6 to take in the data. It has a function of receiving information indicating whether or not it can be performed from another PE. The input I / F unit 11 performs control for data input, and the output I / F unit 12 controls output of a calculation result.
【0018】外部から入力されたデータDは、データ入
力部1において、複数の部分データAに分割されて入力
バス2に送信される。そして、データ入力部1は、かか
る部分データAを送信すると同時に、その部分データA
の送信中、入力バス2上で転送されるこの部分データA
が有効である期間を示すデータ転送情報Bを制御バス4
を介して各PE6に送信する。The data D input from the outside is divided into a plurality of partial data A in the data input section 1 and transmitted to the input bus 2. Then, the data input unit 1 transmits the partial data A and simultaneously transmits the partial data A.
Is transmitted on the input bus 2 during the transmission of
Is transferred to the control bus 4
To each PE 6 via the.
【0019】各PE6のデータ入力許可受信部10は他
のPE6のデータ入力許可送信部9と接続され、データ
入力許可送信部9からのデータ入力許可信号Cを受信す
る。即ち、PE6aでは、図示しない前段のPE6のデ
ータ入力許可送信部9からのデータ入力許可信号Cを受
信し、PE6bでは、PE6aのデータ入力許可送信部
9からのデータ入力許可信号Cを受信し、PE6cで
は、PE6bのデータ入力許可送信部9からのデータ入
力許可信号Cを受信する。The data input permission receiving section 10 of each PE 6 is connected to the data input permission transmitting section 9 of another PE 6 and receives the data input permission signal C from the data input permission transmitting section 9. That is, the PE 6a receives the data input permission signal C from the data input permission transmission unit 9 of the PE 6 in the preceding stage, not shown, and the PE 6b receives the data input permission signal C from the data input permission transmission unit 9 of the PE 6a. The PE 6c receives the data input permission signal C from the data input permission transmission unit 9 of the PE 6b.
【0020】各PE6は、データ転送情報Bとデータ入
力許可受信部10で受信したデータ入力許可信号Cの情
報内容とそのときの動作状態とから、データを取り込む
べきと決定された場合、入力バス2から部分データAを
取り込む。また、このときのPE6の状態に応じて、デ
ータ入力許可送信部9から他のPE6に対してデータ入
力許可信号Cを送信する。When each of the PEs 6 determines from the data transfer information B and the information content of the data input permission signal C received by the data input permission receiving section 10 and the operation state at that time that the data should be fetched, the input bus 2 to obtain partial data A. Further, the data input permission transmitting section 9 transmits a data input permission signal C to another PE 6 according to the state of the PE 6 at this time.
【0021】そこで、例えば、PE6bにおいて、デー
タ入力許可受信部10で受信したPE6aからのデータ
入力許可信号Cの情報内容と自己のこのときの状態とか
ら、データの取込みが許可され、データ転送情報Bによ
り、入力バス2上で部分データAが転送される有効期間
となると、PE6bは入力バス2を転送開始される部分
データAを取り込む。PE6bは、この部分データAを
取り込むと、この部分データBに対してローカルメモリ
8に事前に格納されているプログラムに従ってプロセッ
サ7が所定の演算処理を施し、その処理結果を出力バス
3を介してデータ出力部5に転送する。これは、他のP
E6についても同様である。Therefore, for example, the PE 6b is permitted to fetch data based on the information content of the data input permission signal C from the PE 6a received by the data input permission receiving unit 10 and its own state at this time. When the effective period during which the partial data A is transferred on the input bus 2 is reached due to B, the PE 6b takes in the partial data A whose transfer is started on the input bus 2. When the PE 6b fetches the partial data A, the processor 7 performs predetermined arithmetic processing on the partial data B according to a program stored in the local memory 8 in advance, and outputs the processing result via the output bus 3. The data is transferred to the data output unit 5. This is the other P
The same applies to E6.
【0022】各PE6で行なう処理は、全て同一とする
ことも可能であるし、また、夫々異なるものを与えるこ
とも可能である。また、各PE6では、データ入力,デ
ータ処理,処理結果の転送がデータの取込み毎に行なわ
れる。The processing performed in each PE 6 can be all the same, or different processing can be given. In each PE 6, data input, data processing, and transfer of the processing result are performed each time data is taken.
【0023】図2はデータ入力部1に入力されるデータ
Dの一具体例を示す図であって、ここでは、ビデオカメ
ラやイメージセンサなどの画像検出装置(以下、センサ
という)で検出された画像データを例としている。FIG. 2 is a diagram showing a specific example of data D input to the data input unit 1. Here, the data D is detected by an image detection device (hereinafter, referred to as a sensor) such as a video camera or an image sensor. Image data is taken as an example.
【0024】同図において、入力画像データDはセンサ
というで検出された画像データであって、センサのx,
y方向サイズを持つ2次元のデータである。この入力画
像データDは、データ入力部1において、複数の部分画
像データAに分割され、夫々の部分画像データAがPE
6での処理対象となる。部分画像データAのサイズは全
て同一であってもよいし、異なっていてもよい。また、
図2では、部分画像データAのx方向サイズとセンサの
x方向サイズとが同一としているが、それに限ることは
なく、部分画像データAのx方向サイズは、センサのx
方向サイズを超えない範囲であれば、任意の大きさをと
ることができる。また、部分画像データAの境界部で
は、必要に応じて、画像の重なりを持たせることも可能
である。In FIG. 1, input image data D is image data detected by a sensor, and x,
This is two-dimensional data having a size in the y direction. The input image data D is divided into a plurality of partial image data A in the data input unit 1, and each of the partial image data A is
6 is the processing target. The sizes of the partial image data A may all be the same or may be different. Also,
In FIG. 2, the x-direction size of the partial image data A and the x-direction size of the sensor are the same. However, the present invention is not limited thereto.
Any size can be adopted as long as the size does not exceed the direction size. Further, at the boundary of the partial image data A, the images can be overlapped as necessary.
【0025】図3は図1でのデータ入力部1の一具体例
を示すブロック図であって、1aはメモリ、1bはスイ
ッチ、1cは分割情報記憶部、1dは分割制御部、1e
は転送バッファである。FIG. 3 is a block diagram showing a specific example of the data input unit 1 in FIG. 1, wherein 1a is a memory, 1b is a switch, 1c is a division information storage unit, 1d is a division control unit, 1e
Is a transfer buffer.
【0026】同図において、センサ(図示せず)からの
画像データDとこれに同期した同期信号SYCとデータ
入力部1に入力される。このデータ入力部1はメモリ1
aとスイッチ1bと分割情報記憶部1cと分割制御部1
dと転送バッファ1eで構成されている。分割情報記憶
部1cには、予め決定された部分画像データAのサイズ
などの画像データDの分割に必要な情報が記憶されてお
り、分割制御部1dは、同期信号SYCと分割情報記憶
部1cの情報内容とを用いて所定の部分画像データBを
作成するための制御信号とデータ転送情報Bとを生成す
る。In FIG. 1, image data D from a sensor (not shown), a synchronizing signal SYC synchronized with the image data D, and a data input unit 1 are input. This data input unit 1 is a memory 1
a, switch 1b, division information storage section 1c, division control section 1
d and a transfer buffer 1e. Information necessary for dividing the image data D, such as a predetermined size of the partial image data A, is stored in the division information storage unit 1c. The division control unit 1d stores the synchronization signal SYC and the division information storage unit 1c. A control signal for creating predetermined partial image data B and data transfer information B are generated using the information contents of the above.
【0027】ここで、同期信号SYCは、画像データD
の1画素毎の区切りを示す信号や画像の1ラインの区切
りを示す信号などである。Here, the synchronization signal SYC corresponds to the image data D
And a signal indicating a break of one line of an image.
【0028】入力画像データDは、直接スイッチ1bの
端子a側に供給されるとともに、メモリ1aで所定時間
遅延された後、スイッチ1bの端子b側に供給される。
スイッチ1bは、分割制御部1dの制御のもとに、通
常、端子a側に閉じており、この端子a側に供給される
入力画像データDを転送バッファ1eに供給する。この
転送バッファ1eでは、この入力画像データDのデータ
が順次蓄積され、1つの部分画像データAを構成する全
てのデータが蓄積されると、分割制御部1dがこれを検
知して転送バッファ1eを制御し、この転送バッファ1
eに蓄積されたデータを1つの部分画像データAとして
入力バス2(図1)へ転送する。分割制御部1dは、内
蔵のカウンタによる同期信号SYCのカウント値などと
分割情報記憶部1cに格納されている情報とを比較する
ことにより、1つの部分画像データAを構成する全デー
タが転送バッファ1eに蓄積されたか否か判定すること
ができる。The input image data D is supplied directly to the terminal a of the switch 1b, and after being delayed by a predetermined time in the memory 1a, supplied to the terminal b of the switch 1b.
The switch 1b is normally closed on the terminal a side under the control of the division control unit 1d, and supplies the input image data D supplied to the terminal a side to the transfer buffer 1e. In the transfer buffer 1e, the data of the input image data D is sequentially accumulated, and when all the data constituting one partial image data A are accumulated, the division control unit 1d detects this and stores the data in the transfer buffer 1e. Control this transfer buffer 1
The data stored in e is transferred to the input bus 2 (FIG. 1) as one partial image data A. The division control unit 1d compares the count value of the synchronization signal SYC by the built-in counter or the like with the information stored in the division information storage unit 1c, so that all data constituting one partial image data A is transferred to the transfer buffer. 1e can be determined.
【0029】図4は入力画像データDと部分画像データ
A,データ転送情報Bとのタイミング関係を示す図であ
って、図示するように、入力画像データDはセンサで1
部分画像データ分ずつに間欠的に発生されるものであっ
て、転送バッファ1eから1つの部分画像データAが転
送されてしまってから、次の入力画像データDが発生さ
れてデータ入力部1に送られる。FIG. 4 is a diagram showing the timing relationship between the input image data D, the partial image data A, and the data transfer information B. As shown in FIG.
This is generated intermittently for each partial image data. After one partial image data A has been transferred from the transfer buffer 1e, the next input image data D is generated and sent to the data input unit 1. Sent.
【0030】また、分割制御部1dは、上記のように、
転送バッファ1eから部分画像データAが入力バス2に
転送される期間、データ転送情報Bを出力して(図4で
のデータ転送情報Bの“H”(ハイレベル)期間)制御
バス4(図1)に転送する。Further, as described above, the division control unit 1d
During the period when the partial image data A is transferred from the transfer buffer 1e to the input bus 2, the data transfer information B is output (the "H" (high level) period of the data transfer information B in FIG. 4) and the control bus 4 (FIG. Transfer to 1).
【0031】メモリ1aは、部分画像データ同士で重な
りを持たせることが必要である場合、この重なり部分を
保持しておくために使用する。いま、図2において、部
分画像A1,A2の間で重なり部分を持たせる場合、部分
画像データA1に対する入力画像データDが端子a側に
閉じた状態にあるスイッチ1bを介して転送バッファ1
eに転送されるが、この入力画像データDはメモリ1a
にも供給される。部分画像データA1の全てのデータが
転送バッファ1eに蓄積され、そこから入力バス2に部
分画像データA1が転送開始されても、メモリ1aに
は、部分画像データA1での必要なデータが保持されて
いる。そして、次の部分画像データA2に対する入力画
像データDが入力開始されるのであるが、これに先立っ
てタイミングでスイッチ1bが端子b側に切り換わり、
メモリ1aから必要なデータが読み出され、スイッチ1
bを介して転送バッファ1eに転送される。この必要な
データの読出し完了とともにスイッチ1bは端子a側に
切り換わり、部分画像データA2の開始からスイッチ1
bを介して転送バッファ1eに転送される。このように
して、部分画像データA1の終わり部分と次の部分画像
データA2の始め部分とで同じ内容のデータが含まれる
ものとなり、これら部分画像データA1,A2が一部で重
なりを持つことになる。The memory 1a is used to hold the overlapping portion when it is necessary to make the partial image data overlap each other. Now, in FIG. 2, when an overlapping portion is provided between the partial images A 1 and A 2 , the input image data D for the partial image data A 1 is transferred to the transfer buffer via the switch 1 b which is closed to the terminal a. 1
e, the input image data D is stored in the memory 1a.
Is also supplied. All data of the partial image data A 1 is stored in the transfer buffer 1e, it is initiated input bus 2 partial image data A 1 to transfer therefrom, the memory 1a, the required data in the partial image data A 1 Is held. Then, although the input image data D for the next partial image data A 2 is initiated input, it switches the switch 1b is on the terminal b at the timing prior to this,
Necessary data is read from the memory 1a, and the switch 1
b, the data is transferred to the transfer buffer 1e. Switch 1b is switched to the terminal a side together with the read completion of the necessary data, the switch 1 from the start of the partial image data A 2
b, the data is transferred to the transfer buffer 1e. In this way, it is intended to contain the same contents of data between the start portion partial image data A 1 end portion and the next partial image data A 2, these partial image data A 1, A 2 overlaps a portion Will have.
【0032】また、メモリ1aを大容量にすれば、検出
のタイミングに長時間の間隔がある複数の画像データを
同一の部分画像データに含めることも可能となる。Further, if the memory 1a has a large capacity, it is possible to include a plurality of image data having a long time interval in the detection timing in the same partial image data.
【0033】図5は図1におけるPE6の一具体例を示
すブロック図であって、13はデータ取込制御部、14
はスイッチ回路、15は状態レジスタであり、図1に対
応する部分には同一符号を付けて重複する説明を省略す
る。FIG. 5 is a block diagram showing a specific example of the PE 6 shown in FIG.
Is a switch circuit, and 15 is a status register. The parts corresponding to those in FIG.
【0034】同図において、データ取込部13,スイッ
チ回路14及び状態レジスタ15が図1での入力I/F
11に対応するものであり、その他の部分は図1での夫
々の部分に対応する。また、ここでは、他のPEからデ
ータ入力許可受信部10で受信するデータ入力許可信号
をC1とし、データ入力許可送信部から他のPEに送信
するデータ入力許可信号をC2としている。In FIG. 3, the data fetch unit 13, the switch circuit 14, and the status register 15 correspond to the input I / F in FIG.
11 and the other portions correspond to the respective portions in FIG. Here, the data input permission signal received by the data input permission receiving unit 10 from another PE is C1 and the data input permission signal transmitted from the data input permission transmitting unit to the other PE is C2.
【0035】データ取込制御部13は、制御バス4(図
1)からのデータ転送情報Bやデータ入力許可受信部1
0で受信されるデータ入力許可信号C1,状態レジスタ
15の出力情報に応じて、入力バス2(図1)からの部
分画像データAの取込みを制御するものである。スイッ
チ回路14は入力バス2とローカルメモリ8との間に接
続されており、データ取込制御部13によってオン,オ
フ制御される。状態レジスタ15はこれを内蔵したPE
6の動作状態を示す情報を記憶する。ここで、PEの動
作状態とは、大別して、「(1)データ入力待ち状態」
と「(2)データ処理状態」との2つの状態であるとす
る。この「データ処理状態」には、演算結果の出力処理
状態も含まれている。The data fetch control unit 13 includes the data transfer information B from the control bus 4 (FIG. 1) and the data input permission receiving unit 1.
In response to the data input permission signal C1 received at 0 and the output information of the status register 15, the control of the capture of the partial image data A from the input bus 2 (FIG. 1) is controlled. The switch circuit 14 is connected between the input bus 2 and the local memory 8, and is controlled on and off by the data acquisition control unit 13. The status register 15 is a PE
6 is stored. Here, the operation state of the PE is roughly classified into “(1) data input wait state”.
And "(2) data processing state". The “data processing state” includes the output processing state of the calculation result.
【0036】ここで、図示しない他のPEから通知され
るデータ入力許可信号C1は、そのレベルが“H”であ
るとき、このデータ入力許可信号C1を受信する図示の
PE(以下、他のPEに対し、「自PE」という)6が
部分画像データAの取込みを許可されていることを示
し、そのレベルが“L”(ローレベル)であるときに
は、部分画像データAの取込みが許可されていないこと
を示すものとする。Here, when the level of the data input permission signal C1 notified from another PE (not shown) is "H", the PE shown in the figure receiving the data input permission signal C1 (hereinafter referred to as another PE). 6 indicates that the capture of the partial image data A is permitted. When the level is “L” (low level), the capture of the partial image data A is permitted. Shall be shown.
【0037】自PE6においては、データ取込制御部1
3は、受信したデータ入力許可信号C1,データ転送情
報B及び状態レジスタ15の情報内容から自PE6が部
分画像データAを取り込むべきと判断した場合にのみ、
部分画像データAを取り込むための制御動作を行なう。In the own PE 6, the data acquisition control unit 1
3 is only when the own PE 6 determines from the received data input permission signal C1, the data transfer information B and the information content of the status register 15 that the partial image data A should be fetched,
A control operation for capturing the partial image data A is performed.
【0038】具体的には、他のPEからのデータ入力許
可信号C1が“H”でデータ取込みの許可を表わしてお
り、かつ状態レジスタ15の情報内容から自PE6の状
態が上記「(1)データ入力待ち状態」であると認識さ
れ、かつデータ転送情報Bが“L”から“H”に変化し
たとき、データ取込制御部13がスイッチ回路14をオ
ンとする。これにより、プロセッサ7の制御のもとに、
入力バス2からスイッチ回路14を介して部分画像デー
タAがローカルメモリ8に書き込まれる。そして、1部
分画像データ分のデータがローカルメモリ8に格納さ
れ、データ転送情報Bが“H”から“L”に変化する
と、データ取込制御部13がスイッチ回路14をオフに
してデータの取込みを終了し、しかる後、プロセッサ7
がローカルメモリ8から部分画像データAを取り込んで
その演算処理を開始する。そして、この演算処理が終了
すると、その処理結果を出力I/F12と介して出力バ
ス3(図1)に転送する。More specifically, the data input permission signal C1 from another PE indicates "H" to indicate that the data fetch is permitted, and the information of the status register 15 indicates that the state of the own PE 6 is "(1)". When it is recognized as “data input waiting state” and the data transfer information B changes from “L” to “H”, the data capture control unit 13 turns on the switch circuit 14. Thereby, under the control of the processor 7,
The partial image data A is written from the input bus 2 to the local memory 8 via the switch circuit 14. Then, the data for one partial image data is stored in the local memory 8, and when the data transfer information B changes from "H" to "L", the data capture control unit 13 turns off the switch circuit 14 to capture the data. And after that, the processor 7
Fetches the partial image data A from the local memory 8 and starts its arithmetic processing. Then, when this arithmetic processing is completed, the processing result is transferred to the output bus 3 (FIG. 1) via the output I / F 12.
【0039】また、データ取込制御部13はデータ入力
許可送信部9を制御し、状態レジスタ15の情報内容に
応じたデータ入力許可信号C2を図示しない他のPEに
送信させる。ここで、(1)自PE6がデータ入力待ち
状態及びデータ取込み状態にあるときには、データ入力
許可信号C2を“L”にし、他のPEにデータ取込みを
許可しない旨を伝える。また、(2)自PE6がデータ
取込みを終了した時点でデータ入力許可信号C2を
“H”にする。さらに、上記(1)(2)以外の場合に
は、データ入力許可受信部10で受信した他のPEから
のデータ入力許可信号C1をそのままデータ入力許可信
号C2としてデータ入力許可送信部9から送信する。The data acquisition control section 13 controls the data input permission transmission section 9 to transmit a data input permission signal C2 corresponding to the information content of the status register 15 to another PE (not shown). Here, (1) when the own PE 6 is in the data input waiting state and the data fetch state, the data input permission signal C2 is set to "L", and the other PEs are informed that the data fetch is not permitted. (2) The data input permission signal C2 is set to "H" when the own PE 6 completes the data fetch. Further, in cases other than the above (1) and (2), the data input permission transmitting section 9 transmits the data input permission signal C1 from another PE received by the data input permission receiving section 10 as it is as a data input permission signal C2. I do.
【0040】図6は図5に示した自PE6の以上の動作
を示すタイミングチャートである。FIG. 6 is a timing chart showing the above operation of the own PE 6 shown in FIG.
【0041】同図において、時刻T1では、自PE6
は、データ処理中であって、データ入力待ち状態でな
く、また、データ入力許可受信部10で受信するデータ
入力許可信号C1が“L”であるから、データの取込条
件を満足しておらず、時刻T1〜T2の期間で入力バス
2を転送される部分画像データA1を取り込むことはな
い。この部分画像データA1は、他のPEによって取り
込まれる。In the figure, at time T1, the own PE 6
Is not in the data input waiting state, and the data input permission signal C1 received by the data input permission receiving unit 10 is "L". It not, is not to capture partial image data a 1 that is transferred to input bus 2 during a period of time T1 to T2. The partial image data A 1 is taken up by another PE.
【0042】その後、時刻T2になるまでの時刻T6で
データ処理を終了してデータ入力待ち状態となり(この
とき、データ入力許可送信部9から送信するデータ入力
許可信号C2は“L”となる)、他のPEでの部分画像
データA1の取込みも完了してデータ入力許可信号C1
が“H”となるが、データ転送情報Bが“L”であるか
ら、自PE6はデータ取込状態とならない。しかし、こ
のときには、自PE6はデータ入力待ち状態にあって、
受信されるデータ入力許可信号C1が“H”であるか
ら、時刻T3で次の部分画像データA2が入力バス2を
介して転送され、これとともに、データ転送情報Bが
“H”となると、自PE6はこの部分画像データA2を
取り込む。そして、時刻T4でこの部分画像データA2
の取込みが完了すると、自PE6はこの部分画像データ
A2の処理を開始するとともに、送信するデータ入力許
可信号C2を“H”にし、次の部分画像データA3の自
PE6での取込みを禁止するとともに、他のPEでの取
込みを可能とする。Thereafter, at time T6 until time T2, the data processing is completed and a data input wait state is established (at this time, the data input permission signal C2 transmitted from the data input permission transmission section 9 becomes "L"). , The capture of the partial image data A 1 by the other PEs is also completed, and the data input permission signal C 1
Becomes “H”, but since the data transfer information B is “L”, the own PE 6 does not enter the data capturing state. However, at this time, the own PE 6 is in a data input waiting state,
Since the data input enable signal C1 is received is "H", at time T3 the next partial image data A 2 is transferred via the input bus 2, the same time, the data transfer information B becomes "H", self PE6 captures the partial image data a 2. Then, at time T4, the partial image data A 2
When the uptake is complete, the self PE6 is starts the processing of the partial image data A 2, the data input enable signal C2 is sent to "H", the prohibit incorporation of the self PE6 of the next partial image data A 3 At the same time, it is possible to take in other PEs.
【0043】このように、他のPEから与えられるデー
タ入力許可信号C1と自PE6の状態とデータ転送情報
Bとを用いることにより、データ取込みの制御を行な
い、かつ他のPEに対してデータ取込みの許可を通知す
ることにより、各PEが自律的にデータ入力及び処理を
行なう。As described above, by using the data input permission signal C1 given from another PE, the state of the own PE 6, and the data transfer information B, the control of the data acquisition is performed, and the data acquisition to the other PEs is performed. , Each PE autonomously performs data input and processing.
【0044】次に、図1に示すように、各PE6が送信
するデータ入力許可信号Cを他の1つのPE6のデータ
入力許可受信部10に送信するように構成することによ
り、一次元配列状に順次PE6を接続した場合の動作に
ついて説明する。Next, as shown in FIG. 1, the data input permission signal C transmitted by each PE 6 is transmitted to the data input permission receiving section 10 of another PE 6 to form a one-dimensional array. The operation in the case where the PEs 6 are connected in sequence will be described.
【0045】図1において、自PE6に対し、データ入
力許可信号Cを与える他のPE6を上流側のPE6とい
い、自PE6が入力許可信号を与える他のPE6を下流
側のPE6ということにする。例えば、図1に示す構成
において、自PE6bに対して、PE6aは上流側のP
Eであり、また、PE6cは下流側のPEである。In FIG. 1, the other PE 6 that provides the data input permission signal C to the own PE 6 is referred to as an upstream PE 6, and the other PE 6 to which the own PE 6 provides the input permission signal is referred to as a downstream PE 6. . For example, in the configuration shown in FIG. 1, the PE 6a is connected to the upstream P
E, and PE6c is a downstream PE.
【0046】また、最上流のPE6においては、データ
入力許可受信部10で受信するデータ入力許可信号Cは
常に“H”であり、また、データ入力待ち状態にあるP
E6が複数個同時に存在する場合には、上流側のPE6
が必ず下流側のPE6よりも優先的にデータ取込みを行
なうものとする。つまり、各PE6は、自PE6がデー
タ入力可能な状態であり、かつそれよりも上流側のPE
6がデータを取り込まなかった場合には、データの取込
みが可能になるものとする。In the most upstream PE 6, the data input permission signal C received by the data input permission receiving section 10 is always “H”, and the P 6 in the data input waiting state.
When a plurality of E6s exist simultaneously, the upstream PE6
Should always take priority over the downstream PE6. In other words, each PE 6 is in a state where the own PE 6 can input data, and the PEs on the upstream side thereof
If No. 6 does not take in data, it becomes possible to take in data.
【0047】図7は、一例として、図1に示す順次一次
元配列状に接続された3個のPE6a,6b,6cでの
データ取込み,処理順序を示すタイミングチャートであ
る。FIG. 7 is a timing chart showing, as an example, the data fetching and processing order in the three PEs 6a, 6b, 6c connected in a one-dimensional array in the order shown in FIG.
【0048】図1から明らかなように、PE6aが最上
流のPEであって優先順位が1番であり、PE6cは最
下流のPEであって優先順位が最下位である。PE6b
は中間の優勢順位を有している。As is clear from FIG. 1, the PE 6a is the most upstream PE and has the highest priority, and the PE 6c is the most downstream PE and has the lowest priority. PE6b
Has an intermediate dominance.
【0049】そこで、図7において、いま、PE6a〜
6cが全てデータ入力待ち状態にあり、部分画像データ
A1が入力バス2を転送されてきたとすると、この部分
画像データA1は最も優先順位が高いPE6aに取り込
まれ、演算処理がなされる。このPE6aでのデータ処
理中、次の部分画像データA2が転送されてくると、こ
のときにデータ入力待ち状態にあるPE6b,6cのう
ち、優先順位が高い方のPE6bがこの部分画像データ
A2を取り込み、演算処理を行なう。そして、これらP
E6a,6bでのデータ処理中、さらに、次の部分画像
データA3が転送されてくると、残ったPE6cがこの
部分画像データA3を取り込んで演算処理を行なう。こ
のようにして、優先順位が高い順に、各PE6a〜6c
が部分画像データAを取り込んで演算処理する。Therefore, in FIG.
6c is in all data input standby state, when the partial image data A 1 has been transferred to input bus 2, the partial image data A 1 is received by the highest priority PE6a, arithmetic processing is performed. During data processing in this PE6a, the next partial image data A 2 is transferred, PE6b in the data input wait state in this case, among 6c, priority higher PE6b this partial image data A 2 is fetched and arithmetic processing is performed. And these P
E6a, during data processing in 6b, furthermore, when the next partial image data A 3 coming transferred, remaining PE6c performs arithmetic processing captures the partial image data A 3. In this way, each of the PEs 6a to 6c is arranged in descending order of priority.
Fetches the partial image data A and performs arithmetic processing.
【0050】その後、PE6bでデータの演算処理及び
その処理結果の出力が終了すると、PE6bはデータ入
力待ち状態になるが、かかる状態で次の部分画像データ
A4が転送されてくると、データ入力待ち状態にあるP
EはPE6bのみであるから、このPE6bでこの部分
画像データA4が取り込まれ、演算処理される。次に、
PE6a,6cでデータの演算処理及び処理結果の出力
が終了すると、これらはデータ入力待ち状態となるが、
かかる状態でさらに次の部分画像データA5が転送され
てくると、優先順位が高い方のPE6aがこの部分画像
データA5を取り込み、演算処理する。[0050] Then, the calculation processing and output of the processing result of the data is completed PE6b and PE6b is made to the data input wait state, the next partial image data A 4 in this state is transferred, the data input P in waiting state
Since E is only PE6b, the partial image data A 4 is taken in this PE6b, it is processing. next,
When the data processing and the output of the processing result are completed in the PEs 6a and 6c, they enter a data input waiting state.
Further the next partial image data A 5 in such a state comes transferred, PE6a the higher priority captures the partial image data A 5, arithmetic processing.
【0051】各PE6が処理するデータが画像データで
ある場合には、各PE6の処理プログラムが同一で、か
つ各PE6で処理する部分画像データAのサイズが等し
い場合であっても、各部分画像データAの情報内容に依
存して各PE6での処理時間が異なる場合が生じる。そ
のため、図7に示すように、処理が終了したPE6で優
先的に次に処理すべき部分画像データAを取り込むよう
にすることにより、PE6の稼働率を効果的に高めるこ
とができる。When the data processed by each PE 6 is image data, even if the processing program of each PE 6 is the same and the size of the partial image data A processed by each PE 6 is the same, Depending on the information content of the data A, the processing time in each PE 6 may be different. Therefore, as shown in FIG. 7, by taking the partial image data A to be processed next preferentially in the PE 6 that has completed the processing, the operation rate of the PE 6 can be effectively increased.
【0052】なお、この場合、各PE6はデータの演算
処理が終了した順にその演算結果を出力しているため、
データ出力部5に転送される部分画像データは、必ずし
もデータ入力部1からの部分画像データの転送順もしく
は入力画像データDでのデータ入力順とはならない。そ
のため、各PE6は、その演算結果のデータをデータ出
力部5に転送する際に、その演算結果のデータを処理し
たPE6を示すデータなど、後処理で演算結果のデータ
をデータ転送順もしくはデータ入力順に並び替えるのに
必要な情報を、演算結果のデータに付加してデータ出力
部5に転送することとする。In this case, since each PE 6 outputs the calculation result in the order in which the data processing has been completed,
The partial image data transferred to the data output unit 5 is not always in the transfer order of the partial image data from the data input unit 1 or the data input order of the input image data D. Therefore, when transferring the data of the operation result to the data output unit 5, each PE 6 transfers the data of the operation result in the post-processing such as the data indicating the PE 6 that has processed the data of the operation result or the data input order. Information necessary for rearranging in order is added to the data of the operation result and transferred to the data output unit 5.
【0053】以上説明した実施形態について、装置全体
で見た場合、従来技術にあるような全てのPEの動作状
態を一括管理するような管理部を設けることなく、デー
タ入力待ち状態にあるPEに対し、次に処理するべきデ
ータを効率良く分配することができ、プロセッサの処理
効率を高めることができる。In the above-described embodiment, when viewed from the overall apparatus, a PE which is in a data input waiting state is provided without a management unit which collectively manages the operation states of all the PEs as in the related art. On the other hand, data to be processed next can be efficiently distributed, and the processing efficiency of the processor can be increased.
【0054】図8は本発明による並列処理装置を用いた
半導体ウェハの外観検査装置の一実施形態を示す構成図
であって、16はステージ、17は半導体ウェハ、18
はレンズ、19はリニアセンサ、20は本発明による並
列処理装置である。FIG. 8 is a block diagram showing an embodiment of a semiconductor wafer appearance inspection apparatus using a parallel processing apparatus according to the present invention, wherein 16 is a stage, 17 is a semiconductor wafer, 18
Denotes a lens, 19 denotes a linear sensor, and 20 denotes a parallel processing device according to the present invention.
【0055】この実施形態は、半導体ウエハの外観を検
査するものであって、図8において、検査対象となる半
導体ウエハ17がステージ16上に搭載されている。こ
のステージ16はx,y方向に駆動可能になっている。
半導体ウエハ17の処理部位はレンズ18を介してリニ
アセンサ19に結像され、リニアセンサ19からこの部
位の画像が画像データDとして出力されて、例えば、図
1で示した並列処理装置20に転送される。この並列処
理装置20は、上記のように、PE6を複数有してお
り、画像データDの効果的な並列処理が行なえるように
なっている。In this embodiment, the appearance of a semiconductor wafer is inspected. In FIG. 8, a semiconductor wafer 17 to be inspected is mounted on a stage 16. The stage 16 can be driven in the x and y directions.
The processed part of the semiconductor wafer 17 is imaged on the linear sensor 19 via the lens 18, and an image of this part is output from the linear sensor 19 as image data D and transferred to, for example, the parallel processing device 20 shown in FIG. Is done. As described above, the parallel processing device 20 has a plurality of PEs 6 so that effective parallel processing of the image data D can be performed.
【0056】一般に、半導体ウェハの外観検査では、リ
ニアセンサ20より検出される画像データDは膨大なデ
ータ量であり、また、センサの検出速度も向上してお
り、並列処理装置20としては、高速で高い演算性能が
要求される。また、半導体ウェハ17の外観を検出して
得られる画像には、その検出部位による画像のコントラ
ストの違いなどがあるため、検出部位の異なる複数の画
像で処理に必要となる演算時間を比較した場合、そのデ
ータサイズが同一であっても、その処理時間に違いが生
ずることが考えられる。このように、搭載したPE毎で
演算処理時間に差があるような場合でも、効率良くPE
を使用して高い性能を発揮することが外観検査装置で要
求されるが、本発明による並列処理装置を用いることに
より、効率良くPEを稼働させ、かつ必要最小限のPE
で処理を行なうことにより、高い処理性能の低価格な検
査装置を実現することができる。In general, in the appearance inspection of a semiconductor wafer, the amount of image data D detected by the linear sensor 20 is enormous, and the detection speed of the sensor is also improved. Requires high computing performance. In addition, since the image obtained by detecting the appearance of the semiconductor wafer 17 has a difference in image contrast depending on the detection site, the calculation time required for processing is compared for a plurality of images having different detection sites. However, even if the data size is the same, the processing time may be different. Thus, even when there is a difference in the processing time between the mounted PEs, the PEs can be efficiently processed.
The appearance inspection apparatus is required to exhibit high performance by using the PE, but by using the parallel processing apparatus according to the present invention, the PE can be operated efficiently and the necessary minimum PE can be used.
, A low-cost inspection apparatus with high processing performance can be realized.
【0057】ところで、図3に示したデータ入力部1
は、部分画像データAのサイズを分割情報記憶部1cに
格納された情報によって決めるものであったが、例え
ば、図8に示したような半導体ウエハの外観検査装置に
おいては、検査対象となる半導体ウェハのサイズや形
状,表面のパターンなどの幾何学的特徴、あるいは処理
の内容に応じて、部分画像データのサイズを異ならせる
ことが必要な場合がある。このような場合、図3におけ
る分割情報記憶部1cの情報内容を作業者がいちいち変
更するのは手間がかかることになる。The data input unit 1 shown in FIG.
Determines the size of the partial image data A based on the information stored in the division information storage unit 1c. For example, in a semiconductor wafer appearance inspection apparatus as shown in FIG. In some cases, it is necessary to vary the size of the partial image data according to the geometrical characteristics such as the size and shape of the wafer and the pattern of the surface, or the contents of the processing. In such a case, it takes time and effort for the operator to change the information content of the divided information storage unit 1c in FIG.
【0058】図9はかかる問題を解消した図1における
データ入力部1の他の実施形態を示すブロック図であっ
て、1fはデータ分割決定部であり、図3に対応する部
分には同一符号を付けて重複する説明を省略する。FIG. 9 is a block diagram showing another embodiment of the data input unit 1 in FIG. 1 in which such a problem has been solved. In FIG. 9, 1f denotes a data division determining unit, and parts corresponding to those in FIG. And duplicate explanations are omitted.
【0059】同図において、部分画像データのサイズを
決定するデータ分割決定部1fが設けられており、検査
対象である半導体ウェハのサイズや形状,表面のパター
ンなどの幾何学的特徴、あるいは処理の内容などの検査
条件を表わす情報Eが入力されると、データ分割決定部
1fがこの検査条件に適合した部分画像データのサイズ
を決める入力画像データDの分割情報を自動的に決定
し、この決定された分割情報を分割情報記憶部1cに格
納する。In the figure, a data division determining unit 1f for determining the size of partial image data is provided, and geometrical characteristics such as the size and shape of a semiconductor wafer to be inspected and the pattern of the surface, or processing. When information E indicating inspection conditions such as contents is input, the data division determining unit 1f automatically determines the division information of the input image data D that determines the size of the partial image data conforming to the inspection conditions. The divided information thus stored is stored in the divided information storage unit 1c.
【0060】そこで、データ入力部1では、この分割情
報記憶部1cに新たに格納された分割情報に基づいて分
割制御部1dが上記のように動作し、このときの検査対
象に適合したサイズの分割画像データAが得られること
になり、PEの稼働率を向上させることも可能となる。Therefore, in the data input section 1, the division control section 1d operates as described above based on the division information newly stored in the division information storage section 1c, and the division control section 1d has a size suitable for the inspection object at this time. Since the divided image data A is obtained, the operation rate of the PE can be improved.
【0061】なお、ここでは、検査対象を半導体ウエハ
としたが、特にこれのみに限るものではなく、プリント
配線基板などの他の検査対象であっても、上記と同様の
効果が得られる。Although the inspection object is a semiconductor wafer here, the invention is not particularly limited to this, and other inspection objects such as a printed wiring board can obtain the same effects as described above.
【0062】また、図1に示した並列処理装置は、PE
6夫々が別体のものとしたが、図10に示すように、搭
載する複数のPE6や入力バス2,出力バス3などを一
体の集積回路21とすることもできる。このように集積
回路化することにより、各PE6の動作を高速化できる
上、各PE6間のデータ入力許可信号Cの通信も高速化
し、データ処理のより高速化を図ることができる。The parallel processing device shown in FIG.
Although each of the six is separate, as shown in FIG. 10, a plurality of PEs 6 to be mounted, the input bus 2, the output bus 3, and the like may be formed as an integrated circuit 21. By thus forming an integrated circuit, the operation of each of the PEs 6 can be speeded up, and the speed of communication of the data input permission signal C between the PEs 6 can be increased, so that the speed of data processing can be further increased.
【0063】なお、図10では、入力バス2とPE6と
出力バス3とを1つの集積回路21に集積しているが、
その他、データ入力部1やデータ出力部5も同一の集積
回路に集積することも可能である。このように、複数の
PEを集積した集積回路を用いることにより、演算量が
大きくて多くのPEが必要となるアプリケーションに対
しても、並列処理装置全体をコンパクトに実現すること
ができる。In FIG. 10, the input bus 2, the PE 6, and the output bus 3 are integrated in one integrated circuit 21,
In addition, the data input unit 1 and the data output unit 5 can be integrated on the same integrated circuit. As described above, by using an integrated circuit in which a plurality of PEs are integrated, the entire parallel processing apparatus can be compactly realized even for an application requiring a large amount of calculation and requiring many PEs.
【0064】[0064]
【発明の効果】以上説明したように、本発明によれば、
複数のプロセッサを有効に活用することができて、大容
量のデータを高速に処理することが可能な価格性能比が
優れた並列処理装置とそれを用いた外観検査装置を提供
することができる。As described above, according to the present invention,
It is possible to provide a parallel processing device capable of effectively utilizing a plurality of processors and capable of processing a large amount of data at high speed and having an excellent price / performance ratio, and a visual inspection device using the same.
【図1】本発明による並列処理方法及び装置の一実施形
態を示すブロック図である。FIG. 1 is a block diagram showing an embodiment of a parallel processing method and apparatus according to the present invention.
【図2】図1に示す実施形態での入力データと部分デー
タとを示す図である。FIG. 2 is a diagram showing input data and partial data in the embodiment shown in FIG.
【図3】図1におけるデータ入力部の一具体例を示すブ
ロック図である。FIG. 3 is a block diagram showing a specific example of a data input unit in FIG.
【図4】図3に示すデータ入力部で生成される部分デー
タとデータ転送情報とを示すタイミングチャートであ
る。FIG. 4 is a timing chart showing partial data and data transfer information generated by a data input unit shown in FIG. 3;
【図5】図1におけるプロセッサエレメントの一具体例
を示すブロック図である。FIG. 5 is a block diagram showing a specific example of a processor element in FIG. 1;
【図6】図5に示したプロセッサエレメントの動作を示
すタイミングチャートである。FIG. 6 is a timing chart showing an operation of the processor element shown in FIG.
【図7】図1に示す実施形態の動作を示すタイミングチ
ャートである。FIG. 7 is a timing chart showing the operation of the embodiment shown in FIG. 1;
【図8】本発明による並列処理方法及び装置を用いた半
導体ウェハの外観検査装置の一実施形態を示すブロック
図である。FIG. 8 is a block diagram showing an embodiment of a semiconductor wafer appearance inspection apparatus using the parallel processing method and apparatus according to the present invention.
【図9】図1におけるデータ入力部の他の具体例を示す
ブロック図である。FIG. 9 is a block diagram showing another specific example of the data input unit in FIG. 1;
【図10】図1に示した実施形態を集積回路化して示す
図である。FIG. 10 is a diagram showing the embodiment shown in FIG. 1 as an integrated circuit;
【図11】従来の並列処理装置の一例を示すブロック図
である。FIG. 11 is a block diagram illustrating an example of a conventional parallel processing device.
1 データ入力部 1a メモリ 1b スイッチ回路 1c 分割情報記憶部 1d 分割制御部 1e 転送バッファ 1f データ分割決定部 2 入力バス 3 出力バス 4 制御バス 5 データ出力部 6a,6b,6c プロセッサエレメント(PE) 7 プロセッサ 8 ローカルメモリ 9 データ入力許可送信部 10 データ入力許可受信部 11 入力I/F 12 出力I/F部 13 データ取り込み制御部 14 スイッチ回路 15 状態レジスタ 16 ステージ 17 半導体ウェハ 18 レンズ 19 リニアセンサ 20 並列処理装置 21 集積回路 Reference Signs List 1 data input unit 1a memory 1b switch circuit 1c division information storage unit 1d division control unit 1e transfer buffer 1f data division determination unit 2 input bus 3 output bus 4 control bus 5 data output unit 6a, 6b, 6c processor element (PE) 7 Processor 8 Local memory 9 Data input permission transmission section 10 Data input permission reception section 11 Input I / F 12 Output I / F section 13 Data capture control section 14 Switch circuit 15 State register 16 Stage 17 Semiconductor wafer 18 Lens 19 Linear sensor 20 Parallel Processing unit 21 Integrated circuit
───────────────────────────────────────────────────── フロントページの続き (72)発明者 川口 広志 神奈川県横浜市戸塚区吉田町292番地 株 式会社日立製作所生産技術研究所内 Fターム(参考) 5B045 AA01 BB12 EE12 GG02 ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Hiroshi Kawaguchi 292 Yoshida-cho, Totsuka-ku, Yokohama-shi, Kanagawa Prefecture F-term in Hitachi, Ltd. Production Engineering Research Laboratories F-term (reference) 5B045 AA01 BB12 EE12 GG02
Claims (15)
力データを夫々のプロセッサエレメントに割り当てて処
理するようにした並列処理方法において、 夫々の該プロセッサエレメントに優先順位を割り当て
て、 該プロセッサエレメントは夫々、自己の状態と自己より
も優先順位が上位のプロセッサエレメントの状態とに応
じて、該入力データを取り込んで処理することが許可さ
れるようにしたことを特徴とする並列処理方法。1. A parallel processing method in which a plurality of processor elements are used to assign input data to respective processor elements for processing, wherein a priority is assigned to each of the processor elements, and the processor elements each include: A parallel processing method wherein the input data is permitted to be fetched and processed according to its own state and the state of a processor element having a higher priority than itself.
力データを夫々のプロセッサエレメントに割り当てて処
理するようにした並列処理方法において、 夫々の該プロセッサエレメントに優先順位を割り当て
て、優先順位が上位のプロセッサエレメントの方から優
先順位が下位のプロセッサエレメントの方に順に自己の
状態を表わす情報を送信し、 優先順位が上位のプロセッサエレメントから該情報を受
信したプロセッサエレメントは、データ入力待ち状態に
あって、かつ該優先順位が上位のプロセッサエレメント
がデータ入力待ち状態,データ取込み状態のいずれの状
態にないことを該情報が表わすとき、該入力データを取
り込んで処理することが許可されることを特徴とする並
列処理方法。2. A parallel processing method in which a plurality of processor elements are used to allocate input data to respective processor elements for processing, wherein a priority is assigned to each of the processor elements, and a processor having a higher priority is assigned. The information indicating its own state is transmitted in order from the element toward the processor element with the lower priority, and the processor element receiving the information from the processor element with the higher priority is in a data input waiting state, When the information indicates that the processor element having the higher priority is not in the data input waiting state or the data fetch state, the input data is fetched and processed. Parallel processing method.
理に必要なサイズの部分データに区分し、 データの取込みが許可された前記プロセッサエレメント
は、該部分データの転送期間を検出して該部分データの
取込みを開始することを特徴とする並列処理方法。3. The processor element according to claim 1, wherein the input data is divided into partial data having a size required for one processing of the processor element, and the processor element permitted to take in the data is the partial data. A parallel processing method characterized by detecting a transfer period of the data and starting to fetch the partial data.
特徴とする並列処理方法。4. The parallel processing method according to claim 3, wherein the size of the partial data can be set arbitrarily.
表わすデータ転送情報が転送され、 データの取込みが許可された前記プロセッサエレメント
は、該データ転送情報から前記部分データの転送期間を
検出することを特徴とする並列処理方法。5. The processor element according to claim 3, wherein data transfer information indicating a transfer period of the partial data is transferred together with the partial data, and the processor element permitted to take in the data transfers the data transfer information from the data transfer information. A parallel processing method comprising detecting a transfer period of partial data.
データであることを特徴とする並列処理方法。6. The parallel processing method according to claim 1, wherein the input data is image data detected by an image detection device.
送されるデータを、該データバスに接続された複数のプ
ロセッサエレメントに割り当てて処理するようにした並
列処理装置において、 該プロセッサエレメントは夫々、 他のプロセッサエレメントから送信されるデータ入力許
可信号を受信する第1の受信部と、 他のプロセッサエレメントに自己の状態を表わすデータ
入力許可信号を送信する送信部と、 該データ入力部から送信される該データの転送期間を表
わすデータ転送情報を受信する第2の受信部と、 該第1の受信部で受信した該データ入力許可信号が表わ
す該他のプロセッサエレメントの状態と該第2の受信部
で受信した該データ転送情報と自己の状態とを基に、該
データバスを介して転送される該データの取込み,処理
が許可されているか否かの判定手段とを備え、該判定手
段の判定結果に基づいて、該データバスを介して転送さ
れる該データを取り込み、処理することを特徴とする並
列処理装置。7. A parallel processing device wherein data transferred from a data input unit via a data bus is allocated to a plurality of processor elements connected to the data bus and processed, wherein each of the processor elements comprises: A first receiving unit that receives a data input permission signal transmitted from another processor element; a transmitting unit that transmits a data input permission signal indicating its own state to another processor element; A second receiving unit that receives data transfer information indicating a transfer period of the data, a state of the other processor element indicated by the data input permission signal received by the first receiving unit, and the second reception Based on the data transfer information received by the unit and its own status, the data transfer and data transfer via the data bus is allowed to be fetched and processed. And a determining whether or not measures are, the based on the judgment result judging unit captures the data transferred via the data bus, a parallel processing apparatus characterized by processing.
送されるデータを、該データバスに接続された複数のプ
ロセッサエレメントに割り当てて処理するようにした並
列処理装置において、 該プロセッサエレメントは夫々優先順位が割り当てられ
ており、 該プロセッサエレメントは夫々、 優先順位が上位の該プロセッサエレメントから送信され
る該データの取込みを行わなかったことを示すデータ入
力許可信号を受信する第1の受信部と、 優先順位が下位の該プロセッサエレメントに自己の状態
を表わすデータ入力許可信号を送信する送信部と、 該データ入力部より送信される該データの転送期間を表
わすデータ転送情報を受信する第2の受信部と、 自己の状態を記憶する状態記憶部と、 該第1の受信部で受信した該データ入力許可信号が該デ
ータの取込みを行なう状態にないことを表わし、かつ自
己がデータ入力待ち状態であるとき、該データの取込
み,処理が許可されたと判定し、該データ転送情報に基
づいて該データの取込みを行なう手段とを備えたことを
特徴とする並列処理装置。8. A parallel processing apparatus wherein data transferred from a data input unit via a data bus is assigned to a plurality of processor elements connected to the data bus and processed, wherein each of the processor elements has a priority. A first receiving unit that receives a data input permission signal indicating that the processor element has not taken in the data transmitted from the processor element having a higher priority; A transmission unit for transmitting a data input permission signal indicating its own state to the processor element having a lower priority, and a second reception for receiving data transfer information indicating a transfer period of the data transmitted from the data input unit Unit, a state storage unit for storing its own state, and the data input permission signal received by the first receiving unit Indicates that the data is not ready to be fetched, and when it is in a data input wait state, it is determined that the data fetch and processing are permitted, and the data is fetched based on the data transfer information. And a means for parallel processing.
積されていることを特徴とする並列処理装置。9. The parallel processing device according to claim 7, wherein the plurality of processor elements are integrated in a single integrated circuit.
受信部が自己よりも優先順位が1つ上位の他の前記プロ
セッサエレメントの前記送信部に接続され、自己の前記
送信部が自己よりも優先順位が1つ下位の他の前記プロ
セッサエレメントの前記第1の受信部に接続されている
ことを特徴とする並列処理装置。10. The processor element according to claim 7, 8 or 9, wherein each of the processor elements has its first receiving unit provided to the transmitting unit of another processor element having a priority higher by one than its own. The parallel processing device, wherein the transmission unit is connected to the first reception unit of the other processor element having a priority lower than that of the transmission unit by one.
て、 前記データ入力部は、前記入力データを前記プロセッサ
エレメントの1回の処理に必要なサイズの部分データに
区分し、該部分データの前記データバスへの出力ととも
に、該データの転送期間を表わす前記データ転送情報を
出力することを特徴とする並列処理装置。11. The data input unit according to claim 7, wherein the data input unit divides the input data into partial data having a size necessary for one processing of the processor element. A parallel processing device for outputting the data transfer information indicating a data transfer period together with the output to the data bus.
特徴とする並列処理装置。12. The parallel processing device according to claim 11, wherein the size of the partial data can be set arbitrarily.
て、 前記入力データは画像検出装置によって検出された画像
データであり、 前記データ転送情報は、前記入力データに同期した同期
信号に基づいて生成されることを特徴とする並列処理装
置。13. The input data according to claim 7, wherein the input data is image data detected by an image detection device, and the data transfer information is based on a synchronization signal synchronized with the input data. A parallel processing device characterized by being generated.
と、 該検出手段で得られたデータが前記入力データとして供
給される請求項7〜13のいずれか1つに記載の並列処
理装置とからなり、該検査対象物の形状・大きさ・表面
のパターンなどの外観を検査する外観検査装置。14. A parallel processing device according to claim 7, wherein said detecting means detects an appearance of the inspection object, and data obtained by said detecting means is supplied as said input data. An appearance inspection apparatus for inspecting the appearance of the inspection object, such as the shape, size, and surface pattern.
と、 該検出手段で得られたデータが前記入力データとして供
給される請求項12に記載の並列処理装置とからなり、 該並列処理装置における前記データ入力部に、前記検査
対象物の形状・大きさ・表面のパターンなどの幾何学的
情報や処理の内容などに応じた検査条件をもとに、前記
部分データを前記プロセッサエレメントが1回の処理で
用いるサイズに自動決定するデータサイズ決定部を設け
たことを特徴とする外観検査装置。15. The parallel processing device according to claim 12, comprising: a detection unit for detecting an appearance of the inspection object; and the parallel processing device according to claim 12, wherein data obtained by the detection unit is supplied as the input data. In the data input unit, the partial data is input to the processor element by the processor element 1 based on geometrical information such as the shape, size, and surface pattern of the inspection object, and inspection conditions according to the content of processing. An appearance inspection apparatus, comprising: a data size determination unit that automatically determines a size used in each process.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10212785A JP2000047995A (en) | 1998-07-28 | 1998-07-28 | Parallel processing method and apparatus, and visual inspection apparatus using the same |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10212785A JP2000047995A (en) | 1998-07-28 | 1998-07-28 | Parallel processing method and apparatus, and visual inspection apparatus using the same |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000047995A true JP2000047995A (en) | 2000-02-18 |
Family
ID=16628352
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10212785A Pending JP2000047995A (en) | 1998-07-28 | 1998-07-28 | Parallel processing method and apparatus, and visual inspection apparatus using the same |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2000047995A (en) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001311692A (en) * | 2000-04-28 | 2001-11-09 | Nec Corp | Appearance inspection device and appearance inspection method |
| JP2005134976A (en) * | 2003-10-28 | 2005-05-26 | Hitachi High-Technologies Corp | Image processing device for visual inspection equipment |
| JP2006244070A (en) * | 2005-03-02 | 2006-09-14 | Fujitsu Ten Ltd | Signal processor |
| US9196031B2 (en) | 2012-01-17 | 2015-11-24 | SCREEN Holdings Co., Ltd. | Appearance inspection apparatus and method |
-
1998
- 1998-07-28 JP JP10212785A patent/JP2000047995A/en active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001311692A (en) * | 2000-04-28 | 2001-11-09 | Nec Corp | Appearance inspection device and appearance inspection method |
| JP2005134976A (en) * | 2003-10-28 | 2005-05-26 | Hitachi High-Technologies Corp | Image processing device for visual inspection equipment |
| JP2006244070A (en) * | 2005-03-02 | 2006-09-14 | Fujitsu Ten Ltd | Signal processor |
| US9196031B2 (en) | 2012-01-17 | 2015-11-24 | SCREEN Holdings Co., Ltd. | Appearance inspection apparatus and method |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4038442B2 (en) | Image processing device for visual inspection | |
| US12111778B2 (en) | Image processing accelerator | |
| JP2000514213A (en) | Image acquisition system | |
| JP2003510669A (en) | Modular parallel pipelined vision system for real-time video processing | |
| JP2002328881A (en) | Image processing apparatus, image processing method, and portable video equipment | |
| JP2021536051A (en) | Acceleration control systems, chips and robots based on binarization algorithms | |
| JPH10162130A (en) | Parallel data processing apparatus and method | |
| US20060064517A1 (en) | Event-driven DMA controller | |
| EP1080447B1 (en) | Image processing inspection apparatus | |
| CN108540689B (en) | Image signal processor, application processor and mobile device | |
| US6366686B1 (en) | Video acquisition system including an improved event architecture | |
| CN100363912C (en) | Integrated circuit, image input and output device using same, and method thereof | |
| JP2000047995A (en) | Parallel processing method and apparatus, and visual inspection apparatus using the same | |
| JP3893210B2 (en) | Parallel data processing device and visual inspection device using the same | |
| JPH10198798A (en) | Parallel processing method and apparatus | |
| US20110320677A1 (en) | Data processing apparatus, data processing method, and storage medium | |
| JP4445621B2 (en) | Method and apparatus for accessing shared memory in multiprocessor type processing apparatus | |
| JP2004356673A (en) | Motion vector detection method and image processing apparatus using the same | |
| JP4292218B2 (en) | Image processing apparatus and image processing system | |
| US20030177229A1 (en) | Microcomputer, bus control circuit, and data access method for a microcomputer | |
| JPH10240703A (en) | Parallel data processing apparatus and method, and semiconductor wafer or printed circuit board inspection apparatus and method using the same | |
| JP3959407B2 (en) | Image processing apparatus and image processing system | |
| JPH10154135A (en) | Parallel processing unit | |
| JPH06149759A (en) | Data processing device | |
| KR950008395B1 (en) | Data transferring apparatus between mimd processor and host computer |