RU2066878C1 - Device for multiplication of three matrices and calculation of two-dimensional discrete fourier transform - Google Patents
Device for multiplication of three matrices and calculation of two-dimensional discrete fourier transform Download PDFInfo
- Publication number
- RU2066878C1 RU2066878C1 RU93025195A RU93025195A RU2066878C1 RU 2066878 C1 RU2066878 C1 RU 2066878C1 RU 93025195 A RU93025195 A RU 93025195A RU 93025195 A RU93025195 A RU 93025195A RU 2066878 C1 RU2066878 C1 RU 2066878C1
- Authority
- RU
- Russia
- Prior art keywords
- group
- inputs
- elements
- outputs
- input
- Prior art date
Links
- 238000004364 calculation method Methods 0.000 title description 2
- 238000012545 processing Methods 0.000 claims abstract description 100
- 238000009434 installation Methods 0.000 claims description 24
- 230000000903 blocking effect Effects 0.000 claims description 14
- 238000001069 Raman spectroscopy Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 abstract description 2
- 239000000126 substance Substances 0.000 abstract 1
- 238000012360 testing method Methods 0.000 description 10
- 238000000034 method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 241000238876 Acari Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229910052729 chemical element Inorganic materials 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
Description
Изобретение относится к области вычислительной техники и может быть использовано в специализированных вычислительных системах для перемножения трех матриц и вычисления двумерного ДПФ. The invention relates to the field of computer engineering and can be used in specialized computing systems for multiplying three matrices and computing two-dimensional DFT.
Обычно для обеспечения достоверности получаемых при обработке информации результатов используется тестовый периодический контроль, проводимый с помощью внешних программно-аппаратных средств. При периодическом тестовом контроле вероятность пропуска отказа блока обработки пропорциональна времени между тестовыми проводками (период контроля), при этом объем ошибочной информации, выдача которой происходит между тестовыми проверками, также пропорционален периоду контроля. Временные затраты на тестовую проверку определяются объемом теста, поэтому пропускная способность линейки из блоков обработки известных устройств находится в обратно пропорциональной зависимости от временных затрат на тестовые проверки. Вероятность обнаружения отказа с помощью тестовых проверок определяется разрешающей способностью теста и объемом аппаратуры, охваченной контролем. Время восстановления вычислительного процесса после обнаружения отказа блока обработки (получение достоверного результата на выходе устройства) пропорционально числу P блоков обработки устройства (длине P линейки устройства). Typically, to ensure the reliability of the results obtained during the processing of information, a test periodic control is carried out using external software and hardware. With periodic test control, the probability of skipping a processing unit failure is proportional to the time between test transactions (control period), while the amount of erroneous information that is issued between test tests is also proportional to the control period. The time spent on a test check is determined by the volume of the test, therefore, the throughput of a line of processing units of known devices is inversely proportional to the time spent on test checks. The probability of failure detection using test checks is determined by the resolution of the test and the amount of equipment covered by the control. The recovery time of the computing process after detecting a failure of the processing unit (obtaining a reliable result at the output of the device) is proportional to the number P of processing units of the device (length P of the device bar).
Цель изобретения повышение надежности за счет организации контроля и резервирования и расширение функциональных возможностей за счет решения задач различных размерностей. The purpose of the invention is to increase reliability by organizing control and redundancy and expanding functionality by solving problems of various dimensions.
Поставленная цель достигается тем, что в устройство, содержащее P блоков обработки 11,1P, причем тактовый вход 15 устройства подключен к тактовым выходам блоков обработки с первого по P-й, информационные входы первой и второй групп 9 и 10, первый, второй и третий управляющие входы 11, 12 и 13 устройства подключены соответственно к информационным входам первой и второй групп, к первому, второму и третьему управляющим входам первого блока обработки, выходы первой группы, второй группы, первый, второй и третий выходы i-го блока обработки (i 1,P-1) подключены соответственно к информационным входам первой группы, второй группы, к первому, второму и третьему управляющим входам (i+1)-го блока обработки, введены с (P+1)-го по L-й блоки обработки 1 (L P+R, R число резервных блоков обработки), L комбинационных сумматоров 2, L-1 регистров 3, L узлов сравнения 4, L групп элементов ИЛИ 5, L групп элементов И 7 и элемент ИЛИ-НЕ 8, при этом тактовый вход 16 устройства подключен к тактовым входам блоков обработки 1 с (P+1)-го по L-й и к входам синхронизации регистров 3 с первого по (L-1)-й, выходы первой группы i-го блока обработки 1 подключен соответственно к первым входам элементов И 7 i-й группы, выходы первой группы j-го блока обработки 1 (j P+1,L) подключены соответственно к информационным входам первой группы (j+1)-го блока обработки и соответственно к первым входам элементов И 7 j-й группы, выходы первой группы L-го блока обработки 1 подключены соответственно к первым входам элементов И 7 L-й группы, выходы второй группы, первый, второй и третий выходы К-го блока обработки 1 (К 1, L-1) подключены соответственно к информационным входам второй группы, к первому, второму и третьему управляющим входам (К+1)-го блока обработки 1, четвертый выход Z-го блока обработки 1 (Z 1,L) подключен к информационному входу Z-го комбинационного сумматора 2 и к Z-му выходу группы 21 признака отказа устройства, выходы третьей и четвертой групп К-го блока обработки 1 подключены соответственно к информационным входам группы К-го комбинационного сумматора 2 и к первым входам элементов ИЛИ 5 К-й группы, выходы элементов И 7 групп с первой по L-ю подключены соответственно к входам элементов ИЛИ 6 L-й группы, выходы которых подключены соответственно к выходам 22 результата устройства, управляющие входы первой группы 14 которого подключены соответственно к управляющим входам первой группы первого блока обработки 1, выходы К-го комбинационного сумматора 2 подключены к информационным входам К-го регистра 3 и к входам первой группы К-го узла сравнения 4, выходы L-го комбинационного сумматора 2 подключены к входам первой группы L-го узла сравнения 4, выход Z-го узла сравнения подключен к вторым входам элементов И 7 Z-й группы и к Z-му входу элемента ИЛИ-НЕ 8, выход которого подключен к выходу 23 признака отказа устройства, управляющие входы второй группы 15 которого подключены к входам вторых групп всех узлов управления 4 и к управляющим входам вторых групп всех блоков обработки 1, информационные выходы К-го регистра 3 подключены соответственно к вторым входам элементов ИЛИ 5 К-й группы, выходы которых подключены соответственно к управляющим входам первой группы (К+1)-го блока обработки 1, Z-е входы установки первой, второй и третьей групп 17, 18 и 19 подключены соответственно к первому, второму и третьему входам установки Z-го блока обработки 1, вход блокировки 20 устройства. Каждый блок обработки 1 содержит первый и второй вычислительные узлы 24 и 25, узел сравнения 26, триггер 27, три узла элементов И 28-30, узел элементов ИЛИ 31 и элемент НЕ 32, причем информационные входы первой и второй групп 33 и 34, управляющие входы первой группы 38, первый, второй и третий управляющие входы 35-37 блока обработки 1 подключены соответственно к входам группы первого узла элементов И 28 и соответственно к входам группы второго узла элементов И 29, выходы группы первого узла элементов И 28 подключены соответственно к входам первой группы узла элементов ИЛИ 31, выходы которых подключены соответственно к выходам первой группы 48, второй группы 49, к первому 50, второму 51 и третьему 52 выходам блока обработки 1, выходы первой группы второго узла элементов И 29 подключены соответственно к информационным входам первой группы, второй группы, к первому, второму и третьему управляющим входам первого вычислительного узла 24 и соответственно к информационным входам первой группы, второй группы, к первому, второму и третьему управляющим входам второго вычислительного узла 25, выходы первой группы, второй группы, первый, второй и третий выходы первого вычислительного узла 24 подключены соответственно к входам группы третьего узла элементов И 30 и соответственно к входам первой группы узла сравнения 26, выходы первой группы, второй группы, первый, второй и третий выходы второго вычислительного узла 25 подключены соответственно к входам второй группы узла сравнения 26, выход которого подключен к информационному входу триггера 27, выход которого подключен к входам второго 29 и третьего 30 узлов элементов И, к инверсному входу первого узла элементов И и к четвертому 46 выходу блока обработки 1, выходы третьего узла элементов И 30 подключены соответственно к входам второй группы узла элементов ИЛИ 31, управляющие входы второй группы 42 блока обработки 1 подключены соответственно к управляющим входам группы первого вычислительного узла 24 и соответственно к управляющим входам группы второго вычислительного узла 25, первый вход установки 39 блока обработки 1 подключены к входам начальной установки первого 24 и второго 25 вычислительных узлов, второй и третий входы установки 43 и 44 блока обработки 1 подключены соответственно к входу установки в ноль и к входу установки в единицу триггера 27, вход 40 блокировки и тактовый вход 41 блока обработки 1 подключены соответственно к первому и второму (инверсному) входам элемента И 32, выход которого подключен к тактовым входам первого 24 и второго 25 вычислительных узлов и к входу синхронизации триггера 27, выход вторых групп первого и второго узлов элементов И 28 и 29 подключены соответственно к выходам третьей и четвертой групп 45 и 47 блока обработки 1.This goal is achieved by the fact that in the device containing
Каждый вычислительный узел 24 (25) содержит комбинационный умножитель 53, комбинационный сумматор 54, с первого по четвертый регистры 55-58, группу регистров 59, с первого по шестой триггеры 60-65, с первой по (L+7)-ю группы элементов И 66-73, с первой по пятую группы элементов ИЛИ 74-78, с первого по третий элементы И 79-81, элемент НЕ 82 и дешифратор 83, при этом информационные входы первой группы 84 вычислительного узла подключены к информационным входам первого регистра 55, выходы которого подключены к первым входам элементов И 66 и 67 первой и второй групп, выходы элементов И первой группы 66 подключены к первым входам элементов ИЛИ 74 и 77 первой и второй групп, выходы элементов ИЛИ первой группы 74 подключены к информационным входам первой группы комбинационного умножителя 53, выходы которого подключены к информационным входам первой группы комбинационного сумматора 54 и первым входам элементов И 68 третьей группы, выходы которых подключены к первым входам элементов И 69 четвертой группы и первым входам элементов И 70 пятой группы, выходы которых подключены к вторым входам элементов ИЛИ 77 второй группы, выходы которых подключены к информационным входам второго регистра 58, выходы которого подключены к выходам первой группы 92 вычислительного узла, информационные входы второй группы 85 которого подключены к информационным входам третьего 56 и четвертого 57 регистров, выходы которых подключены соответственно к выходам второй группы 93 вычислительного узла и информационным входам второй группы комбинационного умножителя 53, выходы элементов И 67 второй группы подключены к первым входам элементов ИЛИ 75 третьей группы, выходы которых подключены к информационным входам второй группы комбинационного сумматора 65, выходы элементов И 68 третьей группы подключены к первым входам элементов ИЛИ 76 четвертой группы, выходы которых подключены к информационным входам первого регистра 591 группы, выходы S-го регистра 59 группы (S 1,L-1) подключены к информационным входам (S+1)-го регистра 59 группы и к первым входам S-го элемента И 73 группы, выходы L-го регистра 59 группы подключены к первым входам L-x элементов И 59 (L+5)-й группы, выходы элементов И 73 группы подключены к соответствующим входам элементов ИЛИ 78 четвертой группы, выходы которых подключены к первым входам элементов И 71 (L+6)-й группы и первым входам элементов И 72 (L+7)-й группы, выходы которых подключены к вторым входам элементов ИЛИ 75 третьей группы, выходы элементов И 69 четвертой группы подключены к вторым входам элементов ИЛИ 76 четвертой группы, выходы элементов И 71 (L+6)-й группы подключены соответственно к третьим входам элементов ИЛИ 76 четвертой группы и вторым входам элементов ИЛИ 74 первой группы, первый управляющий вход 86 вычислительного узла подключены к информационному входу первого триггера 60, выход которого подключен к вторым входам элементов И 66 первой группы, (L+7)-й группы 72, к первому входу первого элемента И 79, первому входу второго элемента И 81, информационному входу второго триггера 63 и входу элемента НЕ 82, выход которого подключен к вторым входам элементов И 67 второй группы, пятой группы 70 и (L+6)-й группы 71, второй управляющий вход 87 вычислительного узла подключен к информационному входу третьего триггера 61, прямой выход которого подключен к информационному входу четвертого триггера и второму входу первого элемента И 79, выход которого подключен к вторым входам элементов И 68 третьей группы, инверсный выход третьего триггера 61 подключен к второму входу второго элемента И 81, выход которого подключен к вторым входам элементов И четвертой группы 69, третий управляющий вход 88 вычислительного узла подключен к информационному входу пятого триггера 62 и к первому входу третьего элемента И 80, выход которого подключен к входу записи/считывания четвертого регистра 57, выходы второго 63, четвертого 64, пятого 65 триггеров подключены соответственно к первому 94, второму 95 выходам и к информационному входу шестого триггера 65, выход которого подключен к третьему выходу 96 вычислительного узла, управляющие входы 89 группы которого подключены к входам дешифратора 83, i-й выход которого (i 1,L) подключен к вторым входам элементов И 73 (S+5)-й группы, тактовый вход 90 вычислительного узла подключен к входам записи/считывания первого 55, второго 58 и третьего 56 регистров, регистров 59 группы, к входам синхронизации триггеров с первого по шестой и к второму входу третьего элемента И 80, вход начальной установки 91 вычислительного узла подключен к входам установки в ноль всех регистров и триггеров.Each computing node 24 (25) contains a
На фиг. 1 представлена схема устройства, на фиг. 2 схема блока обработки, на фиг. 3 схема вычислительного узла. In FIG. 1 shows a diagram of a device, FIG. 2 is a diagram of a processing unit, in FIG. 3 diagram of the computing node.
Конвейерное устройство для обработки информации содержит L блоков обработки 1, где L P+R, R число резервных блоков обработки, L комбинационных сумматоров 2, L-1 регистров 3, L узлов сравнения 4, L групп элементов ИЛИ 5 и 6, L групп элементов И 7, элемент ИЛИ-НЕ 8, информационные входы 9 и 10, управляющие входы 11-15, тактовый вход 16, входы установки 17-19, вход блокировки 20, группу выходов 21 признака отказа устройства, выходы результатов 22 и выход 23 признака отказа устройства. Каждый блок обработки 1 содержит вычислительные узлы 24 и 25, узел сравнения 26, триггер 27, узлы элементов И 28-30, узел элементов ИЛИ 31, элемент И 32, информационные входы 33 и 34, управляющие входы 35-39, вход блокировки 40, тактовый вход 41, входы установки 42-44, выходы 45-52. Каждый вычислительный узел 24 (25) содержит комбинационный умножитель 53, комбинационный сумматор 54, регистры 55-58, группу регистров 59, триггеры 60-65, группы элементов И 66-73, группы элементов ИЛИ 74-78, элементы И 79-81, элемент НЕ 82, дешифратор 83, информационные входы 84 и 85, управляющие входы 86-89, тактовый вход 90, вход начальной установки 91 и выходы 92-96. The conveyor device for processing information contains
В основу работы устройства для перемножения трех матриц положены следующие рекуррентные соотношения:
g
gpj= g
h
h
hij= h
Вычислительный блок 24 (25) реализует следующие функции:
Aj+2= αj,
Bj+2= βj,
Fj+2= γj
Fj+1 fj,
где gj вспомогательная переменная (значение содержимого регистра 591 на j-м такте);
αj,βj,γj значения соответственно на первом, втором и третьем настроечных входах вычислительного модуля на j-м такте;
Aj, Bj, Fj значения соответственно на первом, втором и третьем настроечных выходах вычислительного модуля на j-м такте;
hj, fj значения соответственно на первом и втором информационных входах на j-м такте;
Hj, Fj значения соответственно на первом и втором информационных выходах на j-м такте.The basis of the device for multiplying three matrices the following recurrence relations are put:
g
g pj = g
h
h
h ij = h
Computing unit 24 (25) implements the following functions:
A j + 2 = α j ,
B j + 2 = β j ,
F j + 2 = γ j
F j + 1 f j ,
where g j auxiliary variable (the value of the contents of the
α j , β j , γ j values, respectively, at the first, second and third tuning inputs of the computing module on the j-th clock;
A j , B j , F j values, respectively, at the first, second and third training outputs of the computing module on the j-th clock;
h j , f j values, respectively, at the first and second information inputs on the j-th clock;
H j , F j values respectively on the first and second information outputs on the j-th clock.
В основу работы устройства для вычисления двумерного ДПФ положены рекуррентные соотношения перемножения трех матриц, где
CP×Q= {Cpq} = {xpq} ;
Вычислительный узел 24 (25) работает в шести режимах, которые задаются значениями управляющих сигналов a,β и γ, подаваемыми соответственно на входы 86, 87 и 88.The device for calculating two-dimensional DFT is based on the recurrence relations of the multiplication of three matrices, where
C P × Q = {C pq } = {x pq };
The computing node 24 (25) operates in six modes, which are set by the values of the control signals a, β, and γ supplied to the
В первом режиме на входы 86, 87 и 88 подаются управляющие сигналы (α,β,γ) = (1,1,1).. При этом на входы 84 и 85 подаются соответственно элементы d и с, в регистр 55 записывается элемент d, в регистры 56 и 57 записывается элемент с (элемент И 80 открыт с помощью управляющего сигнала γ 1 и разрешена запись в регистр), элементы И 66, 68 и 79 открыты, на выходе умножителя 53 формируется значение с • d, которое через элементы И 68 и ИЛИ 76 на следующем такте записывается в регистр 591, элемент d с выхода регистра 55 через элементы И 66 и ИЛИ 77 подается на вход регистра 58 и далее на выход 92.In the first mode, control signals (α, β, γ) = (1,1,1) are applied to
Второй режим задается управляющими сигналами (α,β,γ) = (1,1,0) на входах 86, 87 и 88. На входы 84 и 85 подаются соответственно элементы d и с'. Элементы И 66, 68 и 79 открываются, на выходе умножителя 53 формируется значение с • d (элемент с записан в регистре 57), на выход регистра 591 подается значение с • d через элементы И 68 и 76, на выход 92 выдается элемент d через элементы И 66 и ИЛИ 77, на выход 93 выдается элемент с'.The second mode is set by control signals (α, β, γ) = (1,1,0) at
В третьем режиме на входы 86, 87 и 88 подаются управляющие сигналы (α,β,γ) = (1,0,1). На входы 84 и 85 подаются соответственно элементы d и с, открываются элементы И 66, 69, 72, 81 и 80, в регистры 56 и 57 записывается элемент с, в регистр 55 элемент d. На выходе умножителя 53 формируется значение с • d, на выходе сумматора 54 значение g c • d + c'd' (значение c' • d' подается на вход сумматора 54 с выхода регистра 59Λ), значение g с выхода сумматора 54 подается на вход регистра 591 через элементы И 69 и ИЛИ 76, элемент d подается через элементы И 66 и ИЛИ 77 на вход регистра 58.In the third mode, control signals (α, β, γ) = (1,0,1) are applied to
В четвертом режиме на входы 86, 87 и 88 подаются управляющие сигналы (α,β,γ) = (1,0,0). На входы 84 и 85 подаются соответственно элементы d и с, элементы И 66, 69, 72 и 81 открываются, в регистр 55 записывается элемент d, в регистр 56 элемент с, в регистре 57 хранится элемент с". На входе умножителя 53 формируется значение c" • d, на выходе сумматора 54 значение g c" • d + c' • d' (значение с' • d' подается на вход сумматора 54 с выхода регистра 59Λ), значение g подается на вход регистра 591, элемент d подается через элементы И 66 и ИЛИ 77 на вход регистра 58.In the fourth mode, control signals (α, β, γ) = (1,0,0) are applied to
Пятый режим работы задается управляющими сигналами (α,β,γ) = (0,0,1) на входах 86, 87 и 88. На входы 84 и 85 подаются соответственно элементы h и f. Элемент h записывается в регистр 55, а элемент f в регистры 56 и 57. Элементы И 67, 70, 71 открываются единичным сигналом с выхода элемента НЕ 82. На выходе умножителя 53 формируется значение f • g, где g содержимое регистра 59Λ, поступающее на второй вход умножителя 53 через элементы И 71 и ИЛИ 74, на выходе сумматора 54 значение h' h + f • g, которое подается через элементы И 70 и ИЛИ 77 на вход регистра 58. The fifth operation mode is set by control signals (α, β, γ) = (0,0,1) at
В шестом режиме работы на входы 86, 87 и 88 подаются управляющие сигналы (α,β,γ) = (0,0,0). На входы 84 и 85 подаются соответственно элементы h и f, которые записываются соответственно в регистры 55 и 56. В регистре 57 хранится элемент f'. In the sixth mode of operation, control signals (α, β, γ) = (0,0,0) are applied to the
Элементы И 67, 70 и 71 открываются. На входе умножителя 53 формируется значение f' • g, на выходе сумматора 54 значение h' h + f' • g, которое подается на вход регистра 58. Elements And 67, 70 and 71 open. At the input of the
Во всех режимах работы управляющие сигналы α,β и γ задерживаются на два такта с помощью триггеров 59-64. In all operating modes, the control signals α, β, and γ are delayed by two clock
На входы 9 и 10 устройства подаются соответственно элементы dij (hij) и cij (fij) в моменты времени
где to= -(2+Λ),Λ = max{τ,p}..At the
where t o = - (2 + Λ), Λ = max {τ, p} ..
На входы 11, 12 и 13 подаются соответственно управляющие сигналы α,β и γ в моменты времени
На выходе результата 22 устройства элементы hij формируются в моменты времени
Последний элемент hIτ формируется на (Λ(Q+I)+2p+τ-Λ)м такте.The
At the output of the result of the
The last element h Iτ is formed at the (Λ (Q + I) + 2p + τ-Λ) m beat.
Период подачи элементов cij, dij, fij для перемножения матриц следующей задачи равен Λ•(Q+I) тактов.The period of submission of the elements c ij , d ij , f ij for multiplying the matrices of the next problem is equal to Λ • (Q + I) clock cycles.
Значение Λ порядка подается на вход 15 устройства, откуда оно через входы 42 блоков 1 и входы 89 вычислительных узлов поступает на дешифратор 83. В результате дешифрации значение L с выхода дешифратора 83 снимается единичный сигнал, который поступает на соответствующий вход элементов И 73i. В результате этого с выходов регистров 59i через элементы И 73i и ИЛИ 78 информация поступает на соответствующие входы элементов И 71 и 72. Таким образом осуществляется настройка вычислительного узла на конкретное значение Λ≅L.The value Λ of the order is fed to the
В каждом блоке обработки 1 производится дублирование выполняемых операций с помощью вычислительных узлов 24 и 25. Результаты выполнения операций, начинающиеся по заднему фронту синхросигнала, формируются на выходе 92 по завершении переходных процессов в комбинационных схемах 53 и 54. Далее информация с выходов 92-96 узлов 24 и 25 поступает соответственно на информационные входы узла сравнения 26. При совпадении информации, поступающей на информационные входы узла сравнения 26 из вычислительных узлов 24 и 25 блока 1j, заданный блок обработки 1j считается исправным и единица с выхода узла сравнения 26 записывается в триггер 27, который используется для фиксации признака исправности данного блока обработки 1j. С выхода триггера 27 единица поступает на соответствующие входы узлов элементов И 29, 30. В результате этого значения αij(h
Единичный сигнал с выхода триггера 27 через выход 45 блока 1j поступает также на выход 21j признака отказа группы устройства. При несовпадении информации, поступающей на информационные входы узла сравнения 26 вычислительных узлов 24 и 25, данный блок обработки 1j считается неисправным и первый сигнал с выхода узла сравнения записывается в триггер 27. С выхода триггера 27 нулевой сигнал информации с выходов 92-96 вычислительного узла 24 блокируется. Нулевой сигнал с выхода триггера 27 поступает также на соответствующий вход узла элементов И 29 и на инверсный вход узла элементов И 28. В результате этого поступление значений αij(h
Для того, чтобы в определенных ситуациях принудительно вывести блок 1j из состава устройства, используется установочный вход 17 устройства. В этом случае внешними средствами управления на выходе 17j устройства формируется сигнал, который через вход 43 блока обработки 1j поступает на вход установки в ноль триггера 27.In order to force
Для того, чтобы в определенных ситуациях принудительно вывести блок 1j из состава устройства, используется установочный вход 17j устройства. В этом случае внешними средствами управления на входе 17j устройства формируется сигнал, который через вход 43 блока обработки 1j поступает на вход установки в ноль триггера 27. Для того, чтобы принудительно ввести блок обработки 1j в состав устройства, например, после его принудительного вывода или после фиксирования ложного отказа, используется вход 18j устройства. В этом случае внешними средствами управления на входе 18j устройства формируется сигнал, который через вход 44 блока обработки 1j поступает на вход установки в единицу триггера 27. При этом работа блока обработки 1j может быть блокирована путем подачи на вход 20 устройства единичного сигнала. В этом случае единичный сигнал через вход 40 блока 1j поступает на инверсный вход элемента И 32, который блокирует прохождение тактовых сигналов на тактовые входы вычислительных узлов 24 и 25, триггера 27.In order to force the
Для установки регистров и триггеров вычислительных узлов 24 и 25 блока 1j в исходное состояние при запусках и перезапусках устройства используется вход 19j устройства. Для установки блока 1j в исходное состояние на вход 19j устройства подается единичный сигнал, который через вход 39 блока 1j поступает на входы установки в исходное состояние вычислительных узлов 24 и 25. Вход установки в исходное состояние вычислительных узлов 24 и 25 подключен к входам установки в нулевое состояние всех регистров и триггеров узлов 24 и 25 (на фиг. 3 не показаны).To set the registers and triggers of the
На вход 14 устройства подается нулевое значение величины m. При наличии исправных блоков 11,1P с выходов 211, 21P признака отказа устройства выдаются единичные сигналы, которые подаются на входы соответствующих комбинационных сумматоров 21,2P. Значение m, поступающее на вход 38 блока 1j, где j 1,n, в случае исправности блоков 11,1j-1 равно j-1. В случае исправности блока 1j данное значение m выдается на выход 45 блока 1j и поступает на соответствующий вход комбинационного сумматора 2j, с выхода которого снимается значение m=j,, которое записывается в регистр 3j, и поступает на выход узла сравнения 4j, на другой вход которого поступает значение P. Таким образом, на каждом такте в случае исправности блока 1j с выхода комбинационного сумматора 2 выдается значение μ.At the
При совпадении значений m и P с выхода узла сравнения 4j выдается единичный сигнал, который открывает элементы И 7P (при этом все остальные элементы И 7 остаются закрытыми) и результат через элементы И 7P и элементы ИЛИ 6 выдаются на выходы 22 устройства. В случае отказа блока 1j происходит обход этого блока, как описано выше. При этом в случае исправности предыдущих блоков 1I,1j-1 на вход 38 блока 1j поступает значение m=j-11, которое далее поступает на выход 47 блока 1j, с выходов 45 и 46 блока 1j снимаются нулевые значения и, таким образом, с выхода комбинационного сумматора 2j снимается нулевое значение m. В результате этого с выхода узла сравнения 4P снимается нулевое значение, которое закрывает элементы И 7P. Если блок 1P+1 исправен, то на вход 38 блока 1P+1 поступает значение m=p-11, с выхода 46 блока 1P+1 выдается единичный сигнал и, следовательно, с выхода комбинационного сумматора 2P+1 снимается значение m=p. В результате этого с выхода узла сравнения 4P+1 снимается единичный сигнал, который открывает элементы И 7P+1 и результат через элементы И 7P+1 и элементы ИЛИ 6 выдается на выходы результата устройства. Нулевое значение величины μ, формируемой на комбинационном сумматоре 2j на последующих тактах, поступает на соответствующие входы элементов ИЛИ 5j и в дальнейшем не влияет на величину mб поступающую на вход 38 блока 1j+1.If the values of m and P coincide with the output of the comparison node 4 j, a single signal is issued that opens the And 7 P elements (while all other And 7 elements remain closed) and the result is sent to the device outputs 22 through the And 7 P elements and the
Таким образом, блок обработки 1j выводится из вычислительного процесса путем обхода, а первый из исправных резервных блоков, например IP+1, вводится в процесс вычисления, при этом длина линейки исправно функционирующих блоков обработки 1 устройства сохраняется.Thus, the
При обнаружении S отказов блоков 1 происходит обход отказавших блоков 1, как было описано выше. Пусть К номер последнего отказавшего блока 1 линейки, тогда с выхода 47 блока 1K будет выдаваться значение m=p-s, которое поступит на вход 38 блока 1K+1. Поскольку блок 1K+1 считается исправным, то с выхода 46 блока 1K+1 выдается единичный сигнал, с выхода комбинационного сумматора 2K+1 будет выдано значение μ = p-s+1, которое поступит на выход 38 блока 1K+2 и т. д. При попадании значения μ на выход 38 исправного блока 1j, на выходе комбинационного сумматора 2j формируется величина, равная m+1. При попадании значения μ на вход 38 неисправного блока 1j, на выходе комбинационного сумматора 2j формируется нулевое значение, а значение m с выхода 47 блока 1j поступает на вход 38 следующего блока 1j+1 линейки. С выхода комбинационного сумматора 2P+S на вход узла сравнения 4p+s подается значение m=p, с выхода узла сравнения 4P+S подается единичный сигнал, который открывает элементы И 7P+S, и результат с выхода 48 блока 1P+S через элементы И 7P+S и ИЛИ 6 поступает на выходы 22 результата. В данном случае на один из входов элемента ИЛИ-НЕ 8 поступает единичный сигнал, и соответственно на выходе 23 признака отказа устройства присутствует нулевой сигнал, который свидетельствует об исправности устройства. При R < S на выходах узлов 41,4L будут нулевые значения, с выхода элемента ИЛИ-НЕ 8 на выход 23 признака отказа устройства будет выдано единичное значение, которое свидетельствует об исчерпании резерва и отказа устройства. Таким образом, при накоплении R отказов работоспособность устройства сохраняется и длина линейки исправно функционирующих блоков обработки 1 устройства остается постоянной. При обнаружении (R+1)-го отказа устройства с выхода элемента ИЛИ-НЕ 8 на выход 23 устройства выдается признак отказа устройства, который далее поступает на средства внешнего управления.When S failures of
При работе устройства незаблокированные резервные блоки 1 автоматически функционируют в режиме контроля дублированием. В этом случае на входы первого блока обработки 1r, где r ≥ P+1, находящегося в резерве, с выхода рабочей линейки устройства поступают вычислительные значения. В результате обработки этого значения в вычислительных узлах 24 и 25 и последующего сравнения результатов в узле 26 резервных блоков обработки 1r происходит обновление значений триггеров 27 этих блоков. Дальнейшее использование этих резервов блоков обработки 1r будет происходить с учетом их исправности.When the device is operating, unblocked
Рассмотрим работу устройства для конкретного случая 1 P3, τ=Q=2 и R 1. Организация входного и выходного потоков данных, состояния регистров, триггеров, значения на выходах умножителя и сумматора вычислительных узлов блоков 11, 12 и 13 в случае их исправности приведены в табл. 1.Consider the operation of the device for a
Рассмотрим формирование элемента h11 в случае исправности блоков 11, 12 и 13. На первом такте в блоке 11 формируется значение c11 • d11, на втором такте значение c12 • d21, на четвертом такте значение g c11 • d11 + d21 • c12, на седьмом такте значение . В блоке 12 на девятом такте формируется значение . В блоке 13 на одиннадцатом такте формируется значение , которое выдается на выход 22 устройства на тринадцатом такте. Аналогичным образом формируются остальные элементы hij.Consider the formation of the element h 11 in the case of serviceability of the
Устройство перемножает три (n x n) матрицы за 2 n (n + 1) тактов. The device multiplies three (n x n) matrices in 2 n (n + 1) cycles.
Пусть на одиннадцатом такте работы устройства обнаружен отказ блока обработки 12. В этом случае состояние регистров триггеров, значения на выходах комбинационных умножителей и сумматора вычислительных узлов блоков обработки 11, 12, 13 и 14 (14 резервный блок обработки) приведены в табл. 2. На такте t 11 обнаружен отказ блока 12, на такте t 12 производится обнуление блока 11, блокировка блока 12, на такте t 13 производится блокировка и обнуление блока 13, на такте t 14 производится перезапуск устройства, разблокирование блока 13. Появившийся отказ блока обработки 12 приводит к тому, что нулевое значение сигнала с выхода узла сравнения 26 записывается в триггер 27. С выхода триггера 27 нулевое значение сигнала поступает на входы узлов элементов И 29, 30 и на инверсные входы узлов элементов И 28. В результате этого происходит обход блока 12 и запрещение выдачи информации с выходов узла 24. Блокировка работы блока 12 осуществляется подачей единичного сигнала на вход 202 устройства. Обнуление блока 11 осуществляется с помощью подачи единичного сигнала на вход 191 устройства. Нулевой сигнал с выхода триггера 27 поступает на выход 212 устройства. Все временные диаграммы подачи значений элементов матриц и внешних управляющих сигналов формируются с помощью средств внешнего управления или аппаратурной среды. Алгоритм восстановления вычислительного процесса после обнаружения отказа блока 1j определяет следующую последовательность действий:
такт i: фиксирование блока 1j с обнаруженным отказом, блокировка блока 1j, чтение информации с блока 1j+1 в блок 1j+2, обнуление блока 1j+1 и блокировка блока 1j+1;
такт i+1: чтение информации с блока 1j+2 в блок 1j+3, блокировка и обнуление блока 1j+2, обнуление блоков 11,1j+1;
такт i+2: чтение информации с блока 1j+3 в блок 1j+4, блокировка и обнуление блока 1j+3, разблокирование блока 1j+1;
такт i+3: чтение информации с блока 1j+4 в блок 1j+5, блокировка и обнуление блока 1j+4, разблокировка блока 1j+2;
такт i+K: чтение информации с блока 1j+K+1 в блок 1j+K+2, блокировка и обнуление блока 1j+K+1, разблокировка блока 1j+K+1.Suppose that at the eleventh cycle of the device, a failure of
measure i: fixing
cycle i + 1: reading information from
cycle i + 2: reading information from
cycle i + 3: reading information from
cycle i + K: reading information from
Если tn время (число тактов), требуемое для подготовки к передопуску устройства со стороны средств внешнего управления, то время реинициализации линейки составит 2 (j+tn) тактов.If t n is the time (number of clock cycles) required to prepare for a device restart from the side of external controls, then the ruler reinitialization time will be 2 (j + t n ) clock cycles.
В силу технологической структуры кристалл ИС состояния исправности или неисправности его различных долей взаимосвязаны. Степень связи между отказами различных долей ИС измеряется коэффициентом корреляции, величина которого тем большем, чем выше уровень технологии и степень интеграции ИС. Наличие не менее 16-разрядных комбинационных умножителей, сумматора и регистров обуславливает степень интеграции и уровень технологии, достаточные для проявления высокой степени корреляции отказов. При контроле дублированием вычислительных узлов необходимо, чтобы узлы и блоки обработки 1 были реализованы на разных кристаллах ИС. Аналогично, исходя из соображений корреляции отказов внутри кристалла ИС, необходимо, чтобы избыточные (резервные) блоки 1 не размещались на одних кристаллах ИС вместе с рабочими. By virtue of the technological structure, the crystal of an IS state of serviceability or malfunction of its various parts is interconnected. The degree of connection between failures of different parts of the IP is measured by the correlation coefficient, the magnitude of which is greater, the higher the level of technology and the degree of integration of IP. The presence of at least 16-bit Raman multipliers, an adder and registers determines the degree of integration and the level of technology sufficient to exhibit a high degree of correlation of failures. In the control of duplication of computing nodes, it is necessary that the nodes and
Технико-экономический эффект предлагаемого устройства заключается в следующем. The technical and economic effect of the proposed device is as follows.
В предлагаемом устройстве осуществляется непрерывный аппаратный контроль на протяжении всего времени работы и блокировка выдачи ошибочной информации при обнаружении отказавшего блока обработки. В устройстве реализован наиболее полный аппаратный контроль, ориентированный на обнаружение всех видов отказов, при этом время контроля сравнимо с тактовым периодом. Достоверность функционирования блока обработки 1 систолического устройства будет определяться как
Dф (t) Pпр (t) + Poo (t),
где Pпр (t) вероятность правильной работы блока обработки 1,
Poo (t) вероятность правильной работы блока обработки 1 и выдача с выхода блока 1 сигнала отказа.In the proposed device, continuous hardware monitoring is carried out throughout the entire operating time and the blocking of the issuance of erroneous information upon detection of a failed processing unit. The device implements the most comprehensive hardware control focused on detecting all types of failures, while the monitoring time is comparable to the clock period. The reliability of the functioning of the
D f (t) P ol (t) + P oo (t),
where P CR (t) is the probability of the correct operation of
P oo (t) is the probability of the correct operation of
Для рассматриваемого систолического устройства
Pпр(t) = P
Poo (t) 2Pуз (t) (1 Pуз (t)),
где Pуз (t) вероятность безотказной работы вычислительного узла 24 (25).For the systolic device in question
P ol (t) =
P oo (t) 2P knots (t) (1 P knots (t)),
where P knots (t) is the probability of failure of the computing node 24 (25).
Следовательно, достоверность функционирования всего устройства будет
Dф= (2Pуз(t)-P
При Pуз (t) 0,99, n 3 Dф 0,996; при Pуз (t) 0,99, n 10 Dф 0,9891; при Pуз (t) 0,999, n 3 Dф 0,999997; при Pуз (t) 0,999, n 10 Dф 0,999989; при Pуз (t) 0,9999 и выше Dф практически равна 1.Therefore, the reliability of the operation of the entire device will be
D f = (2P knots (t) -
When P knots (t) 0.99, n 3 D f 0.996; at P knots (t) 0.99, n 10 D f 0.9891; at P knot (t) 0.999, n 3 D f 0.999997; at P knot (t) 0.999, n 10 D f 0.999989; when P knots (t) 0,9999 and above D f almost equal to 1.
Время восстановления вычислительного процесса (получение достоверного результата на выходе устройства) пропорционально значению mотк, где mотк≅Λ, mотк номер отказавшего блока обработки 1 в линейке устройства. ЫЫЫ2Recovery time computing process (obtaining reliable results on the output device) is proportional to the value of TCI m where m TCI ≅Λ, m TCI number of the failed
Claims (2)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU93025195A RU2066878C1 (en) | 1993-04-28 | 1993-04-28 | Device for multiplication of three matrices and calculation of two-dimensional discrete fourier transform |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU93025195A RU2066878C1 (en) | 1993-04-28 | 1993-04-28 | Device for multiplication of three matrices and calculation of two-dimensional discrete fourier transform |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU93025195A RU93025195A (en) | 1996-08-27 |
| RU2066878C1 true RU2066878C1 (en) | 1996-09-20 |
Family
ID=20141041
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU93025195A RU2066878C1 (en) | 1993-04-28 | 1993-04-28 | Device for multiplication of three matrices and calculation of two-dimensional discrete fourier transform |
Country Status (1)
| Country | Link |
|---|---|
| RU (1) | RU2066878C1 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2222114C2 (en) * | 1998-03-04 | 2004-01-20 | Конинклейке Филипс Электроникс Н.В. | Hidden character detection |
-
1993
- 1993-04-28 RU RU93025195A patent/RU2066878C1/en active
Non-Patent Citations (1)
| Title |
|---|
| 1. Захаров В.П. и др. "О выборе схем резервирования для повышения надежности микроэлектронной аппаратуры", Электронная техника, серия 10, вып.1, 1978. 2. Авторское свидетельство СССР N 1552200, кл. G 06F 15/347, 1990 /прототип/. * |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2222114C2 (en) * | 1998-03-04 | 2004-01-20 | Конинклейке Филипс Электроникс Н.В. | Hidden character detection |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6785842B2 (en) | Systems and methods for use in reduced instruction set computer processors for retrying execution of instructions resulting in errors | |
| EP0227749B1 (en) | Fault tolerant data processing system and method therefor | |
| US6128755A (en) | Fault-tolerant multiple processor system with signature voting | |
| US6199171B1 (en) | Time-lag duplexing techniques | |
| US20050138501A1 (en) | System and method for testing electronic devices on a microchip | |
| Breuer et al. | Roving emulation as a fault detection mechanism | |
| RU2066878C1 (en) | Device for multiplication of three matrices and calculation of two-dimensional discrete fourier transform | |
| US5568407A (en) | Method and system for the design verification of logic units and use in different environments | |
| US5440604A (en) | Counter malfunction detection using prior, current and predicted parity | |
| RU2049353C1 (en) | Device for computation of two-dimensional convolution | |
| RU2066879C1 (en) | Device for calculation of two-dimensional discrete fourier transform | |
| RU2112274C1 (en) | Device for convolution calculation | |
| RU2117987C1 (en) | Device for calculation of eigenvalues for n*n matrix | |
| RU2049352C1 (en) | Device for multiplication of two matrices | |
| US5388253A (en) | Processing system having device for testing the correct execution of instructions | |
| RU2051412C1 (en) | Device for solving systems of linear algebraic equations | |
| RU2117986C1 (en) | Device for calculation of two-dimensional convolution | |
| US4625312A (en) | Test and maintenance method and apparatus for investigation of intermittent faults in a data processing system | |
| RU2049350C1 (en) | Device for solving systems of linear algebraic equations | |
| SU1408438A1 (en) | Device for test check of processor | |
| Ramamoorthy | Fault-tolerant computing: an introduction and an overview | |
| JPS60142747A (en) | Instruction execution control system | |
| Hertwig et al. | Fast self-recovering controllers | |
| SU1203506A1 (en) | Adaptive calculating device | |
| SU1599862A1 (en) | Device for monitoring microprocessor |