игра брюс 2048
Главная / Аппаратное обеспечение / Архитектура параллельных вычислительных систем / Тест 7

Архитектура параллельных вычислительных систем - тест 7

Упражнение 1:
Номер 1
АЛУ содержит два ИУ сложения, два – умножения, два канала обмена с памятью. Сложение выполняется за 2 такта, умножение – за 3. Все элементы массива A = {a1, a2,…} находятся по одной формуле. Составьте оптимальную программу одновременного вычисления двух элементов массива. aj=bj×c+ d

Ответ:

 (1)
++××ЗаnЗаn
bjcbj+1c
NOP
NOP
+d+d
NOP
Заn ajЗаn aj+1
 

 (2)
++××ЗаnЗаn
bjcbj+1c
NOP
NOP
+d+d
Заn ajЗаn aj+1
 

 (3)
++××ЗаnЗаn
bjcbj+1c
NOP
NOP
+d+d
NOP
NOP
Заn ajЗаn aj+1
 


Номер 2
АЛУ содержит два ИУ сложения, два – умножения, два канала обмена с памятью. Сложение выполняется за 2 такта, умножение – за 3. Все элементы массива A = {a1, a2,…} находятся по одной формуле. Составьте оптимальную программу одновременного вычисления двух элементов массива. aj=(bj+c)×(aj+d)

Ответ:

 (1)
++××ЗаnЗаn
bj+caj+d
bj+1+caj+1+d
(bj+c)×(aj+d)
(bj+1+c)×(aj+1+d)
NOP
Заn aj
Заn aj+1
 

 (2)
++××ЗаnЗаn
bj+caj+d
bj+1+caj+1+d
(bj+c)×(aj+d)
(bj+1+c)×(aj+1+d)
NOP
Заn ajЗаn aj+1
 

 (3)
++××ЗаnЗаn
bj+caj+d
bj+1+caj+1+d(bj+c)×(aj+d)
(bj+1+c)×(aj+1+d)
NOP
Заn aj
Заn aj+1
 


Номер 3
АЛУ содержит два ИУ сложения, два – умножения, два канала обмена с памятью. Сложение выполняется за 2 такта, умножение – за 3. Все элементы массива A = {a1, a2,…} находятся по одной формуле. Составьте оптимальную программу одновременного вычисления двух элементов массива. aj=(bj×c)×(aj+d)

Ответ:

 (1)
++××ЗапЗап
aj+daj+1+dbj×cbj+1×c
NOP
NOP
(bj×c)×(aj+d)(bj+1×c)×(aj+1+d)
NOP
NOP
Заn ajЗаn aj+1
 

 (2)
++××ЗапЗап
aj+daj+1+dbj×cbj+1×c
NOP
(bj×c)×(aj+d)(bj+1×c)×(aj+1+d)
NOP
NOPЗаn aj
Заn aj+1
 

 (3)
++××ЗапЗап
aj+daj+1+dbj×cbj+1×c
NOP
NOP
(bj×c)×(aj+d)(bj+1×c)×(aj+1+d)
NOP
Заn ajЗаn aj+1
 


Упражнение 2:
Номер 1
АЛУ содержит два ИУ сложения, два – умножения, логическое ИУ выполняет и функции обмена с памятью. Сложение выполняется за 1 такт, умножение – за 2. Составьте план оптимальной программы параллельного вычисления величины возбуждения нейрона, если количество дендритов (входов) равно К. К = 8, передаточная функция имеет вид:files

Ответ:

 (1)
++××ЛОГ
ω0V0ω1V1
ω2V2ω3V3
ω0V01ω1V12ω4V4ω5V5
ω2V21ω3V32ω6V6ω7V7
ω4V41ω5V52
ω6V61ω7V72
Σ12
-hVj
 

 (2)
++××ЛОГ
ω0V0ω1V1
ω2V2ω3V3
ω0V01ω1V12ω4V4ω5V5
ω2V21ω3V32ω6V6ω7V7
ω4V41ω5V52
ω6V61ω7V72
Σ12-hVj
 

 (3)
++××ЛОГ
ω0V0ω1V1
ω0V01ω1V12ω2V2ω3V3
ω2V21ω3V32ω4V4ω5V5
ω4V41ω5V52ω6V6ω7V7
ω6V61ω7V72
Σ12
-h
Vj
 


Номер 2
АЛУ содержит два ИУ сложения, два – умножения, логическое ИУ выполняет и функции обмена с памятью. Сложение выполняется за 1 такт, умножение – за 2. Составьте план оптимальной программы параллельного вычисления величины возбуждения нейрона, если количество дендритов (входов) равно К. К = 8, передаточная функция имеет вид:files Vj:= if V≥ h then V else 0

Ответ:

 (1)
++××ЛОГ
ω0V0ω1V1
ω2V2ω3V3
ω0V01ω1V12ω4V4ω5V5
ω2V21ω3V32ω6V6ω7V7
ω4V41ω5V52
ω6V61ω7V72
V=Σ12
Σ:=V≥h
if ΣthenV else 0
 

 (2)
++××ЛОГ
ω0V0ω1V1
ω2V2ω3V3
ω0V01ω1V12ω4V4ω5V5
ω2V21ω3V32ω6V6ω7V7
ω4V41ω5V52
ω6V61ω7V72
V=Σ12Σ:=V≥h
if ΣthenV else 0
 

 (3)
++××ЛОГ
ω0V0ω1V1
ω2V2ω3V3
ω0V01ω1V12ω4V4ω5V5
ω2V21ω3V32ω6V6ω7V7
ω4V41ω5V52
ω6V61ω7V72
V=Σ12
Σ:=V-hif ΣthenV else 0
 


Номер 3
АЛУ содержит два ИУ сложения, два – умножения, логическое ИУ выполняет и функции обмена с памятью. Сложение выполняется за 1 такт, умножение – за 2. Составьте план оптимальной программы параллельного вычисления величины возбуждения нейрона, если количество дендритов (входов) равно К. К = 7, передаточная функция имеет вид:files Vj:= if V≥ h then 1 else 0

Ответ:

 (1)
++××ЛОГ
ω0V0ω1V1
ω2V2ω3V3
ω0V01ω1V12ω4V4ω5V5
ω2V21ω3V32ω6V6
ω4V41ω5V52
ω6V61
V=Σ12
Σ:=V≥h
if Σthen1 else 0
 

 (2)
++××ЛОГ
ω0V0ω1V1
ω2V2ω3V3
ω0V01ω1V12ω4V4ω5V5
ω2V21ω3V32ω6V6ω7V7
ω4V41ω5V52
ω6V61
V=Σ12Σ:=V≥h
if ΣthenV else 0
 

 (3)
++××ЛОГ
ω0V0ω1V1
ω2V2ω3V3
ω0V01ω1V12ω4V4ω5V5
ω2V21ω3V32ω6V6
ω4V41ω5V52
ω6V61
V=Σ12
Σ:=V-hif ΣthenV else 0
 


Упражнение 3:
Номер 1
АЛУ содержит два ИУ сложения, два – умножения, логическое ИУ выполняет и функции обмена с памятью. Сложение выполняется за 1 такт, умножение – за 2. Количество дендритов (входов) К = 8, передаточная функция имеет вид:files
Составьте планы программ для процессора с синхронными ИУ.

Ответ:

 (1)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×ω0V0r1×ω1V1r2+r1r2r3
×ω2V2r1×ω3V3r2+r1r2r4
×ω4V4r1×ω5V5r2+r1r2r5
×ω6V6r1×ω7V7r2+r1r2r6
+r3r4r7+r5r6r8+r7r8Σ
-ΣhVj
 

 (2)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×ω0V0r1×ω1V1r2+r1r2r3
×ω2V2r1×ω3V3r2+r1r2r4
×ω4V4r1×ω5V5r2+r1r2r5
×ω6V6r1×ω7V7r2+r1r2r6
+r3r4r7+r5r6r8+r7r8Σ
-ΣhVj
 

 (3)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×ω0V0r1×ω1V1r2+r1r2r3
×ω2V2r1×ω3V3r2+r1r2r4
×ω4V4r1×ω5V5r2+r1r2r5
×ω6V6r1×ω7V7r2+r1r2r6
+r3r4r7+r7r8Σ
+r5r6r8-ΣhVj
 


Номер 2
АЛУ содержит два ИУ сложения, два – умножения, логическое ИУ выполняет и функции обмена с памятью. Сложение выполняется за 1 такт, умножение – за 2. Количество дендритов (входов) К = 8, передаточная функция имеет вид:
files 
Vj:= if V≥ h then V else 0
Составьте планы программ для процессора с синхронными ИУ.

Ответ:

 (1)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×ω0V0r1×ω1V1r2+r1r2r3
×ω2V2r1×ω3V3r2+r1r2r4
×ω4V4r1×ω5V5r2+r1r2r5
×ω6V6r1×ω7V7r2+r1r2r6
+r3r4r7+r5r6r8+r7r8Σ
-ΣhVN+2
ЗпVVjB
ЗпVjB
(N+2 – адрес перехода для пропуска следующей команды, В – адрес выхода) 

 (2)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×ω0V0r1×ω1V1r2+r1r2r3
×ω2V2r1×ω3V3r2+r1r2r4
×ω4V4r1×ω5V5r2+r1r2r5
×ω6V6r1×ω7V7r2+r1r2r6
+r3r4r7+r5r6r8+r7r8Σ
-ΣhVУЗпVVjУЗпVj
(УЗп – запись по условию, выработанному в первом слоге командного слова) 

 (3)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×ω0V0r1×ω1V1r2+r1r2r3
×ω2V2r1×ω3V3r2+r1r2r4
×ω4V4r1×ω5V5r2+r1r2r5
×ω6V6r1×ω7V7r2+r1r2r6
+r3r4r7+r5r6r8+r7r8Σ
-ΣhV
УЗпVVjУЗпVj
 


Номер 3
АЛУ содержит два ИУ сложения, два – умножения, логическое ИУ выполняет и функции обмена с памятью. Сложение выполняется за 1 такт, умножение – за 2. Количество дендритов (входов) К = 7, передаточная функция имеет вид:
files Vj:= if V≥ h then 1 else 0
Составьте планы программ для процессора с синхронными ИУ.

Ответ:

 (1)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×ω0V0r1×ω1V1r2+r1r2r3
×ω2V2r1×ω3V3r2+r1r2r4
×ω4V4r1×ω5V5r2+r1r2r5
×ω6V6r1+r1r6
+r3r4r7+r5r6r8+r7r8Σ
-ΣhVУЗп1VjУЗпVj
 

 (2)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×ω0V0r1×ω1V1r2+r1r2r3
×ω2V2r1×ω3V3r2+r1r2r4
×ω4V4r1×ω5V5r2+r1r2r5
-r3r4r7+r5r6r8+r7r8Σ
-ΣhV
УЗп1Vj
УЗпVj
 

 (3)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×ω0V0r1×ω1V1r2+r1r2r3
×ω2V2r1×ω3V3r2+r1r2r4
×ω4V4r1×ω5V5r2+r1r2r5
×ω6V6r1+r1r6
+r3r4r7+r5r6r8+r7r8Σ
-ΣhVN+2
УЗп1VjB
УЗпVjB
 


Упражнение 4:
Номер 1
Для архитектуры с синхронными ИУ составить оптимальную программу счета значения выражения и составить временную диаграмму выполнения работ, считая время умножения вдвое большим времени сложения. Определить минимальную длину расписания. Y:=ax2+bx+c

Ответ:

 (1)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×axr1×bxr2
×r1xr3+r2cr4+r3r4Y
files Минимальная длина расписания равна 5 

 (2)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×axr1×bxr2×r1xr1
+r1r2r3+r3cY
files Минимальная длина расписания равна 6 

 (3)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×xxr1×bxr2
×ar1r1+r1r2r3+cr3Y
files Минимальная длина расписания равна 6 


Номер 2
Для архитектуры с синхронными ИУ составить оптимальную программу счета значения выражения и составить временную диаграмму выполнения работ, считая время умножения вдвое большим времени сложения. Определить минимальную длину расписания. Z:=c+bx+ax2

Ответ:

 (1)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×bxr1×axr2
+r2xr2+r1cr1+r1r2Z
files Минимальная длина расписания равна 5 

 (2)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×Bxr1+cr1r1×axr2
×r2xr2+r1r2Z
files Минимальная длина расписания равна 7 

 (3)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×Bxr1×axr2×r2xr2
+r1cr1+r1r2Z
files Минимальная длина расписания равна 6 


Номер 3
Для архитектуры с синхронными ИУ составить оптимальную программу счета значения выражения и составить временную диаграмму выполнения работ, считая время умножения вдвое большим времени сложения. Определить минимальную длину расписания. 
X:=(ax+b)×x+c

Ответ:

 (1)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×Axr1+r1br1×r1xr2
+r2cX
files Минимальная длина расписания равна 6 

 (2)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×Axr1×r1xr1×bxr2
+r1r2r3+r3cX
files Минимальная длина расписания равна 6 

 (3)
КОПR1R2R3/AКОПR1R2R3/AКОПR1R2R3/A
×Axr1×bxr2+r2cr2
×r1xr1+r1r2X
files Минимальная длина расписания равна 6 


Упражнение 5:
Номер 1
Для выражения
Y:=ax2+bx+c
составьте матрицу следования работ и укажите значения времени их выполнения, поздних сроков начала их выполнения (для Т = 6), а также объема последующих работ

Ответ:

 (1)
ОперацияМатрицаtτθ
ax215
bx224
bx+c1132
ax21233
Y11151
 

 (2)
ОперацияМатрицаtτθ
ax215
bx224
bx+c1142
ax21233
Y11151
 

 (3)
ОперацияМатрицаtτθ
ax215
bx223
bx+c1142
ax21233
Y11141
 


Номер 2
Для выражения
Z:=c+bx+ax2
составьте матрицу следования работ и укажите значения времени их выполнения, поздних сроков начала их выполнения (для Т = 6), а также объема последующих работ

Ответ:

 (1)
ОперацияМатрицаtτθ
bx224
ax215
c+bx1142
ax21233
Z11151
 

 (2)
ОперацияМатрицаtτθ
bx214
ax225
c+bx11142
ax21233
Z11151
 

 (3)
ОперацияМатрицаtτθ
bx224
ax225
c+bx1132
ax21233
Z11151
 


Номер 3
Для выражения
X:=(ax+b)×x+c
составьте матрицу следования работ и укажите значения времени их выполнения, поздних сроков начала их выполнения (для Т = 6), а также объема последующих работ

Ответ:

 (1)
ОперацияМатрицаtτθ
ax215
ax+b1124
(ax+b)x1233
X11151
 

 (2)
ОперацияМатрицаtτθ
ax205
ax+b1124
(ax+b)x11223
X111151
 

 (3)
ОперацияМатрицаtτθ
ax206
ax+b1124
(ax+b)x1233
X1151
 


Упражнение 6:
Номер 1
Произведите обоснование предпочтительной формы представления алгоритма для оптимизации программы ВС, управляемой в каждом такте.
Каким рекомендациям необходимо следовать при обработке массива?

Ответ:

 (1) необходимо предусмотреть одновременную обработку более одного элемента массива 

 (2) предусмотрев одновременную обработку более одного элемента массива, следует организовать конвейер этой обработки 

 (3) не следует пользоваться алгоритмами обработки элементов массива, если они не распараллеливаются 


Номер 2
Произведите обоснование предпочтительной формы представления алгоритма для оптимизации программы ВС, управляемой в каждом такте. Какие существуют возможности реализации условных выражений в составе арифметических операторов?

Ответ:

 (1) основной прием реализации условных выражений заключается в одновременном счете оператора-условия и альтернативных операторов в спекулятивном режиме 

 (2) в составе команд обязательно должна присутствовать команда вида if-then-else, по которой выбирается необходимый вариант счета, соответствующий значению проверяемого условия 

 (3) только команды, использующие память предикатов, способны обеспечить спекулятивный режим счета 


Номер 3
Произведите обоснование предпочтительной формы представления алгоритма для оптимизации программы ВС, управляемой в каждом такте. Какая структура является более гибкой, поддерживающей асинхронный характер работы ИУ многофункционального АЛУ, - полностью управляемая в каждом такте командным словом, или осуществляющая синхронизацию по готовности данных?

Ответ:

 (1) опыт показывает, что передача всех функций управления на жесткий программный уровень при полной ликвидации элементов самоуправления, приводит к неэффективности и сложности программного кода, к необходимости в значительно большей степени отслеживать во времени частичную упорядоченность работ. Автоматическое соблюдение частичной упорядоченности работ снижает необходимость этого отслеживания. Тем более, что алгоритмы синхронизации на основе используемых адресов весьма просты 

 (2) возложение на аппаратуру функций соблюдения правила готовности данных для выполнения операций приводит к значительному усложнению оборудования. Целесообразно возложить эти функции на транслятор 

 (3) аппаратное соблюдение частичной упорядоченности работ на основе анализа адресной информации решает задачу оптимизации программного кода весьма грубо и приближенно. На уровне трансляции могут быть использованы значительно более точные методы оптимизации 

 (4) задача оптимизации программного кода – комплексная проблема, решаемая на уровне подготовки алгоритма, на уровне трансляции и, несомненно должна поддерживаться на уровне взаимодействия элементов оборудования 


Номер 4
Произведите обоснование предпочтительной формы представления алгоритма для оптимизации программы ВС, управляемой в каждом такте. Представьте предпочтительный ряд рабочих критериев, по которым производится включение "готовых" команд в формируемое "длинное" командное слово

Ответ:

 (1) полное отсутствие подобных критериев (назначение в порядке следования при анализе потока команд) сокращает время трансляции, не приводя на практике к значительному снижению качества программы 

 (2) в большинстве случаев достаточно пользоваться критерием назначения по максимальному времени выполнения операций 

 (3) включение команды в состав "длинного" командного слова определяется предпочтительным рядом критериев: максимум времени выполнения, минимум максимального времени начала выполнения, максимум объема последующих работ 

 (4) включение команды в состав "длинного" командного слова определяется предпочтительным рядом критериев: минимум максимального времени начала выполнения, максимум времени выполнения, максимум объема последующих работ 




Главная / Аппаратное обеспечение / Архитектура параллельных вычислительных систем / Тест 7