的缓冲寄存器。若按照最快的方式用该流水线计算 ① 请画出其处理过程的时空图。 ② 计算其实际吞吐率,加速比和效率。 解:(1).任务划分如下:
。
F = X1·Y1·Z1 + X2·Y2·Z2 + X3·Y3·Z3 + X4·Y4·Z4 + X5·Y5·Z5 ⑴
⑵ ⑶
⑺
⑷
⑸
⑽
⑹
⑻ ⑼ ⑿
⑾ ⒀ ⒁ 时空图如下: 空 间 S6 S5 S4 S3 S2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 11 12 13 14 11 12 13 14 S1 1 2 3 4 5 6 7 8 9 10 11 12 13 22 Δt 14 时 间 (2).Tk = 22Δt,TP = 7/11Δt=7/(11*50ns)=12.727e6,S = 28/11=2.555,E = 14/33=42.42%
3.18、在Cray 1机上,按链接方式执行下面4条向量指令(括号中给出相应功能部件时间),如果向量寄存器和功能部件之间的数据传输需要1拍,试求此链接流水线的流过时间为多少拍?如果向量长度为64,则需要多少拍能得到全部结果。
V0←存储器 (存储器取数:7拍)
V2←V0+V1 (向量加:3拍) V3←V2 解答: 四条指令每前后两条依次存在先写后读相关,故流水线经过时间为(1+7+1) + (1+3+1) + (1+4+1) + (1+2+1) = 24。 如果向量长度为64,则需24 + (64-1) = 87拍能得到全部结果。 3.19、某机有16个向量寄存器,其中V0~V5中分别放有向量A、B、C、D、E、F,向量长度均为8,向量各元素均为浮点数;处理部件采用二个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。用类似Cray 1的链接技术,先计算(A+B)*C,在流水线不停流的情况下,接着计算(D+E)*F。 (1) 求此链接流水线的流过时间为多少拍?(设寄存器入,出各需1拍)。 (2) 假设每拍时间为50ns,完成这些计算并把结果存进相应寄存器,此部件的实际的吞吐率是多少MFLOPS? 解答: (1) (A+B)*C 可用以下2条指令完成: V0←A+B V1←V0*C 流水线流过时间为(1+2+1) + (1+3+1) = 9拍 (2) 实际吞吐率为
相关推荐: