系统结构-向量处理中的优化:链接技术,拍数

南大自考流程详解
自考-计算机应用专业
2020系统结构系列

有小伙伴让我试试这道题,这个书上有。P207。并且课后习题也有

知识点复习

我猜,之所以有网友问这道题,肯定是不晓得访存为什么6拍等问题。
这里我们复习一下,CRAY-1向量流水处理部分的相关知识点:
CRAY-1启动访存、把元素送往功能部件及结果存入Vi都需要1拍的传送延迟。
CRAY-1访存流水线的建立需要6拍,另外浮加6拍,浮乘7拍。
这些书上都有记载,都记在了犄角旮旯,系统结构的难度绝对是被这本教材拉上去的。
在这里插入图片描述
在这里插入图片描述

例题的巩固

ps:这个真题是哪年的,这图实在太糊了
在这里插入图片描述

(1)1、2、3串行执行需要多少拍?

第一条向量指令,V3<–存储器:

1拍启动访存+6拍访存+1拍访存结果存入V3,第一个结果分量就出来了,之后每过一拍就可以出一个结果,向量长度为N,全部出来要N-1拍。
结果分量1:(1+6+1)+N-1

第二条向量指令,V2<–V0+V1:

1拍送浮加+6拍浮加+1拍访存结果存入V2。
结果分量2:(1+6+1)+N-1

第三条向量指令,V4=V2 X V3

1拍送浮乘+7拍浮乘+1拍访存结果存入V4。
结果分量3:(1+7+1)+N-1
最终结果:
【(1+6+1)+N-1】+【(1+6+1)+N-1】+【(1+7+1)+N-1】=3N+22 拍

(2)1、2并行执行后,再执行3?

前两条并行执行,所以只用一个(1+6+1)+N-1的时间
最终结果:【(1+6+1)+N-1】+【(1+7+1)+N-1】=2N+15 拍

(3)采用链接技术?

链接技术,书上也有提及,如下图所示:
在这里插入图片描述
换个图更明白
在这里插入图片描述
访存和浮加并行,第一个V2分量和V3分量出来之后,不等下面的向量分量结果全部出来,而是直接把这两个值送去浮乘。之后每过一拍就可以出一个结果,向量长度为N,全部出来要N-1拍。
最终结果:(1+6+1)+(1+7+1)+N-1=N+16拍

热爱编程的小水怪,欢迎关注。有错请指出,一起加油。

猜你喜欢

转载自blog.csdn.net/changhuzichangchang/article/details/115523788