湖南大学-自算计体系结构 - 考试题库

【简答题】

[1/16]三、请简述指令之间数据冲突的类型。

参考答案：

答：指令之间的数据冲突有3种类型：真相关、反相关、输出相关。真相关（数据依赖，有时候也称为数据相关）：考虑两条指令i和j，i在j的前面，指令k在指令i和指令j之间。如果下述条件之一成立，则称指令j与指令i真相关：（1）指令j使用指令i产生的结果（写后读）；（2）指令j与指令k真相关，而指令k又与指令i真相关。（真相关的传递性）反相关：考虑两条指令i和j，i在j的前面，如果指令j所写的名与指令i所读的寄存器名或存储地址相同，则称指令i和j发生了反相关。（读后写）输出相关：考虑两条指令i和j，i在j的前面，如果指令j和指令i所写的寄存器名或存储地址相同，则称指令i和j发生了输出相关。（写后写）其中反相关和输出相关又合称名相关。名相关的意思是两条指令使用了相同的寄存器名或存储地址，但是它们之间并没有数据流动，即没有真正的数据依赖关系，则称这两条指令存在名相关。

参考解析：

无

【简答题】

[2/16]二、假设某应用程序中有4类操作，通过改进各类操作的功能部件，可获得不同的性能提高。具体数据如下表所示：操作类型程序中的数量（百万条指令）改进前...

参考答案：

：根据Amdahl定律Sn=1/(1-f)+f/a，其中f是可改进部分在总运行时间中所占比例，a是可改进部分的加速比，可得操作类型各类操作的指令条数在程序中所占的比例fi 各类操作的加速比Si 各类操作单独改进后，程序获得的加速比操作1 1.9% 2 1.01 操作2 58.2% 1.33 1.17 操作3 34.0% 3.33 1.31 操作4 5.8% 4 1.04 4类操作均改进后，整个程序的加速比： Sn=1/(1-ΣFi）+ΣFi/Si≈1.77

参考解析：

无

【简答题】

[3/16]六、假设有一条长流水线，仅仅对条件分支指令使用分支目标缓冲。其中分支预测错误的开销为4个时钟周期，分支目标缓冲不命中的开销为3个时钟周期。分支目标缓冲...

参考答案：

答：（1）程序执行的CPI = 没有分支的基本CPI（1） + 分支带来的额外开销分支带来的额外开销是指在分支指令中，缓冲命中但预测错误带来的开销与缓冲没有命中带来的开销之和。（通常，在采用了分支目标缓冲时，如果发生了分支目标缓冲命中，那么会直接利用缓冲中的分支目标地址进行取指，即预测分支转移，所以如果分支预测正确，那就没有开销。如果分支实际未发生转移，那么就出现了预测错误，需要取消已取来的分支目标处指令，重新从分支失败处取指。根据题意，这种情况的开销为4个时钟周期。另一方面，如果分支目标缓冲不命中，那么根据题意，开销为3个时钟周期）分支带来的额外开销= 15% * (90%命中×10%预测错误×4 + 10％没命中×3)= 0.099 所以，程序执行的CPI ＝ 1 ＋ 0.099 = 1.099 （2）采用固定的2 个时钟周期延迟的分支处理CPI = 1 + 15%×2 = 1.3 由（1）（2）可知分支目标缓冲方法执行速度快。

参考解析：

无

【简答题】

[4/16]五、假设某程序各种分支指令数占所有指令数的百分比如下：条件分支 20%（其中的60%是分支成功的）跳转和调用 5% 现有一条段数为4的流水线，无条...

参考答案：

答：没有控制相关时流水线的平均CPI＝1 存在控制相关时：无条件分支在第2个时钟周期结束时就被解析出来，而条件分支要到第3个时钟周期结束时才能被解析出来，这意味着分支目标地址可以在第2个时钟周期计算出来（因为无条件分支只需要知道分支目标即可），而分支条件要到第3个时钟周期才能判断出来。因为题目未指定控制相关的解决方法，故假设采用暂停流水线、预测分支成功、预测分支失败这3种方法。每种方法的分析如下：（1）若使用暂停流水线的策略，则对于条件分支，有2个额外的stall，对无条件分支，有1个额外的stall： CPI = 1+20%*2+5%*1 = 1.45 加速比S=CPI/1 = 1.45 （2）若使用预测分支成功策略，则对于不成功的条件分支，有2个额外的stall，对无条件分支和成功的条件分支，有1个额外的stall 1： CPI = 1+20%*(60%*1+40%*2) +5%*1 = 1.33 加速比S=CPI/1 = 1.33 （3）若使用预测分支失败策略，则对于成功的条件分支，有2个额外的stall；对无条件分支，有1个额外的stall；对不成功的条件分支，其目标地址已经由PC 值给出，不必等待，所以无延迟： CPI = 1+20%*(60%*2 + 40%*0) +5%*1 = 1.29 加速比S=CPI/1 = 1.29

参考解析：

无

【简答题】

[5/16]二、计算机系统中有三个部件可以改进，这三个部件的改进加速比为：部件加速比1=30；部件加速比2=20；部件加速比3=10 （1）如果部件1和部件...

参考答案：

答：（1）在多个部件可改进情况下，Amdahl定理的扩展： SN=1/（1-ΣFi）+ΣFi/Si 已知S1＝30，S2＝20，S3＝10，Sn＝10，F1＝0.3，F2＝0.3，得：10=1/1-（0.3+0.3+F3）+（0.3/30+0.3/20+F3/10）得F3＝0.36，即部件3的比例为36%。（2）设系统改进前的执行时间为T，则3个部件改进前的执行时间为：（0.3+0.3+0.2）T = 0.8T，不可改进部分的执行时间为0.2T。已知3个部件的改进加速比分别为S1＝30，S2＝20，S3＝10，因此3个部件改进后的执行时间为：T`n=0.3T/30+0.3T/20+0.2T/10=0.045T 改进后整个系统的执行时间为：Tn = 0.045T+0.2T = 0.245T 那么系统中不可改进部分的执行时间在总执行时间中占的比例是：0.2T/0.245T=0.82

参考解析：

无

【简答题】

[6/16]十四、请简述通道的概念，以及通道完成一次数据传输的主要过程。答：通道是指专门负责整个计算机系统输入/输出工作的专用处理机，能执行有限的一组输入输出指...

参考答案：

通道完成一次数据传输的主要过程如下：（1）在用户程序中使用访管指令进入操作系统内核，由CPU通过管理程序组织一个通道程序，并启动通道。 (2) 通道处理机执行CPU为它组织的通道程序，完成指定的数据I/O工作。 (3) 通道程序结束后向CPU发中断请求。CPU响应这个中断请求后，第二次进入操作系统设备管理程序，调用管理程序对I/O中断请求进行处理。

参考解析：

无

【简答题】

[7/16]十、请简述高速缓冲存储器（Cache）的写策略及其组合情况。

参考答案：

答：Cache进行写操作时有写命中和写缺失两种情况。在写命中时，有写回和写通两种策略。写回策略在写命中时，只改写Cache中的数据块，并记录该数据块已被修改，而不把数据写到主存。这样Cache和主存的数据会不一致。直到该数据块被替换时，被修改的数据块才被写到主存。写通策略在写命中时，不但改写Cache中的数据块，同时将数据写到主存，从而Cache和主存的数据保持一致。在写缺失时，有写分配和写不分配两种策略。写分配策略在写缺失时，先将数据块从主存载入Cache，然后改写数据块，并做修改标记。写不分配策略在写缺失时，不载入数据块到Cache中，而是直接改写主存中的数据块。写回策略通常与写分配策略组合，写通策略通常与写不分配策略组合。

参考解析：

无

【简答题】

[8/16]请简述主存数据块到高速缓冲存储器（Cache）的映象方式

参考答案：

答：Cache的映射方式可以有3种，全相联映象、直接映象和组相联映象。全相联映象：主存中的任一块可以被放置到Cache中任意一个地方。直接映象：主存中的每一块只能被放置到Cache中唯一的一个地方。组相联映象：主存中的每一块可以放置到Cache中唯一的一组中任何一个地方（Cache分成若干组，每组由若干块构成）。

参考解析：

无

【简答题】

[9/16]七、（2）当前流行的多核处理器在Flynn分类中应该归入哪一类？

参考答案：

（2）当前流行的多核处理器在Flynn分类中应该归入多指令流多数据流（MIMD）这一类。

参考解析：

无

【简答题】

[10/16]（1）请简述计算机体系结构的Flynn分类；（2）当前流行的多核处理器在Flynn分类中应该归入哪一类？

参考答案：

答：（1）Flynn分类是按照指令流和数据流的多倍性对计算机体系结构进行分类，共有4类：单指令流单数据流（SISD）；单指令流多数据流（SIMD）；多指令流单数据流（MISD）；多指令流多数据流（MIMD）。

参考解析：

无