计算机系统结构参考答案.docx

上传人:b****6 文档编号:8759523 上传时间:2023-05-14 格式:DOCX 页数:23 大小:320.80KB
下载 相关 举报
计算机系统结构参考答案.docx_第1页
第1页 / 共23页
计算机系统结构参考答案.docx_第2页
第2页 / 共23页
计算机系统结构参考答案.docx_第3页
第3页 / 共23页
计算机系统结构参考答案.docx_第4页
第4页 / 共23页
计算机系统结构参考答案.docx_第5页
第5页 / 共23页
计算机系统结构参考答案.docx_第6页
第6页 / 共23页
计算机系统结构参考答案.docx_第7页
第7页 / 共23页
计算机系统结构参考答案.docx_第8页
第8页 / 共23页
计算机系统结构参考答案.docx_第9页
第9页 / 共23页
计算机系统结构参考答案.docx_第10页
第10页 / 共23页
计算机系统结构参考答案.docx_第11页
第11页 / 共23页
计算机系统结构参考答案.docx_第12页
第12页 / 共23页
计算机系统结构参考答案.docx_第13页
第13页 / 共23页
计算机系统结构参考答案.docx_第14页
第14页 / 共23页
计算机系统结构参考答案.docx_第15页
第15页 / 共23页
计算机系统结构参考答案.docx_第16页
第16页 / 共23页
计算机系统结构参考答案.docx_第17页
第17页 / 共23页
计算机系统结构参考答案.docx_第18页
第18页 / 共23页
计算机系统结构参考答案.docx_第19页
第19页 / 共23页
计算机系统结构参考答案.docx_第20页
第20页 / 共23页
亲,该文档总共23页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

计算机系统结构参考答案.docx

《计算机系统结构参考答案.docx》由会员分享,可在线阅读,更多相关《计算机系统结构参考答案.docx(23页珍藏版)》请在冰点文库上搜索。

计算机系统结构参考答案.docx

计算机系统结构参考答案

《计算机系统结构》习题解答

1-3章作业评阅说明

1.作业应按时完成。

缺大题的作业暂不签字,也不记分,退回补做;

2.解题要有主要过程,不能只写最终答数。

含作图内容的题目,图占1/2的分值。

作图形式应模仿教材中的例题,不能随意画(比如3.19题(4)问的实存状况图必须标示出应有的“*”号);

3.凡是计算题,得数应该是一个具体的数字,而不能只列一个算式;

4.今后的作业都要注意格式规范,考试更是如此。

Sn

20

1

01Fe

1.12已知Se=20,求作Fe-Sn关系曲线。

将Se代入Amdahl定律得

1.15已知两种方法可使性能得到相同的提高,问哪一种方法更好。

(1)用硬件组方法,已知Se=40,Fe=0.7,解出Sn=40/12.7≈3.1496(两种方法得到的相同性能)

(2)用软件组方法,已知Se=20,Sn=40/12.7,解出Fe=27.3/38≈0.7184(第二种方法的百分比)

(3)结论:

软件组方法更好。

因为硬件组需要将Se再提高100%(20→40),而软件组只需将Fe再提高1.84%(0.7→0.7184)。

1.19由各种指令条数可以得到总条数,以及各百分比,然后代公式计算。

(1)

(2)

(3)

2.3(忽略P124倒1行~P125第8行文字,以简化题意)已知2种浮点数,求性能指标。

此题关键是分析阶码、尾数各自的最大值、最小值。

原图为数据在内存中的格式,阶码的小数点在其右端,尾数的小数点在其左端,遵守规格化要求。

由于尾数均为原码,原码的绝对值与符号位无关,所以最大正数与最小负数的绝对值相同,可用“±最大绝对值”回答;最小正数与最大负数的绝对值相同,可用“±最小绝对值”回答。

第1小问中,阶码全部位数为8,作无符号数看待真值为0~255,作移-127码看待真值为-127~+128;尾数(不计符号位)有23位小数,另加1位整数隐藏位,所以尾数绝对值为1.0~2.0–2-23,有效位数p=24;

第2小问中,阶码全部位数为11,作无符号数看待真值为0~2047,作移-1023码看待真值为-1023~+1024;尾数(不计符号位)有52位小数,另加1位整数隐藏位,所以尾数绝对值为1.0~2.0–2-52,有效位数p=53。

最大绝对值为最大阶码与最大尾数绝对值的组合,最小绝对值为最小阶码与最小尾数绝对值的组合。

代入相关公式后得最终结果如下表。

32位

64位

±最大绝对值

±(1-2-24)·2129

±(1-2-53)·21025

±最小绝对值

±2-127

±2-1023

表数精度δ

2-24

2-53

表数效率η

100%

100%

注:

如果修改题目,将1、2小问的尾数规定为纯小数(即1位隐藏位是小数点后第1位),则尾数真值降为原值的1/2,全部结果改为下表。

32位

64位

±最大绝对值

±(1-2-24)·2128

±(1-2-53)·21024

±最小绝对值

±2-128

±2-1024

表数精度δ

2-24

2-53

表数效率η

100%

100%

2.13已知10条指令使用频度,求3种编码方法的平均码长与信息冗余量。

(1)此问中的“最优Huffman编码法”实际是指码长下限,即信源的平均信息量──熵,代公式得H=2.9566。

(2)Huffman编码性能如下表;

(3)2/8扩展编码是8/64/512法的变种,第一组2条指令,码长为2(1位扩展标志,1位编码),第二组8条指令,码长为4(1位扩展标志,与第一组区别,加3位编码),编码性能如下表;

(4)3/7扩展编码是15/15/15法的变种,第一组3条指令,码长为2(共有4种组合,其中3种组合分别代表3条指令,留1种组合作为扩展前缀标志),第二组7条指令,码长为5(2位固定的前缀扩展标志,与第一组区别,加3位编码,只用其中7种组合),编码性能如下表。

Huffman编码

2/8扩展编码

3/7扩展编码

平均码长L

2.99

3.1

3.2

信息冗余量R

1.10%

4.61%

7.59%

3.3直接代公式计算存储层次性能指标。

(1)74ns,38ns,23.6ns

(2)0.258,0.315,0.424(单位:

美元/K字节,换算成美元/字节还要除以1024)

(3)T64K>T128K>T256K

c64K

(4)19.092,11.97,10.0064。

答:

256K方案最优。

3.19中(3)(4)(6)(8)问

虚存实页0123

虚组000√√

1实存1√√

虚组12·0实组02√√

3·1虚3√√

虚组24·2实组1页4√√

5·35√√

虚组366√√

77√√

(a)虚页集合与实页集合的对应关系(b)对应关系表(√为有关系)

(3)

(4)通过作“实存状况图”模拟各虚块的调度情况,可获得Cache的块地址流序列。

P=

6

2

4

1

4

6

3

0

4

5

7

3

C0

4

4*

4

4

4

4*

4

4*

4*

4*

C1

1

1*

1*

1*

0

0*

5

5

5

C2

6

6*

6*

6*

6*

6

6*

6*

6*

6*

7

7*

C3

2

2

2

2

2*

3

3

3

3

3*

3

C=

2

3

0

1

0

2

3

1

0

1

2

3

此问最容易出错的地方是忽略“组相联”地址约束,将虚页装错实组。

另外没有及时标注“*”号也容易导致淘汰对象错误。

(6)H=4/12≈33%

(8)做法同3.15题(3)问,Hcell=(12×16-8)/(12×16)≈95.8%

时间中断请求主程序1级2级3级4级

D1,D2

D3,D4

4.5已知中断服务次序为3-2-4-1

(1)中断屏蔽字表如下图;

D1

D2

D3

D4

D1

0

1

1

1

D2

0

0

1

0

D3

0

0

0

0

D4

0

1

1

0

(2)中断过程示意图如右图。

4.8

(1)f=2×105字节/秒,T=5µs

(2)Ts+Td=5µs,通道时间图如下。

作图时注意:

至少要画到最慢设备的第二次请求出现,才能确定是否丢失数据(因为响应优先级低的设备较易丢失数据)。

设优

备先

号级

D11

D24

D32

D43

时间

(µs)0102030405060708090100110120130140150160170

(3)5,未处理D2第一次服务请求(即“无”。

答160也可),20,40

(4)D2丢失第一次请求的数据;

(5)增加通道的最大流量,动态改变设备的优先级,增加一定数量的数据缓冲器(教材P245)。

F=A1×B1+A1×B1+A1×B1+A1×B1+A1×B1+A6×B6

123456

789

10

11

(a)计算顺序二叉树

5.9为了缩短运算时间,首先应考虑“最少切换算法”,即先执行完所有乘法(任务编号1-6)再执行加法(任务编号7-11),其次在加法中采用“最少相关算法”(即二叉树算法)。

右图(a)是计算顺序二叉树,其中任务1-6是乘法,任务7-11是加法。

注意任务10应该用前一级最早完成的任务7和8的结果,如果用任务9的结果则要推迟1拍启动,使总时间增加1拍。

右图(b)是时空图,由它得

TP=11/(22Δt)=1/(2Δt)

S=(6×4Δt+5×4Δt)/(22Δt)=2

E=(6×4Δt+5×4Δt)/(6×22Δt)=1/3

6

5

4

3

2

1

01234567891214151822

(b)时空图

 

5.15Δt=10ns=10-8秒

(1)F={1,2,5},C=(10011)

(2)状态转移图如下图(a)所示。

(3)最小启动循环=(3),最小平均启动距离=3Δt。

(4)插入2个延迟,最小启动循环=

(2),最小平均启动距离=2Δt。

(5)新预约表如下图(b)所示。

(6)F={1,3,7},C=(1000101),状态转移图如下图(c)所示。

(7)插入前TPmax=1/3Δt=1/30ns,插入后TPmax=1/2Δt=1/20ns。

12345678初态4,6,≥8

S1×12×

初态3,4,≥6S2×1×1000101

S3×4,6,≥84,6,≥8

10011S41××25

D1×10101011000111

D2×25

(a)(b)(c)

(8)插入前TP=10/33Δt=1/33ns,插入后TP=10/26Δt=1/26ns,如下图所示。

S4

S3………

S2

S1

3t

(a)插入前9×36

 

D2

D1

S4………

S3

S2

S1

2t

(b)插入后9×28

 

6.6(注意阅读P372倒数第9行-倒数第6行)

已知n=32,k加=6,k乘=7,k访存=6,k倒数=14,启动、输出延迟各1。

求各小题总拍数。

 

 

 

 

 

7.3已知输入端编号13=1101B。

(1)Cube3(1101B)=0101B=5

(2)PM2+3(13)=(13+23)mod16=21mod16=5

(3)PM2-0(13)=(13-20)mod16=12

(4)Shuffle(1101B)=1011B=11

(5)Shuffle(Shuffle(1101B))=Shuffle(1011B)=0111B=7

7.10用混洗―交换网络模拟Cube网。

当模拟Cube0功能时,只需一次交换即可完成;而模拟Cubei且i≠0时,需先作n–i步混洗,再作1步交换,最后作i步混洗才能完成,共计n+1步。

综上所述,下限为1步,上限为n+1步。

7.26

(1)~(3);

(1)见下图实线。

(2)见下图虚线;不会阻塞,因为两条路径的控制信号都是1110,形成级控模式,所以不会阻塞。

(3)一次通过实现的置换数为168=4294967296,全部置换数为N!

=20922789888000,前者约占后者的0.02%。

级3级2级1级0

00000000

00010001

00100010

00110011

01000100

01010101

01100110

01110111

10001000

10011001

10101010

10111011

11001100

11011101

11101110

11111111

7.27

(3)求作超立方体贪心选播树

源结点编号的二进制形式1010在Cube0~Cube3位分别与7、6、5、6个目的结点的二进制形式不同,所以总时间=4(如某一位没有与源结点不同的目的结点,则该维不发送,总时间减少1),并且Cube0方向应该最先发送,Cube2方向最后发送,其它2个方向的发送先后顺序没有限制。

我们可以采用Cube0、Cube1、Cube3、Cube2的发送顺序,生成的选播树如下图所示,总流量=11。

1010

Cube0

10101011

Cube1

1010100010111001

Cube3

10100010100000001011001110010001

Cube2

1010111000100110100011000000010010111111001101111001110100010101

1014268120411153791315

超立方体贪心选播树

8.12问题为S=A1×B1+……+A32×B32,其中T乘=4Δt,T加=2Δt,T传=1Δt。

(1)在串行计算机上,各操作不论是否相关均不能重叠,总时间恒等于各操作单独时间之和,所以不必考虑运算顺序。

T=32·T乘+31·T加=(32×4+31×2)Δt=190Δt

(2)设此双向环可以并行传送(即为“移数环”,因为SIMD系统各种数据操作都能并行)。

按平均分配原则,每个结点内有4对数据。

首先在各结点用串行算法它们的相乘与求和,需时T1=4·T乘+3·T加=(4×4+3×2)Δt=22Δt;

然后用二叉树并行算法将8个结点中的部分和相加(见下图),其中并行加法需3次,每次时间相同,而并行传送3次的每次时间却随距离倍增,依次为1、2、4步,所以有T2=(1+2+4)·T传+3·T加=(7×1+3×2)Δt=13Δt;

总时间T=T1+T2=35Δt

s=s1+s2+s3+s4+s5+s6+s7+s8

①.右传20步

加法1步

②.右传21步

加法1步

③.右传22步

加法1步

 

9.6

解法1:

设处理机甲执行一个任务的时间为R,则处理机乙执行一个任务的时间为2R。

仍记C为一个任务与异机任务的通信时间,K为处理机甲分得的任务数。

参考公式(9.1)得,总时间T=R·max{2(M-K),K}+C(M-K)K

由于

是max函数的转折点,所以T也可写成分段函数

图形如下

TT

2MR2MR

MRMR

02/3MMK02/3MMK

(A)当

时,K=M处最低(B)当

时,K=2/3M处最低

由于二次函数的上凸性,T的最小点只可能位于

或K=M二者之一。

为求临界条件,令

T|K=2/3M=T|K=M,得

,解出

结论:

时,最佳分配参数

时,最佳分配参数

解法2:

设处理机乙执行一个任务的时间为R,则处理机甲执行一个任务的时间为R/2。

仍记C为一个任务与异机任务的通信时间,K为处理机甲分得的任务数。

参考公式(9.1)得,总时间T=R·max{(M-K),K/2}+C(M-K)K

由于

是max函数的转折点,所以T也可写成分段函数

图形如下

TT

MRMR

MR/2MR/2

02/3MMK02/3MMK

(A)当

时,K=M处最低(B)当

时,K=2/3M处最低

由于二次函数的上凸性,T的最小点只可能位于

或K=M二者之一。

为求临界条件,令

T|K=2/3M=T|K=M,得

,解出

结论:

时,最佳分配参数

时,最佳分配参数

9.18问题为S=(A1+B1)×……×(A8+B8),其中T加=30ns,T乘=50ns,T传=10ns。

将加法记为任务1-8,乘法记为任务9-15。

(1)在串行计算机上,同8.12题1问分析,共计15步运算,T=8·T加+7·T乘=(8×30+7×50)ns=590ns。

(2)多功能部件SISD计算机的工作方式可参考P346题18(3)。

为了充分利用加法器与乘法器的可并行性,尽量让加法与乘法交替进行,可自左向右顺序运算(见下图)。

T=2·T加+7·T乘=(2×30+7×50)ns=410ns

15

8147×50ns

A8B8

713乘法910111215

A7B7加法12345678

8×30ns

9

21

A2B2A1B1

(3)同8.12题2问,设单向环可以并行传送(即为“移数环”,理由同8.12题2问)。

12345678102040

2468传送

48乘法505050

8加法30

T=T加+3·T乘+(1+2+4)·T传=(30+3×50+7×10)ns=250ns

[算法改进:

将8对数据的加法由8个结点同时完成(共30ns)改成4个结点分两批完成(共60ns),这样要多花30ns;但由于结果在4个结点中,其后的累乘就只需要做2次传输,距离分别是1步、2步,省去了原来最费时间的第3次传输(4×10ns=40ns),收支相抵之后还省下了10ns,实际用240ns。

一般原则:

对于传输时间随距离上升的网络来说,如果二叉树并行算法的末尾的一次传输时间大于一次运算时间,就把n对数据改存于n/2甚至n/4个结点中,以增加运算次数的代价来换取减少长距离传输的收益。

其判决条件就是“传输时间vs运算时间”。

]

(4)在全互连网络上,任意两个结点之间的距离均为1步,所以任何置换都能在1步完成,故

101010

传送

乘法505050

加法30

T=T加+3·T乘+(1+1+1)·T传=(30+3×50+3×10)ns=210ns

9章加1题:

采用由4个PE和以太网(一次只允许发送一个数据)组成的多处理机计算下式:

A1×B1+……+A32×B32,每个PE完成一次乘法、加法、发送数据均需一个单位时间(接收数据不占用PE时间)。

(1)画出最快算法的计算树;

(2)画出最快算法的时空图;

(3)写出最快算法所需时间;

(4)写出串行算法(即只使用一个PE)所需时间;

(5)求加速比。

解:

(1)计算树;

(2)时空图;

S=S1+S2+S3+S4处理机

P4

P3

P2

P1

(8+7)Δt4Δt时间

其中S1表示求和操作

,S1在P1内顺序完成。

S2~S4的处理方法相同。

(3)并行算法时间;T=15Δt+4Δt=19Δt

(4)串行算法时间;T=32Δt+31Δt=63Δt

(5)加速比:

S=63Δt/19Δt≈3.32

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 医药卫生 > 临床医学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2