《计算机系统结构》复习题学习资料.docx
《《计算机系统结构》复习题学习资料.docx》由会员分享,可在线阅读,更多相关《《计算机系统结构》复习题学习资料.docx(14页珍藏版)》请在冰点文库上搜索。
《计算机系统结构》复习题学习资料
《计算机系统结构》复习题
计算机系统结构复习
填空(15*1分),选择(15*1分),简答题(5/630分),综合题(4*10分)
1、从使用语言角度,可将系统按功能划分为多层次机器级结构,层次结构分别是:
应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言机器级和微程序机器级。
2、各机器级的实现主要靠翻译和解释或两者结合进行。
翻译是先用转换程序将高一级机器级上的程序整个地变换成低一级机器级上等效的程序,然后再在低一级机器级上实现的技术。
解释则是在低级机器上用它的一串语句或指令来仿真高级机器上的一条语句或指令的功能,是通过对高级的机器级语言程序中的每条语句或指令逐条解释来实现的技术。
3、计算机系统结构在计算机系统机器级层次中指传统机器级的系统结构。
4、计算机系统结构研究的是软、硬件之间的功能分配以及对传统机器级界面的确定,为机器语言、汇编语言程序设计或编译程序生成系统提供使其设计或生成的程序能在机器上正确运行应看到的遵循的计算机属性。
5、计算机系统结构的属性包括:
1.数据表示、2.寻址方式、3.寄存器组织、4.指令系统、5.存储系统组织、6.中断机构、7.系统机器级的管态和用户态的定义和切换、8.机器级的I/O结构、9.系统各部分的信息保护方式和保护机构等。
6、机器透明性:
指相对于每一机器级设计人员,都客观存在的功能或属性看不到的现象,称相对于此级设计人员来说,这些功能或属性是具有透明性,即透明的。
7、计算机组成指的是计算机系统结构的逻辑实现,包括机器级内部的数据流和控制流的组成以及逻辑设计等。
它着眼于机器级内部各事件的排序方式与控制机构、各部件的功能及各部件间的联系。
8、计算机组成设计要解决的问题是在所希望达到的性能和价格下,怎样更好、更合理地把各种设备各部件组织成计算机,来实现所确定的系统结构。
9、当前,计算机组成设计主要是围绕提高速度,着重从提高操作的并行度、重叠度,以及功能的分散和设置专用功能部件来进行的。
10、计算机组成设计要确定的方面一般应包括:
1.数据通路宽路、2.专用部件的设置、3.各种操作对部件的共享程度、4.功能部件的并行度、5.控制机构的组成方式、6.缓冲和排队技术、7.预估预判技术、8.可靠性技术等。
11、计算机实现指计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,器件、模块、插件、底板的划分与连接,专用器件的设计,微组装技术,信号传输,电源、冷却及整机装配技术等。
它着眼于器件技术和微组装技术,其中,器件技术在实现技术中起着主导作用。
13、软、硬件取舍的三个基本原则是:
(1).考虑在现有硬件、器件(主要是逻辑器件和存储器)条件下,系统要有高的性能价格比,主要从实现费用、速度和其他性能要求来综合考虑。
(2).考虑到准备采用和可能采用的组成技术,使它尽可能不要过多或不合理地限制各种组成、实现技术的采用。
(3).从“软”的角度考虑如何为编译和操作系统的实现以及为高级语言程序的设计提供更多更好的硬件支持。
14、程序在系统上运行的时间应该是衡量机器时间(速度)性能最可靠的标准。
15、计算机性能通常用峰值性能及持续性能来评价。
峰值性能是指在理想情况下计算机系统可获得的最高理论性能值,它不能反映出系统的实际性能。
16、持续性能的表示有算术性能平均值、调和性能平均值和几何性能平均值三种。
17、算术性能平均值通常对系统执行时间评价;调和性能平均值与运行全部程序所需的时间成反比,比较准确地衡量计算机的时间(速度)性能;几何性能平均值是对不同机器进行性能比较时,可以对性能采取归一化,即可以以某台机器性能作为参考标准,让其他机器的性能与参考标准去比,不论哪台机器作参考机,几何性能平均值均能正确地反映出结果的一致性。
18、计算CPU的程序执行时间Tcpu有3个因素,即程序执行的总指令条数IC、平均每条指令的时钟周期数CPI、主时钟频率fc。
19、MIPS是机器单位时间执行指令的条数。
它与时钟周期数CPI有关,CPI越少,MIPS就越高,一定程度上反映机器的性能越好。
MIPS很大程度依赖于机器的指令系统,用它很难准确衡量指令系统不同的机器之间的性能。
因此MIPS只能用于比较相同机器指令系统的计算机之间的性能。
即使是同一台机器,程序不同,其CPI也不同,其性能的差异会很大。
其次MIPS还与机器硬件有关,如浮点运算部件的机器,虽MIPS很低,但浮点运算速度会很高,而在软件实现浮点运算机器上,MIPS虽然很高,但浮点运算速度可能很低。
MFLOPS只能反映机器执行浮点操作的性能,并不能反映机器的整体性能。
20、简述Amdahl定理?
答:
系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。
Told:
没有采用改进措施前执行某任务的时间
Tnew:
采用改进措施后执行某任务的时间
Sp:
加速比(系统改进后的性能与未改进时的性能的比值)Sp=Told/Tnew
Fe:
计算机执行某个任务的总时间中可被改进部分的时间所占比例。
rnew:
改进部分采用改进措施后比没有采用改进措施的性能提高倍数。
(部件加速比)
21、程序访问的局部性包括时间上和空间上的两个局部性。
22、什么是时间上的局部性?
指最近将来要用到的信息很可能就是现在正在使用的信息,这是因为程序存在着循环。
23、什么是空间上的局部性?
指最近将来要用到的信息很可能与现在正在使用的信息在程序位置上是邻近的,这是因为指令通常是顺序存放、顺序执行的,数据也通常是以向量、阵列、树、表等形式簇聚地存放在一起。
24、系统结构的差异决定软件的移植工作量,要实现软件移植工量小,常采用三种方法来实现:
统一高级语言、采用系列机、模拟和仿真。
25、模拟是指?
仿真是指?
B机器的每条机器指令用A机器一段机器语言程序解释,如同A机器上也有B机器的指令系统一样,这种用机器语言程序解释实现软件移植的方法称为模拟.进行模拟的A机器称为宿主机,被模拟的B机器称为虚拟机.
用微程序直接解释另一种机器指令系统的方法就称为仿真。
进行仿真的机器称为宿主机,被仿真的B机器称为目标机。
为仿真所写的解释程序称为仿真微程序。
26、多级存储体系的采用是依据_局部性原理_原理建立,且存储速度提高,但存储体价格下降。
27、B机上的每条指令都由A机上的一段微程序解释执行称为仿真。
28.流水线分为静态流水线和动态流水线。
静态:
某一时间内各段只能按同一种功能连接流水。
动态:
同一时间内可按不同运算或功能连接。
29、衡量浮点操作的指标是MFLOPS,衡量指令执行速度的指标是____MIPS____。
30、指令系统设计的两大典型风格是___CISC___和____RISC___________。
31、克服流水中的瓶颈段的两种方法是:
瓶颈流水段的细分和瓶颈流水段的重复。
32、流水线中出现的3种相关是:
结构相关,数据相关,控制相关。
33、系统结构的差异决定软件的移植工作量,避免软件移植瓶颈,常采用三种方法来解决,三种方法是统一高级语言、采用系列机、模拟和仿真。
34、向量的处理三种方式有:
(1)横向处理方法;
(2)纵向处理方法;(3)纵横向处理方法。
35、处理器间采用单向环网时的互连函数是:
PM2+0或PM2-0。
36、以硬件为基础实现多Cache(缓存)一致性方法有:
写作废法、写更新法、目录表法。
37、编址方式常分为三种,它们是___隐含编址__,__独立编址__和统一编址。
38、阵列处理机的基本结构分为两种:
(1)分布式存储器的阵列机;
(2)共享存储器的阵列机。
39、程序并行性相关性有三种,即数据相关、数据反相关、数据输出相关。
40.寻址方式的三种面向:
面向主存,面向寄存器,面向堆栈。
41.指令系统的特性:
1.规整性;2.对称性;3.独立性和全能性;4.正交性;5.可组合性;6.可扩充性
42.中断的响应次序是在同时发生多个不同中断类的中断请求时,中断响应硬件中的排队器所决定的响应次序。
43.中断的处理次序
46、数据表示指的是能由机器硬件直接识别和引用的数据类型。
数据结构是要通过软件映像,变换成机器中所具有的数据表示来实现的。
数据表示和数据结构是软,硬件的交界面。
47、自定义数据表示包括标志符数据表示和数据描述符两类;
高级数据表示:
自定义数据表示,向量数组数据表示,堆栈数据表示。
48、在指令系统设计、发展和改进上,RISC采用:
通过减少指令种数和简化指令功能来降低硬件设计的复杂度,提高指令的执行速度。
49、在指令系统设计、发展和改进上,CISC采用:
进一步增强原有指令的功能以及设置更为复杂的新指令取代原先由软件子程序完成的功能,实现软件功能的硬化。
51、流水线的表示法有三种:
连接图法、时空图法、预约表法。
52、定向技术法的基本思想:
如果后续指令要使用前面指令的运算果值,则通过硬件专门电路将该运算结果提前传送到有关缓冲寄存器,使后续指令得以不停顿地进入流水线。
53、衡量流水线性能的主要指标有:
吞吐率、加速比和效率。
54.I/O系统的三种控制方式:
a.程序控制I/O(包括全软的,程序查询的,中断驱动的)
b.直接存储器访问(DMA)
c.I/O处理机方式(通道方式,外围处理机方式PPU)
55.标量流水机全局性相关的处理:
(1)使用猜测法。
(2)加快和提前形成条件码。
(3)采取延迟转移。
(4)加快短循环程序的处理。
55.指令系统的发展和改进:
P64简答题
CISC可分别从面向目标程序,面向高级语言,面向操作系统的优化实现三个方面来叙述。
RISC:
逻辑采用硬联和微程序相结合;在CPU中设置大量工作寄存器并采用重叠寄存器窗口。
56.RISC重叠寄存器窗口的作用:
(1).减少访存,尽量让指令在寄存器之间进行,提高执行速度,缩短指令周期,简化寻址方式和指令格式。
(2).更简单有效的支持高级语言中大量出现的过程调用,减少过程调用中为保存主调过程现场,建立被调过程新现场,以及返回时恢复主调过程现场等所需的辅助操作。
(3).更简单,直接地实现过程中的参数传递。
57.设计RISC机器的一般原则及可采用的基本技术是哪些?
设计RISC机器的一般原则:
1.精简指令的条数;2.简化指令的格式,让指令字等长,并让所有指令都在一个机器周期执行完;3.扩大机器中通用寄存器的个数,只让存取两类指令可以访问,其他的指令一律只能对寄存器进行操作;4.指令的实现以组合电路硬联实现为主,少量指令可采用微程序解释;5.精心设计高质量的编译程序来优化支持高级语言程序的实现。
设计RISC机器的基本技术:
1.按设计RISC机器的一般原则来精选和优化设计指令系统;2.逻辑上采用硬联组合电路为主,适当辅以微程序控制来实现;3.在CPU内设置大量的寄存器,并采用重叠寄存器组的窗口;4.指令采用重叠和流水的方式解释,并采用延迟转移;5.采用高速缓冲存储器Cache缓冲指令和数据。
56、将下面程序改写成不存在数据相关的形式?
Z=0
DO10I=1,64
X(I)=X(I)+Y(I)
Z=Z+X(I)
10CONTINUE
57、简述计算机系统结构、计算机组成和计算机实现的定义和相互关系?
答:
计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性。
所谓外特性,就是计算机的概念性结构和功能特性。
计算机组成:
计算机组成是计算机系统结构的逻辑实现,包括机器内部的数据流的组成以及逻辑设计等。
计算机实现:
是指计算机组成的物理实现。
包括处理机、主存、等部件的物理结构,器件集成度、速度、信号传输等。
相同系统结构,可以有不同的组成;一种组成可以有多种不同的实现方法;采用不同的系统结构会使可以采用的组成技术产生差异;组成也会影响结构。
62、向量流水处理的三种方式:
1.横向处理方式,又称为水平处理方式,横向加工方式等。
向量计算是按行的方式从左至右横向地进行。
2.纵向处理方式,又称为垂直处理方式,纵向加工方式等。
向量计算是按列的方式自上而下纵向地进行。
3.纵横处理方式,又称为分组处理方式,纵横向加工方式等。
横向处理和纵向处理相结合的方式。
63、向量链接技术:
结果寄存器可能成为后继指令的操作数寄存器,两条有数据相关的向量指令并行执行,这种技术称为两条流水线的链接技术
64、实现链接的条件
(1)没有向量寄存器冲突和运算部件冲突。
(2)只有第一个结果送入向量寄存器的那一个周期可以链接。
(3)先行的两条指令产生运算结果的时间必须相等。
(4)两条向量指令的向量长度必须相等。
66、PM2I单级网络的互连函数:
。
67、处理器间采用单向环网时的互连函数是:
PM2+0或PM2-0。
68、处理器间采用双向环网时的互连函数是:
PM2+0和PM2-0。
69.开发系统结构中的并行性的途径有时间重叠,资源重复和资源共享等。
70.计算机系统的分类
弗林.按指令流和数据流的多倍性
单指令流单数据流(SISD)
单指令流多数据流(SIMD)
多指令流单数据流(MISD)
多指令流多数据流(MIMD)
71、什么是机群系统?
什么是大规模并行机系统?
72、静态数据流机与动态数据流机主要区别在哪里?
73.VLSI的发展与应用,对逻辑设计方法产生了什么影响?
举例说明器件发展是推动系统结构发展的关键因素。
器件的发展使逻辑设计已由过去传统的逻辑化简,转变成强调在满足系统结构所提出的功能要求前提下,如何能用上大批量生产的高集成度片子,提高其系统效能,缩短其研制周期,降低其生产成本。
计算机的设计也已从过去只进行全硬的逻辑设计发展到现在所用的软硬结合方法进行计算机的辅助设计和辅助制造。
74.简要列出集中式串行链接/定时查询/独立请求三种总线控制方式的优缺点。
同时分析硬件产生故障时通信的可靠性。
A.串行链接方式的优点:
1.选择算法简单,用于解决总线控制分配的控制线的线数少,只要3根,切不取决于部件的数量;2.部件的增减容易,只需简单地把它连到总线上或从总线上去掉即可,可扩充性好;3.逻辑简单,容易通过重复设置提高可靠性。
缺点:
1.对“总线可用”线及其有关电路的失效敏感;2.由于优先级是线连固定,不能由程序改变,不灵活;3.受总线长度的限制,增减或移动部件也受到限制。
B.定时查询方式的优点:
1.计数器初值,部件号均可由程序设定,优先次序可由程序控制,灵活性强;2.不会因某个部件失效而影响其他部件对总线的使用,可靠性高。
缺点:
1.控制线的数量多,需2+[1bN]根;2.可以共享总线的部件数受限于定时查询线的线数(编址能力),扩展性稍差;3.控制较为复杂;4.总线分配的速度取决于计数信号的频率和部件数,不能很高。
C.独立请求方式的优点:
1.总线分配速度快,所有部件的总线请求同时送到总线控制器,不用查询;2.控制器可以使用程序可控的预定方式,自适应方式,循环方式或他们的混合方式灵活确定下一个使用总线的部件;3.能方便的隔离失效部件的请求。
缺点:
控制线数量过大,为控制N个设备必须有2N+1根控制线,而且总线控制器要复杂得多。
75.引入数据表示的原则(P43)
原则一看系统的效率是否显著提高,包括实现时间和存储空间是否有显著减少,实现时间是否减少又主要看在主存和处理机之间传送的信息量是否减少。
传送的信息量减少,实现时间就越少。
原则二看引入这种数据表示后,其通用性和利用率是否提高。
如果只对某种数据结构的实现效率很高,而对其他数据结构的实现效率很低,或者引入这种数据表示在应用中很少用到,那么为此所耗费的硬件过多却并未在性能上得到好处,必然导致性能价格比的下降。
P33习题16,7,10,11第一章Amdahl定理(大题1个)
P79习题29,10,11,12(第二章哈夫曼编码,大题1个)
P109习题35,6,8
第三章P89中断屏蔽位设置(大题1个)
P195习题56,11
第五章P185流水线预约表及状态图(大题1个)
P200习题61,2,5
第六章P200链接图会画(大题1个)
40、有两台机器,它们对条件转移指令的处理采用不同的设计方案:
(1)CPUA采用一条比较指令来设置相应的条件码,由紧随其后的一条转移指令对此条件码进行测试,以确定是否进行转移。
因此实现一次条件转移要执行比较和测试两条指令。
(2)CPUB采用比较和测试两种能合在一条指令的方法,这样实现条件转移只需一条指令。
假设在这两台机器的指令系统中,执行条件转移指令需2个时钟周期,而其他指令只需1个时钟周期。
又假设CPUA中,条件转移指令占总执行指令条数20%。
由于每条转移指令都需要一条比较指令,所以比较指令也将占20%。
由于CPUB在转移指令中含了比较功能,因此它的时钟周期就比CPUA要慢25%。
问CPUA和CPUB哪个工作速度要快些?
41、假设FPSQR操作占整个测试程序执行时间的20%。
改进的一种方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍。
另一种方法是使FP指令的速度提高到2倍,FP指令占整个执行时间的50%。
比较两个设计方案。
42、假设要将某一执行部件改进后速度提高10倍,改进后被改进部件执行时间占系统总运行时间的50%.问改进后,获得的加速比Sp是多少?
43、假设Cache的工作速度是主存的5倍,且Cache被访问命中的概率为90%.问:
采用Cache后,能使整个存储系统获得多高的加速比?
44、为提高某计算机运算速度,决定增加向量处理部件.此时处理向量的速度比其通常的运算速度要快20倍.现定义向量处理部件运算的时间占总时间的百分比称为可向量化百分比.
(1)求出加速比和可向量化百分比之间的关系.
(2)若要得到加速比为2.5,可向量化百分比是多少?
45、某计算机Cache能存放2000条指令.假设10%的指令承担了90%时间的指令访问,且知这10%指令中每条指令的执行时间相同.如果要执行的某程序共50000条指令,且已知其中的10%是频繁使用的.问:
当计算机执行该程序时,在Cache中能访问到的指令会占多少百分比?
58、下列5条指令组成的程序在一台3段流水线处理机上执行,每一流水段上都有相关检测和分解。
这3个流水段是取指令IF、取操作数OF(一个或多个)、执行EX(包括写回)。
程序中ACC为累加寄存器,M为存储器。
请画时时空图说明:
(1)在程序执行中所有可能出现的相关情况,
(2)避免相关发生的调度方法。
INCR0;R0←(R0)+1
MVLACC,R0;ACC←(ACC)*(R0)
STRR1,ACC;R1←(ACC)
ADDACC,R0;ACC←(ACC)+(R0)
STAM,ACC;M←(ACC)
59、在一台流水线处理机上执行下面程序。
I1SUBR0,R0;R0←0
I2LOADR1,#8;R1←向量长度8
I3Loop:
LOADR2,A(R1);R2←A向量的第1个元素
I4MULR2,R1;R2←(R2)*(R1)
I5ADDR0,R2;R0←(R0)+(R2)
I6DNER1Loop;R1←(R1)-1,若(R1)≠0转向Loop
I7STORER0,M(x);保存结果
每条指令都要经过“取指”、“译码”、“执行”、“写结果”4个流水段,每个流水段延迟都是5ns。
但在“执行”流水段LS部件和ALU部件只能其中一个工作,其中LS部件完成LOAD和STORE操作,ALU部件完成其他操作。
这两个操作部件的输出端和输入端有直接输出通路相互切换连接,且ALU部件产生的条件码也直接送入控制器。
假定采用静态分支预测技术,每次都预测转移不成功。
要求:
(1)画出指出指令流水线的时空图(中间部分可省略,图中可用指令序号表示)
(2)计算流水线的吞吐率和加速比,并分别计算译码部件和ALU部件的使用效率。
60、一条有4个流水段的非线性流水线,每个流水段的延迟时间都相等,它的预约表如下图:
时间
流水段
1
2
3
4
5
6
7
S1
X
X
S2
X
X
S3
X
X
S4
X
(1)写出流水线的禁止向量和初始冲突向量;
(2)画出调度流水线的状态图;
(3)求流水线的最小启动循环和最小启动距离;
(4)求平均启动距离最小的恒定循环。
(5)按最小启动距离调度任务时,有10个任务进入流水,画出时空图,计算实际吞吐率。
61、在一个5段的流水线处理机上需经9拍才能完成一个任务,其预约表为:
时间
流水段
t0
t1
t2
t3
t4
t5
t6
t7
t8
S1
V
V
S2
V
V
S3
V
V
V
S4
V
V
S5
V
V
分别写出禁止表,冲突向量C;画出流水线状态转移图,求出最小平均延迟及流水线的最大吞吐率、调度方案。
按此流水调度方案输入6个任务,求实际吞吐率。
65、向量处理机上用4条向量指令完成如下计算:
E:
=A*(B+C)+D
LDV0,M(A);V0←存储器A向量
ADDVV3,V1,V2;V3←V1+V2
MULVV4,V0,V3;V4←V0*V3
ADDVV6,V4,V5;V6←V4+V5
假设V1、V2、V5向量寄存器已分别存放向量B、C、D,向量长度N=32,两个浮点功能部件执行时间为加法6拍,乘法7拍;存储器取数6拍;数据进入和流出功能部件(包括寄存器)为1拍。
(1)分析指令序列,如果能链接,画出向量链接图。
(2)计算指令组全部完成所需的时间。