循环展开及指令调度Word格式文档下载.docx-资源下载

循环展开及指令调度Word格式文档下载.docx

1、记录执行过程中各种相关发生的次数以及程序执行的总时钟周期数；（3）将循环展开3次，将4个循环体组成的代码代替原来的循环体，并对程序做相应的修改。然后对新的循环体进行寄存器换名和指令调度；（4）用winMIPS64运行修改后的程序，记录执行过程中各种相关发生的次数以及程序执行的总时钟周期数；（5）根据记录结果，比较循环展开、指令调度前后的性能。实验步骤1）代码：divff2,f5,f6f1,f2,f6f3,f1,f5f0,f4,f7addff14,f0,f6f15,f5,f7multff20,f4,f6f21,f5,f72）设置运算部件个数以及运算时钟周期数图1 图2. Pipeline

2、图以下为出现的数据相关图3先写后读相关图4由于只有两个除法部件，所以出现了功能部件的冲突。总的执行周期是38指令调度后代码：将无关指令放在一起执行，相关指令分开尽量避免数据相关f2,f5,f6f21,f5,f7f1,f2,f6f3,f1,f5f0,f4,f7f14,f0,f6图5.Pipeline图图6.Statistics图总执行时钟周期为35个。（6）指令调度后，数据相关减少了，总时钟周期数减少了，效能提高了。调度前的时钟周期数为38，调度后的时钟周期数减少为35，加速比=38/35=1.08带循环指令代码：求四个1相加的和，结果存在r2中 .text .global main mai

3、n: addi r1,r0,#4 addi r2,r0,#0Loop: sgt r3,r1,r0 bnez r3,Sub1 trap 0 Sub1: addi r2,r2,#1 subi r1,r1,#1 j Loop 结果：总时钟周期是42个，5 raw stalls,循环了4次，结果r2 =4 图7循环展开： addi r1,r0,#4 addi r2,r0,#0 addi r2,r2,#1 subi r1,r1,#1 subir1,r1,#1 trap0总时钟周期是15个，0rawstalls,执行了4次，结果r24 图8原因的对比：是因为LOOP指令执行完后会有一个nop指令的延迟。

4、图9多Cache一致性：实验目的1、加深对多CACHE一致性的理解。2、进一步掌握解决多CACHE一致性的目录协议和监听协议的基本思想。3、掌握在各种情况下，目录协议和监听协议是如何工作的。给出进行操作的类型以及CACHE块状态的变化情况模拟器使用方法简介（目录式）该模拟器模拟4个CPU（A、B、C、D）访存的工作过程。每个CPU中都有一个Cache，该Cache包含有4个块，其块地址为0-3。分布式存储器中有32个块，其块地址为0-31。每个块状态用色块表示，其中灰色为“无效”状态，淡青色为“共享”状态，橘红色为“独占”。主存中块的状态由其右边的目录项的颜色来表示，未缓冲状态由黄色来表示

5、，其他两种状态同Cache块。对于每一个CPU都可以指定所要进行的访问是读还是写（从列表中选），并在输入框中输入所要访问的主存块号，然后用鼠标单击在其右边的标有“”的按钮，模拟器就将开始演示该访问的工作过程。图10 模拟器简介（监听协议）集中共享存储器中有32个块，其块地址为0-31。图11实验步骤（目录协议）对于以下访问序列，写出目录协议所进行的操作。所进行的访问目录协议所进行的操作CPU A读第6块1读;2.不命中;3本地:向宿主结点发读不命中（A，6）消息；4.宿主：把数据块送给本地结点；5.共享集合为：ACPU B读第6块1 读；2.不命中；3. 本地:向宿主结点发读不命中（B，

6、6）消息；4宿主：把数据块发送给本地结点；A+BCPU D读第6块1读；向宿主结点发读不命中（D，6）消息；A，B+DCPU B写第6块1写；2.命中；向宿主结点发写命中（，6）消息，宿主：向远程结点A发作废（6）消息，宿主：向远程结点D发作废（6）消息； 4.共享集合为： BCPU C读第6块1读；向宿主结点发读不命中（C，6）消息；给远程结点发取数据块（6）的消息；5.远程：把数据块送给宿主结点；6.宿主：7.共享集合为：B+CCPU D写第20块向宿主结点发写不命中（D，20）消息； 5.共享集合为： DCPU A写第20块向宿主结点发写不命中（A，20）消息；给远程结点发送取并作废（2

7、0）消息；把数据块送给宿主结点把Cache中的该块作废；CPU D写第6块向宿主结点发写不命中（D，6）消息；向远程结点发作废（6）消息；5.宿主：DCPU A读第12块3.本地：向被替换块的宿主结点发写回并修改共享集（A，20）消息；4.本地：向宿主结点发写不命中（A,20）消息；6.共享集合为：实验步骤（监听协议）对于以下访问序列，写出监听协议所进行的操作。是否发生替换是否发生写回监听协议所进行的操作CPU A读第5块否读;不命中;读不命中;数据送回CPU B读第5块CPU C读第5块CPU B写第5块发生写,命中;作废A,C中的数据5，CPU D读第5块写回;CPU B写第21块写;写不命中;用数据21替换原来的数据5CPU A写第23块CPU C写第23块替换;CPU B读第29块替换实验环境windows实验结果与分析a）指令调度技术可以明显的优化指令执行的效率，通过指令调度使得功能部件被尽可能的充分使用，从而进一步加强指令执行的效率；b）循环在执行时会出现不同循环次数的执行过程中出现相关，导致数量增加，通过寄存器换名等方法，使得这种相关性数量下降。教师评语注：可根据实际情况加页

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？