关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx

上传人:b****2 文档编号:5082426 上传时间:2023-05-04 格式:DOCX 页数:25 大小:562.01KB
下载 相关 举报
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第1页
第1页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第2页
第2页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第3页
第3页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第4页
第4页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第5页
第5页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第6页
第6页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第7页
第7页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第8页
第8页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第9页
第9页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第10页
第10页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第11页
第11页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第12页
第12页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第13页
第13页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第14页
第14页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第15页
第15页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第16页
第16页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第17页
第17页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第18页
第18页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第19页
第19页 / 共25页
关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx_第20页
第20页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx

《关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx(25页珍藏版)》请在冰点文库上搜索。

关于FPGA的外文文献翻译中英文翻译Word文档下载推荐.docx

本文介绍了通用的地点和路线(VPR)工具,设计很灵活,足够让许多FPGA架构的比较VPR可以执行的位置,要么全球路由或合并后的全球详细路由。

这是公开的www.eecg.toronto.edu/〜jayar/软件。

为了使FPGA体系结构的比较有意义,它是至关重要的CAD工具用于将每个电路架构,以地图的高品质展现。

路由相优于所有的VPR在查看FPGA的路由器方面,任何标准基准测试的结果都可用,并且指出VPR的砂矿和路由器的组合胜过所有出版的FPGA布局和布线工具。

本文结构如下:

在第2节我们描述了一些VPR功能的FPGA架构和围与它可能被使用的地方。

在第3和第4节,我们描述了布局布线法。

在第5节讲述了比较有必要的VPR曲目数量和该电路成功的布线所要求的其他已发表的工具。

在第6节得出了我们的结论,并提出一些VPR将来的升级。

2概述VPR

图1概括了VPR的CAD流程。

VPR投入到由一个technologymapped网表和一个文本文件描述了的FPGA架构中。

VPR可以放置电路,或一个预先存在的位置,可以读入VPR可以执行或者是全局的路线或合并后的全球/详细的安置途径。

VPR的输出由布局、布线和统计组成,评估一项有用的工具FPGA架构,如路由线长,跟踪计数最大净长度。

给出一些可指定的建筑结构参数描述文件:

•逻辑块输入和输出的数量,

•对每个逻辑块的输入和输出端访问(S)之和

•逻辑等价性不同的输入和输出引脚(例如,所有对照表输入功能当量),

•对I/成一行或一列的FPGA适合O引脚数,

•逻辑块阵列的尺寸(如23×

30的逻辑块)。

此外,如果全球路由要执行,你也可以指定:

•横向和纵向通道的相对宽度之和

•在不同区域的FPGA的渠道相对宽度。

最后,如​​果合并后的全球和详细的路由被执行,一个也会进行求值:

•开关块[1]架构(即为何路由曲目是相互关联的),

•曲目,每个逻辑块的输入引脚连接([1]),

•为逻辑块输出FC值,

•对I/O口FC值。

当前的体系结构描述格式不允许跨越多个领域和多个逻辑块和被列入路由体系结构,但我们目前加入此功能。

添加新的路由架构的功能VPR相对容易,因为VPR使用体系结构描述来创建路由资源图。

每个路由跟踪和建设中的每一个脚成为在这个图中的节点,图边表示为允许的连接。

路由器,图形可视化和统计计算程序都与此路由资源图的工作相关,所以添加新的路由架构功能仅涉及更改的子程序来建设这个图。

虽然VPR最初是岛式FPGA的开发[2,3],它也可以和以行为为基础的FPGA应用[4]。

VPR目前没有能力为目标的层次FPGA的[5],显然增加一个适当的位置和成本函数设计所需的布线资源图形程序将使其能够解决这些问题。

最后,VPR的置图形允许交互式可视化的布局,路由可用资源和互连的可能途径路由资源。

 

VPACK逻辑块包装程序/网络表翻译

VPACK读取一个已经技术映射电路网表格式blif到LUT和触发器,包装成所需的FPGA逻辑LUT和触发器块,并输出在VPR的网表。

VPACK可以针对逻辑块组成一个LUT,如图2所示,因为这是一种常见的FPGA逻辑元件。

VPACK也针对逻辑块包含几个有用的LUT和几个拖动程序,有或没有共享LUT的输入[6]。

这些“clusterbased”逻辑块类似于最近由AlteraFPGA开发的工具类型。

3布局算法

VPR采用模拟退火算法[7]。

我们已经尝试与几个不同的成本函数联系,发现我们称之为线性挤塞的成本函数提供了一个合理的计算时间,最好的结果[8]。

此成本函数的函数形式就是对所有的求和电路中的网进行计算。

对于每一个网,北方新宇和bby指出在其边界框的水平和垂直跨度分别为Q(n)的因数补偿。

边界线长度模型中的实际低估所需的布线,就可以看成超过三个终端网,作为建议[10]。

它的价值取决于净N两端;

Q是对总体1有3个或更少的终端,并慢慢增加了50台网逻辑与上2.79。

贾夫常数x(n)、Ÿ(n)为平均信道容量(在首部)在X和Y方向,分别比较全净边框和成本函数的余量,需要更多的调配路由的领域,FPGA具有窄渠道。

本文中的所有结果的得到,是利用FPGA中的所有通道都有相同的原则。

在这种情况下,贾夫是一个常数,函数的线性阻塞耗费降低到一个包围盒的成本函数。

一个良好的退火算法的必要条件是时间表取得一个合理的高品质的解决方案与模拟退火的计算时间相关联。

我们已经开发出一种新的退火附表,导致非常高品质的展示位置,并在其中给出退火参数的自动调节功能,不同的成本和电路尺寸。

我们计算在初始温度相同的方式为[11]。

让Nblocks是总数逻辑块加的I/O口电路中的数量。

我们首先创建一个随机安置的电路。

接下来,我们执行Nblocks移动(成对掉期)的逻辑块或I/O口,并计算出不同的成本,这些Nblocks标准偏差配置。

初始温度设定为20倍标准差,确保最初几乎所有的行动是在退火算法围被系统接受。

正如在[12],默认的行为在每个温度都有评价。

这个默认的数字可以在命令行被取代,从而让不同的CPU时间和填筑质量权衡。

减少温度每秒移动数的10倍,例如,加快安置到10倍,并降低了大约只有10%的最终填筑质量。

当温度是如此之高,几乎任何举动都可以被接受时,我们基本上从一个位置随机移动到另一个位置所改善获得的成本都是小成本。

相反,如果动作是很少被接受(因温度当前正处于低位,安置相当高的品质),也有不少改善成本。

有了这个动机,我们提出了一个新的温度更新附表,在温度增加的时间花费在一个重要的小区域上,但不是全部动作都被接受。

如表1:

最后,它表明在[12,13],这是可取的Raccept保证作为近似0.44的量有可能被取值。

为此,就需要利用Raccept值来控制这个围限制器。

块是小于或等于交汇处的值,Dlimit单位除了在X和Y方向尝试。

一个小的Dlimit增加值由Raccept确保这仅仅是块进行交换考虑。

而这些“本地交换“往往导致安置成本相对较小的变化,越来越多被接受的可能性增加。

最初,Dlimit设置为整个芯片。

每当温度降低,Dlimit整个芯片的尺寸为这个结果退火的第一部分,逐渐萎缩退火过程中的中间阶段,并正在为退火低温第1部分最后设计余量,当T退火终止“0.005*成本/Nnets。

该运动的逻辑块总是至少影响到一个网。

当温度高于平均净成本的一个单位时,它是不可能接受任何成本增加的调配结果的,所以我们终止了退火。

4路由算法

VPR的路由器是基于试探谈判的拥塞算法[14,8]。

基本上该算法由最初各条线路的最短路径找到网,无论任何接线段或逻辑块管脚,都可能会导致过度使用。

路由器的迭代过程包含顺序抓取行动和重新路由(由最低成本路径中找到)中的每个电路网。

对使用路由资源成本的函数,其对资源的任何过度使用都会让当前路由发生事先迭代。

通过逐渐增加的多余认购路由资源成本,该算法势力替代路线网,以避免使用超额认购资源,只剩下网最需要一个给定的资源。

对于本文的实验结果,我们设置路由器的最大数量迭代为45,如果电路中路由没有成功,一定数目的目录中45迭代就被假定为不可路由通道的宽度。

为了避免过于迂回路线以节省CPU时间,我们让一个去净路由最外的3个通道的净终端边界框。

一个重要的执行细节值得一提。

无论是原探路者算法和Vpr路由器使用的Dijkstra算法(即一个迷宫路由器[15]),以每个网络连接和AK用线网为依据,路由器调用通道的k-1次执行所有需要的连接。

在第一次调用迷宫路由波从净源扩大,直到它到达任何的K–1值之后。

路径从源到接收器作为现在这个网的路由的第一部分。

波前的迷宫路由被清空,新波前扩展是从整个网络布线开始发出的。

之后的K-1路由器的迷宫调用净终端将所有k值连接。

不幸的是,这种方法需要高扇出网络相当多的CPU时间。

高扇出网络通常跨越大部分或所有的FPGA。

因此,后者调用迷宫路由器的路由部分作为净源会非常大,它将需要相当长的时间以扩大迷宫路由器波前部分到下一个接收器。

幸好,有一个更有效的方法。

当达到净水槽值时,加入所有路由资源分部需要连接水槽和目前的局部路由成本为0的波前(即扩展列表)。

当前不要空迷宫路由波前,只要保证继续扩大正常。

由于增加新的路径路由的部分有一个零成本,由于这项新路径通常相当小迷宫路由器将首先扩大它围,也需要相对较少的时间来添加此新波,如果整个波前扩展了能实现那么下一个接收器将达到的速度远远超过现在。

图3说明了差异图形。

5实验结果

各种FPGA在本节中使用的参数,总是选择与先前参数有明显对比的那些参数。

所得结果在本节获得了逻辑的4输入LUT加上一个触发器组成的块,如图所示在图2。

时钟网和时序电路没有递交,因为它通常是路由通过专用FPGA的商业网络中的路由。

每个LUT的输入出现在一个逻辑块的一面,而逻辑块输出一般访问底部和右侧,如图4。

每个逻辑块的输入或输出连接任何相邻通道(s)(即Fc的=宽)。

每根电线段和其他布线连接到三段,而在通道交叉口(即值=3)和开关箱拓扑是“不相交”这是因为在0磁道接线段只连接在0磁道的其他布线段。

5.1实验结果与输入引脚Doglegs

以往大多数FPGA布线结果认为“输入引脚doglegs”是可能。

如果输入引脚之间的音轨和它连接接线盒的Fc通过独立的SRAM位控制晶体所组成,为了验证两条轨道上的这些开关通过电气连接的可能性。

我们将把这个作为一个输入管脚doglegs。

作为商业化的FPGA,实现从一个输入引脚接线盒到多路通道,只有一个轨道可以连接到输入引脚,使用多路复用器而不是独立通过在FPGA中的晶体管布局来保存相当的面积。

另外,通常有一个缓冲轨道之间的连接块和它连接多路复用这样做的目的是为了提高速度,同时这也意味着缓冲输入引脚doglegs不能被使用。

因此,如果在未来FPGA的路由器测试时没有输入引脚doglegs那么我们必须让输入引脚doglegs和过去​​的结果公平的比较这样是最好的。

在本节中我们比较了所需的最低数目,每一条成功的路径和CAD工具的路由设置。

所有的基准circuits.1在表2给出结果,得到了路由Altor[16],制作了一个基于位置的工具min。

列出三两步(全球和详细)路由与其它路由器进行合并后的全球和详细的路由。

VPR要求比第二,第三最佳路由器降低10%的资源数目,表3列出了音轨需要执行这些标准时数新的CAD工具,同时允许地方和路线的电路的连接。

列出所有电路逻辑快的消息清单。

VPR使用少于13%资源数目的同时,它将执行合并后的全球和详细的路由,世嘉比用于执行详细路由对AAVPR生成全版图走线。

执行安置和全局路由,在试图改善绕线同时需要超过87%以上VPR总资源数目。

最后,让VPR配置电路而不是强迫它使用Altor存来减少资源数目的40%,这表明VPR的模拟退火算法单元远较Altor最小单元更好。

5.2不输入引脚的Doglegs实验

比较了VPR与SPLACE/SROUTE工具,不允许输入引脚doglegs的性能。

当这两个工具都只能使用路线一,比起SROUTE轨道Altor产生的安置需求VPR减少13%,。

当然这些工具都支持允许布局和布线的电路,对于SPLACE/SROUTE组合VPR还需要少29%资源数目。

无论是基于VPR和SPLACE只要是使用模拟退火算法,我们相信VPR单元在一方面优于SPLACE是因为它处理高扇出网络更有效率,让更多的动作进行评估,另一方面是因为它更有效的退火时间表给定的时间。

朗显示对应的拉丁字符的拼音

大电路5.3实验结果

在第5.1和5.2的54至358的逻辑基准块围使用面积计算显然太小,因为这是特殊的FPGA。

因此在本节中我们目前的实验结果,20个最大的MCNC基准电路[27],它的大小围从1047到8383逻辑块。

我们使用Flowmap[28]以技术图每4个LUT和拖动块并为VPACKtocombine拖动块,进入我们的基本逻辑电路块LUT。

I/O引脚数每行或列适合设置为2,符合目前的商业化FPGA。

每个电路被放置在最小的正方形FPGA可以包含它的路由并且输入引脚doglegs是不允许的。

请注意三个基准bigkey,DES和dsip,是padlimited要求在FPGA架构表5比较资源数量的地方,在完全路线电路与全版图围所需地点与路线的电路与数字VPR,然后进行详细的路由世嘉[23]。

表5还给出了大小每个逻辑块的数量计算电路。

在世嘉列中的条目³

仿真无法成功,因为世嘉运行路由存不足。

由VPR增加路由产生的全版图航线曲目总数,有超过所需68%路线的电路主场由VPR路由完全执行。

显然,世嘉处理无法进行。

因为路由大电路当输入引脚doglegs是不允许的。

为了鼓励其它FPGA研究人员公布的结果,以这些大型路由基准,我们发出以下“FPGA的挑战。

”每次验证结果跳动的最好验证先前对这些基准结果公布,我们将每条信息支付1美元给作者(对不起,1元加币。

,而不是1美元),由他们来处理如果减少需要跟踪的总数。

该技术映射网表,由VPR生成和投放位置的目前最全的跟踪路由在www.eecg.toronto.edu/〜jayar/

software.html。

上可以找到

6结论和未来工作

我们已经提出了一个优于所有这类工具的新的FPGA布局布线工具,它让我们可以进行直接的比较。

此外,我们已经提出更大的电路基准测试结果。

建立专门用于描述精密学术的FPGA布局布线工具。

我们希望下一代的FPGACAD工具将优化这些大型基点,因为他们是一系列密切的问题被映射成今天的FPGA。

VPR的主要设计目标之一是保持足够的灵活性,允许工具使用在很多FPGA架构的研究上。

我们目前正进行几个VPR改进,才能进一步提高其在FPGA架构的研究能力。

在不久的将来VPR将支持缓冲和分段路由结构,我们计划增加定时分析仪和时序驱动的路由。

外文原文

VPR:

ANewPacking,PlacementandRoutingToolfor

FPGAResearch1

VaughnBetzandJonathanRose

DepartmentofElectricalandComputerEngineering,UniversityofToronto

Toronto,ON,CanadaM5S3G4{vaughn,jayar}eecg.toronto.edu

Abstract

WedescribethecapabilitiesofandalgorithmsusedinanewFPGACADtool,VersatilePlaceandRoute(VPR).Intermsofminimizingroutingarea,VPRoutperformsallpublishedFPGAplaceandroutetoolstowhichwecancompare.Althoughthealgorithmsusedarebasedonpreviouslyknownapproaches,wepresentseveralenhancementsthatimproverun-timeandquality.WepresentplacementandroutingresultsonanewsetoflargecircuitstoallowfuturebenchmarkcomparisonsofFPGAplaceandroutetoolsoncircuitsizesmoretypicaloftoday’sindustrialdesigns.VPRiscapableoftargetingabroadrangeofFPGAarchitectures,andthesourcecodeispubliclyavailable.Itandtheassociatednetlisttranslation/clusteringtoolVPACKhavealreadybeenusedinanumberofresearchprojectsworldwide,andshouldbeusefulinmanyareasofFPGAarchitectureresearch.

1Introduction

InFPGAresearch,onemusttypicallyevaluatetheutilityofnewarchitecturalfeaturesexperimentally.Thatis,benchmarkcircuitsaretechnologymapped,placedandroutedontotheFPGAarchitecturesofinterest,andmeasuresofthearchitecture’squality,suchasspeedorarea,canthenreadilybeextracted.Accordingly,thereisconsiderableneedforflexibleCADtoolsthatcantargetawidevarietyofFPGAarchitecturesefficiently,andhenceallowfaircomparisonsofthearchitectures.ThispaperdescribestheVersatilePlaceandRoute(VPR)tool,whichhasbeendesignedtobeflexibleenoughtoallowcomparisonofmanydifferentFPGAarchitectures.VPRcanperformplacementandeitherglobalroutingorcombinedglobalanddetailedrouting.Itispubliclyavailablefrom.eecg.toronto.edu/~jayar/software.html.

InordertomakemeaningfulFPGAarchitecturecomparisons,itisessentialthattheCADtoolsusedtomapcircuitsintoeacharchitectureareofhighquality.TheroutingphaseofVPRoutperformsallpreviouslypublishedFPGAroutersforwhichstandardbenchmarksresultsareavailable,andthatthecombinationofVPR’splacerandrouteroutperformsallpublishedcombinationsofFPGAplacementandroutingtools.2Theorganizationofthispaperisasfollows.InSection2wedescribesomeofthefeaturesofVPRandtherangeofFPGAarchitectureswithwhichitmaybeused.InSections3and4wedescribetheplacementandroutingalgorithms.InSection5,wecomparethenumberoftracksrequiredbyVPRtosuccessfullyroutecircuitswiththatrequiredbyotherpublishedtools.InSection6weconcludeandoutlinesomefutureenhancementswhichwillbemadetoVPR.

2OverviewofVPR

Figure1outlinestheVPRCADflow.TheinputstoVPRconsistofatechnologymappednetlistandatextfiledescribingtheFPGAarchitecture.VPRcanplacethecircuit,orapre-existingplacementcanbereadin.VPRcanthenperformeitheraglobalrouteoracombinedglobal/detailedrouteoftheplacement.VPR’soutputconsistsoftheplacementandrouting,aswellasstatisticsusefulinassessingtheutilityofanFPGAarchitecture,suchasroutedwirelength,trackcount,andmaximumnetlength.Someofthearchitecturalparametersthatcanbespecifiedinthearchitecturedescriptionfileare:

•thenumberoflogicblockinputsandoutputs,

•theside(s)ofthelogicblockfromwhicheachinputandoutputisaccessible,

•thelogicalequivale

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 工程科技 > 电力水利

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2