小型特种车辆液压传动系统改进设计.docx
《小型特种车辆液压传动系统改进设计.docx》由会员分享,可在线阅读,更多相关《小型特种车辆液压传动系统改进设计.docx(11页珍藏版)》请在冰点文库上搜索。
小型特种车辆液压传动系统改进设计
小型特种车辆液压传动系统改进设计
小型特种车辆液压传动系统改进设计毕业设计外文资料翻译设计题目:
小型特种车辆液压传动系统改进设计译文题目:
加速汽车设计的InfiniBand正文:
外文资料译文附件:
外文资料原文指导教师评语:
签名:
年月日正文:
加速汽车设计的InfiniBand全文:
版权所有2008年Mellanox技术1.0摘要CAE模拟和分析是非常尖端的应用,它可以使工程师们洞察复杂的现象和实际地调查物理行为。
为了尽可能产生最佳结果,这些模拟解决方案需要高性能的计算平台。
在本文中,我们要对高性能集群在最大限度地提高效率和生产率方面,CAE应用方面,特别在对汽车设计方面的最佳使用进行调查。
1.1简介高性能计算对汽车设计和制造是一种非常重要的工具。
从部件到整车分析,它被应用于计算机辅助工程(CAE技术)。
如:
模拟碰撞,结构完整,散热管理,气候控制,引擎建模,废气,噪音等等。
高性能计算有助于推动加速推向市场,降低成本和巨大的灵活性。
高性能计算的优点就是通过将CPU性能推动到其极限以获得最佳持续工作情况的能力。
在汽车行业大幅度的成本节约和产品改进一直被认为是高性能计算的动机。
为确定车辆安全性的特点,实车碰撞试验的总费用通常会达到二十五万美元或更多。
另一方面,高性能计算集群的成本可以只是单个碰撞测试成本的一小部分,同时提供一个可用于每个模拟测试进行的系统。
除了模拟碰撞,高性能计算还被应用于许多其他方面。
计算密集型系统和应用程序被应用于从气囊部署到刹车冷却,排气系统,热舒适性和可清洗前挡风玻璃的每种模拟。
以高性能计算为基础的模拟和分析使工程师和设计师们能够造出对现实生活环境更完善和安全的汽车。
1.2汽车模拟碰撞汽车设计中最严格的应用就是模拟碰撞(全锋,偏锋,角度,正面,侧面碰撞,尾部撞击和更多)。
在碰撞模拟的发展过程中,虽然其出现非常早,一旦车辆完全建立,其很晚才能被验证。
模拟越先进和复杂,越多的部件和细节便能够被分析。
以计算机为基础的分析提供了一个对在实验中难以收集到的现象的早期认识,并且,只用在较后一阶段和可观的成本。
不必建造昂贵的原型,从而节省时间和金钱。
汽车制造商在整个设计过程增加了对模拟碰撞的依赖程度,同时降低对实际原型的需要,从而实现更快的上市时间与设计阶段更低的成本。
高性能计算集群仅仅使视觉纯虚拟开发和物理原型得以验证。
对于沃尔沃S80车型,1993年至1998年,沃尔沃在设计的过程中完成1000次模拟和使用15个原型。
对于S40/V40系列,1999年至2003年,沃尔沃将模拟增加到6000次和仅使用5个原型。
对于他们的V70N车型,2005年至2007年,沃尔沃完成10000次模拟碰撞,在产品开发中没有使用任何真正的原型,并在模拟碰撞中包含了大量的各种景观,如行人,滑行碰撞,翻滚等等。
高性能计算集群的工作有助于沃尔沃进行复杂的模拟碰撞,并且高性能计算集群的灵活性和可扩展性的使沃尔沃提高了计算能力,以进行更多的模拟和更早的上市。
高性能计算集群是由货架服务器,一个高速互连和一套存储解决方案组成。
互连对总集群的性能和可扩展性有重大影响。
慢互连会造成服务器之间和服务器与存储器之间数据传输的延误,导致计算资源利用不畅和迟钝的模拟执行。
一个需要将CPU周期作为联网进程的一部分的互连,将减少应用程序可用的计算资源,并因此将放慢和限制可以被执行于特定集群的模拟的数量。
此外,这将限制集群的可扩展性,当处理器的数量增加,更高的负担将强加于处理器去处理网络。
InfiniBand,一个由Mellanox技术分发的高速互连,可在服务器之间提供最低的反应时间和最高的吞吐量,所以计算节点之间的通讯将足够快的向CPU提供数据和消除闲散的时间。
此外,InfiniBand被设计的完全地卸载,这就意味着所有的通信将在互连内部被处理,没有CPU的参与。
这进一步保障了当更多的计算资源被必需时扩大线性性能的能力。
1.3多核心集群环境计算集群解决方案是由多核心服务器组成。
一个多核心的环境对集群组件提出了更高的要求,尤其是在集群的连接方面。
在模拟工作执行过程中,每个CPU核心对网络施加了一个单独的要求,因此集群互连必须能够同时地处理这些多个数据流,并且同时保证快速和可靠的数据传向每个流。
在一个多核心的环境中,避免CPU内核开销处理是极其重要的。
通过提供低延迟,高带宽和极低的CPU开销,InfiniBand提供了一个平衡的计算系统和最大限度地提高了应用性能:
这就是为什么的InfiniBand正在以最部署的高速互联出现,取代专有或低性能解决方案的一个重大的因素。
1.4SMP与MPI对比在一个单一的服务器中,一个普通的多核心环境由8到16个CPU内核组成。
在一个典型的单服务器环境中,应用程序的工作可以以共享内存处理(SMP)的方式,或用一个信息传递接口(MPI)协议被执行。
为了在这两种选择之间进行比较,我们应用了利弗莫尔软件技术公司(LSTC)的LS-DYNA基准。
LS-DYNA是一个通用的结构和流体分析仿真软件包,其能模拟复杂的现实世界的问题。
它被广泛应用于汽车行业的耐撞性,乘员安全和金属成形,也应用于航空航天,军事,国防和消费产品。
主要有三种用于衡量一个平台的性能,效率和可扩展性的LS-DYNA基准:
3车碰撞(一辆货车撞上小型汽车的后部,轮流地,小型汽车撞上中型汽车),neon_refined(初速度为31.5英里/小时的正面碰撞)和car2car(NCAC袖珍货车模型)。
最近,修订版的neon_refined已被提出,名为neon_refined_revised。
该平台用于这一性能评价的是Mellanox技术的“赫利俄斯”集群。
它是Mellanox集群中心的一部分,一个可用于性能测试和应用开发的计算资源。
赫利俄斯集群由32组服务器节点组成,与千兆以太网和20Gb/s的InfiniBand连接。
每个服务器节点有双插槽,四核处理器2.66GHz英特尔至强处理器(代号为Clovertown)。
测试中使用的MPI是卡利的MPI连接。
为了比较SMP和MPI这两种方式,需要使用一台单一服务器。
该比较以每24小时可以完成的工作量为度量。
MPI的使用提高了系统的效率和并行可扩展性,随着更多内核的使用,MPI方式与传统的SMP方式相比表现的更好。
在一台单一服务器中,MPI的使用不仅提供了更好的性能和效率,还能够实现一台单一服务器到一个集群环境的顺利整合。
此外,当需要更多的计算能力时,不需要软件的改变。
1.5集群环境的扩展:
互连的重要性在一个私人系统网络中,集群是商品硬件基础上的可扩展的高性能计算解决方案。
集群的主要优点在于其可扩展性,可用性和高性能。
一个集群利用计算服务器节点的联合计算能力,为基础的应用程序,如MCAD或CAE应用程序,形成了一个高性能的解决方案。
当更多的计算能力被需要时,它可以通过向集群增加服务器节点来简单地实现。
在集群环境中,当发生节点故障,或当一台服务器节点因为一个规划服务需要被提出时,每个节点可以是每个其它节点的一个备用选项。
对应用程序或用户来说,此操作是透明的,并且没有应用运行会发生。
集群节点连接在一起的方式对整体应用性能有很大的影响,特别是在多核心服务器使用时。
群集互连对整个集群的效率和可扩展性是非常关键的,因为它需要处理来自每个CPU核心的I/O请求,而不是将任何网络开销强加在同一处理器上。
1.6多核心InfiniBand集群的最大化碰撞模拟针对多核心的集群平台,为了最大限度地发挥应用程序的性能和增加每天可获得的应用工作的数量,以太网在集群大小方面变的无效而InfiniBand成为必须。
随着越来越多的工作被执行,使得产品的质量得以提高和产品的上市时间得以缩短。
评估计算解决方案的一个典型的方法就是其运行一个应用程序的基准,或者一个应用程序的工作所花费的时间,运行时间越快,计算解决方案就越有效。
然而,对于多内核平台上真正的模拟它并非总是最好的办法。
多内核平台不仅对集群互连提出了更多的要求,而且对一个服务器节点内和CPUS与存储器之间的CPU提出了更多的要求。
虽然在集群中运行一个单一工作将为那些特殊工作提供最快的运行时间,但以这种方式每天最大量的模拟目标可能无法实现。
1.7加速汽车设计从概念到设计,及从设计到测试和制造,汽车业依靠强大的虚拟开发解决方案。
计算流体力学和碰撞模拟正在努力地确保质量和加快发展进程。
集群解决方案正在最大化CAE技术环境所有权的的总价值和扩大在虚拟产品开发中的创新。
为了保持一个平衡的系统,并实现应用程序高的性能和扩展,多核心集群环境对集群连接的吞吐量,低延迟,低CPU开销,网络的灵活性和高效率有较高的要求。
低性能互连解决方案,或缺乏互连硬件能力将导致退化的系统和应用性能。
对三种情况进行了调查。
在第一种情况下,很明显,与使用一种SMP模式相比使用MPI的应用程序将提供更多的性能--即使在一台单一服务器上。
在第二种情况下,我们已经对在碰撞模拟中使用高速,低延迟和低CPU开销的互连的重要性进行了调查。
调查结果显示,低速互联,如以太网对集群大小变得无效,甚至在增加更多的计算节点时,降低了集群计算能力。
InfiniBand对集群大小显示出更大的效率和可扩展性。
第三种情况表明,CPU的亲和力和互联的使用必须正确配置,以便最大限度地发挥集群效益。
通过减少插座连接和内存的压力,同时更好地利用互联,这样才能完成更多的应用工作。
碰撞模拟是汽车设计的重要组成部分,并且每天能够运行更多碰撞模拟的能力将使更为复杂的模拟成为可能,减少设计阶段和需要原型的数量。
附件:
AcceleratingAutomotiveDesignwithInfiniBand1.0AbstractCAEsimulationandanalysisarehighlysophisticatedapplicationswhichenableengineerstogetinsightintocomplexphenomenaandtovirtuallyinvestigatephysicalbehavior.Inordertoproducethebestresultspossiblethesesimulationsolutionsrequirehigh-performancecomputeplatforms.Inthispaperweinvestigatetheoptimumusageofhigh-performanceclustersformaximumefficiencyandproductivity,forCAEapplications,andforautomotivedesigninparticular.1.1IntroductionHigh-performancecomputingisacrucialtoolforautomotivedesignandmanufacturing.Itisusedforcomputer-aidedengineering(CAE)fromcomponent-leveltofullvehicleanalyses:
crashsimulations,structureintegrity,thermalmanagement,climatecontrol,enginemodeling,exhaust,acousticsandmuchmore.HPChelpsdriveacceleratedspeedtomarket,significantcostreductions,andtremendousflexibility.ThestrengthinHPCistheabilitytoachievebestsustainedperformancebydrivingtheCPUperformancetowardsitslimits.Themotivationforhigh-performancecomputingintheautomotiveindustryhaslongbeenitstremendouscostsavingsandproductimprovements.Atotalcostofarealvehiclecrash-testsinordertodetermineitssafetycharacteristics,isoftherangeof$250,000ormore.Ontheotherhand,thecostofahigh-performancecomputeclustercanbejustafractionofthepriceofasinglecrashtest,whileprovidingasystemthatcanbeusedforeverytestsimulationgoingforward.HPCisusedformanyotheraspectsthanjustcrashsimulations.Compute-intensivesystemsandapplicationsareusedtosimulateeverythingfromairbagdeploymenttobrakecooling,exhaustsystems,thermalcomfortandwindshieldwashernozzles.HPC-basedsimulationsandanalysesempowerengineersanddesignerstocreatevehiclesthataremorereadyandsaferforreal-lifeenvironments.1.2AutomotiveCrashSimulationsOneofthemostdemandingapplicationsofautomotivedesigniscrashsimulation(full-frontal,offset-frontal,angle-frontal,side-impact,rear-impactandmore).Crashsimulations,whileperformedveryearlyinthedevelopmentprocess,arevalidatedverylateinthedevelopmentprocessoncethevehicleiscompletelybuilt.Themoresophisticatedandcomplexthesimulation,themorepartsanddetailscanbeanalyzed.Computer-basedanalysesprovideanearlyinsightintophenomenathataredifficulttobegatheredexperimentally,andifso,onlyatalaterstageandatasubstantialcost.Timeandmoneyissavedwithouthavingtobuildcostlyprototypes.Automotivemakersincreasetheirdependencyforcarcrashsimulationsthroughoutthedesignprocesswhilereducingtheneedforrealprototypes,thusachievingfastertimetomarketwithlesscostassociatedwiththedesignphase.HPCclustersenablethevisionofpurevirtualdevelopmentandhavingphysicalprototypesforverificationonly.FortheVolvoS80carmodel,1993-1998,Volvoperformed1000simulationsandused15prototypesduringthedesign.FortheS40/V40series,1999-2003,Volvoincreasedtheirsimulationsto6000andusedonly5prototypes.FortheirV70Nmodel,2005-2007,Volvoperformed10,000crashsimulationsduringtheproductdevelopmentwithoutanyrealprototypes,andthecrashsimulationsincludedalargevarietyoflandscapes,suchaspedestrian,slideimpact,rolloverandmuchmore.TheperformanceofHPCclustershavehelpedVolvotoperformthecomplexcrashsimulations,andtheflexibilityandscalabilityofHPCclustersenabledVolvotoincreasethecomputepowerinordertoperformagreaternumbersofsimulationandfastertimetomarket.HPCClustersconsistofof-the-shelfservers,ahighspeedinterconnectandastoragesolution.Theinterconnecthasagreatinfluenceonthetotalclusterperformanceandscalability.Aslowinterconnectwillcausedelaysindatatransfersbetweenserversandbetweenserversandstorage,causingpoorutilizationofthecomputeresourcesandslowexecutionofsimulations.AninterconnectthatrequiresCPUcyclesaspartofthenetworkingprocesswilldecreasethecomputeresourcesavailabletotheapplicationsandthereforewillslowdownandlimitthenumbersofsimulationsthatcanbeexecutedonagivencluster.Furthermore,thiswilllimittheclusterscalabilityaswhentheamountofCPUsincreases,thehighertheburdenthatwillbeenforcedontheCPUstohandlethenetworking.InfiniBand,ahigh-speedinterconnectdistributedbyMellanoxTechnologies,providesthelowestlatencyandthehighestthroughputbetweenservers,sothecommunicationbetweenthecomputenodeswillbefastenoughtofeedtheCPUswithdataandeliminatingidletimes.Moreover,InfiniBandwasdesignedtobefullyoffloaded,meaningallthecommunicationsarebeinghandledwithintheinterconnect,withnoinvolvementfromtheCPU.Thisfurtherguaranteestheabilitytoscaleupwithlinearperformance,whenmorecomputeresourcesarerequired.1.3Multi-coreClusterEnvironmentsComputeclustersolutionsconsistofmulti-coreservers.Amulti-coreenvironmentintroduceshigherdemandsontheclustercomponents,especiallyontheclusterconnectivity.EachCPUcoreimposesaseparatedemandonthenetworkduringsimulationjobexecution,andthereforetheclusterinterconnectneedstobeabletohandlethosemultipledatastreamssimultaneouslyandatthesametimeguaranteefastandreliabledatatransferforeachofthestreams.Inamulti-coreenvironment,itisessentialtoavoidoverheadprocessingintheCPUcores.Byprovidinglow-latency,high-bandwidthandextremelylowCPUoverhe