intelNehalemEP处理器首发深度评测第三部分.docx
《intelNehalemEP处理器首发深度评测第三部分.docx》由会员分享,可在线阅读,更多相关《intelNehalemEP处理器首发深度评测第三部分.docx(19页珍藏版)》请在冰点文库上搜索。
![intelNehalemEP处理器首发深度评测第三部分.docx](https://file1.bingdoc.com/fileroot1/2023-6/2/bb81b462-4c74-4641-b598-e35229816e25/bb81b462-4c74-4641-b598-e35229816e251.gif)
intelNehalemEP处理器首发深度评测第三部分
基本CMOSMOSFET晶体管结构,channel沟道存在于图上的“通道”区域
IntelHigh-kMetalGate晶体管,S极到D极的红色箭头就是“channel沟道”,也就是耗尽区所在
在同一个线路中,使用的晶体管不同,耗电也是不同的,MOSFET元件按沟道长度可以分为长沟道LongChannel和短沟道ShortChannel,短沟道具有较好的性能,不过其漏电流也相应更大(耗尽区宽度不足而与源极合并而导致大量漏电电流)。
这个图可不容易明白:
沟道长度与漏电的关系,请自行理解(越低的延迟,越高的漏电电流)
在IC设计当中通常需要根据不同的情况使用不同沟道长度的晶体管,对于Nehalem而言,非时序关键(non-timing-critical)的线路可以使用性能略差的长沟道MOSFET晶体管以减少亚阈值漏电(subthresholdleakage,MOSFET的subthreshold亚阈值特性被广泛利用在低电压线路上),实际上Intel用的是"longer-channel"——“更长沟道”的MOSFET。
Nehalem核心部分的58%和核外部分(不包括缓存阵列)的85%都使用了更长沟道晶体管,最后,漏电功率被控制到总功耗的16%。
代价是Nehalem的L1-D延迟由上一代的3时钟周期上升到4时钟周期。
在Nehalem处理器当中,除了大规模使用长沟道晶体管技术来降低总漏电之外,还搭载了一个新的单元,来管理所有的核心的工作状态,包括电压、频率等,这个单元的名字就叫作PowerControlUnit电源管理单元。
它也负责处理器参数的实时监测。
空闲的核心和缓存将会被降低供应电压,并降低工作频率,以达到降低功耗、节约能源的目的。
PCU是Nehalem处理器的电源总管
在需要的情况下,空闲的核心和缓存可以设置为关闭模式以降低耗电。
彻底避免这些线路用电是不太可能的,在关闭模式下,SRAM的供电将从0.90V降低到0.36V,提供83%的漏电功耗节约,作为比较,睡眠电压是0.75V,节约为35%。
关闭模式是由PowerGate电源阀来实现的:
图片看不清楚?
请点击这里查看原图(大图)。
PowerGate是PCU的实际执行者之一
为了实现PCU,Nehalem使用了特别的工艺,在第9金属层上实现了非常低导通电阻和非常高关闭电阻及极低晶体管漏电的PowerGate电路。
通过PowerGate,在Nehalem上还实现了了一种新的能耗比控制技术:
TurboMode,或者叫做TurboBoosting,这种技术在笔记本上曾经出现过。
作用就是当一些核心处于空闲状态,被PowerGate关闭之后,剩余的核心可以动态提升频率以提升负载的相应能力。
通常状态
两个核心被TurboBoost
TDP允许的情况下,所有的核心都被TurboBoost
TDP允许的情况下,部分核心允许更进一步地TurboBoost
并不是所有的处理器都具有TurboMode功能,在Xeon5500系列处理器当中,只有最后一位数字为0的处理器具备超线程技术和TurboMode,为其他数字的则没有。
一开始,桌面版本的Nehalem也是没有超线程技术和TurboMode的,后来Intel改变了主意,这个举动应该是为了刺激市场,通过培养消费者来扩展它们的应用领域。
从前面可以看出,Nehalem架构比以往Intel处理器具有了较大的变迁,这个变迁带来了非常直接的性能提升,总结起来,Nehalem-EP/Gainestown比Penryn/Harperton具备的主要优势有三点:
直联架构带来了IMC和QPI
IMC:
CISC的x86架构对缓存/内存带宽极度渴求,集成内存控制器让处理器避开了访问内存需要通过FSB总线的限制,并将带宽提升到三通道DDR31333(8核心Nehalem-EX支持四通道DDR3)每处理器,极大提升了Nehalem处理器的内存带宽,对服务器应用提升巨大。
QPI:
新的点对点总线带宽更高,并且让处理器之间可以直接连接,避免了共享的FSB总线在处理器核心过多时的效率急剧下降,更适合扩展到大规模并行系统。
同样处理器数量下,QPI点对点形成的ccNUMA拓扑比共享FSB的星型总线具有更高的效率。
虽然SMT有不少处理器采用,不过,在x86处理器上只有Intel具有
HTT:
超线程技术在打游戏的时候或许看不出有作用,不过在企业级别应用上效果明显。
在主要竞争对手也有IMC和类似QPI的情况下,HTT就成为了Nehalem的特别武器。
这项据说耗资十亿开发费用的技术终于从Nehalem开始大放光芒。
要了解一款处理器,可以先看它的规格表。
在Nehalem-EP新Xeon5500处理器首度曝光中我们已经有了一个简单的表格介绍Nehalem-EP/Gainestown处理器的规格,不过这个规格表不是非常完善,而且只有Nehalem-EP部分的数据,因此我们整理了以下表格,包括了Corei7/Bloomfield、XeonHarptown和Nehalem-EP/Gainestown的完整处理器资料:
IntelCorei7/Bloomfield规格表
名称
Corei7920
Corei7940
Corei7Extreme965
Corei7Extreme975
系列
Nehalem/Corei7
Nehalem/Corei7Extreme
每系统数
1
频率
2.66GHz
2.93GHz
3.20GHz
3.33GHz
QPI速率
4.80GT/s
6.40GT/s
TurboBoost
○
HTT(SMT)
○
核心/线程
4/8
L2缓存
4x256KB
L3缓存
8MB
TDP
130W
普通的Corei7和Corei7Extreme的区别就在于主频,以及QPI总线规格。
45nmHarpertownXeon的型号众多,可以按照FSB分为1333MHz(5400)和1600MHz(5402),或者分为低电压版和普通版。
不同型号的差别只是在于主频、FSB总线和TDP。
Nehalem-EP/Nehalem-WS规格对照表
上表除包括了Nehalem-EP/Gainestown之外,还包括了Nehalem-WS——这一系列CPU部分属于Bloomfield(Nehalem-WS1S系列),部分属于Gainestown(Nehalem-WS2S系列,只有一款型号:
XeonW5580)不过是面向Workstation市场,它们和Nehalem-EP的区别就是它们大部分只支持一路处理器系统(也就是Nehalem-WS1S系列;支持二路系统的是Nehalem-WS2S系列并只有一款处理器:
W5580)。
不同型号的差别在于主频、QPI总线(有三种)、L3容量(有两种)和TDP(有四种)。
Nehalem-EP也提供了两款低电压版型号。
Nehalem-EP还提供了一款双核的型号,此外并不是所有的Nehalem-EP都搭载了HTT超线程技术(同时和TurboBoost技术)。
为了搭载全新的Nehalem处理器,需要同样是全新的芯片组,这个芯片组需要QPI总线,并且不需要内存控制器,这个芯片组就是Tylersburg。
如同Nehalem处理器有普通版本和Nehalem-EP版本一样,Tylersburg芯片组也有普通版本和Tylersburg-EP版本,普通版本的Tylersburg我们都已经很熟悉,就是搭配Corei7处理器用的X58芯片组。
由于Nehalem处理器已经集成了内存控制器,因此主板芯片组上就没有必要再有,因此北桥芯片组的名称也就不能再叫MCH(MemoryControllerHub),现在的Tylersburg叫做(IOH,I/OHub)。
作为一个IOH,IO自然是其目的,Tylersburg的IO主要针对三个方面:
CPU、PCIE设备和ICH南桥,这三种设备的连接分别由QPI、PCIExpress、ESI来完成。
其中PCIExpress支持是Tylersburg最重要的部分。
Tylersburg-EPIOH最多可以提供2个x16规格的PCIExpress总线(Tylersburg-36D),并且可以分割为多个细小的连接,如分解为4个x8,或者最多分解为8个x4。
除了两个这两个可以用来连接显卡的x16界面之外,Tylersburg-EP还可以额外提供一个x4界面用来在连接两块x16显卡之后连接其它如阵列卡这样的设备,这个额外的端口可以分割为两个x2界面。
因此,Tylersburg-EP最多具有10个PCIExpress端口,并且这些端口都属于第二代(PCIExpressGen2,或者2.0),每信道带宽达到了500MB/s,是其上一代的两倍。
包括ICH10R在内,Tylersburg最多可以提供42个PCIeLanes:
36个Gen2,6个Gen1
Tylersburg-EP最多提供两个QPI总线,可以最多支持两路Nehalem-EP处理器(我们尝试了将Corei7放上去,结果无法启动……)。
Tylersburg-EP使用的南桥是ICH10R,而不是以往的ESB63x1系列,这一点和桌面版本的Tylersburg/X58一样。
Tylersburg-EP还支持特别的双芯片组设置:
两个Tylersburg通过QPI总线互相连接,并分别连接一个Nehalem-EP处理器,这样,整个系统就可以提供非常多的PCIExpress信道,例如,连接4块全速的PCIExress2.0x16显卡等。
Tylersburg-EP最多支持两个QPI总线,最高3.2GHz,6.4GT/s
Tylersburg-EP还拥有写入缓存,用于缓冲QPI发来的写入请求以提高性能
除了在Nehalem处理器集成的部分VT-d虚拟化增强技术之外,Tylersburg-EP也集成了这个技术的一部分(依赖于PCIExpress的那部分),Tylersburg-EP支持IOAT2,支持ATS和中断重映射特性,并提供更强的性能
Tylersburg-EP还支持IntelIntelligentPowerNodeManager(Intel智能电源节点管理器),进一步提升Intel平台的远程管理能力
Tylersburg芯片其实分为四个型号,按照单处理器/双处理器分两种,按照PCIExpress信道的数量又分为两种,二二得四,最终的型号就有:
Tylersburg-24S、Tylersburg-36S、Tylersburg-24D和Tylersburg-36D,这些型号非常好记:
数字表明了PCIExpress信道的数量,字母表示单处理器还是双处理器,S就是Single单处理器,D就是Dual双处理器。
IntelTylersburg芯片组规格表
名称
Tylersburg-24S
Tylersburg-36S
Tylersburg-24D
Tylersburg-36D
系列
Tylersburg-DT
Tylersburg-EP
对应处理器
Nehalem/Bloomfield
Nehalem-EP/Gainestown
QPI数/处理器数
1
2
PCIELanes
24(16+8)
36(16+16+4)
24(16+8)
36(16+16+4)
QPI速率
6.40GT/s
VT-dGen2
○
IOAT2
○
南桥总线
DMI/ESI
南桥
ICH10R
单处理器版本是因为只具有一个QPI总线,双处理器则是因为具有两个。
我们目前接触到的Tylersburg-EP都是Tylersburg-36D。
桌面的Corei7处理器搭配的X58芯片组实际上就是Tylersburg-36S。
IntelTylersburg-36D实物