Alpha昔日王者Alpha的历史Word文件下载.docx
《Alpha昔日王者Alpha的历史Word文件下载.docx》由会员分享,可在线阅读,更多相关《Alpha昔日王者Alpha的历史Word文件下载.docx(25页珍藏版)》请在冰点文库上搜索。
这也是其与IBM大型主机系统竞争的有力手段。
到1968年为止,PDP-8共生产和销售了1450台(未包括修改版)。
68年,当时最新的36-bitPDP-10被推出市场,它基于PDP-6的设计,主要为数据处理中心,研究实验室和美国军方提供高性能的运算。
从发布到1983年其间,PDP-10一直在生产销售。
但其中有一个小插曲,一开始36-bit架构的性能不尽如人意,在LeonardHughes和DavidRogers的主导下,发起了独角兽项目,旨在提升36-bit架构的性能,却因为种种原因于1975年六月终止了该计划。
不过计划中的所有资源都被用于32-bit架构的开发,从而大大促进了32-bit架构的发展,这在后文中有所提及。
20世纪70年代前期,DEC发布了16-bit的PDP-11,它也是DEC研制的第一款使用8byte的计算机,而且直接继承了PDP-8的产品线。
由于采用了简化设计、统一总线架构、使用更有效的指令集和较低的生产成本等手段,PDP-11系列取得了空前的成功。
当然PDP-11的各种克隆版本也开始在世界到处泛滥,其中包括CM-4(前苏联,保加利亚,匈牙利),CM-1420(前苏联,保加利亚,前东德),CM-1600(前苏联),IZOT-1016(保加利亚),DVK(前苏联)。
同时基于PDP-11而开发的操作系统也有相当多的版本,比如说:
DEC开发的P/OS,RSX-11,RT-11,RSTS/E,以及一些基于DOS的分支版本。
最后在1971年,由贝尔实验室以PDP-7和PDP-11为原型机的基础上,开发出了第一个UNIX操作系统。
随着时间的推移,曾显赫一时的PDP-11由于缺乏地址空间,而逐渐淡出市场。
在这段时间中,32-bit的CISC(复杂指令集计算机)有了长足的进步。
到了1975年四月,VAX架构委员会召开会议,正式确立了VAX(虚拟地址扩展)架构。
该架构发布数个月后,由GordonBell领衔,发起了星球计划(Starproject)。
该计划主要任务在于增加通用寄存器的位宽到32-bit,数量增加到16个,并且几乎重新设计了大部分指令集。
而与此同时进行的独角兽计划决定终止,转而支持32-bitVAX的开发。
在两股力量的共同努力下,1977年10月发布了第一款VAX计算机,model11/780。
几个月之后,也就是1978年2月,基于VAXen的操作系统也被推出,操作系统名为VMS(虚拟内存系统)v1.0。
这款操作系统支持多用户和多任务,最大支持64MB主内存,还有网络功能,任务计划和扩展进程管理等功能。
由于这些都是在当时前所未见的新技术,因此引起了很大的轰动。
后来DEC再接再厉,1980年四月推出VAX/VMSv2.0,带来了很多地方的改进。
与此同时,经典UNIX也很快被移植到VAX上,在上世纪整个80年代,VAXen销售的都非常成功。
其中根据订单,相当数量的产品一直交付到90年代末。
其整个产品线覆盖范围很广,从小型工作站到6处理器的大型服务器主机。
直到现在,还有相当一部分VAXen在美国国防部、美国国家安全局和一些商业组织里被使用着。
不过VAXen只代表着80年代的辉煌。
进入90年代,DEC赌上了另一个新架构。
整个80年代VAXen销售都非常成功
PRISM项目
从80年代开始,DEC公司通过销售量节节攀升的VAX而赚了大把大把的钞票。
不过随着技术的发展,VAX也逐渐的退居幕后,将市场留给新架构的发布。
从此时开始,越来越多的公司开始对RISC(精简指令集计算机)发生了兴趣。
DEC自然不会忽略这个趋势。
在1982年到1985年间,DEC将RISC划分为几个部分来分开研究:
Titan,从1982年开始,由DEC公司位于加利福尼亚州的西部研究实验室负责研制的一种高速设计方案
SAFE,快速执行流线架构,从1983年开始,由AlanKotok和DavidOrbits领衔负责开发
HR-32,以DEC工厂的所在地哈德迅命名(HudsonRISC32-bit),从1984年开始,由RichardWitek和DanielDobberpuhl领衔开发
CASCADE,从1984年开始,由DavidCutler负责开发
1985年,Cutler主动提出“协作RISC计划”后,上述四个项目就被合并为一个项目,并且更名为PRISM(并行指令集计算机),关于这款新RISC处理器的第一份草图发布于1985年8月。
为了进一步顺利的将新架构打入市场,DEC在参与MIPSR3000的处理器项目开发过程中,主动发起创建了高级计算环境协会(AdvancedComputingEnvironmentconsortium)来提升新架构的影响力。
因此,新处理器中有些许多和MIPS架构相似的特性就不足为奇了,不过两者之间不同之处也是显而易见的。
首先是新处理器中的所有指令都采用了固定的32-bits长度,上6位和下5位用于表示指令代码,剩下的21个字节用来保存即时数据和寻址需求。
另外新处理器中还有64个32-bit通用目的寄存器(MIPS里只有32个寄存器),另外追加了16个64-bit矢量寄存器,3个控制寄存器:
其中两个7-bit,用于存储矢量长度和矢量计算;
还有一个64-bit用于vectormask。
不过新产品没有处理器状态寄存器,这也是为什么将两个标量操作数的比较结果放在通用目的寄存器中的原因。
而两个矢量操作数比较的结果,就直接放入vectormask。
同时在处理器中没有内建浮点单元,而是使用一组在软件中被创建的特殊指令(扩展处理器指令代码),采用读取微代码的方式,通过运行环境或操作系统的帮助来处理特殊任务,并且这些特殊的扩展指令代码并不属于标准指令集。
稍后不久,这个功能被移植到了Apha架构中,重新被命名为PAL编码(专用架构库编码)。
然而这个计划还没有最终完成的时候,1988年DEC公司的管理高层决定采用MIPS处理器,同时不再继续这个项目。
认为继续为这个项目提供财政支持纯属浪费钱,决定终止计划。
计划的发起者和负责人Cutler曾激烈反对未果,于是辞职来到微软,着手从事WindowsNT的开发,这是后话。
1989年初,DEC就推出了公司第一款RISC工作站处理器—DECstation3100,这款处理器基于MIPSR2000,内部时钟频率为16MHz,其系列产品DECstation2100采用相同的处理器,核心频率为12MHz,操作系统使用UltrixOS。
在1990年,这款工作站计算机售价为8000美元(在当时不算贵)。
Alpha计划
到了1989年,日益老化的VAX架构,面对MIPS和SPARC等第二代RISC架构的强力挑战越来越感到力不从心。
很显然,留给VAX的时间不多了。
因此在此年中,DEC的工程师接到任务,开发一款更具有竞争力的RISC架构,并且要在相当长的时期内保持足够的升级潜力,同时还要对VAX/VMS以及所有相关的应用程序保证最大的兼容性。
64-bit解决方案由此而诞生。
开发团队初步确立,RichardWitek和RichardSites成为了这个项目的首席架构师。
Alpha架构于1992年2月25日,在东京召开的一次会议上面被正式推介,新架构的关键特性都一一的被罗列出来。
当时说Alpha只是产品开发的内部代号。
新处理器采用完全64-bitRISC设计,执行固定长度指令(32bits)。
有32个64bit整数寄存器,操作43-bit的虚拟地址(在后来能够扩充到64-bit)。
和VAX相同,使用little-endian字节顺序,即低字节的寄存器占用低内存地址线。
而不像如摩托罗拉等大多数处理器所使用的big-endian字节顺序,即低字节寄存器占用高内存地址线。
除此之外,处理器还内建一个算术协处理器,有32个浮点64-bit寄存器,采用随机存取,而不是在intelx87协处理器上使用的堆栈存取方式。
整个Alpha的生命周期被设计为至少25年。
被简化后的指令集更利于流水线操作,它由5个部分所组成:
·
整数指令
浮点数指令
分支和比较指令
读取和存储指令
PAL编码指令
和现在一些I386架构的处理器不同,Alpha的架构是完完全全的RISC架构。
而RISC(精简指令集计算机)和CISC(复杂指令集计算机)两者的概念是完全不同:
特性CISCRISC
Alpha处理器当时发布的时候,运行在一个很高的频率上—150MHz,而且还有提升的空间,不改变生产工艺就可以将频率提升到200MHz。
这是一个从哪方面看都会取得成功的架构。
项目也进行的很顺利,到了生产销售阶段。
这时候,DEC公司市场部突然提出要将新架构命名为AXP,于是产品就被正式定名为AlphaAXP。
没有人知道AXP代表什么意思,或许它根本就没有意义。
这让人联想到DEC公司以前在命名VAX商标的时候所遇到的一些麻烦。
当时要注册VAX商标的公司除了DEC外,还有一家本身名字就为VAX的真空吸尘器的制造商。
双方争执不下,还闹上法庭,这给DEC带来不小的负面影响。
正因为有此不快往事,因此取一个完全没有意义,但绝对没有重名的名字,对于DEC公司来说还是很有可能的。
不过还是有人从鸡蛋里面挑出了骨头,指出AXP即意为“AlmostExactlyPRISM”。
EV4,LCA4,EV45,LCA45
第一款Alpha系列的处理器被称为21064(21意为alpha是一款面向21世纪的新架构,0代表处理器的版本,64代表具备64-bit的计算能力)。
开发代号为EV4,其中EV是ExtendedVAX(扩展VAX)的简称,采用CMOS4的生产工艺。
EV4的展示原型是在1991年推出的,当时限于生产工艺水平,使用了CMOS3,因此只有较小的缓存,同时没有浮点运算单元。
这对于一款处理器的性能来说,打了一个非常大的折扣。
而EV4是在92年发布的,当时的生产工艺已经达到了3层0.75μ的水平,并且在后来一段时间中,采用了更为先进的0.675μCMOS4S制造工艺,自然可以将节省出来的空间装入更多的晶体管,来增强性能。
由此可以看出,在那个时候,生产工艺对于处理器的性能影响相当巨大。
处理器设计工作电压为3.3V,核心频率为150MHz-200MHz(TDP为21W到27W之间)。
处理器内部共由168万个晶体管组成,芯片面积为233平方毫米,芯片采用PGA-431方式进行封装。
从EV4开始,就能够支持多处理器,这是其架构中很关键的一个特性之一。
其中的L1缓存由:
8KB的指令缓存(I-cache)和8KB的数据缓存(D-cache)组成。
其中D-cache读取延迟为3个时钟。
每一个I-cache由32字节指令,21-bit的tagrecord,8-bit的分支记录区域和其他的一些辅助部分所组成。
每一个D-cache由32字节的数据和21bit的tagrecord所组成。
L2缓存,当时又被称为备份缓存(B-cache),不过采用的却是外置的同步或异步SRAM芯片,最大容量达到了16MB(通常从512KB到2MB不等)。
B-cache由带有1-bit长的奇偶校验和7-bit的ECC校验的32字节的数据和指令,带有1-bit奇偶校验的tagrecord和3-bit的状态标签所组成。
由于采用外置式的L2缓存设计方式,因此缓存的速度在很大程度上都限制着处理器的运算。
系统数据总线作为沟通处理器和L2缓存之间的接口,作用越发显得重要,系统数据总线采用了两种位宽64bit和128bit。
由于B-cache的多样性,这种转换是相当有必要的。
系统地址总线为34-bit位宽。
除此之外,处理器还采用了一种叫做“victimwrite”的机制,用于将B-cache中的数据,储存到主内存中。
在整个系统中,只有处理器才能够对B-cache执行读写操作,系统其他的逻辑核心只能够读取B-tag数据。
这对于后来越来越复杂的多处理器系统中,显得尤为重要。
只有这样,才能够尽可能的保证B-cache中的数据一致性。
在处理器中的分支预测单元有一个4096个入口的分支预测表,还有有一根整数管线(E-box,7级流水线)和一根浮点管线(F-box,10级流水线)。
指令解码器的执行单元能够每个时钟周期执行2个命令(I-box)。
除此之外,还有读取单元(A-box)。
读取单元的作用很重要,主要用于协调缓存和系统总线控制器之间的操作,其中涉及到的部件有:
I-cache、D-cache和B-cache。
尽管有非常出色的性能,不过EV4对于大多数的潜在消费者而言,还是太贵了。
因此在1993年九月,其低价的孪生兄弟21066(LCA4)被推出市场。
新处理器基本上是基于EV4核心,另外整合了内存和PCI控制器,以及一些其他的小功能。
为了降低成本,并在性能上和EV4拉开差距,LCA4的系统数据总线位宽被缩减到64bit,这对性能会造成一个比较大的影响。
LCA4采用了更为先进的0.675μCMOS4S制造工艺,芯片面积比EV4略有缩小。
由于当时的桌面机箱,通风散热问题较为突出。
因此处理器工作的频率也被调低到100MHz-166MHz。
整个处理器由175万个晶体管组成,工作电压为3.3V。
该芯片被授权给日本三菱生产,三菱公司同一时期所生产的LCA4也包括了200MHz的版本。
21064A(EV45)在1993年10月的微处理器论坛上面被发布。
它是EV4的修改版,采用4层0.5μCMOS5制造工艺。
第二年21066A(LCA45)在11月举行的Comdex大会上被推出。
LCA4同样是在生产工艺上面进行了更新。
DEC公司的市场开发人员习惯于,将采用更先进的生产工艺制作出来的产品后面增加一个字母,以示区别。
其实这一时期所推出的核心架构都没有多少变化,如:
EV45中的I-cache和D-cache的容量分别增大了一倍,分支记录区域和I-cache分别扩展到了16bit,D-cache变成了2路相关。
除此之外,EV45和LCA45在浮点运算单元中有进一步的优化,在EV4中,执行单精度操作数和双精度操作数分别需要34个时钟和63个时钟周期。
而且这个过程和操作数本身的复杂程度无关。
在EV45中,单精度的操作数处理时间为19-34个时钟周期,双精度的操作数处理时间为29-63个时钟周期。
并且和操作数本身的值密切相关。
LCA45同样委任给三菱生产。
由于采用了当时最新的生产工艺,EV45和LCA45的芯片核心面积进一步下降到164mm²
和161mm²
,虽然EV45内部晶体管的数量有较大的增幅,达到了285万个。
不过能耗和发热量都有所降低。
EV45的核心频率为200-300MHz之间,LCA45的频率为166MHz-233MHz。
第一款基于EV4开发的芯片组支持:
TURBOchannel,FutureBus+和XMI外设总线。
尽管这些设计在当时有着非常快的速度(大约100Mb/s),不过它们的扩展性却不强,因此能够支持的外设数量有限。
为了解决这个问题,DEC特别将业界标准总线架构:
PCI和ISA作为重点参考的对象。
在1994年发布了基于PCI总线的新芯片组—DECApecs,该芯片组有两个不同的版本:
64-bit系统数据总线(21071)和128-bit系统数据总线(21072)。
这两款芯片组的复杂程度也不相同,前者由4块芯片所组成,分别是:
1个通用控制器,两个数据片和一个PCI总线控制器,后者由6块芯片组成(增加了两个数据片)。
芯片组支持33MHz系统总线频率,最高支持16MBL2缓存和最大4GB的奇偶校验内存(内存的访问延迟为100到50ns)。
同时在标准桥接芯片中,还支持ISA和EISA总线。
第一款基于Alpha的工作站发布于1992年11月,全名叫做DEC3000Model500AXP(开发代号:
Flamingo)。
采用的是EV4150MHz,512KB的L2缓存和32MB主内存,1GBSCSI硬盘和SCSI光驱,内建10Mbit以太网控制器、音效芯片和ISDN控制器。
配备了19英寸显示器(1280x10248位色)。
机器售价为38995美元。
技术参数
EV5,EV56,PCA56,PCA57
其实在94年8月14日举行的HotChips大会上,DEC就已经非常详细的阐述了第二代Alpha处理器的第一手资料。
不过正式的官方发布会还要推迟到94年9月7日,新处理器被命名为21164(EV5),该处理器是在EV45的基础上发展出来的,不过产品的名称已经告诉人们,这是一款有着重要架构改进的产品。
在新处理器中,整数单元和浮点单元的管线数量均增加了一倍,即每一个单元有两根管线。
在EV5里面,DEC的工程师将每个运算单元的功能很明确的分配给每一个管线来处理。
比如说:
整数单元中的一根管线专门用于处理算术运算部分,而第二根管线则用于处理逻辑运算部分;
而浮点单元中的两个管线也同样是分别处理单浮点代码和多重浮点代码。
除此之外,该处理器采用4层0.5μCMOS5制造工艺,工作电压为3.3V,共由930万个晶体管所组成,其中缓存部分占用了718万个晶体管。
芯片面积为299平方毫米,这已经非常接近该制造工艺的极限了。
处理器的核心频率在266MHz到333MHz之间,TDP为46W到56W不等。
处理器采用IPGA-499封装方式。
EV5技术图解
21164A(EV56)在1995年10月的微处理器论坛上被发布。
它是EV5的修改版,后者采用更先进的0.35μCMOS6生产工艺。
为了提升生产工艺,DEC特别投资了4亿5000万美元在哈德迅修建了一座现代化的工厂。
新处理器架构中采用了BWX(Byte-WordExtension),即增加了一组6个命令来存取8位或16位的数据。
最开始,Alpha架构处理的数据都是32位或64位的,不过要在其他的处理器架构,如i386和MIPS上移植或模拟代码变得比较困难。
因此从1994年6月开始,BWX被应用到新的处理器和芯片组中。
该处理器由966万个晶体管所组成,核心面积为209平方毫米,需要两种工作电压2.5V和3.3V。
EV56的设计时钟频率为66MHz到666MHz,TDP为31W到55W不等。
从96年夏天开始,授权生产的三星开始出货。
EV56
21164PC(PCA56)在1997年3月17日,作为EV56的低价版发布。
这款处理器是由DEC和三菱联合研制的。
S-cache和与此相关的逻辑电路被取消,不过I-cache增大为原来的两倍(16KB)。
处理器由350万个晶体管所组成,芯片面积为141平方毫米,采用和EV56相同的制造工艺和工作电压。
不过封装方式变为IPGA-499。
核心频率为400MHz-533MHz,TDP为26W到35W不等。
之后不久,三星采用更先进的0.28μ的制造工艺重新生产PCA56(PCA57),I-cache和D-cache都增大了一倍,晶体管的总数也增加到了570万个,不过核心面积却减小到101平方毫米,工作电压进一步下降到2.0V和2.5V。
核心频率提升到533MHz—666MHz。
除了从EV56那里继承了BWX指令之外,PCA56还支持新的指令集—MVI(MotionVideoInstructions),用于加速使用SIMD指令的视频、音频计算速度,和MMX比较类似。
第一款支持EV5的标准芯片组为DECAlcor(21171)。
支持33MHz系统总线,最大支持64MB外置L2缓存,支持8GBFPMECC内存,主内存使用256bit位宽和64bitPCI总线(33MHz)。
标准桥接芯片中还支持ISA和EISA总线,没有内建IDE控制器,不过能够使用第三方产品独立安装。
芯片组由五个物理芯片组成:
1个通用控制器,4个数据转换器。
后来为了配合EV56,从新发布了支持BWX的Alcor修订版。
DEC公司的终结
在1998年1月26日,这家世界上历史最悠久,规模最庞大的计算机公司,因为财政危机而被康柏(Compaq)所收购。
1998年2月2日,DEC公司召开股东大会,并且通过了这项提议。
DEC公司以96亿美元的价格被收购,当时评估DEC公司的市场占有份额为70亿美元。
整个并购过程大约持续了半年左右,1998年6月11日,DEC公司正式在纽约证交所摘牌。
双方从1995年开始接触,96年DEC公司高层同意了康柏的收购提议,到98年被最终摘牌只有短短的三年时间。
根据89年的公司报告,DEC公司大约有13万名雇员,市值超过140亿美元,是仅次于IBM的全美国最大的计算机制造公司,它们还有着非常优秀的研究/开发部门和规模庞大的生产工厂。
人们有理由问道:
为什么如此庞大的公司会在顷刻之间倒下?
其中的原因自然是纷繁复杂,下文将会对DEC公司7大败笔作出一一描述。
败笔之一,思想落后:
很长时间中,DEC公司的创始人,也是一直的CEO—KennethOlsen的销售理念有很大的偏差。
工程师出身的他,对于销售并不了解。
他曾说过“一款优秀的产品能够自己被卖出去”。
这句话深刻的反应了DEC公司对于产品宣传和市场开发的一贯态度。
他同时还认为“每家每户都拥有一台电脑是不可能的”。
也许这些想法放在以前可能是正确的,因为当时的计算机产量很少,价格高昂。
不过在进入20世纪末,当时每年要销售数百万台计算机,计算机的销售网点遍布全美,消费者可以很轻松的买到适合自己的电脑。
与此同时,购买计算机的消费对象也发生了变化,消费的主体从技术/专业人员转移到了普通人群中,这些消费者没有专业的背景知识,甚至分不清“晶体管”和“电阻器”的写法(注:
晶体管和电阻器写法接近,分别为transistor和resistor)。
因此对于市场宣传不够重视,对于市场变化不够敏感,仍然用向专业人员销售的方法,向普通消费者兜售产品,结果事半功倍。
此为败笔一也。
败笔之二,错失良机:
1991年二月,DEC公司推出了EV4处理器。
与此同时,APPLE的工程师们正在为公司的产品寻求一款性能更好的处理器,而EV4的推出给他们留下了深刻的印象。
于是APPLE的CEOJohnSculley曾在