Linux高性能集群硬件和网络体系结构.docx
《Linux高性能集群硬件和网络体系结构.docx》由会员分享,可在线阅读,更多相关《Linux高性能集群硬件和网络体系结构.docx(11页珍藏版)》请在冰点文库上搜索。
Linux高性能集群硬件和网络体系结构
Linux高性能集群-硬件和网络体系结构
级别:
初级
金戈(jinge@),IBM软件工程师,IBM
2002年11月20日
本文是高性能集群系列文章的第三部分。
在本文中,笔者以IBMeServerCluster1300为例介绍了Beowulf集群中硬件和网络体系结构和组成部分。
1Beowulf集群硬件和网络体系结构
图1是Cluster1300的硬件和网络体系结构图
图1是Cluster1300的硬件和网络体系结构图。
从图中可以看出,整个系统由5类计算或网络设备和5类网络组成。
这5类设备是:
∙主控制节点(ControlNode)
∙计算节点
∙以太网交换机(EthernetSwitch)
∙Myrinet交换机
∙TerminalServer
5类网络是:
∙集群局域网(ClusterVLAN蓝色)
∙管理网络(ManagementVLAN右边绿色)
∙IPC网络(IPCVLAN棕色)
∙Terminal网络(灰色)
∙ServiceProcessor网络(左边绿色)
本文的以下部分将介绍这些设备和网络的角色,功能和一般的配置。
回页首
2Beowulf集群中的节点
这一节主要介绍Beowulf集群中的节点,节点的类型和相应的功能。
根据功能,我们可以把集群中的节点划分为6种类型:
∙用户节点(UserNode)
∙控制节点(ControlNode)
∙管理节点(ManagementNode)
∙存储节点(StorageNode)
∙安装节点(InstallationNode)
∙计算节点(ComputeNode)
虽然由多种类型的节点,但并不是说一台计算机只能是一种类型的节点。
一台计算机所扮演的节点类型要由集群的实际需求和计算机的配置决定。
在小型集群系统中,用户节点、控制节点、管理节点、存储节点和安装节点往往就是同一台计算机。
下面我们分别解释这些类型节点的作用。
2.1用户节点(UserNode)
用户节点是外部世界访问集群系统的网关。
用户通常登录到这个节点上编译并运行作业。
用户节点是外部访问集群系统强大计算或存储能力的唯一入口,是整个系统的关键点。
为了保证用户节点的高可用性,应该采用硬件冗余的容错方法,如采用双机热备份。
至少应该采用RAID(RedundantArrayofIndependentDisks)技术保证用户节点的数据安全性。
2.2控制节点(ControlNode)
控制节点主要承担两种任务
∙为计算节点提供基本的网络服务,如DHCP、DNS和NFS。
∙调度计算节点上的作业,通常集群的作业调度程序(如PBS)应该运行在这个节点上。
通常控制节点是计算网络中的关键点,如果它失效,所有的计算节点都会失效。
所以控制节点也应该有硬件冗余保护。
2.3管理节点(ManagementNode)
管理节点是集群系统各种管理措施的控制节点:
∙管理网络的控制点,监控集群中各个节点和网络的运行状况。
通常的集群的管理软件也运行在这个节点上。
∙ASMA的控制点:
ASMA(AdvancedSystemManagerAdapter)允许将计算节点通过菊花链连接构成ServiceProcessor网络用于接受计算节点的警报并收集SNMPTrap.
2.4存储节点(StorageNode)
如果集群系统的应用运行需要大量的数据,还需要一个存储节点。
顾名思义,存储节点就是集群系统的数据存储器和数据服务器。
如果需要存储TB级的数据,一个存储节点是不够的。
这时候你需要一个存储网络。
通常存储节点需要如下配置:
∙ServerRAID保护数据的安全性
∙高速网保证足够的数据传输速度
2.5安装节点(InstallationNode)
安装节点提供安装集群系统的各种软件,包括操作系统、各种运行库、管理软件和应用。
它还必须开放文件服务,如FTP或NFS。
2.6计算节点
计算节点是整个集群系统的计算核心。
它的功能就是执行计算。
你需要根据你的需要和预算来决定采用什么样的配置。
理想的说,最好一个计算节点一个CPU。
但是如果考虑到预算限制,也可以采用SMP。
从性价比角度说,两个CPU的SMP优于3或4个CPU的SMP机器。
因为一个计算节点的失效通常不会影响其他节点,所以计算节点不需要冗余的硬件保护。
2.7集群中节点的部署
虽然由多种类型的节点,但并不是说一台计算机只能是一种类型的节点。
一台计算机所扮演的节点类型要由集群的实际需求和计算机的配置决定。
在小型集群系统中,用户节点、控制节点、管理节点、存储节点和安装节点往往就是同一台计算机,这台计算机通常成为主节点(MasterNode)。
在这种情况下,集群就是由多个计算节点和一个主节点构成。
在大型的集群系统中如何部署这些节点是个比较复杂的问题,通常要综合应用需求,拓扑结构和预算等因素决定。
回页首
3Beowulf集群的网络结构
3.1集群中的网络技术
因为计算节点间的通信需求,IPC网络的性能是Beowulf集群设计中非常重要的话题。
由于应用的需求,通常需要高带宽、速度和低延迟的网络。
Beowulf集群的主要瓶颈通常也在于双工的网络通信,延迟和全局同步。
有好几种网络技术可以用于IPC网络。
它们是快速以太网、千兆以太网和Myrinet。
为了达到高带宽,通常需要采用交换机。
交换机接受从双绞线传来的数据包,但是它和集线器不一样。
它不向所有连接的节点广播这个数据包,它会根据目的地址哪个端口是接受者,然后把这个包传给接受者。
3.2Beowulf集群网络拓扑
如上所述,通常Beowulf集群系统中有5类网络。
其中ServiceProcessor网络是以太网连接起来的菊花链结构,Terminal网络是计算节点和TerminalServer通过串口线连接起来的星形结构。
管理网络、集群网络和IPC网络则是通过交换机相连的。
虽然可以把这三个网络配置在一个网段,但是通常我们把它们分化在三个虚拟网中(VLAN)。
图2是Beowulf集群网络结构。
3.2.1管理网络(ManagementVLAN)
管理网络用于访问IPC网络交换机、ServiceProcessor网络和TerminalServer。
HTTP、Telnet和SNMP等协议被用来管理这些设备。
3.2.2集群网络(ClusterVLAN)
计算节点和存储节点用这个网络进行通常的网络I/O。
3.2.3IPC网络(IPCVLAN)
用于计算节点间的高速通信。
通常由特殊的高速网络设备构成。
3.2.4ServiceProcessor网络
以太网连接起来的菊花链结构,用于系统管理目的。
3.2.5Terminal网络
Terminal网络是计算节点和TerminalServer通过串口线连接起来的星形结构。
TerminalServer是外界访问这个网络的接口。
管理节点通过TerminalServer虚拟出来的终端可以登录到其他节点上完成必要的管理工作。
3.2.6KVM网络
KVM网络是KVMSwitch和各节点连接的星形网络。
其实把KVM网络称为一个网络并恰当。
KVM是指Keyboard、Video和Mouse。
通过KVMSwitch的切换,管理员可以在管理各个节点。
回页首
4附录:
一个Cluster1300集群系统的配置清单
Qty.P/NDescription
IBMProducts
ComputeNodes
4865431YxSeries3301000256256/OPEN24X
437L720218.2GBUltra160HDD
410K3806866Mhz133MHz256K
1233L3144256MB133MHzECCSDRAMRDIMMMEMORY
106P4792C2TCableKit
ManagementNode
186564RYxSeries340,866Mhz,128Mb
119k4630866Mhz133MHz256K
433L3144256MB133MHzECCSDRAMRDIMMMEMORY
137L6091ServeRAID4LLVDSCSIAdapter
337L720218.2GB7200rpmUltra160SCSIHot-SwapSLH
134L1501Netfinity10/100EthernetPCIAdapter2
134L0301NetfinityGigabitEthernetSXAdapter
137L6880270WRedundantHSPowerSupply
SharedResources
19306200Netbay22HalfRack
13619702Netbay22RackExtensionKit
19411AG1Monitor(flatpanel)
1L6888Flatpanelrackmountkit
109N42918x2ConsoleSwitch(KVMSwitch)
294G7447ConsoleCableSet12ft(toKVMswitch)
128L3644SpacesaverKeyboard/trackpoint
128L4707Keyboardtray
237L6866NetbayUniversalVoltagePDU
101K7209ASMAAdapter(Wisemancard)
136L99731MFibreChannelCable
103K9308ShortWaveGBIC(Gigabitmodule)
EquinoxProducts
1990209EquinoxELS-16
1210059Micro-Transceiver,AUI(DB-15)to10BaseT
1790091ELSRackmountkit
4210062EquinoxSerialAdapters
469022610'SerialCables
MyrinetNetworkingProducts
1M3-E16Myrinet20003-slotChassis
1M3-MManagementModule
4M3S-CB-5MMyricomMyrinetLANcables
4M3S-PCI64B-2MyrinetLANCard
1M3SW16-8SMyrinet8-portSerialmodules
MiscellaneousProducts
83'CAT5Cables
51'CAT5Cables
ExtremeNetworksProducts
113020Summit24-FullLayer3-X