Linux高性能集群硬件和网络体系结构.docx

上传人:b****1 文档编号:10403934 上传时间:2023-05-25 格式:DOCX 页数:11 大小:48.44KB
下载 相关 举报
Linux高性能集群硬件和网络体系结构.docx_第1页
第1页 / 共11页
Linux高性能集群硬件和网络体系结构.docx_第2页
第2页 / 共11页
Linux高性能集群硬件和网络体系结构.docx_第3页
第3页 / 共11页
Linux高性能集群硬件和网络体系结构.docx_第4页
第4页 / 共11页
Linux高性能集群硬件和网络体系结构.docx_第5页
第5页 / 共11页
Linux高性能集群硬件和网络体系结构.docx_第6页
第6页 / 共11页
Linux高性能集群硬件和网络体系结构.docx_第7页
第7页 / 共11页
Linux高性能集群硬件和网络体系结构.docx_第8页
第8页 / 共11页
Linux高性能集群硬件和网络体系结构.docx_第9页
第9页 / 共11页
Linux高性能集群硬件和网络体系结构.docx_第10页
第10页 / 共11页
Linux高性能集群硬件和网络体系结构.docx_第11页
第11页 / 共11页
亲,该文档总共11页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

Linux高性能集群硬件和网络体系结构.docx

《Linux高性能集群硬件和网络体系结构.docx》由会员分享,可在线阅读,更多相关《Linux高性能集群硬件和网络体系结构.docx(11页珍藏版)》请在冰点文库上搜索。

Linux高性能集群硬件和网络体系结构.docx

Linux高性能集群硬件和网络体系结构

Linux高性能集群-硬件和网络体系结构

级别:

初级

金戈(jinge@),IBM软件工程师,IBM

2002年11月20日

本文是高性能集群系列文章的第三部分。

在本文中,笔者以IBMeServerCluster1300为例介绍了Beowulf集群中硬件和网络体系结构和组成部分。

1Beowulf集群硬件和网络体系结构

图1是Cluster1300的硬件和网络体系结构图

图1是Cluster1300的硬件和网络体系结构图。

从图中可以看出,整个系统由5类计算或网络设备和5类网络组成。

这5类设备是:

∙主控制节点(ControlNode)

∙计算节点

∙以太网交换机(EthernetSwitch)

∙Myrinet交换机

∙TerminalServer

5类网络是:

∙集群局域网(ClusterVLAN蓝色)

∙管理网络(ManagementVLAN右边绿色)

∙IPC网络(IPCVLAN棕色)

∙Terminal网络(灰色)

∙ServiceProcessor网络(左边绿色)

本文的以下部分将介绍这些设备和网络的角色,功能和一般的配置。

回页首

2Beowulf集群中的节点

这一节主要介绍Beowulf集群中的节点,节点的类型和相应的功能。

根据功能,我们可以把集群中的节点划分为6种类型:

∙用户节点(UserNode)

∙控制节点(ControlNode)

∙管理节点(ManagementNode)

∙存储节点(StorageNode)

∙安装节点(InstallationNode)

∙计算节点(ComputeNode)

虽然由多种类型的节点,但并不是说一台计算机只能是一种类型的节点。

一台计算机所扮演的节点类型要由集群的实际需求和计算机的配置决定。

在小型集群系统中,用户节点、控制节点、管理节点、存储节点和安装节点往往就是同一台计算机。

下面我们分别解释这些类型节点的作用。

2.1用户节点(UserNode)

用户节点是外部世界访问集群系统的网关。

用户通常登录到这个节点上编译并运行作业。

用户节点是外部访问集群系统强大计算或存储能力的唯一入口,是整个系统的关键点。

为了保证用户节点的高可用性,应该采用硬件冗余的容错方法,如采用双机热备份。

至少应该采用RAID(RedundantArrayofIndependentDisks)技术保证用户节点的数据安全性。

2.2控制节点(ControlNode)

控制节点主要承担两种任务

∙为计算节点提供基本的网络服务,如DHCP、DNS和NFS。

∙调度计算节点上的作业,通常集群的作业调度程序(如PBS)应该运行在这个节点上。

通常控制节点是计算网络中的关键点,如果它失效,所有的计算节点都会失效。

所以控制节点也应该有硬件冗余保护。

2.3管理节点(ManagementNode)

管理节点是集群系统各种管理措施的控制节点:

∙管理网络的控制点,监控集群中各个节点和网络的运行状况。

通常的集群的管理软件也运行在这个节点上。

∙ASMA的控制点:

ASMA(AdvancedSystemManagerAdapter)允许将计算节点通过菊花链连接构成ServiceProcessor网络用于接受计算节点的警报并收集SNMPTrap.

2.4存储节点(StorageNode)

如果集群系统的应用运行需要大量的数据,还需要一个存储节点。

顾名思义,存储节点就是集群系统的数据存储器和数据服务器。

如果需要存储TB级的数据,一个存储节点是不够的。

这时候你需要一个存储网络。

通常存储节点需要如下配置:

∙ServerRAID保护数据的安全性

∙高速网保证足够的数据传输速度

2.5安装节点(InstallationNode)

安装节点提供安装集群系统的各种软件,包括操作系统、各种运行库、管理软件和应用。

它还必须开放文件服务,如FTP或NFS。

2.6计算节点

计算节点是整个集群系统的计算核心。

它的功能就是执行计算。

你需要根据你的需要和预算来决定采用什么样的配置。

理想的说,最好一个计算节点一个CPU。

但是如果考虑到预算限制,也可以采用SMP。

从性价比角度说,两个CPU的SMP优于3或4个CPU的SMP机器。

因为一个计算节点的失效通常不会影响其他节点,所以计算节点不需要冗余的硬件保护。

2.7集群中节点的部署

虽然由多种类型的节点,但并不是说一台计算机只能是一种类型的节点。

一台计算机所扮演的节点类型要由集群的实际需求和计算机的配置决定。

在小型集群系统中,用户节点、控制节点、管理节点、存储节点和安装节点往往就是同一台计算机,这台计算机通常成为主节点(MasterNode)。

在这种情况下,集群就是由多个计算节点和一个主节点构成。

在大型的集群系统中如何部署这些节点是个比较复杂的问题,通常要综合应用需求,拓扑结构和预算等因素决定。

回页首

3Beowulf集群的网络结构

3.1集群中的网络技术

因为计算节点间的通信需求,IPC网络的性能是Beowulf集群设计中非常重要的话题。

由于应用的需求,通常需要高带宽、速度和低延迟的网络。

Beowulf集群的主要瓶颈通常也在于双工的网络通信,延迟和全局同步。

有好几种网络技术可以用于IPC网络。

它们是快速以太网、千兆以太网和Myrinet。

为了达到高带宽,通常需要采用交换机。

交换机接受从双绞线传来的数据包,但是它和集线器不一样。

它不向所有连接的节点广播这个数据包,它会根据目的地址哪个端口是接受者,然后把这个包传给接受者。

3.2Beowulf集群网络拓扑

如上所述,通常Beowulf集群系统中有5类网络。

其中ServiceProcessor网络是以太网连接起来的菊花链结构,Terminal网络是计算节点和TerminalServer通过串口线连接起来的星形结构。

管理网络、集群网络和IPC网络则是通过交换机相连的。

虽然可以把这三个网络配置在一个网段,但是通常我们把它们分化在三个虚拟网中(VLAN)。

图2是Beowulf集群网络结构。

3.2.1管理网络(ManagementVLAN)

管理网络用于访问IPC网络交换机、ServiceProcessor网络和TerminalServer。

HTTP、Telnet和SNMP等协议被用来管理这些设备。

3.2.2集群网络(ClusterVLAN)

计算节点和存储节点用这个网络进行通常的网络I/O。

3.2.3IPC网络(IPCVLAN)

用于计算节点间的高速通信。

通常由特殊的高速网络设备构成。

3.2.4ServiceProcessor网络

以太网连接起来的菊花链结构,用于系统管理目的。

3.2.5Terminal网络

Terminal网络是计算节点和TerminalServer通过串口线连接起来的星形结构。

TerminalServer是外界访问这个网络的接口。

管理节点通过TerminalServer虚拟出来的终端可以登录到其他节点上完成必要的管理工作。

3.2.6KVM网络

KVM网络是KVMSwitch和各节点连接的星形网络。

其实把KVM网络称为一个网络并恰当。

KVM是指Keyboard、Video和Mouse。

通过KVMSwitch的切换,管理员可以在管理各个节点。

回页首

4附录:

一个Cluster1300集群系统的配置清单

Qty.P/NDescription

IBMProducts

ComputeNodes

4865431YxSeries3301000256256/OPEN24X

437L720218.2GBUltra160HDD

410K3806866Mhz133MHz256K

1233L3144256MB133MHzECCSDRAMRDIMMMEMORY

106P4792C2TCableKit

ManagementNode

186564RYxSeries340,866Mhz,128Mb

119k4630866Mhz133MHz256K

433L3144256MB133MHzECCSDRAMRDIMMMEMORY

137L6091ServeRAID4LLVDSCSIAdapter

337L720218.2GB7200rpmUltra160SCSIHot-SwapSLH

134L1501Netfinity10/100EthernetPCIAdapter2

134L0301NetfinityGigabitEthernetSXAdapter

137L6880270WRedundantHSPowerSupply

SharedResources

19306200Netbay22HalfRack

13619702Netbay22RackExtensionKit

19411AG1Monitor(flatpanel)

1L6888Flatpanelrackmountkit

109N42918x2ConsoleSwitch(KVMSwitch)

294G7447ConsoleCableSet12ft(toKVMswitch)

128L3644SpacesaverKeyboard/trackpoint

128L4707Keyboardtray

237L6866NetbayUniversalVoltagePDU

101K7209ASMAAdapter(Wisemancard)

136L99731MFibreChannelCable

103K9308ShortWaveGBIC(Gigabitmodule)

EquinoxProducts

1990209EquinoxELS-16

1210059Micro-Transceiver,AUI(DB-15)to10BaseT

1790091ELSRackmountkit

4210062EquinoxSerialAdapters

469022610'SerialCables

MyrinetNetworkingProducts

1M3-E16Myrinet20003-slotChassis

1M3-MManagementModule

4M3S-CB-5MMyricomMyrinetLANcables

4M3S-PCI64B-2MyrinetLANCard

1M3SW16-8SMyrinet8-portSerialmodules

MiscellaneousProducts

83'CAT5Cables

51'CAT5Cables

ExtremeNetworksProducts

113020Summit24-FullLayer3-X

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2