1、其实Cache Fusion会消耗节点服务器很大的私网资源,另外,私网间无法通信还会引起brain split(脑裂),以前为解决这种问题,我们可以采用网卡bonding技术,而Oracle在11g R2的时候HAIP技术来实现,HAIP(Highly Available Virtual IP)用于节点间的私网通信,支持同时使用多个网络连接来满足网卡间的负载均衡,并且还提高了Cache Fusion资源通信能力。HAIP技术并不是主要内容,所以在这里点到为止。VIP :RAC的每个节点都需要有一个虚拟IP,这就是VIP。VIP需要和PUBLIC IP同一个子网,它们是由GI的Clusterwa
2、re来管理的。VIP在其节点服务器发生故障的时候会自动漂移到另外正常的节点服务器上,如果RAC是多个节点运行的,那具体漂移到哪个活动的节点将由Clusterware决定。VIP发生漂移现象之后,其当前的节点服务器LOCAL LISTENER是不会监听它的请求的,所以有客户端向这个VIP发送请求时,Clusterware的FAN会通知客户端向别的VIP发送请求,客户端收到通知后通过Failover机制把请求重新发送到ADDRESS列表中的其他VIP上。虽然有这种较复杂的过程,但始终对客户端是透明进行的,而且这个过程完成时间非常短暂,客户端也就几乎感受不到有节点宕机。等故障节点恢复正常,漂移的VI
3、P也回到此节点上,继续提供服务。SCAN VIP :SCAN VIP就是我在刚开始常说的SCAN IP,也就是由DNS或者GNS、hosts解析出来的IP地址。上面也说过,SCAN VIP最多能有三个,它们循环地被客户端所请求到。这里大家可能会存在这样的问题,SCAN VIP只有三个,那RAC是四节点或更多的节点情况怎么办?存在这种问题的原因归咎于对SCAN VIP的了解不足。其实,SCAN VIP数量和节点数是没有任何关系的,SCAN VIP会落到哪个节点上都是随机的。GNS VIP :GNS VIP同SCAN VIP,也是Oracle从11g R2开始提供的。GNS VIP是提供GNS服务
4、的IP地址,它绑定到某个节点的PUBLIC IP所在网卡上,当节点出现故障,GNS资源会自动切换到其他正常的节点继续提供GNS解析服务。如果我们不使用GNS解析方法,那么也不会存在GNS VIP。LOCAL LISTENER :本地监听器,RAC的每个节点上都会有独立的本地监听器,它会监听该节点的PUBLIC IP和VIP,而每个节点的实例在启动的时候也向本地监听器进行注册,当然它也会向SCAN监听器注册,当VIP或者PUBLIC IP(这种情况比较少见)有连接请求的时候,本地监听器就接受处理并和本地实例建立连接。如果某个节点故障,其上面的VIP会进行漂移,但本地监听器并不会产生漂移。SCAN
5、 LISTENER :SCAN监听器,它是实现SCAN负载均衡的原理所在。如果RAC上有三个SCAN VIP,那么SCAN监听器也有三个,它们各自监听SCAN VIP的连接请求。SCAN监听器跟着SCAN VIP随机分配到节点服务器上,如果某个节点发生故障,运行在此节点上的SCAN VIP会进行漂移,这时候SCAN监听器也跟着漂移到正常的节点上,继续为SCAN VIP监听连接请求,当PMON进程下次动态更新实例信息到该SCAN监听器之后,它又重新接受客户端的连接。这和VIP产生漂移的时候是有所区别的。LOCAL_LISTENER :这是Oracle的参数,这个参数控制着本地监听器的注册,因为本
6、地监听器的工作机制关系,通过本地监听器的数据库连接请求只会连接到本地节点的实例上。REMOTE_LISTENER : 同LOCAL_LISTENER是Oracle的参数,通过这个设置,任何实例都会向SCAN监听器注册,所以SCAN监听器能够负载均衡地分发连接请求到节点本地监听器上,也就是连接到其本地节点上实例上。关于LOCAL_LISTENER与REMOTE_LISTENER的配置,在下面讲动态注册的时候再看一下。SCAN解析与配置SCAN是在安装GI(Grid Infrastructure)时配置的,作为Clusterware资源被管理。忽略hosts解析之后,有两种方式配置和解析SCAN:
7、 DNS和GNS(Grid Naming Service)。这里重点说一下DNS解析SCAN方式使用DNS解析SCAN的时候,DNS服务器会采用rr(round-robin)的方式循环解析为它准备的3个IP地址,与Oracle 11g R2的客户端配合使不同的客户端能够连接到不同的SCAN Listener上,这相当于是Oracle 10g中配置的客户端负载均衡(通过LOAD_BALANCE=yes配置)。下面看一下客户端通过SCAN连接到数据库的过程,首先由DNS服务器解析SCAN名称,DNS服务器返回SCAN对应的3个IP地址的列表,客户端会选择使用其中一个SCAN VIP地址作为连接地址
8、,将命名方法解析后的连接信息发送到SCAN VIP对应的SCAN Listener上,SCAN Listener通过负载均衡机制再把请求转发给比较空闲的服务器上的本地监听器,由本地监听器完成实例与客户端之间的连接。使用SCAN连接数据库实例,整个过程实现了客户端的Failover(Oracle 10g R2是通过FAILOVER=on来配置),DNS服务器返回的是一个SCAN VIP列表,客户端会选择其中一个连接到RAC,如果这个IP地址不能正常访问,客户端会选择另一个IP地址继续连接,直到所有的地址都不能正常连接,才返回错误给客户端,整个过程对客户端程序来说依然是透明的。需要注意的是,使用S
9、CAN连接到数据库,不再需要客户端能解析节点的PUBLIC IP和VIP,只需要客户端能够通过DNS服务器正常解析SCAN就可以了。负载均衡工作交给服务器端的SCAN实现。至于GNS解析SCAN,因为目前GNS服务存在不稳定的情况,也很少有企业将其投入到生产环境使用,而且其工作原理也较为复杂,所以在这里并不深入说明。实例的动态注册上面已经介绍了LOCAL_LISTENER和REMOTE_LISTENER两个和动态注册有关的参数,那我们看看它们在数据库中的表现形式:本地监听器注册是由实例的LOCAL_LISTENER参数所控制的:SQL set line 150 show parameter l
10、ocal_listenerNAME TYPE VALUE - local_listener string (DESCRIPTION=(ADDRESS_LIST=(AD DRESS=(PROTOCOL=TCP)(HOST=192. 168.0.194)(PORT=1521) 这是我管理的一套RAC上的配置,当然我已经处理好IP地址了。LOCAL_LISTENER设置为向本地VIP地址进行注册,由于本地监听器是在本地的PUBLIC IP和VIP上监听,所以向VIP监听注册就能保证成功向本地监听器注册。查看本地监听器的状态:gridpos2 $ lsnrctl status listenerLSNR
11、CTL for Linux: Version 11.2.0.3.0 Production on 23-OCT-2012 12:01:21Copyright (c) 1991, 2011, Oracle. All rights reserved.Connecting to (DESCRIPTION=(ADDRESS=(PROTOCOL=IPC)(KEY=LISTENER)STATUS of the LISTENERAlias LISTENERVersion TNSLSNR for Linux: Version 11.2.0.3.0 ProductionStart Date 19-JUL-2012
12、 15:31:45Uptime 95 days 20 hr. 29 min. 35 secTrace Level offSecurity ON: Local OS AuthenticationSNMP OFFListener Parameter File /u01/app/11.2.0/grid/network/admin/listener.oraListener Log File /u01/app/grid/diag/tnslsnr/pos2/listener/alert/log.xmlListening Endpoints Summary (DESCRIPTION=(ADDRESS=(PR
13、OTOCOL=ipc)(KEY=LISTENER) (DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=192.168.0.192)(PORT=1521) (DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=192.168.0.194)(PORT=1521)Services SummaryService +ASM has 1 instance(s). Instance +ASM2, status READY, has 1 handler(s) for this servicepospos2posXDBThe command com
14、pleted successfully 这里注意:查看本地监听器信息的时候每个节点只能看到其上运行的实例。SCAN监听器的注册是由REMOTE_LISTENER参数控制的,任何实例都会向所有的SCAN监听器注册: show parameter remote_listenerremote_listener pos-cluster-scan:1521下面是LISTENER_SCAN1的一个状态信息,当然你也可以查看LISTENER_SCAN2和LISTENER_SCAN3的状态。gridpos2 $ lsnrctl status listener_scan106:56Connecting to (
15、DESCRIPTION=(ADDRESS=(PROTOCOL=IPC)(KEY=LISTENER_SCAN1) LISTENER_SCAN1 95 days 20 hr. 35 min. 10 sec /u01/app/11.2.0/grid/log/diag/tnslsnr/pos2/listener_scan1/alert/log.xml (DESCRIPTION=(ADDRESS=(PROTOCOL=ipc)(KEY=LISTENER_SCAN1) (DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=192.168.0.195)(PORT=1521) ha
16、s 2 instance(s).pos1由于任何实例启动都会向所有的SCAN监听器动态注册,从LISTENER_SCAN1的SCAN监听器运行状态来看,SERVICE pos包括了所有的实例名称。就像我昨天回答那位朋友的时候简单说“是通过内部机制”一样,大家可能看到上面的内容并不知道SCAN监听器如何找到比较空闲的实例的。其实SCAN监听器是实时了解所有实例的运行情况的,因此它能够准确地将连接重定向到空闲服务器的本地监听器上。下面我们通过日志查看实例的动态注册与动态更新1)本地监听器动态注册日志:gridpos2 $ cd $ORACLE_BASE/diag/tnslsnr/pos2/list
17、ener/alertgridpos2 alert$ grep service_register log_1.xml | head -3 18-JUN-2012 13:58:23 * service_register * LsnrAgt * 030 * service_register * +ASM2 * 018-JUN-2012 15:54:15 * service_register * pos2 * 0- 之所以选择log_1.xml历史文件是因为发现我的log.xml里基本都是更新日志,没有注册日志。2)本地监听器动态更新日志:gridpos2 alert$ grep service_up
18、date log.xml | head -316-OCT-2012 16:07:09 * service_update * pos2 * 033 * service_update * pos2 * 008:03 * service_update * pos2 * 03)SCAN监听器动态注册日志:gridrac1 $ cd $ORACLE_BASE/diag/tnslsnr/rac1/listener_scan2/alert/gridrac1 $ grep service_register log.xml | head -313-AUG-2012 05:25:00 * service_regi
19、ster * LsnrAgt * 013-AUG-2012 20:29:07 * service_register * luocs1 * 005 * service_register * luocs1 * 0- 这是我另一套测试RAC环境。4)SCAN监听器动态更新日志:gridrac1 $ grep service_update log.xml | head -319 * service_update * luocs1 * 030:46 * service_update * luocs1 * 0注意,如果你的RAC是通过hosts解析了SCAN域名的,那么系统里就找不到上面的SCAN监听器日
20、志的路径。实例的动态注册和动态更新过程是由实例的PMON进程完成的,正是因为SCAN监听器能够实时了解实例的负载情况,所以SCAN监听器能够负载均衡地将连接请求转发给合适实例的本地监听器来处理。这里谈到负载均衡,那么就说下负载均衡中的优先级共享服务器配置中: 低负载节点低负载实例实例相关的低负载调度器专用服务器配置中:SCAN兼容性配置介绍SCAN差不多了,这里还有个兼容性问题不能不说。要完美实现SCAN功能特性,其实对客户端的要求也是存在的。下面看下不同版本和SCAN之间的兼容性编号客户端软件版本服务器端软件版本SCAN特性的使用111gR2能够充分使用SCAN的特性2早于11gR2版本不能
21、充分感受到SCAN特性3在服务器端没有SCAN的概念4这里稍微详细说一下第2种情况,如果客户端低于11g R2的版本,在DNS解析的3个VIP地址中,可能只能固定地使用第一个SCAN VIP连接数据库;如果该SCAN VIP对应的监听器出现故障,那么整个连接将会失败,客户端也会收到到错误信息。那针对兼容性问题我们拿出各种客户端配置方法1)客户端和服务器端软件版本都是11g R2的时候Tnsnames.oraRACSCAN = (DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = luocs-cluster-)(PORT = 1521) (CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = luocs10g) )2)客户端是早于11g R2的版本,服务器端是11g R2的时候 (ADDRESS_LIST = (LOAD_BALANCE=on) (FAILOVER=on) (ADDRESS = (PROTOCOL = TCP)(HOST
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2