数据迁移服务V200R100C00OracleRAC下使用ASM的数据迁移方案Word格式.docx
《数据迁移服务V200R100C00OracleRAC下使用ASM的数据迁移方案Word格式.docx》由会员分享,可在线阅读,更多相关《数据迁移服务V200R100C00OracleRAC下使用ASM的数据迁移方案Word格式.docx(18页珍藏版)》请在冰点文库上搜索。
对应产品开局指导书
第1章数据迁移前必读
1.1概述
本文以在Linux系统下OceanStorS3100迁移到OceanStorS5900为例,详细描述了使用OracleRAC的ASM卷管理功能实现不同存储系统之间的数据迁移,同时提供了常见的问题解答。
1.2读者对象
本文档用于指导华为服务工程师和华为合作工程师使用OracleRAC的ASM卷管理功能实现跨存储的数据迁移。
操作人员必须具备以下经验和技能:
●熟悉当前业务的组网和系统版本信息。
●有华为存储设备维护经验,熟悉设备的操作维护方式。
●Linux服务器操作维护经验,OracleRAC的ASM使用经验
1.3适用场景
本文只介绍使用OracleRAC的ASM卷管理功能进行数据迁移的存储配置操作以及数据迁移相关的步骤,不包括上层的业务等系统相关的配置操作过程和步骤。
必须同时满足以下几点,才能使用OracleRAC的ASM卷管理功能进行数据迁移。
●业务场景
OracleRAC应用的磁盘被ASM管理。
●存储型号
兼容对应Linux系统环境的存储,例如本文中的S3100(源存储)和S5900(目标存储)。
●组网方式
1.DAS连接(服务器直连存储)。
2.SAN连接(服务器通过交换机直连存储)。
●迁移方式
支持在线或离线的数据迁移,如有疑问请联系存储专业服务团队寻求技术支持。
&
说明
安装目标存储多路径软件、卸载源存储多路径软件等步骤需根据实际要求确定是否停止业务。
1.4注意事项
进行数据迁移时,需要注意以下几点:
●请确保电源持续供电。
●Xxxxxx(请补充)
第2章数据迁移流程
使用OracleRAC的ASM卷管理进行数据迁移总体流程如下图所示:
第3章数据迁移前准备
3.1迁移环境准备
检查时间
检查项目
参考章节
耗时
升级前1周
准备参考文档
30分钟
查询系统信息
分钟
升级前3天
获取所需的软件及工具
获取所需的软件和工具
1小时
检查设备的运行状态
3.1.1准备参考文档
包括并不限于以下文档:
参考文档
备注
分工界面
目标存储兼容性列表,需含本次替换测试的输出文档
华为
源存储操作指导书、多路径软件使用手册、巡检指导书
华为存储使用ISM管理软件和UltraPath多路径软件
客户(如果源存储也是华为提供,则由华为负责)
目标存储操作指导书、多路径软件使用手册、巡检指导书
3.1.2查询系统信息
包括并不限于以下信息:
系统信息
主机信息
Ø
操作系统版本
OracleRAC配置信息
磁盘信息
磁盘容量
ASM管理的对象信息
HBA卡信息
。
客户/华为
源存储多路径软件及版本
源存储配置信息
RAID、LUN、映射关系、告警集成等配置信息
业务环境组网图
主机、光纤交换机、源存储的组网图
客户
3.1.3获取所需的软件和工具
包括并不限于以下软件和工具:
软件或工具名称
SSH登录工具
Putty、SshClient等
华为/客户
FTP工具
目标存储管理软件
华为存储网管软件是ISM
源存储管理软件
目标存储多路径软件
华为存储多路径软件是UltraPath,根据系统信息确定目标存储对应的多路径软件版本
其他工具准备:
串口线(RJ45串口)、网线、防静电手套、标签纸、笔记本电脑(确认可连接RJ45串口)。
3.1.4检查系统及设备运行状态
包括并不限于以下运行状态:
业务、集群等运行状态
通过重启主机、集群切换等操作确认运行是否正常
客户(如果业务是华为提供,则由华为负责)
主机运行状态
多路径运行是否正常、HBA卡及链路是否正常等
源存储运行状态
光纤交换机运行状态
光纤交换机运行是否正常,链路连接是否正常
客户(如果光纤交换机是华为提供,则由华为负责)
注意
1、启动数据迁移前务必进行主机/业务重启以及集群切换等动作,确保业务系统没有潜在的风险
2、进行检查过程中如果发现业务软硬件环境存在故障,必须在启动数据迁移前完成故障处理,确保业务系统和设备都健康运行
3.2配置目标存储
请完全按照源存储(S3100)的RAID组、LUN、主机组、主机和映射关系等配置,完成目标存储(S5900)的安装部署。
3.2.1配置热备盘
在每个框(控制框或硬盘框)里面,配置两块热备盘。
如果每框满配24块硬盘,请将slot22和slot23硬盘设置为热备盘,如果没有满配,请将最后两块硬盘设置为热背盘。
3.2.2创建RAID组及划分LUN
请根据《XXX数据迁移项目设备档案.xlsx》记录的“3、RAID配置”和“4、LUN配置与映射”,按照以下要求,完成S5900存储的配置。
●RAID组配置:
与原S3100的RAID组顺序、RAID组名称、RAID级别和RAID组成员盘数目等RAID组配置信息保持完全一致。
●LUN配置:
与原S3100的LUN归属RAID组、LUN名称、LUN容量和LUN数目等配置信息保持一致。
●映射关系:
与S3100的主机组、主机和启动器信息保证完全一致。
1.当目标存储新创建的LUN的运行状态是“正在格式化”时,可以进行配置操作,但不能进行数据迁移。
2.全部LUN的运行状态从“正在格式化”变成“在线”后,表示可正常读写数据,才能再进行数据迁移操作。
3.启动数据迁移前,必须确认目标存储(S5900)工作状态正常,无任何告警,否则不能进行数据迁移操作。
3.3数据备份
包括并不限于以下数据:
业务配置信息
集群、业务平台(数据库/邮件系统等业务配置)等信息
备份3.1.2节中涉及的系统信息
光纤交换机配置
如果业务中有用到光纤交换机,则备份光纤交换机的配置信息
源存储数据
源存储上即将进行迁移的数据需要备份
迁移前必须进行数据备份,降低数据迁移风险。
第4章数据迁移方案
使用OracleRAC的ASM卷管理进行迁移步骤如下:
说明
本文档中重点描述了数据迁移过程与存储相关的操作步骤,实际流程需要根据现网实际情况补充业务系统相关的操作步骤。
4.1添加目标存储映射
说明:
“添加目标存储映射”时间和业务组网复杂度以及源LUN数量相关,可按照120min进行估算
需先确认是否满足以下2个条件:
1、目标存储的多路径软件和源存储多路径软件兼容,可以共存与同一台主机上并对2台存储映射的LUN互不影响;
2、目标存储的多路径软件安装在操作系统上不需要重启主机就可以生效;
如果无法确认是否满足上面2个条件,请联系二线进行支持。
如果同时满足以上2个条件,可以按照下面步骤操作:
步骤一:
按照标准组网将目标存储通过DAS或SAN方式连接到Linux主机上;
步骤二:
在linux主机上安装目标存储多路径软件;
如果不能同时满足以上2个条件,比如本文中的目标存储(S5900)多路径安装需要重启主机生效,则按照下面章节的内容进行操作
1.步骤一:
更改设备物理连接
将目标存储(S5900)的2个控制器上的2个业务光纤接口连接到Linux主机或者光纤交换机对应端口,如下图:
2.步骤二:
映射目标存储LUN给主机
完成物理组网后,在目标存储(S5900)使用的ISM管理软件添加对应的主机的FCHBA信息,并将格式化完成的LUN映射给主机。
本文是OracleRAC双机应用,需将目标存储的LUN同时映射给双机,但迁移时只需在一台主机进行迁移操作。
4.2迁移数据
迁移速度可按照60MB/s进行估算
确认RAC环境
本文中为RAC双机,命名为node1和node2,使用下面命令确认OracleASM使用磁盘组个数和各自的磁盘个数:
#su–oracle
#exportORACLE_SID=ASM1
#sqlplus“/assysdba”
SQL>
selectnamefromv$asm_diskgroup;
Name
----------------------------
Dg_data
Dg_index
从显示结果可知OracleRAC的ASM实例使用的卷组是dg_data和dg_index磁盘组。
再使用下面的命令确认每个磁盘组包含的磁盘个数和在os中对应的盘符。
selectname,disk_number,failgroup,pathfromv$asm_disk
Namedisk_numberfailgrouppath
……..
本文OracleRAC环境下dg_data使用sdb,dg_index卷使用sdc,dg_ocr、dg_lock和dg_ora分别在sdd的3个分区上。
在ASM中查看各卷已使用容量。
在节点1依次执行:
#su-oracle
#exportORACL_SID=+ASM1
#asmcmd
进入ASM命令行,使用下面命令查看空间使用情况:
#lsdsk–k
通过上面的命令输出计算容量:
共使用了约620G空间,其中data卷约250G,index卷约350G,其他三个卷总容量之和不到20G。
如果觉得空间占用太多,可以删除一些多余实例,腾出了部分空间。
停止业务和RAC集群,安装目标存储多路径软件
在RAC双机上分别安装目标存储(S5900)多路径软件(具体步骤请参考对应版本多路径安装指导书),扫描识别目标存储映射的LUN。
Linux对设备即插即用支持较差,在线情况下如果无法扫描出新映射的LUN,需要重启主机识别新映射的LUN
3.步骤三:
迁移dg_ocr、dg_lock和dg_ora
使用dd命令直接复制这些raw设备来实现数据迁移,具体操作如下:
1、按照sdd的分区方式将目标存储(S5900)映射的sdf创建3个分区,分别对应dg_ocr、dg_lock和dg_ora
2、停止业务和RAC集群,修改linkraw_oracle.sh,在新建的3个分区上创建raw设备,替换dg_ocr、dg_lock和dg_ora原来的raw设备。
将/etc/init.d/linkraw_oracle.sh如下
raw/dev/raw/raw1231/dev/sdd1
ln-f-s/dev/raw/raw1231/dev/diskgroup/dg_ocr
raw/dev/raw/raw1232/dev/sdd2
ln-f-s/dev/raw/raw1232/dev/diskgroup/dg_lock
raw/dev/raw/raw1233/dev/sdd3
ln-f-s/dev/raw/raw1233/dev/diskgroup/dg_ora
修改为:
raw/dev/raw/raw1236/dev/sdf1
ln-f-s/dev/raw/raw1236/dev/diskgroup/dg_ocr
raw/dev/raw/raw1237/dev/sdf2
ln-f-s/dev/raw/raw1237/dev/diskgroup/dg_loc
raw/dev/raw/raw1238/dev/sdf3
ln-f-s/dev/raw/raw1238/dev/diskgroup/dg_ora
3、执行如下命令完成裸设备更新:
#sh/etc/init.d/linkraw_oracle.shstart
4、用如下dd命令分别把数据迁移过去:
#ddif=dev/raw/raw1231of=dev/raw/raw1237bs=1M
#ddif=dev/raw/raw1232of=dev/raw/raw1238bs=1M
#ddif=dev/raw/raw1233of=dev/raw/raw1239bs=1M
4.步骤四:
重启RAC集群和业务
5.步骤五:
迁移dg_data和dg_index
此过程在线进行,具体操作如下:
1、为目标存储的LUN建立raw和软链接
目标存储(S5900)用于迁移的LUN映射给主机后盘符为sdg和sdh,使用下面命令建立raw和软链接:
#raw/dev/raw/raw1239/dev/sdg
#ln-f-s/dev/raw/raw1239/dev/diskgroup/dg_data2
#raw/dev/raw/raw1230/dev/sdh
#ln-f-s/dev/raw/raw1230/dev/diskgroup/dg_index2
#cd/dev/raw/
#chownoracle:
dbaraw1239
#chmod660/dev/raw/1239
dbaraw1230
#chmod660/dev/raw/1230
2、登陆任一主机上的ASM实例
#suoracle
#exportORACL_SID=+AMS1
#sqlplus/nolog
#conn/assysdba
3、将目标存储的LUN添加到ASM中对应的diskgroup中
alterdiskgroupDG_DATAadddisk'
/dev/diskgroup/dg_data2'
namedg_data2;
alterdiskgroupDG_DATArebalancepower8;
alterdiskgroupDG_INDEXadddisk'
/dev/diskgroup/dg_index2'
namedg_index2;
alterdiskgroupDG_INDEXrebalancepower8;
1、第一条命令的意思就是往名为DG_DATA这个的diskgroup中添加名为dg_data2的磁盘,物理路径为/dev/diskgroup/dg_data2,它实际上一个指向raw设备的软链接。
diskgroup的名字可以在ASMCMD下面通过lsdg命令查看
2、第二条命令是修改数据平衡速度的。
后两条命令与前两条含义类似
4、启动迁移
从ASM中删除源存储(S3100)上的卷,删除操作会触发ASM将该卷的数据全部迁移到该diskgroup的其他卷上,通过下面命令实现:
alterdiskgroupDG_DATAdropdiskDG_DATA_0000;
alterdiskgroupDG_INDEXdropdiskDG_INDEX_0000;
这时数据会从源存储(S3100)上的dg_data_000和dg_index_000开始往目标存储(S5900)上的dg_index2和dg_data2进行平衡迁移。
ASM中进行的是迁移,不是拷贝,源存储上dg_data_000和dg_index_000的空闲空间会逐步增大
6.步骤六:
修改/etc/init.d/linkraw_oracle.sh文件
修改dg_data和dg_index使用的raw设备,将原配置:
以后重启RAC的时候,就能自动正确地完成raw设备的初始化了。
如果需要移除源存储,目标存储的LUN在Linux服务器上的盘符会发生改变,必须按照新盘符重新修改/etc/init.d/linkraw_oracle.sh文件,以保证RAC集群启动时正确识别磁盘
7.步骤七:
查看进度
1、在RAC双机上分别用iostat命令查看存储磁盘IO
#iostat-xkt2
这时候在ASM中看到原来的数据卷DG_DATA_000和DG_INDEX_000仍然存在,如下图,只是空闲空间在不断增大。
2、确认迁移完成
在RAC双机上分别用iostat命令查看sdb和sdc,如果迁移完成sdb和sdc已无IO流量:
迁移完成后进入RAC任意节点的ASMCMD查看,此时原来的数据卷DG_DATA_000和DG_INDEX_000消失,如下图:
4.3调测业务系统
到此,数据已经完全搬迁到了目标存储上,如果业务拉起正常,业务数据抽检正常,请客户检查并确认数据一致,则可确认数据迁移成功完成。
第5章回退方案
5.1回退场景
考虑环境搭建以及业务切换至新环境的时间。
发生如下情况未能解决则需要执行回退操作。
●相关设备发生短时间无法处理的硬件故障;
●系统无法正确识别分配的存储空间;
●业务经过重新配置后无法正常运行,而且没有相关解决方案;
●现场工程师没有在指定时间段内完成割接。
5.1.1数据备份与恢复
应对措施:
1.通过业务自身的工具进行事前数据备份。
5.1.2割接失败导回方案
凌晨0:
00至5:
00为环境搭建以及业务切换至新环境的时间。
在5:
00前,发生如下情况未能解决则需要执行回退操作:
1.相关设备发生短时间无法处理的硬件故障;
2.系统无法正确识别分配的存储空间;
3.业务经过重新配置后无法正常运行,而且没有相关解决方案。
4.现场工程师没有在指定时间段内完成割接。
5.2回退步骤
出现问题回退步骤如下:
1.组网回退到源存储(S3100)退网前的状态
2.使用备份数据进行恢复
第6章FAQ
第7章缩略语
缩略语
完整术语
RAID
RedundantArrayOfIndependentDisk
FC
FiberChannel
HBA
HostBusAdapter
LUN
LogicalUnitNumber
SCSI
SmallComputerSystemsInterface
WWN
WorldWideName
UltraPath