DataStage安装手册Word文件下载.docx
《DataStage安装手册Word文件下载.docx》由会员分享,可在线阅读,更多相关《DataStage安装手册Word文件下载.docx(37页珍藏版)》请在冰点文库上搜索。
![DataStage安装手册Word文件下载.docx](https://file1.bingdoc.com/fileroot1/2023-5/11/d2c2cfbf-231b-405b-b1da-2e0cbf7b1409/d2c2cfbf-231b-405b-b1da-2e0cbf7b14091.gif)
进入解压目录Tarxvf2105-ds-75a-aix.tar
进入/解压环境/Ascential.media/aix目录
如果是光盘包,则执行命令:
Mount/cdrom
进入/cdrom目录
1)AIX操作系统执行/Ascential.media/install.sh–admindsadm.
2);
HPUnix执行./INSTALL.SH\;
1。
会出现下图所示:
每步安装都附有图片,图片上方为本图注释:
3)检测用户是否为root,输入y继续
4)提示这是一个新的安装过程,输入y继续
5)确认安装,输入n继续
6)输入n继续
7)licenseagreement,输入y继续
8)选择安装文件临时存放目录,此目录必须存在,dsadm用户要有存取权限,且目录必须为空,输入c改变临时目录
9)确认临时目录路径,输入n继续
10)输入serialnumber,CPUcount,expirationdate,enterpriseeditioncode,servercode,输入n继续,MVSeditioncode不用输入
11)确认信息,输入n继续
12)因为未购买RTIAgent,SASIntegration,IMSSource,所以不用输入以下三个code,输入n继续
13)默认安装路径,输入n继续
14)选择语言,输入c,改变语言
15)输入5,选择简体中文
16)输入n继续
17)选择插件,输入a选择全部
18)输入n继续
19)输入projectname:
UDI,回车继续
20)project默认存放路径,回车继续
21)输入U选择unprotectedproject,继续
22)输入n继续
23)DataStage引擎安装路径,输入n继续
24)输入n继续
25)输入n继续
26)输入n开始安装
3.1.1.5安装完毕,检查后台Server是否启动正常
输入ps–ef|grepdsrpcd
后台Server进程名dsrpcd
如果未正常启动,请检查安装日志(/app/dsadm/Ascential/DataStage/Logfiles)
3.1.2Client安装
执行datastageclient文件夹中执行setup,选择client端安装。
注意:
Client需要安装Microsoft.NetFramework支持。
如未安装Framework,client安装程序开始后会提示是否从安装光盘安装Framework,选择是安装Framework。
安装结束后,请重新执行安装光盘中的setup,继续安装client.
依次输入客户端的输入Serialnumber,UserLimit,EnterpriseCode,AuthorizationCode;
选择安装文件夹,点击Next直到安装完成。
3.1.3EEStage安装
安装前准备
确保DSEEServer正确安装
安装步骤
1、在用户的.profile中设置环境变量
APT_ORCHHOME=/home/dsadm/Ascential/DataStage/PXEngine;
exportAPT_ORCHHOME
DSHOME=/home/dsadm/Ascential/DataStage/DSEngine
ExportDSHOME
PATH=$PATH:
$DSHOME/bin:
$APT_ORCHHOME/binNLS_LANG=American_America.ZHS16GBK;
exportNLS_LANG
2、在服务器端重启服务
uv–admin–stop
uv–admin–start
3.1.4验证
创建测试job
点击菜单Tools中RunDirector
进入Director中查看程序是否运行成功:
发现test1状态为Finished,说明DataStage安装成功。
3.2DataStage集群配置
DB2EnterpriseEditionStage是DataStageParallelJob提供的三种DB2Stage之一。
其效率远超DB2APIStage。
对于大数据量处理,推荐首选DB2EEStage。
按照DB2的认证方式及与是否为RemoteDB,有如下三种情况:
1)LocalDB,认证方式无关紧要。
对于LocalDB,配置比较简单。
在dsenv中添加DB2环境变量,不推荐直接执行db2profile,最好单独添加$PATH,$LIBPATH等环境变量。
注意$LIBPATH一定要指向32位lib。
确保无错执行db2setup.sh和db2grant.sh,这两个脚本可以参照下文修改。
2)RemoteDB,采用Client端认证。
对于RemoteDB&
ClientAuthentication,不需要在DB2服务器上做任何设置,只要参照下文中DataStage服务器端设置部分即可。
3)RemoteDB,采用Server端认证
下文介绍了当DB2为RemoteDB&
ServerAuthentication时,如何配置DB2EEStage的详细步骤。
要求具体实施人员熟悉DataStageEE,熟悉DB2的基本概念及DB2通信原理,熟练使用UNIX操作系统。
配置DB2EEStage前,确保DataStageEE服务器已经正确安装并且正常运行。
3.2.1环境
内容
1.
硬件环境
DataStage
1个节点,hostname:
datastage
DB2
3个节点
Hostname分别为:
db01,db02,db03
3.
软件环境
IBMAIX5.3,DataStage7.5.2,DB2v8
3.2.2安装DB2客户端
本部分请DBA协助完成。
在DataStage服务器上创建32位DB2客户端。
Catalog远程数据库到本地。
3.2.3配置RemoteShell(即rsh)
本部分请操作系统管理员协助完成。
DataStage通过rsh和DB2各个物理节点进行通信。
以此次配置为例,DataStage使用1个节点,DB2使用3个节点。
Rsh配置完成后,要确保以上4个节点,任意两个节点间能够不需要密码通过rsh执行命令或者登陆。
3.2.4修改hosts文件
修改DataStage服务器与DB2服务器的hosts文件,添加hostname与对应的IP地址
3.2.5DB2节点上创建dsadm用户及dstage组
在DB2三个节点上创建dstage组及dsadm用户,令dsadm主组为dstage,GroupSet应当包括DB2组。
确保与Datastage服务器上的dsadm用户有相同的主目录。
建议与DataStage服务器上的dsadm用户及dstage组保持相同的UID及GID。
修改DataStage服务器上dsadm用户GroupSet,添加DB2组
3.2.6修改DB2节点dsadm用户.profile
修改所有DB2节点dsadm的.profile,添加如下变量:
DB2DIR=/usr/opt/db2_08_01;
exportDB2DIR
DB2INSTANCE=qdb01;
exportDB2INSTANCE
INSTHOME=/db2home/qdb01;
exportINSTHOME
$INSTHOME/sqllib/bin:
$INSTHOME/sqllib/adm:
$INSTHOME/sqllib/misc
exportPATH
DB2PATH=$INSTHOME/sqllib/bin:
$INSTHOME/sqllib/misc;
exportDB2PATH
LIBPATH=$LIBPATH:
/home/dsadm/Ascential/DataStage/DSEngine/lib:
/home/dsadm/Ascential/DataStage/PXEngine/lib:
$DB2DIR/lib:
$INSTHOME/sqllib/lib32;
exportLIBPATH
使用echo命令查看$PATH及$LIBPATH,如下图所示
3.2.7复制DataStagePXEngine到DB2节点
执行DataStage服务器端$APT_ORCHHOME/install/copy-orchdist脚本,脚本语法如下
copy-orchdist[remote-hostname]
此脚本将通过rsh复制DataStage并行处理引擎到DB2节点。
令参数remote-hostnam等于不同的DB2节点名,执行多次将DataStage并行处理引擎复制到DB2节点。
下图为执行脚本的示例,以本次配置为例,需要执行三次脚本,每次参数分别为db01,db02,db03
至此,在DB2节点上的配置告一段落。
3.2.8复制DB2节点配置文件
将DB2Node0节点上的db2nodes.cfg拷贝到DataStage服务器/home/dsadm/sqllib下。
3.2.9修改DataStage服务器dsenv文件
在DataStage服务器dsenv文件中添加如下变量:
#####addAPT_ORCHHOME/lib
$APT_ORCHHOME/lib
#####ADDDB2ENV##########
DB2INSTANCE=qetldb;
INSTHOME=/db2home/qetldb;
3.2.10修改DataStageconfigurationfile
修改DataStageConfigurationFile,添加DB2节点,范例如下:
{
node"
node1"
{
fastname"
datastage"
pools"
"
resourcedisk"
/home/dsadm/Ascential/DataStage/Datasets"
{pools"
}
resourcescratchdisk"
/home/dsadm/Ascential/DataStage/Scratch"
}
node2"
datastage"
node3"
node4"
node5"
db01"
node6"
db02"
node7"
db03"
3.2.11修改DataStage服务器dsadm用户.profile
在dsadm用户的.profile中添加dsenv文件,如下图:
使用echo命令查看$PATH及$LIBPATH
3.2.12执行DataStage服务器上DB2授权脚本
切换目录到$APT_ORCHHOME/bin,修改$APT_ORCHHOME/bin/db2setup.sh,
#!
/bin/sh
#usage:
db2setup.sh<
dbname>
#
#EnvironmentvariablesDB2INSTANCEandINSTHOMEmustbesetcorrectly.
#anddb2(thecommand-lineinterfacetodb2)mustbeonyourpath
iftest$#=3
then
db2connectto$1user$2using$3
db2bind${APT_ORCHHOME}/bin/db2esql.bnddatetimeISOblockingallgrantpublic#thisstatementmustberunfrom/instance_dir/bnd
cd${INSTHOME}/sqllib/bnd
db2bind@db2ubind.lstdatetimeISOblockingallgrantpublic
db2bind@db2cli.lstdatetimeISOblockingallgrantpublic
db2connectreset
db2terminate
else
echo'
Usage:
<
user>
passwd>
'
exit1
fi
修改$APT_ORCHHOME/bin/db2grant.sh
db2grant.sh<
username>
#TheenvironmentvariableDB2INSTANCEmustbesetcorrectly.
iftest$#=4
db2grantbind,executeonpackagedsadm.db2esqltogroup$4
group>
执行上述两个脚本:
./db2setup.sh[DBNAME][USER][PASSWD]
./db2grant.sh[DBNAME][USER][PASSWD][dsadm用户主组]
以本次配置为例,应该执行:
./db2setup.shqetldbdb2inst1db2inst1
./db2setup.shqetldbdb2inst1db2inst1dstage
确保脚本执行完毕,没有错误发生。
如发生错误,请尝试拷贝命令,在命令行中执行。
3.2.13重启动DataStage服务
断开所有DataStage客户端。
停止DataStage服务,执行命令uv–admin–stop
等待30秒uv-admin-start重新启动DataStage服务。
3.2.14DB2EESTAGE配置结束
在JobParameters中添加:
$APT_CONFIG_FILE,令其等于第10步中创建的DataStage配置文件
$APT_DB2INSTANCE_HOME,令其等于/home/dsadm
在DB2EEStage中添加ClientInstanceName,等于本地客户端创建时的实例名。
尝试ViewData,如果可以看到数据则配置成功。
配置过程中,不可随意更改路径顺序,必要时请参照图片。
3.2.15验证
创建测试job,测试向DB2数据库中装载数据
同上面验证方法一样,程序状态为Finished则集群配置成功。
3.3DataStage环境配置
3.3.1新建工程ETL_ODS
通过DataStageAdministration登陆ETL服务器,点击Add按钮新建工程ETL_ODS,并指定工程所在路径。
3.3.2配置工程环境
建好工程后点击Properties按钮,进入下图界面,
点击Envirorment按钮
进入OperatorSpecific,设置环境变量APT_COPY_TRANSFORM_OPERATOR的值为True。
设置该环境的变量的目的是:
将TransformerStage编译后的文件rcp到各个物理几点对应的工程目录下。
当然,如果工程目录为各物理节点所共享则可以不用设置该变量。
进入UserDefined菜单下,添加变量APT_IMPEXP_ALLOW_ZERO_LENGTH_FIXED_NULL,并将其值设为yes
该变量设置后,对于各种字段类型,在DataStage读文本的时候,如果两个字段分隔符间没有任何字符,则认为该字段为空,如果该字段为非空,在sequencefilestage中可以针对每个字段做相应的空处理。
3.3.3配置节点
修改节点配置文件:
$DSHOME/../Configurations/default.apt
如下所示:
fastname"
dev91"
pools"
resourcedisk"
/dsapp/scratch/DataSet"
resourcescratchdisk"
/dsapp/scratch/Pool"
}
dev88"
/odsapp/DataSets"
/odsapp/scratch"