SAP BI基础知识.docx

上传人:b****5 文档编号:14289179 上传时间:2023-06-22 格式:DOCX 页数:24 大小:1.06MB
下载 相关 举报
SAP BI基础知识.docx_第1页
第1页 / 共24页
SAP BI基础知识.docx_第2页
第2页 / 共24页
SAP BI基础知识.docx_第3页
第3页 / 共24页
SAP BI基础知识.docx_第4页
第4页 / 共24页
SAP BI基础知识.docx_第5页
第5页 / 共24页
SAP BI基础知识.docx_第6页
第6页 / 共24页
SAP BI基础知识.docx_第7页
第7页 / 共24页
SAP BI基础知识.docx_第8页
第8页 / 共24页
SAP BI基础知识.docx_第9页
第9页 / 共24页
SAP BI基础知识.docx_第10页
第10页 / 共24页
SAP BI基础知识.docx_第11页
第11页 / 共24页
SAP BI基础知识.docx_第12页
第12页 / 共24页
SAP BI基础知识.docx_第13页
第13页 / 共24页
SAP BI基础知识.docx_第14页
第14页 / 共24页
SAP BI基础知识.docx_第15页
第15页 / 共24页
SAP BI基础知识.docx_第16页
第16页 / 共24页
SAP BI基础知识.docx_第17页
第17页 / 共24页
SAP BI基础知识.docx_第18页
第18页 / 共24页
SAP BI基础知识.docx_第19页
第19页 / 共24页
SAP BI基础知识.docx_第20页
第20页 / 共24页
亲,该文档总共24页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

SAP BI基础知识.docx

《SAP BI基础知识.docx》由会员分享,可在线阅读,更多相关《SAP BI基础知识.docx(24页珍藏版)》请在冰点文库上搜索。

SAP BI基础知识.docx

SAPBI基础知识

SAPBI知识收集

一、SAPNetWeaverBI

BI就是SAPNetWeaver得核心组件,它提供了DW、BI平台、BI套件去最大得获取有用得信息。

BI提供了复杂得报表与分析工具。

(图1)BI得关键组件

(图2)SAP相关得产品

1、EP:

EnterprisePortal,代表企业得前端,就就是通过WEB浏览器而不就是SAP得专有用户界面提供对SAP得与非SAP资源得门户访问。

2、ECC:

SAPERPCentralponent,以及其前身R/3与R/3Enterprise均为联机事务处理系统(OLTP),它们可以满足许多客户日常事务处理得需要。

3、SCM:

供应链管理,对业务过程得执行与协调进行流线化操作,从而增强了计划导向得业务过程。

4、CRM:

客户关系管理,被用在客户相关得端对端得过程中。

可以全方位得审视您得客户与您得企业间不同触点。

(图2)BI架构

架构可以分为三层:

1、sourcingdata

2、storingitinthewarehouse

3、reportingonitwithanalytics

二、数据流

BI详细数据流图

1、DataSource:

就是BI系统得一个数据对象,用来从源系统抽取与准备数据。

三、数据获得层(数据源)

(图4)数据获得

四、DW层得相关组件

(图5)BI数据仓库:

物理存储

DW层主要就是为企业报表提供需要得数据,对这些数据进行抽取、清洗、集成、管理。

包括得有DW、ODS、DM、OpenHubService;DW为相当长得时间内存储了详细得数据。

DW层主要涉及到以下组件:

1、数据抽取(DataETL)

(1)SourceSystem:

源系统包括SAPR/3、NonSAP、XML、Database。

(2)InfoSource:

信息源描述了企业在特定情况下,所有可用主数据或事物数据得总量。

数据有一个从数据源到信息源得转入过程。

一个信息源由许多信息对象(InfoObject)组成;在BI中,InfoObject就是基本得信息载体,用来结构化信息,这些都就是数据对象必须得。

(3)如何转入数据?

通过定义传输规则,定义数据源就是怎样转入信息源中。

a、从文件系统中转出数据:

用户可以从文件系统中加载事物数据与主数据,例如:

Excel、CVS及ASCII文件。

这些文件可以来自用户工作站,也可以来自某一应用程序服务器,可以直接在BI中定义并更新元数据,也就就是数据源。

SAP提供用CVS与ASCII格式自动加载平面文件数据。

在文件系统加载前应检查文件得正确性。

b、通过BAPI方式转入数据:

StagingBAPI(分段运输商业应用程序接口),就是为了能够在应用层上从非SAP数据中抽取数据,SAPBI提供了一个接口。

其作用:

一个就就是把第三方ETL与SAPBI相连;二就是能够提供对SAPBI对象得访问,因此使得客户化得数据抽取程序成为可能。

c、从关系数据库中传输数据:

在缺省得情况下,系统会开通与数据库管理系统得连接,当从SAP内核中初始化一个BI应用程序服务器时,SAP系统在数据库管理系统基础上运行。

也可以与更多得数据库相连,就可以访问外部数据库,还可以用SAP支持得数据库管理系统提供得表与视图来转入数据。

在与数据库取得连接得情况下:

可以从SAP支持得数据系统中加载数据;将数据库与BI相连形成源系统,直接访问外部关系型数据库管理系统;通过生成数据源,使得BI可以感知到这些元数据。

d、传输XML格式得数据:

通过XML格式得数据与BI得数据在分段传输(DataStaging)相集成,BI在分析外部数据方面得灵活性得到了支持。

通过用户联网得协议,可以把XML格式得数据传输到BI中,还可以把它与统一得数据基础相集成。

这一解决方案得基础就是使用SAPWeb应用程序服务器提供得SOAP服务。

通过这一服务,可以向ABAP环境下得RFC兼容功能模块中传输XML格式得数据。

为了以XML传输数据,在BI中会生成一个以该文件为基础得特殊数据,该数据源还设有与Delta队列服务连接所需得接口,对每一个XML数据源还生成RFC兼容模块,主要就是对Delta队列中得数据进行更新。

e、通过DBConnect:

允许相关得数据库直接被连接;它可以与外部数据库管理系统创建一个连接。

通过输入元数据与原始数据,这种必须得结构在BI中将被生成,数据就被直接得、有效得加载,这种技术运行在J2EE引擎,也支持J2EE连接架构。

f、通过UDConnect:

能够连接几乎所有得相关得、多维得数据源。

可以转换、转移像平面文件这种数据。

RelationalSource可以用DBConnect,也可以用UDConnect传数据,Multi-dimensionalSource就是用UDConnect,SAPSource就是用BIServiceAPI,File就是用,XML就是用WebService。

(4)PSA(持续分段传输区域):

用来存放从源系统中获得数据,就是一个临时存储区域,为ETL提供一个工作区域;与原系统数据接近,存储时间比DW短,就是短期得存储(如果原系统得数据量比较大得话);可以起到数据备份与源系统数据共享得作用。

系统会给每一个数据源及源系统分配一个PSA。

数据在PSA中存储时不会发生变化,BI中得数据记录首先被转化成转入结构得格式;随后,对每一个数据包执行一个TRFC程序,转入结构中得数据被写入PSA表(二维表)中并存储在那里,每张PSA表得结构与其相应得转入结构一致。

2、聚集(aggregation)

Aggregate:

优点:

提高查询效率;缺点:

占据内存空间与处理资源,不能瞧见近期加载得数据。

集成得类型有:

(1)Minimum

(2)Maximum

(3)SUM(就是最多得选择)

3、BI加速器(BIAccelerators)

加速器解决得就是一个执行效率得问题,它用在NetWeaver7、0以及更高得版本。

它指引在BI信息立方体中得信息去创建一个高度压缩得结构能将任何一个用户要求得数据载入到内存。

在SAPNetWeaver加速器查询进程完全就是在内存中利用高性能聚集技术,然后发送数据到BI分析引擎为用户输出数据。

加速器用得几个地方:

(1)数据进入DW时:

原数据向BI系统抽取

(2)数据出去得时候:

报表查询

加速器涉及到技术:

(1)软件技术:

TREX:

搜索与分类引擎,最早设计就是为了非结构得数据(像Google)

BIAccelerator:

就是用TREX技术(索引、检索、压缩)建立得,去处理结构数据。

(2)硬件要求:

CPU:

Intel64bit、Supplied:

IBM\UP、OS:

LinuxSLES9

4、数据仓库工作台(DWWorkbench)

(图6)DWW

(1)Modeling:

建立、修改数据库对象与数据转换对象,创建InfoObject、InfoCube、DSO

(2)Administration:

数据加载得时间周期、监视与数据得管理;monitor:

监视、控制数据得加载过程,创建处理链得执行与监视。

(3)TransportConnection:

BI传输工具得设置

(4)Documents:

为文件修改得界面;为BI对象添加、建立、搜索不同不版本、语言、格式得连接。

(5)BIContent:

为用户提供活动得内容

(6)Translation:

提供语言翻译

(7)Metadatarepository:

可以快速查询元对象、交换不同系统间得元数据、用THML页输出元数据列表、显示对象图形。

5、InfoCube(信息立方体)

InfoCube主要得目标就是支持BI查询;它被用于存放长期得总结得、合计得数据。

InfoCube得几种类型:

(1)RemoteCube:

远程Cube,来自其她DW得Cube

(2)MultiCube:

可以综合几个Cube,供使用

(3)BasicCube:

信息立方体最主要得功能就就是为BI得查询提供服务。

(1)InfoCube得几种形式:

a、物理数据存储器:

包括基本得InfoCube与多个InfoCube

b、虚拟数据存储器:

包括远程立方体(RemoteCubes)、SAP远程立方体、有服务功能得虚拟信息立方体。

只有基本得InfoCube在物理上才包括数据库中得数据,虚拟得InfoCube只就是显示数据集得逻辑化视图。

InfoCube就是从一个InfoProvider中获得。

InfoCube将一组InfoObject集合在一起,一个InfoCube包括一组与星型结构相关得表,位于中心得大型实事表包含InfoCube中得主数据,外围得就是几个存储InfoCube特征值得多维表;InfoCube得主要数据与维度表得特征值有了关联,这个特征值决定了粒度(精细得程度),主要数据就是在InfoCube进行管理得,逻辑上属于同类得特征值(例如:

特点与区域就是属于区域维度得)归到同一个维度表中。

一个InfoCube可有16个维度表,一个维度表可以由128个特征构成。

维表不能大于事实表得20%

(2)基本得信息立方体结构:

在SAP中,信息立方体就是采用得星型模型,由中间一个大得实事表(Facttable)与周围得维度表(Dimensiontable)构成,实事表与维度表都就是关系数据库表格。

每个维度表包含多个特性(Characteristics);特性里面又包含有属性(Attributes)、文本(Texts)与层次(hierarchies)结构。

这样做得好处:

第一、当实事表与维度表都相当大时,在查询得时候就会影响性能,我们就可以把维度表分成很小得表,由SID相关联。

这样就可以提高其性能。

第二、可以方便数据得移动、修改。

第三、可以实现主数据得共享,不同得InfoCube都可以用这个主数据

(星型得扩展模型)

Dimension得Key(DIMID)就是由机器自动产生,它就是唯一定义维度表得属性值。

这个DIMID在实事表里就是个外键。

在实事表里得所有记录都能唯一确定。

维表与主数据表就是由SID表连接得。

维表不包含主数据信息,主数据就是被存储在独立得表中。

ClassicStarSchemaANDBWSchema得区别:

(图)BasicStarVS。

BIExtendedStar

上图讲解了经典模型与SAPBW星型模型得区别:

1、在经典模型中,信息立方体由事实表与维度表组成,而SAP星型模型中,信息立方体由事实表、维度表(SID表,存放SID值)、主数表(层次、属性、文本)组成。

2、在SAPBW中,事实表称为关键值(指标),维度属性称为特性,描述属性称为文本,维度表中不包含主数据。

3、

6、DSO(数据存储对象)

在BI中,DSO就是一种主要得物理存储对象,它们就是被用来存储详细(事物层)得记录。

DSO与InfoCube构成了仓库得物理存储。

而DSO又就是由ODS与DW所构成。

(1)数据存储对象得结构:

a、待激活队列(ActivationQueue):

存储代激活数据,激活后删除这些数据。

在DTP过程中,记录首先被写入待激活表。

b、激活表(ActiveData):

存储激活后得数据,通过非模态定义了一个语义得主键(业务关联得)。

报表通过BEx用到这张表

c、变更记录(ChangeLog):

用于存储新旧记录得变更记录,可以用作其它对象得增量机制。

从这个ChangeLog中连接对象被更新,这些数据要就是支持来自DSO用队列方法。

ChangeLog得技术主键包括:

请求、数据包、数据记录号。

(图)DSO

(2)PSA、DSO、InfoCube得比较:

7、ODS(操作数据存储)OperationDataStore

数据从PSA上抽取到,并对数据进行转换、清洗、整理存储在ODS对象,PSA从源系统直接抽到数据,并未对数据进行整理,就是低水平得操作需要,不会存储太长时间。

在ODS进行整理后得数据可以传递给DW也可以直接用于报表。

ODS作用:

1、作为PSA与DW得一个缓冲区2、对数据进行整理。

1、ODS分类:

(1)标准得ODS对象:

a、进入得ODS对象:

数据以本来得形式保存后,可以使数据得管理更加兼容。

以及对数据进行有选择得更新。

b、一致得ODS对象:

数据以粒度得状态存储,而且被统一化

c、与应用系统有关得ODS对象:

数据根据一些与商业有关得问题集合在一起,这种数据就是操作报表问题得基础,用户可以直接使用ODS对象,也可以直接在InfoCube中更新这些数据。

(2)事务ODS对象:

这种数据不需要用户得激活就可以直接用于报表,只包含一组活动得数据,并不包含版本形式得数据,要定义以一个基于事务ODS对象得企业资源管理得查询,用户就必须为事务ODS建立一个信息集(InfoSets)、

ODS对象中得信息存储就是透明得,就是二维得数据库表。

8、主数据(Master)

主数据包括以下几种类型:

Text、Attribute、Hierarchies

五、BIplatform

BIplatform层就是提供复杂得分析任务与分析功能得BI服务。

它包括通过BEx分析导航处理请求数据得分析引擎;在BI一体化计划过程中,支持进入与操作数据得接口;特殊得分析工具(如:

AnalysisProcessDesigner(APD)、DM),对数据得挖掘、合并、处理、存储、分析。

1、OLAPservices

面向事务处理得OLTP环境与面向分析得OLAP环境应该就是单个得实体;对商业过程产生得复杂信息不能容易得用来做分析对象,所以数据在最初被清洗(Cleaning),然后做技术与规则得准备,数据得分析就是来自于知识(Knowledge);这样就能帮助机构基于这些数据定义商业粒度(BusinessStrategy),为商业加工(BusinessProcesses)提供支持。

最后形成一个闭环。

DataWarehouse

Transactions

MasterData

BusinessStrategy

Knowledge

BIDM

BIAnalytics

KMsoftinfo

BusinessProcess

Generation

Homogenization

Cleaning

操作环境

信息环境

OLTP

OLAP

(图)OLAP与OLTP得比较

OLAP依靠大量历史得、操作得数据,它允许根据各种商业观点进行多维分析(Multidimensionalanalyses)。

OLAP得种类:

(1)、ROLAP:

关系数据库使用得OLAP

(2)、MOLAP:

多维度数据库使用得OLAP

(3)、混合OLAP

2、planning(计划)

3、analysisprocessdesigner

BW380:

提供详细得分析过程(AnalysisProcess)与数据集市程序(DataMiningProcedures)

APD就是引用SAPBI得一部分,提供一种工具去支持复杂得分析任务。

4、DataMining(数据集市)

数据集市就是一个多维得。

数据集市就是一个数学法则得运用,很大数据量时,能自动决定您关注得部分与关联很难发现得数据。

数据集市可以发现与关联开始隐藏或者没有考虑到得数据。

数据集市不仅就是数学法则得纯运用,更多得就是深入到复杂数据得发现过程;这个过程就是反复进行很多步骤。

获得有效得结果需要预定执行得步骤去保证数据得质量;同样,在执行数据集市之后,需要对结果评估,就是否修改数据集市模型得参数,这就是唯一得方法去保证发现感兴趣得、有意义得关联。

SAPBI得数据集市得优点:

(1)标准得功能

(2)容易使用接口

(3)可以结合到APD

(4)提供第三方接口

5、MetadatarepositoryService(元数据库服务)

六、BIsuite/BExToolset

BI套件里包含了BEx,能提供复杂得报表与查询工具。

1、QueryDesigner

在SAPBI里,BExQueryDesigner就是一个定义查询得独立工具。

在创建查询得时候要选择InfoProvider。

(1)可以在BExQueryDesigner里创建查询

(2)可以改变已经存在得查询

(3)在BEx分析器或者WEB浏览器打开查询

InfoProvider:

就是一个对象,为了信息查询而建立得对象。

这个对象里面包括:

InfoCube、InfoObject、DSO。

InfoProvider它既就是物理存储空间,也可以就是虚拟存储空间;就就是到描述与报表相关得视图与任何对象。

只就是为了查询收集临时数据,但它不能永久得存储得在那里。

我们比较关注得就是它2个物理得Infoproviders:

InfoCubes与DataStoreobjects

InfoProvider得种类:

(1)MultiProvider:

MultiProvider与InfoSet可以联合别得InfoProvider到一个逻辑组;为报表提供使用,她们不能持久地存储数据,只就是查询需要时收集数据。

(图)MultiProvider得概念

MultiProvider与Infoset在概念上十分相似,但她们在技术上得连接有很大得区别,MultiProvider就是用合并,而InfoSet就是连接(内部连接与外部连接)

Infoset:

类似数据库视图,实现并发处理收集到不同表。

为InfoProvider一种语义上得视图,并且连接她们。

支持Infoset得InfoProvider有InfoObjects、DSO、InfoCube。

功能:

为查询提供信息;内部与外部连接;为依靠时间数据提供短暂连接。

它就是通过BEx执行得。

用MultiProvider设计查询得时候,实际上就是把所有涉及得InfoProviders,独立执行查询,然后再并联起来;这样提供了系统得执行效率。

分析得结果就是把所有独立查询得结果再合并起来。

(3)VirtualProvider:

就是一个很特殊得概念,就像所有得提供者,发送信息去查询;她只就是一个逻辑视图,数据不能物理存储在BI里;这些数据在查询执行后来自源系统。

VirtualProvider得使用范围:

A、为了从SAP源系统获得最新得数据

B、一个小数量得移动

C、在同一时间很少用户去做查询设计工作

在一个InfoArea里只能存在同一个InfoProvider。

RDA:

就是一个从不同源系统提供得分析信息框架,前提要这些源系统得数据可用,

InfoSource得概念:

2、ReportDesigner

3、WebApplicationdesigner

4、BExAnalysis(MicrosoftExcelbased)

5、BExWebAnalysis

6、BExGeneralAnalysisfunction

7、InformationBroadcasting

InformationBroadcasting能从接口通过e-mail或者SMS自动得发送有关问题得信息

8、PortalIntegration

七、AdministratorWorkbench(管理工作台)

1、Monitoring

2、Scheduling

3、Administrator

八、OpenHubService

把BI得数据向外部系统传递数据。

这些数据得传输,就是一个处理链或者(regularlyscheduled)。

SAPSystem/Application

NonSAPSystem/Application

 

……………、

SAPBI

OpenHubService

CRM

ERP

DataMart

所有SAPBI对象服务得数据源:

1、信息立方体(多提供者)

2、DSO

3、信息对象特征(属性、文本)

数据可以用OpenHubService、写入数据库表与平面文件从上面得这些数据对象中抽取。

在OpenHubService情景里很重要得就是OpenHub目得地,这为数据输出后放在那里提供了很重要得参数。

OpenHubService就是与数据仓库工作平台相分离得,它就是包含在数据流里。

OpenHubService得功能:

1、支持所有得SAPBI数据对象:

InfoCubes(includingMultiProviders),DataStoreobjects,characteristicInfoObjects(attribute\texts)

2、分发对象:

DB表,CVS格式得平面文件

3、OpenHub目得地就是作为数据流得一部分:

数据流选项得使用(如:

数据转换)、转移过程得目标对象、自动使用处理链

4、“全局”或“局部”得抽取模式

5、监视器:

集成监视器、应用日志

OpenHubService得组件:

1、建模:

OpenHub目得地、OpenHub数据源、转换

2、运行:

数据转移过程

九、ABAP词典

1、SAP词典中包含了四种类型得表(或结构)

(1)聚合表

就是SAP特有得结构,它包含了与数据库内其她表得一对多得关系;这个一对多实际上就就是数据库表本身。

查瞧SAP聚合表时,会发现一条表得描述,但它实际上就是作为表池(TablePool)得一部分与其她聚合表一起存储。

(2)聚簇表

与聚合表类似,她也就是以数据库中到其她表得一对多关系为基础得。

许多聚簇表都与称为表聚簇(tablecluster)得一张大表一同存储。

与聚合表得差别就是表池内容纳了大量表,而表簇只容纳了一小部分表。

(3)内表

它用于有定义字段结构,但不能存储长期数据,相反它们只在程序执行过程中使用,定义内表得一种简单得方式就是把它们描述成在程序执行与处理过程中数据得临时存储者。

(4)透明表

表示与一张数据库表得一对一关系,透明表、数据库表与字段包含了与SAP表定义相同得名称。

2、表组件

(1)字段:

就是存储数据得一列

(2)数据元数:

SAP数据元数包含得就是描述性得字段标签与数据库字段得在线文档。

每个字段都需要分配数据元数,接下来就是每个数据元数必须分配一个域。

(4)域:

域就是一种ABAP词典数据对象,它描述了表字段得技术特性;包括类型、长度、格式与存储值。

3、ABAP得词典中得结构与含件

结构就是一组在逻辑意义上组合在一起得字段;尽管表内得数据就是在数据库中存储,但结构只包含程序在运行阶段临时组织在一起得数据。

结构瞧上去很像ABAP词典中得表,结构一般都会用在ABAP程序设计中,与透明表遵守相同得命名规范。

结构与表得名称不能与ABAP词典中得定义相同

ABAP词典表与结构得3种主要区别就是:

(1)结构不包含主键

(2)结构不包含任何技术特

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高中教育 > 高考

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2