回归分析方法及其应用中的例子.docx

上传人:b****2 文档编号:17718696 上传时间:2023-08-03 格式:DOCX 页数:30 大小:71.62KB
下载 相关 举报
回归分析方法及其应用中的例子.docx_第1页
第1页 / 共30页
回归分析方法及其应用中的例子.docx_第2页
第2页 / 共30页
回归分析方法及其应用中的例子.docx_第3页
第3页 / 共30页
回归分析方法及其应用中的例子.docx_第4页
第4页 / 共30页
回归分析方法及其应用中的例子.docx_第5页
第5页 / 共30页
回归分析方法及其应用中的例子.docx_第6页
第6页 / 共30页
回归分析方法及其应用中的例子.docx_第7页
第7页 / 共30页
回归分析方法及其应用中的例子.docx_第8页
第8页 / 共30页
回归分析方法及其应用中的例子.docx_第9页
第9页 / 共30页
回归分析方法及其应用中的例子.docx_第10页
第10页 / 共30页
回归分析方法及其应用中的例子.docx_第11页
第11页 / 共30页
回归分析方法及其应用中的例子.docx_第12页
第12页 / 共30页
回归分析方法及其应用中的例子.docx_第13页
第13页 / 共30页
回归分析方法及其应用中的例子.docx_第14页
第14页 / 共30页
回归分析方法及其应用中的例子.docx_第15页
第15页 / 共30页
回归分析方法及其应用中的例子.docx_第16页
第16页 / 共30页
回归分析方法及其应用中的例子.docx_第17页
第17页 / 共30页
回归分析方法及其应用中的例子.docx_第18页
第18页 / 共30页
回归分析方法及其应用中的例子.docx_第19页
第19页 / 共30页
回归分析方法及其应用中的例子.docx_第20页
第20页 / 共30页
亲,该文档总共30页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

回归分析方法及其应用中的例子.docx

《回归分析方法及其应用中的例子.docx》由会员分享,可在线阅读,更多相关《回归分析方法及其应用中的例子.docx(30页珍藏版)》请在冰点文库上搜索。

回归分析方法及其应用中的例子.docx

回归分析方法及其应用中的例子

3.1.2虚拟变量的应用

例3.1.2.1:

为研究美国住房面积的需求,选用3120户家庭为建模样本,回归模型为:

其中:

Q——3120个样本家庭的年住房面积(平方英尺)横截面数据

P——家庭所在地的住房单位价格

Y——家庭收入

经计算:

()()()

上式中

=

的价格弹性系数,

=

的收入弹性系数,均符合经济学的常识,即价格上升,住房需求下降,收入上升,住房需求也上升。

但白人家庭与黑人家庭对住房的需求量是不一样的,引进虚拟变量D:

模型为:

例3.1.2.2:

某省农业生产资料购买力和农民货币收入数据如下:

(单位:

十亿元)

年份

农资购买力

农民货币收入

1975

1976

1977

1978

1979

1980

1981

1982

1983

1984

1985

 

 

0

0

0

0

1

1

1

1

1

1

1

①根据上述数据建立一元线性回归方程:

②带虚拟变量的回归模型,因1979年中国农村政策发生重大变化,引入虚拟变量来反映农村政策的变化。

建立回归方程为:

()()()

虽然上述两个模型都可通过显著性水平检验,但可明显看出带虚拟变量的回归模型其方差解释系数更高,回归的估计误差(

)更小,说明模型的拟合程度更高,代表性更好。

3.5.4岭回归的举例说明

企业为用户提供的服务多种多样,那么在这些服务中哪些因素更为重要,各因素之间的重要性差异到底有多大,这些都是满意度研究需要首先解决的问题。

国际上比较流行并被实践所验证,比较科学的方法就是利用回归分析确定客户对不同服务因素的需求程度,具体方法如下:

假设某电信运营商的服务界面包括了A1……Am共M个界面,那么各界面对总体服务满意度A的影响可以通过以A为因变量,以A1……Am为自变量的回归分析,得出不同界面服务对总体A的影响系数,从而确定各服务界面对A的影响大小。

同样,A1服务界面可能会有A11……A1n共N个因素的影响,那么利用上述方法也可以计算出A11……A1n对A1的不同影响系数,由此确定A1界面中的重要因素。

通过两个层次的分析,我们不仅得出各大服务界面对客户总体满意度影响的大小以及不同服务界面上各因素的影响程度,同时也可综合得出某一界面某一因素对总体满意度的影响大小,由此再结合用户满意度评价、与竞争对手的比较等因素来确定每个界面细分因素在以后工作改进中的轻重缓急、重要性差异等,从而起到事半功倍的作用。

例3.5.4:

对某地移动通信公司的服务满意度研究中,利用回归方法分析各服务界面对总体满意度的影响。

a.直接进入法

显然,这种方法计算的结果中,C界面不能通过显著性检验,直接利用分析结果是错误的,见表3.5.4.1:

表3.5.4.1强制回归的Coefficients

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

B

Std.Error

Beta

(Constant)

A

B

C

D

E

F

aDependentVariable:

H

b.逐步回归法

这种方法剔除了一个不能通过统计检验的大的服务界面(C界面),虽然通过了显著性检验,但却遗漏了C界面的信息。

表3.5.4.2逐步回归的Coefficients

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

B

Std.Error

Beta

(Constant)

A

B

D

E

F

aDependentVariable:

H

同样,使用强制删除法,C服务界面不能通过显著性检验,向前法和向后法亦剔除了C界面进入分析。

可以看出,通过以上回归分析我们得到了不同的分析结果,显然这种分析方法存在着较大的偏差,随意选取一种是不负责任的,必须深入研究。

一般来说,满意度分析中涉及到许多因素,而诸多因素间存在着一定的关联,因而在进行回归分析时,各自变量之间的共线性问题导致了直接使用线性回归分析模型时一些因子不能参与分析的现象。

一些市场研究咨询公司常采用舍弃一些变量,遗漏部分信息来求得统计检验通过的方法;有的不顾显著性检验结果而强行使用不合理的分析结果来保证变量不被舍弃,从而虚假地保障了信息不被遗漏。

我们认为这是满意度分析错误的两个极端。

处理的正确方法是,利用SPSS软件中的岭回归分析来解决,既保障信息不被遗漏,同时保障分析具有统计意义。

SPSS软件界面没有直接进行岭回归的命令,我们可以通过SPSS提供的程序编辑命令,自行编辑程序加以实现。

在SAS软件中可直接进行岭回归分析。

对例3.5.4.1进行岭回归,分析结果和表的结果对比如下。

可见两者之间有较大差异(下表数据将已将回归系数之和标准化为100%),F界面对总体满意度的作用被缩小了5%左右,而B界面、D界面的作用各被夸大近5%。

表3.5.4.3强制回归与岭回归结果的比较

表的错误分析

岭回归结果

两者之间的差异

A

%

%

%

B

%

%

%

C

%

%

%

D

%

%

%

E

%

%

%

F

%

%

%

5回归分析方法应用的举例说明——怎样作回归分析How

本章以一个例子详细说明回归分析方法在实际研究中是如何应用的。

回归分析变量的数据转换

本章举例说明的例子选用39家企业样本数据(见表),带动作用是因变量,其余各变量均为自变量,其中所属产业和员工人数是对该样本企业而言,而接触程度则指该样本企业与本地的龙头企业之间在业务上的接触紧密程度。

接触程度、各自变量和因变量均以Likert五分量表进行度量。

表例子的样本数据

样本编号

所属产业

员工人数

接触程度

企业合作

公共事务

营销努力

技术改进

资源共享

风险分担

带动作用

1

皮革

230

1

2

皮革

159

3

3

皮革

208

2

4

皮革

112

1

5

皮革

100

1

6

皮革

495

1

7

皮革

33

3

8

皮革

80

1

9

皮革

100

3

10

皮革

150

3

11

皮革

136

1

12

皮革

61

3

13

皮革

17

3

14

皮革

230

3

15

家电

300

5

16

家电

250

3

17

家电

80

5

18

家电

134

3

19

家电

428

3

20

家电

80

3

21

家电

400

2

22

家电

20

3

23

家电

225

4

24

家电

180

3

25

家电

90

3

26

家电

160

1

27

家电

100

2

28

家电

350

3

29

家电

345

3

30

家电

305

1

31

家电

400

2

32

家电

100

3

33

家电

414

2

34

家电

324

2

35

家电

300

4

36

家电

200

3

37

家电

85

3

38

家电

180

1

39

家电

415

3

5.1.1企业所属产业虚拟变量的引入

从表中看到,自变量所属产业为名义变量,在进行多元回归分析之前需要将其转化为虚拟变量进行处理。

而员工人数在一定程度上能够反映企业的规模,因此也将其处理为虚拟变量。

将皮革产业变量定义为变量D1,则

5.1.2企业规模虚拟变量的引入

首先按照企业员工人数将企业划分为微型、小型、一般型、中型和大型共5种类型企业,具体划分标准见表:

表企业规模的划分和变量说明

企业规模

小型

中型

大型

员工数

≤100

>100且≤300

≥300

变量名

D2

D3

D4

由此,有:

当以上D2、D3均为0时,则表示该企业属于大型企业。

5.1.3引入虚拟变量后的变量数据

将上述各变量进行转换处理之后,得到本例进行回归分析的各个变量数据,见表:

表回归分析的变量数据

编号

皮革行业

小型

中型

接触程度

企业合作

公共事务

营销努力

技术改进

资源共享

风险分担

带动

D1

D2

D3

Tach

Coop

Publ

Mark

Tech

Reco

Risk

Effe

1

1

0

1

1

2

1

0

1

3

3

1

0

1

2

4

1

0

1

1

5

1

1

0

1

6

1

0

0

1

7

1

1

0

3

8

1

1

0

1

9

1

1

0

3

10

1

0

1

3

11

1

0

1

1

12

1

1

0

3

13

1

1

0

3

14

1

0

1

3

15

0

0

1

5

16

0

0

1

3

17

0

1

0

5

18

0

0

1

3

19

0

0

0

3

20

0

1

0

3

21

0

0

0

2

22

0

1

0

3

23

0

0

1

4

24

0

0

1

3

25

0

1

0

3

26

0

0

1

1

27

0

1

0

2

28

0

0

0

3

29

0

0

0

3

30

0

0

0

1

31

0

0

0

2

32

0

1

0

3

33

0

0

0

2

34

0

0

0

2

35

0

0

1

4

36

0

0

1

3

37

0

1

0

3

38

0

0

1

1

39

0

0

0

3

变量间的相关分析

5.2.1相关分析在Spss软件中的操作

SPSS的相关分析是借助于Statistics菜单的Correlate选项完成的。

调用此过程可对变量进行相关关系的分析,计算有关的统计指标,以判断变量之间相互关系的密切程度。

调用该过程命令时允许同时输入两变量或以上变量,但系统输出的是变量间两两相关的相关系数。

激活Statistics菜单选Correlate中的Bivariate...命令项,弹出BivariateCorrelation对话框。

在对话框左侧的变量列表中选中本例的所有变量,点击钮使之进入Variables框;再在CorrelationCoefficients框中选择相关系数的类型,共有三种:

Pearson为通常所指的相关系数(r),Kendell’stau-b为非参数资料的相关系数,Spearman为非正态分布资料的Pearson相关系数替代值,本例选用Pearson项;在TestofSignificance框中可选相关系数的单侧(One-tailed)或双侧(Two-tailed)检验,本例选双侧检验。

点击Options...钮弹出BivariateCorrelation:

Options对话框,可选有关统计项目。

本例要求输出个变量的均值与标准差,故选Meansandstandarddeviations项,而后点击Continue钮返回BivariateCorrelation对话框,再点击OK钮即可。

5.2.2相关分析结果及其解释

首先看表中,各变量的均值及其标准差:

表变量的描述性数据

变量

均值

标准差

样本数

effe

.79983

39

coop

.88252

39

publ

.87023

39

mark

.82885

39

tech

.62307

39

reco

.87637

39

risk

.80624

39

D1

.3590

.48597

39

D2

.3333

.47757

39

D3

.4103

.49831

39

tach

39

由于举本例的目的是为了详细解释在SPSS中如何进行回归分析,所以在本文中不详细论述与本主体关系不大的各项分析及其结论。

在表中,详细列出了所有变量之间的两两相关系数:

表变量的相关系数及其显著性

effe

coop

publ

mark

tech

reco

risk

D1

D2

D3

tach

effe

1

coop

.377(*)

1

publ

.385(*)

.607(**)

1

mark

.410(**)

.387(*)

.382(*)

1

tech

.438(**)

.398(*)

.617(**)

.313

1

reco

.709(**)

.502(**)

.376(*)

.174

.324(*)

1

risk

.731(**)

.257

.322(*)

.210

.265

.659(**)

1

D1

(*)

1

D2

.092

.204

.017

.000

.000

.017

.151

1

D3

.006

.070

.063

.042

.137

(**)

1

tach

.397(*)

.162

.212

.064

.349(*)

.187

.304

(*)

.126

1

*相关系数在水平下显著(双尾)

**相关系数在水平下显著(双尾)

从表中看到,因变量effe分别与自变量coop、publ、mark、tech、reco、risk、D1和tach之间的相关系数在水平下是显著的,而与自变量D2和D3之间的相关系数在水平下不显著。

5.2.3各自变量与因变量之间的散点图(结果略)

激活Graphs菜单选Scatter/Dot中的SimpleScatter项,弹出SimpleScatterplot话框。

从对话框左侧的变量列表中选effe,点击钮使之进入YAxis框,分别选其余各个变量(包括coop、publ、mark、tech、reco、risk、D1、D2、D3和tach),点击钮使之进入XAxis框,点击OK钮即输出各自变量与因变量之间的散点图。

强制(Enter)的多元线性回归分析

5.3.1强制(Enter)多元线性回归分析在Spss软件中的操作

激活Statistics菜单选Regression中的Linear...项,弹出LinearRegression对话框。

从对话框左侧的变量列表中选effe,点击钮使之进入Dependent框,选其余各个变量(包括coop、publ、mark、tech、reco、risk、D1、D2、D3和tach),点击钮使之进入Indepentdent(s)框;在Method处下拉菜单,共有5个选项:

Enter(强制法)、Stepwise(逐步法)、Remove(剔除法)、Backward(向后法)、Forward(向前法)。

首先选用Enter法。

点击Statistics...钮选择是否作变量的描述性统计、回归方程应变量的可信区间估计等分析,在本例中选择Regressionconfidence下的Estimate、Residuals下的Durbin-Watson,以及Modelfit和CollinearityDiagnostics这几个选项,分别进行回归系数的估计、模型的拟合评价和回归三大问题的诊断;点击Plots...钮选择是否作变量分布图,在本例中选择DEPENDENT即因变量作为X轴,ZRESID即标准化残差作为Y轴,观察Y随X变化的情况,以判断是否存在异方差和自相关问题;点击Save...钮选择对回归分析的有关结果是否作保存,在本例中不做选择;点击Options...钮选择变量入选与剔除的α、β值和缺失值的处理方法,在本例中选择系统默认值。

点击OK钮即完成分析。

5.3.2强制(Enter)多元线性回归分析三大问题的诊断

首先要判断本强制回归中是否存在回归的三大问题。

因此,对照第3章的相关内容有:

1、多重共线性诊断

见表和表中,回归方程的R2较高但t值显著的不多,表明自变量之间有存在严重多重共线性的可能。

但方差膨胀因子VIF值基本在2左右,而容忍度(Tolerance)也在可接受范围内。

在表中也看到,除去第11个层面(Dimension),其余各层面的条件指标(Conditionindex;CI)在30以内,各个自变量在每个层面上的方差比例基本没有出现都较大的现象。

说明自变量之间没有严重的多重共线性问题。

表模型的拟合(b)

Model

R

RSquare

AdjustedRSquare

Std.ErroroftheEstimate

Durbin-Watson

1

.872(a)

.761

.675

.45576

aPredictors:

(Constant),tach,D3,mark,reco,D1,tech,coop,D2,risk,publ

bDependentVariable:

effe

表回归系数(a)

Model

UnstandardizedCoefficients

StandardizedCoefficients

t

Sig.

CollinearityStatistics

1

B

Std.Error

Beta

Tolerance

VIF

(Constant)

.568

.490

coop

.128

.657

.425

publ

.131

.779

.422

mark

.219

.105

.227

.046

.723

tech

.157

.162

.122

.973

.339

.540

reco

.327

.135

.358

.023

.388

risk

.403

.135

.406

.006

.461

D1

.191

.182

.633

D2

.218

.227

.130

.963

.344

.466

D3

.034

.208

.021

.165

.870

.508

tach

.071

.086

.096

.829

.414

.644

aDependentVariable:

effe

表变量的多重共线性诊断(a)

Model

Dimension

Eigenvalue

ConditionIndex

VarianceProportions

常数

coop

publ

mark

tech

reco

risk

D1

D2

D3

tach

1

1

.00

.00

.00

.00

.00

.00

.00

.00

.00

.00

.00

2

.00

.00

.00

.00

.00

.00

.00

.00

.17

.14

.00

3

.694

.00

.00

.00

.00

.00

.00

.00

.50

.01

.01

.01

4

.211

.00

.00

.01

.00

.00

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 农林牧渔 > 水产渔业

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2