回归分析影响公共交通工具的因素.docx

上传人:b****6 文档编号:15716769 上传时间:2023-07-07 格式:DOCX 页数:10 大小:103.93KB
下载 相关 举报
回归分析影响公共交通工具的因素.docx_第1页
第1页 / 共10页
回归分析影响公共交通工具的因素.docx_第2页
第2页 / 共10页
回归分析影响公共交通工具的因素.docx_第3页
第3页 / 共10页
回归分析影响公共交通工具的因素.docx_第4页
第4页 / 共10页
回归分析影响公共交通工具的因素.docx_第5页
第5页 / 共10页
回归分析影响公共交通工具的因素.docx_第6页
第6页 / 共10页
回归分析影响公共交通工具的因素.docx_第7页
第7页 / 共10页
回归分析影响公共交通工具的因素.docx_第8页
第8页 / 共10页
回归分析影响公共交通工具的因素.docx_第9页
第9页 / 共10页
回归分析影响公共交通工具的因素.docx_第10页
第10页 / 共10页
亲,该文档总共10页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

回归分析影响公共交通工具的因素.docx

《回归分析影响公共交通工具的因素.docx》由会员分享,可在线阅读,更多相关《回归分析影响公共交通工具的因素.docx(10页珍藏版)》请在冰点文库上搜索。

回归分析影响公共交通工具的因素.docx

回归分析影响公共交通工具的因素

WEIHUAsystemofficeroom【WEIHUA16H-WEIHUAWEIHUA8Q8-WEIHUA1688】

 

logistic回归分析影响公共交通工具的因素

 

logistic回归分析影响公共交通工具的因素

 

 

1.绪论

鉴于交通工具是我们出行中必不可少的一部分,而随着科技的发展与进步,交通方式愈加趋向于多元化,人们可以选择的交通工具也多种多样,新的交通工具带来便利的同时,也不可避免的给我们带来了一些问题。

不同社会地位的人所选择的交通工具的原因与其本身的内在因素以及外部条件相关。

不同的年龄,性别,收入都是影响人们交通方式的重要因素。

应用Logistic回归的原理和计算方法,并利用在公共交通调查数据在一次关于公共交通的社会调查中,年龄,月收入,性别与是乘公共汽车上下班还是骑自行车上下班的资料,采用Logistic回归方法,进行假设检验,对影响的因素进行分析。

建立Logistic回归模型,更加明确因变量与自变量之间的关系。

2.Logistic回归理论

logistic回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。

所以实际中最为常用的就是二分类的logistic回归。

由于Y取值非0即1,如设Y取1的概率为P,则它取0的概率为Q=1-P。

第i个观察对象的发生概率比数(odds)为

称为发生比,是发生概率与不发生概率的比。

发生概率取对数称为LOGIT变换。

回归系数的解释,β,i表示xi改变一个单位时,logitP的平均变化量。

相对危险度:

RR=P1/P2

比数:

Odds=P/(1-P)

比数比:

OR=

对比数比取自然对数得到关系式:

β的意义是在其他自变量固定不变的情况下,自变量X的水平没改变一个测量单位时所引起的比数比的自然对数改变量。

或者说,在其他自变量固定不变的情况下,当自变量X的水平每增加一个测量单位时所引起的比数比为增加前的

倍。

Logit回归模型实质是求一种概率的估计,将某种概率与一个线性模型联系起来。

三.实例

原始数据

因变量y=1表示乘坐公共汽车,y=0表示骑自行车。

自变量x1是年龄,作为连续变量;x2是月收入,x3是性别,x3=1表示男性,x3=0表示女性,调查对象为工薪族群体。

表1公共交通社会调查

序号

年龄x1

月收入x2

性别x3

交通y

1

18

850

0

0

2

21

1200

0

0

3

23

850

0

1

4

23

950

0

1

5

28

1200

0

1

6

31

850

0

0

7

36

1500

0

1

8

42

1000

0

1

9

46

950

0

1

10

48

1200

0

0

11

55

1800

0

1

12

56

2100

0

1

13

58

1800

0

1

14

18

850

1

0

15

20

1000

1

0

16

25

1200

1

0

17

27

1300

1

0

18

28

1500

1

0

19

30

950

1

1

20

32

1000

1

0

21

33

1800

1

0

22

33

1000

1

0

23

38

1200

1

0

34

41

1500

1

0

25

45

1800

1

1

26

48

1000

1

0

27

52

1500

1

1

28

56

1800

1

1

 

程序与分析

程序

datasasa;

inputnx1x2x3y;

datalines;

11885000

221120000

32385001

42395001

528120001

63185000

736150001

842100001

94695001

1048120000

1155180001

1256210001

1358180001

141885010

1520100010

1625120010

1727130010

1828150010

193095011

2032100010

2133180010

2233100010

2338120010

2441150010

2545180011

2648100010

2752150011

2856180011

proclogisticdata=sasadesending;

modely=x1x2x3/selection=stepwise;

Run;

运行结果分析

输入数据信息

Logistic回归方程log(odds)默认的形式是处理那个变量值比较小的,由运行结果可以看得出,因变量y取值的排列顺序是从大到小,所以第一个可能概率模型为y=1。

引入变量

给出了自变量进入模型的次序。

先是截距项Step0了,step1x3第一个进入模型,附带了很多评估它对因变量预测能力的指标。

-2LogL和Score用来检测自变量是否显着。

-2LogL中的L就是LikelihoodRatio,它的p值是,Score的p值是,wald的p值为,都小于,故x3是一个很显着的解释变量。

AIC和SC两个信息量标准用来比较不同的模型,它们数值越小,模型变现就越好,step2x1变量进入模型后的情况,模型的情况变化不大,step2x1变量移除模型后的情况比step2的情况好,AIC和SC的值变小了,-2LogL和Score对应的p值也更小。

模型的总体检验

由运行结果可以看出,p<,所以模型有较好的拟合效果。

参数检验以及几个描述性统计量、参数OR值,以及95%置信区间

给出了模型参数的估计,据此可以写出改回归方程的形式是

log(p/(1-p))=。

概率为

X3为性别,结果显示其回归系数b=,P值为,表明在控制其他因素不变的情况下,性别对使用公共交通工具有负面影响。

OR(X3)=,表示消除其他影响后,男性乘坐公共汽车是女性的倍,女性乘坐公共汽车的人多

95%置信区间为[,]

4.结论

二分类logistic回归法分析公共交通社会调查,我们发现乘坐公共汽车与年龄,月收入关系不显着,女性乘坐公共汽车的人数多于男性,男性骑自行车的人数多于女性,于此看出,男性群体普遍热爱运动,女性大众也应多骑自行车,有利于身体健康。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2