Matlab与Logistic回归.docx

上传人:b****1 文档编号:1865471 上传时间:2023-05-01 格式:DOCX 页数:32 大小:71.81KB
下载 相关 举报
Matlab与Logistic回归.docx_第1页
第1页 / 共32页
Matlab与Logistic回归.docx_第2页
第2页 / 共32页
Matlab与Logistic回归.docx_第3页
第3页 / 共32页
Matlab与Logistic回归.docx_第4页
第4页 / 共32页
Matlab与Logistic回归.docx_第5页
第5页 / 共32页
Matlab与Logistic回归.docx_第6页
第6页 / 共32页
Matlab与Logistic回归.docx_第7页
第7页 / 共32页
Matlab与Logistic回归.docx_第8页
第8页 / 共32页
Matlab与Logistic回归.docx_第9页
第9页 / 共32页
Matlab与Logistic回归.docx_第10页
第10页 / 共32页
Matlab与Logistic回归.docx_第11页
第11页 / 共32页
Matlab与Logistic回归.docx_第12页
第12页 / 共32页
Matlab与Logistic回归.docx_第13页
第13页 / 共32页
Matlab与Logistic回归.docx_第14页
第14页 / 共32页
Matlab与Logistic回归.docx_第15页
第15页 / 共32页
Matlab与Logistic回归.docx_第16页
第16页 / 共32页
Matlab与Logistic回归.docx_第17页
第17页 / 共32页
Matlab与Logistic回归.docx_第18页
第18页 / 共32页
Matlab与Logistic回归.docx_第19页
第19页 / 共32页
Matlab与Logistic回归.docx_第20页
第20页 / 共32页
亲,该文档总共32页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

Matlab与Logistic回归.docx

《Matlab与Logistic回归.docx》由会员分享,可在线阅读,更多相关《Matlab与Logistic回归.docx(32页珍藏版)》请在冰点文库上搜索。

Matlab与Logistic回归.docx

Matlab与Logistic回归

Matlab软件包与Logistic回归

在回归分析中,因变量

可能有两种情形:

(1)

是一个定量的变量,这时就用通常的regress函数对

进行回归;(2)

是一个定性的变量,比如,

0或1,这时就不能用通常的regress函数对

进行回归,而是使用所谓的Logistic回归。

Logistic回归的基本思想是,不是直接对

进行回归,而是先定义一种概率函数

,令

要求

此时,如果直接对

进行回归,得到的回归方程可能不满足这个条件。

在现实生活中,一般有

直接求

的表达式,是比较困难的一件事,于是,人们改为考虑

一般的,

人们经过研究发现,令

即,

是一个Logistic型的函数,效果比较理想。

于是,我们将其变形得到:

然后,对

进行通常的线性回归。

例1 企业到金融商业机构贷款,金融商业机构需要对企业进行评估。

例如,Moody公司就是NewYork的一家专门评估企业的贷款信誉的公司。

设:

下面列出美国66家企业的具体情况:

YX1X2X3

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

其中,

建立破产特征变量

的回归方程。

解:

在这个破产问题中,

我们讨论

,概率

=企业2年后具备还款能力的概率,即,

=企业不破产的概率。

因为66个数据有33个为0,33个为1,所以,取分界值,令

由于我们并不知道企业在没有破产前概率

的具体值,也不可能通过

的数据把这个具体的概率值算出来,于是,为了方便做回归运算,我们取区间的中值,

数据表变为:

X1X2X3

于是,在Matlab软件包中编程如下,对

进行通常的线性回归:

X=[1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,1;

1,,,;

1,,,1;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,-280,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,-98,,;

1,-129,,;

1,-4,,;

1,,,;

1,,,;

1,,,;

1,-38,,;

1,,,;

1,,,;

1,,-4,;

1,,,;

1,43,,;

1,47,16,;

1,,4,;

1,35,,;

1,,,;

1,,,;

1,33,,;

1,,,;

1,,,;

1,,,;

1,59,,;

1,,,;

1,,7,;

1,,,;

1,,,;

1,,,;

1,,,4;

1,,,;

1,,,1;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,2;

1,,,;

1,,,;

1,,,;

1,,7,2;

1,,,1;

1,,,];

a0=*ones(33,1);a1=*ones(33,1);

y0=[a0;a1];

Y=log((1-y0)./y0);

[b,bint,r,rint,stats]=regress(Y,X)

rcoplot(r,rint)

执行后得到结果:

b=

bint=

r=

rint=

stats=

即,得到:

值=(说明回归方程刻画原问题不是太好),F_检验值=>(这个值比较好),与显著性概率

相关的p值=>

,说明变量

之间存在线性相关关系。

回归方程为:

以及残差图:

通过残差图看出,残差连续的出现在0的上方,或者连续地出现在0的下方,这也暗示变量

之间存在线性相关。

编程计算它们的相关系数:

X=[1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,1;

1,,,;

1,,,1;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,-280,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,-98,,;

1,-129,,;

1,-4,,;

1,,,;

1,,,;

1,,,;

1,-38,,;

1,,,;

1,,,;

1,,-4,;

1,,,;

1,43,,;

1,47,16,;

1,,4,;

1,35,,;

1,,,;

1,,,;

1,33,,;

1,,,;

1,,,;

1,,,;

1,59,,;

1,,,;

1,,7,;

1,,,;

1,,,;

1,,,;

1,,,4;

1,,,;

1,,,1;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,2;

1,,,;

1,,,;

1,,,;

1,,7,2;

1,,,1;

1,,,];

X1=X(:

2);X2=X(:

3);X3=X(:

4);

corrcoef(X1,X2)

corrcoef(X1,X3)

corrcoef(X2,X3)

执行后得到结果:

ans=

ans=

ans=

可见corrcoef(X1,X2)=,这说明,在做回归时,可以去掉

列。

根据经济意义,我们去掉

列,再进行回归。

X=[1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,1;

1,,,;

1,,,1;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,-280,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,-98,,;

1,-129,,;

1,-4,,;

1,,,;

1,,,;

1,,,;

1,-38,,;

1,,,;

1,,,;

1,,-4,;

1,,,;

1,43,,;

1,47,16,;

1,,4,;

1,35,,;

1,,,;

1,,,;

1,33,,;

1,,,;

1,,,;

1,,,;

1,59,,;

1,,,;

1,,7,;

1,,,;

1,,,;

1,,,;

1,,,4;

1,,,;

1,,,1;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,2;

1,,,;

1,,,;

1,,,;

1,,7,2;

1,,,1;

1,,,];

a0=*ones(33,1);a1=*ones(33,1);

y0=[a0;a1];

Y=log((1-y0)./y0);

X1=X(:

2);X2=X(:

3);X3=X(:

4);E=ones(66,1);

B=[E,X2,X3];

[b,bint,r,rint,stats]=regress(Y,B)

rcoplot(r,rint)

执行后得到:

b=

bint=

r=

rint=

stats=

以及残差图:

 

残差图仍然显示变量之间的相关性,这说明,最开始调查数据时,3个指标没有选好。

最后得到:

将企业的具体数据

代入

的表达式计算,再结合

金融机构就可以知道,是否应该贷款给这家企业。

注:

一个通常的Regress回归,可以用

等参数评价回归结果的好坏,但对Logistic回归来说,不存在这样简单而令人满意的评价参数,所以,一般应该进行回归诊断。

Logistic回归的诊断

所谓的

回归诊断,就是将

的原始数据代入求得的回归方程中,计算

值,看看有多少个由回归方程计算所得的

值与原始的

值不同,因而判断回归方程的好坏。

(1)用回归方程

进行诊断。

①在Matlab软件包中,编程诊断

X=[1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,1;

1,,,;

1,,,1;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,-280,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,-98,,;

1,-129,,;

1,-4,,;

1,,,;

1,,,;

1,,,;

1,-38,,;

1,,,;

1,,,;

1,,-4,;

1,,,;

1,43,,;

1,47,16,;

1,,4,;

1,35,,;

1,,,;

1,,,;

1,33,,;

1,,,;

1,,,;

1,,,;

1,59,,;

1,,,;

1,,7,;

1,,,;

1,,,;

1,,,;

1,,,4;

1,,,;

1,,,1;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,;

1,,,2;

1,,,;

1,,,;

1,,,;

1,,7,2;

1,,,1;

1,,,];

forj=1:

66;

f=1/(1+expiff<=;

j

y=0

elsej

y=1

end

end

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 农林牧渔 > 水产渔业

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2