统计学——Python实现教学课件cha10优质PPT.pptx

上传人:wj 文档编号:427155 上传时间:2023-04-28 格式:PPTX 页数:29 大小:3MB
下载 相关 举报
统计学——Python实现教学课件cha10优质PPT.pptx_第1页
第1页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第2页
第2页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第3页
第3页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第4页
第4页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第5页
第5页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第6页
第6页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第7页
第7页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第8页
第8页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第9页
第9页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第10页
第10页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第11页
第11页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第12页
第12页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第13页
第13页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第14页
第14页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第15页
第15页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第16页
第16页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第17页
第17页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第18页
第18页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第19页
第19页 / 共29页
统计学——Python实现教学课件cha10优质PPT.pptx_第20页
第20页 / 共29页
亲,该文档总共29页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

统计学——Python实现教学课件cha10优质PPT.pptx

《统计学——Python实现教学课件cha10优质PPT.pptx》由会员分享,可在线阅读,更多相关《统计学——Python实现教学课件cha10优质PPT.pptx(29页珍藏版)》请在冰点文库上搜索。

统计学——Python实现教学课件cha10优质PPT.pptx

第1章,1-,统计学Python实现贾俊平,2023-02-14,贾俊平2023-02-14,StatisticswithPython统计学Python实现,我,人生苦短,要Python,第10章,贾俊平,2023-02-14,回归模型及其参数估计拟合优度和显著性检验多重共线性及其处理相对重要性和模型比较利用回归方程进行预测哑变量回归,10-,统计学Python实现贾俊平,2023-02-14,第10章多元线性回归,第10章,10.1,回归模型及其参数估计,多元线性回归模型及其假定,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.1回归模型及其参数估计,多元线性回归模型的估计方程,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.1,回归模型及其参数估计,参数的最小二乘估计,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.1回归模型及其参数估计,参数的最小二乘估计例题分析,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.1回归模型及其参数估计,参数的最小二乘估计例题分析,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.1回归模型及其参数估计,参数的最小二乘估计例题分析【例10-1】方差分析表,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.2拟合优度和显著性检验,模型的拟合优度多重决定系数估计标准误差估计标准误差对误差项的标准差的一个估计值,计算公式为,详见Python输出,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.2拟合优度和显著性检验,显著性检验线性关系检验(F检验),检验因变量与所有自变量之间的线性关系是否显著也被称为总体的显著性检验检验方法是将回归均方(MSR)同残差均方(MSE)加以比较,应用F检验来分析二者之间的差别是否显著,如果是显著的,因变量与自变量之间存在线性关系如果不显著,因变量与自变量之间不存在线性关系,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.2拟合优度和显著性检验,显著性检验回归系数检验(t检验),详见Python输出,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.2拟合优度和显著性检验,模型诊断例题分析诊断图,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.3,多重共线性及其处理,多重共线性的识别,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.3多重共线性及其处理,多重共线性的识别例题分析相关系数检验相关系数矩阵相关系数检验P值矩阵,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.3多重共线性及其处理,多重共线性的识别例题分析相关系数检验VIF统计量,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.3多重共线性及其处理,多重共线性的处理变量选择向前选择和向后剔除,变量选择的方法主要有:

@#@向前选择、向后剔除、逐步回归等,10-,统计学Python实现贾俊平,2023-02-14,向前选择,从模型中没有自变量开始对k个自变量分别拟合对因变量的一元线性回归模型,共有k个,然后找出F统计量的值最高的模型及其自变量(P值最小的),并将其首先引入模型分别拟合引入模型外的k-1个自变量的二元线性回归模型如此反复进行,直至模型外的自变量均无统计显著性为止,向后剔除,先对因变量拟合包括所有k个自变量的回归模型。

@#@然后考察p(pk)个去掉一个自变量的模型(这些模型中在每一个都有k-1个自变量),使模型的SSE值减小最少的自变量被挑选出来并从模型中剔除考察p-1个再去掉一个自变量的模型(这些模型中每一个都有k-2个自变量),使模型的SSE值减小最少的自变量被挑选出来并从模型中剔除如此反复进行,一直将自变量从模型中剔除,直至剔除一个自变量不会使SSE显著减小为止,第10章,10.3多重共线性及其处理,多重共线性的处理变量选择逐步回归,逐步回归,将向前选择和向后剔除两种方法结合起来筛选自变量在增加了一个自变量后,它会对模型中所有的变量进行考察,看看有没有可能剔除某个自变量。

@#@如果在增加了一个自变量后,前面增加的某个自变量对模型的贡献变得不显著,这个变量就会被剔除按照方法不停地增加变量并考虑剔除以前增加的变量的可能性,直至增加变量已经不能导致SSE显著减少在前面步骤中增加的自变量在后面的步骤中有可能被剔除,而在前面步骤中剔除的自变量在后面的步骤中也可能重新进入到模型中,R的逐步回归信息最小准则(AIC),R中的逐步回归以AIC信息准则为选择标准,选择使AIC最小的变量建立模型赤池信息准则也被称为AIC准则(AkaikesInformationCriterion),由日本学者赤池于1973年提出除应用于线性模型的变量筛选外,还被应用于时间序列自回归模型阶数的确定AIC由两部分组成,一部分反映模型的拟合精度,一部分反映模型中参数的个数,即模型的繁简程度。

@#@AIC的值越小,说明拟合的模型精度越高而且又简洁当用最小二乘法拟合模型时,计算公式为,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.3多重共线性及其处理,多重共线性的处理变量选择逐步回归例题分析,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.3多重共线性及其处理,多重共线性的处理变量选择逐步回归例题分析方差分析表诊断图,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.4相对重要性和模型比较,自变量的相对重要性标准化回归系数,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.4相对重要性和模型比较,模型比较全模型-简化模型-嵌套模型比较的检验方法,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.4,相对重要性和模型比较,模型比较anova方法,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.4相对重要性和模型比较,模型比较AIC准则例题分析用anova做模型比较时,要求模型必须是嵌套的用AIC信息准则也可以用来比较模型,而且它不要求模型必须是嵌套的AIC值越小,说明模型用较少的参数(或自变量)就获得了足够的拟合度因。

@#@而模型将被优先选择,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.4相对重要性和模型比较,模型比较anova方法和AIC方法例题分析,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.6,哑变量回归,在模型中引入哑变量例题分析,也称虚拟变量。

@#@用数字代码表示的定性自变量哑变量可有不同的水平只有两个水平的哑变量,如性别(男,女)有两个以上水平的哑变量,如贷款企业的类型(家电,医药,其他)哑变量的取值为0,1当定性变量只有两个水平时,可在回归中引入一个哑变量比如,性别(男,女)一般而言,如果定性自变量有k个水平,需要在回归中模型中引进k-1个哑变量,例题分析,【例10-8,】,-,统计学Pyt,2023-02-14,沿用例10-1。

@#@假定在分析影响日均营业额的因素中再,考虑“交通方便程度”变量,并设其取值为“方便”和“不方便”。

@#@为便于理解,原来的5个自变量我们只保留用餐平均支出一个数值自变量。

@#@假定调查得到的数据表,第10章,10.6,哑变量回归,在模型中引入哑变量例题分析不引入哑变量,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.6,哑变量回归,在模型中引入哑变量例题分析引入哑变量,10-,统计学Python实现贾俊平,2023-02-14,第10章,10.6,哑变量回归,引入哑变量与不引入哑变量的比较,在模型中引入哑变量例题分析引入哑变量方差分析表引入哑变量的模型图像,10-,统计学Python实现贾俊平,2023-02-14,THEEND,THANKS2023-02-14,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2