1、第 1 章,统计学Python 实现,贾俊平2022-06-02,人生苦短,我要P y t h o nStatistics with Python,1-,统计学Python实现贾俊平,2022-06-02,第 9 章,确定变量间的关系模型的估计和检验利用回归方程进行预测回归模型的诊断贾俊平2022-06-02,9-,统计学Python实现贾俊平,2022-06-02,第 9 章一元线性回归,第 9 章,9.1变量间的关系,变量间的关系回归建模需要清楚的问题建立回归模型时,首先需要弄清楚变量之间的关系分析变量之间的关系需要解决下面的问题变量之间是否存在关系如果存在,它们之间是什么样的关系变量之间
2、的关系强度如何样本所反映的变量之间的关系能否代表总体变量之间的关系,9-,统计学Python实现贾俊平,2022-06-02,第 9 章,9.1变量间的关系,变量间的关系函数关系与相关关系,函数关系对应的确定关系设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x称为自变量,y 称为因变量各观测点落在一条线上相关关系一个变量的取值不能由另一个变量唯一确定当变量 x 取某个值时,变量y 的取值对应着一个分布各观测点分布在直线周围,9-,统计学Python实现贾俊平,
3、2022-06-02,第 9 章,9.1变量间的关系,相关关系的描述散点图例题分析【例9-1】为研究销售收入与广告支出之间的关系,随机抽取20家医药生产企业,得到它们的销售收入和广告支出的数据如表91所示。#绘制散点图描述销售收入与广告支出之的关系,9-,统计学Python实现贾俊平,2022-06-02,第 9 章,9.1变量间的关系,相关关系关系强度的度量相关系数性质与解读,度量变量之间线性关系强度的一个统计量若相关系数是根据总体全部数据计算的,称为总体相关系数,记为若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为 r也称为Pearson相关系数(Pearsons corr
4、elation coefficient)样本相关系数的计算公式,性质1:#r 的取值范围是-1,1,|r|=1,为完全相关;#r=0,不存在线性相关关系-1 r0,为负相关;#0r 1,为正相关|r|越趋于1表示关系越强;#|r|越趋于0表示关系越弱性质2:#r具有对称性。#即x与y之间的相关系数和y与x之间的相关系数,相等,即rxy=ryx性质3:#r数值大小与x和y原点及尺度无关,即改变x和y的数据原点及,计量尺度,并不改变r数值大小性质4:#仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性,关系。#这意为着,r=0只表示两个 变量之间不存在线性相关关系,并不说明变量之间没有任何关
5、系性质5:#r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系,9-,统计学Python实现贾俊平,2022-06-02,第 9 章,9.1,变量间的关系,相关关系相关系数检验,9-,统计学Python实现贾俊平,2022-06-02,第 9 章,9.2,一元线性回归,回归模型与回归方程,模型假定因变量x与自变量y之,间为线性关系,在重复抽样中,自变量x的取值是固,定的,即假定x是非随机的误差项满足,正态性。#是一个服从正态分布的随机变量,且期望值为0,即N(0,2)。#对于一个给定的 x 值,y 的期望值为E(y)=0+1x方差齐性。#对于所有的 x 值,的方差一个特
6、定的值,的方差也都等于 2 都相同。#同样,一个特定的x值,y 的方差也都等于 2独立性。#独立性意味着对于一个特定的 x 值,它所对应的与其他 x值所对应的不相关;#对于一个特定的 x 值,它所对应的 y 值与其他x 所对应的 y 值也不相关,9-,统计学Python实现贾俊平,2022-06-02,第 9 章,9.2,一元线性回归,参数的最小二乘估计,9-,统计学Python实现贾俊平,2022-06-02,第 9 章,9.2,一元线性回归,一元线性回归建模例题分析,9-,统计学Python实现贾俊平,2022-06-02,第 9 章,9.2一元线性回归,一元线性回归建模拟合优度误差分解总
7、平方和(SSTtotal sum of squares)反映因变量的 n 个观察值与其均值的总误差回归平方和(SSRsum of squares of regression)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和残差平方和(SSEsum of squares of error)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和,9-,统计学Python实现贾俊平,2022-06-02,第 9 章,9.2一元线性回归,一元线性回归建模拟合优度决定系数R2估计标准误,根
8、,反映实际观察值在回归直线周围的分散状况,实际观察值与回归估计值误差平方和的均方,对误差项 的标准差 的估计,是在排除了x对,y的线性影响后,y随机波动大小的一个估计量,小,反映用估计的回归方程预测y时预测误差的大,计算公式为,9-,统计学Python实现贾俊平,2022-06-02,第 9 章,9.2一元线性回归,一元线性回归建模模型检验F 检验t 检验,9-,统计学Python实现贾俊平,2022-06-02,第 9 章,9.3利用回归方程进行预测,回归预测置信区间和预测区间,9-,统计学Python实现贾俊平,2022-06-02,第 9 章,统计,学Pyt,20,22-,6-02,9.3利用回归方程进行预测,回归预测置信区间和预测区间例题分析,9-,n实现贾俊平,第 9 章,9.4回归模型的模型诊断,模型诊断残差与标准化残差,残差因变量的观测值与预测值之差,用e表示,反映了用估计的回归方程去预测而引起的误差可用于确定有关误差项 的假定是否成立,标准化残差残差除以它的标准差,残差图模型诊断工具,9-,统计学Python实现贾俊平,2022-06-02,第 9 章,9.4,回归模型的模型诊断,模型诊断例题分析,9-,统计学Python实现贾俊平,2022-06-02,THE END,T H A N K S2022-06-02,
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2