统计学——Python实现教学课件cha9PPT资料.pptx
《统计学——Python实现教学课件cha9PPT资料.pptx》由会员分享,可在线阅读,更多相关《统计学——Python实现教学课件cha9PPT资料.pptx(18页珍藏版)》请在冰点文库上搜索。
第1章,统计学Python实现,贾俊平2022-06-02,人生苦短,我要PythonStatisticswithPython,1-,统计学Python实现贾俊平,2022-06-02,第9章,确定变量间的关系模型的估计和检验利用回归方程进行预测回归模型的诊断贾俊平2022-06-02,9-,统计学Python实现贾俊平,2022-06-02,第9章一元线性回归,第9章,9.1变量间的关系,变量间的关系回归建模需要清楚的问题建立回归模型时,首先需要弄清楚变量之间的关系分析变量之间的关系需要解决下面的问题变量之间是否存在关系如果存在,它们之间是什么样的关系变量之间的关系强度如何样本所反映的变量之间的关系能否代表总体变量之间的关系,9-,统计学Python实现贾俊平,2022-06-02,第9章,9.1变量间的关系,变量间的关系函数关系与相关关系,函数关系对应的确定关系设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量各观测点落在一条线上相关关系一个变量的取值不能由另一个变量唯一确定当变量x取某个值时,变量y的取值对应着一个分布各观测点分布在直线周围,9-,统计学Python实现贾俊平,2022-06-02,第9章,9.1变量间的关系,相关关系的描述散点图例题分析【例9-1】为研究销售收入与广告支出之间的关系,随机抽取20家医药生产企业,得到它们的销售收入和广告支出的数据如表91所示。
@#@绘制散点图描述销售收入与广告支出之的关系,9-,统计学Python实现贾俊平,2022-06-02,第9章,9.1变量间的关系,相关关系关系强度的度量相关系数性质与解读,度量变量之间线性关系强度的一个统计量若相关系数是根据总体全部数据计算的,称为总体相关系数,记为若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为r也称为Pearson相关系数(Pearsonscorrelationcoefficient)样本相关系数的计算公式,性质1:
@#@r的取值范围是-1,1,|r|=1,为完全相关;@#@r=0,不存在线性相关关系-1r0,为负相关;@#@0r1,为正相关|r|越趋于1表示关系越强;@#@|r|越趋于0表示关系越弱性质2:
@#@r具有对称性。
@#@即x与y之间的相关系数和y与x之间的相关系数,相等,即rxy=ryx性质3:
@#@r数值大小与x和y原点及尺度无关,即改变x和y的数据原点及,计量尺度,并不改变r数值大小性质4:
@#@仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性,关系。
@#@这意为着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系性质5:
@#@r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系,9-,统计学Python实现贾俊平,2022-06-02,第9章,9.1,变量间的关系,相关关系相关系数检验,9-,统计学Python实现贾俊平,2022-06-02,第9章,9.2,一元线性回归,回归模型与回归方程,模型假定因变量x与自变量y之,间为线性关系,在重复抽样中,自变量x的取值是固,定的,即假定x是非随机的误差项满足,正态性。
@#@是一个服从正态分布的随机变量,且期望值为0,即N(0,2)。
@#@对于一个给定的x值,y的期望值为E(y)=0+1x方差齐性。
@#@对于所有的x值,的方差一个特定的值,的方差也都等于2都相同。
@#@同样,一个特定的x值,y的方差也都等于2独立性。
@#@独立性意味着对于一个特定的x值,它所对应的与其他x值所对应的不相关;@#@对于一个特定的x值,它所对应的y值与其他x所对应的y值也不相关,9-,统计学Python实现贾俊平,2022-06-02,第9章,9.2,一元线性回归,参数的最小二乘估计,9-,统计学Python实现贾俊平,2022-06-02,第9章,9.2,一元线性回归,一元线性回归建模例题分析,9-,统计学Python实现贾俊平,2022-06-02,第9章,9.2一元线性回归,一元线性回归建模拟合优度误差分解总平方和(SSTtotalsumofsquares)反映因变量的n个观察值与其均值的总误差回归平方和(SSRsumofsquaresofregression)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和残差平方和(SSEsumofsquaresoferror)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和,9-,统计学Python实现贾俊平,2022-06-02,第9章,9.2一元线性回归,一元线性回归建模拟合优度决定系数R2估计标准误,根,反映实际观察值在回归直线周围的分散状况,实际观察值与回归估计值误差平方和的均方,对误差项的标准差的估计,是在排除了x对,y的线性影响后,y随机波动大小的一个估计量,小,反映用估计的回归方程预测y时预测误差的大,计算公式为,9-,统计学Python实现贾俊平,2022-06-02,第9章,9.2一元线性回归,一元线性回归建模模型检验F检验t检验,9-,统计学Python实现贾俊平,2022-06-02,第9章,9.3利用回归方程进行预测,回归预测置信区间和预测区间,9-,统计学Python实现贾俊平,2022-06-02,第9章,统计,学Pyt,20,22-,6-02,9.3利用回归方程进行预测,回归预测置信区间和预测区间例题分析,9-,n实现贾俊平,第9章,9.4回归模型的模型诊断,模型诊断残差与标准化残差,残差因变量的观测值与预测值之差,用e表示,反映了用估计的回归方程去预测而引起的误差可用于确定有关误差项的假定是否成立,标准化残差残差除以它的标准差,残差图模型诊断工具,9-,统计学Python实现贾俊平,2022-06-02,第9章,9.4,回归模型的模型诊断,模型诊断例题分析,9-,统计学Python实现贾俊平,2022-06-02,THEEND,THANKS2022-06-02,