统计学——Python实现教学课件cha4.pptx
《统计学——Python实现教学课件cha4.pptx》由会员分享,可在线阅读,更多相关《统计学——Python实现教学课件cha4.pptx(26页珍藏版)》请在冰点文库上搜索。
第1章,统计学Python实现,贾俊平2022-04-15,人生苦短,我要PythonStatisticswithPython,1-,统计学Python实现贾俊平,2022-04-15,第4章,什么是概率随机变量的概率分布样本统计量的概率分布贾俊平2022-04-15,4-,统计学Python实现贾俊平,2022-04-15,第4章随机变量的概率分布,第4章,4.1,什么是概率,概率,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.2随机变量的概率分布,随机变量的概括性度量随机变量,4-,统计学Python实现贾俊平,2022-04-15,事先不知道会出现什么结果,一般用X,Y,Z来表示投掷两枚硬币出现正面的数量一座写字楼,每平方米的出租价格一个消费者对某一特定品牌饮料的偏好离散型随机变量随机变量X取有限个值或所有取值都可以逐个列举出来以确定的概率取这些不同的值连续型随机变量可以取一个或多个区间中任何值所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点,第4章,4.2随机变量的概率分布,随机变量的概括性度量离散型期望值和方差【例】一家手机制造商声称,它们所生产的手机100个中拥有次品的个数及相应的概率如下表所示。
求该手机次品数的期望值和标准差,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.2随机变量的概率分布,随机变量的概括性度量连续型期望值和方差期望值,方差,E,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.2随机变量的概率分布,随机变量的概率分布离散型,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.2随机变量的概率分布,随机变量的概率分布离散型二项分布,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.2随机变量的概率分布,随机变量的概率分布离散型二项分布二项分布Binomial(5,b)图,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.2随机变量的概率分布,随机变量的概率分布离散型二项分布概率计算,【例4-2】已知一批产品的次,品率为6%,从中任意有放回地,抽取5个。
求5个产品中没有次品的概率恰好有1个次品的概率有3个及以下次品的概率,没有次品的概率,恰好有1个次品的概率,3个及3个以下次品的概率,P(X=0)=0.733904,P(X=1)=0.234225,P(X3)=0.999938,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.2随机变量的概率分布,随机变量的概率分布连续型正态分布,连续型随机变量可以取某一区间或整个实数轴上的任意一个值它取任何一个特定的值的概率都等于0不能列出每一个值及其相应的概率通常研究它取某一区间值的概率用概率密度函数的形式和分布函数的形式来描述,正态分布,4-,统计学Python实现贾俊平,2022-04-15,由C.F.高斯(CarlFriedrichGauss,17771855)作为描述误差相对频数分布的模型而提出描述连续型随机变量的最重要的分布许多现象都可以由正态分布来描述可用于近似离散型随机变量的分布,如二项分布经典统计推断的基础概率密度函数,第4章,4.2随机变量的概率分布,随机变量的概率分布连续型正态分布正态分布,图形是关于x=对称钟形曲线,且峰值在x=处均值和标准差一旦确定,分布形式也惟一确定,不同参数正态分布构成一个完整的“正态分布族”均值可取实数轴上的任意数值,决定正态曲线的具体位置;标准差决定曲线的“陡峭”或“扁平”程度。
越大,正态曲线扁平;越小,正态曲线越高陡峭X的取值向横轴左右两个方向无限延伸,曲线的两个尾端也无限渐近横轴,理论上永远不会与之相交在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1,不同均值和标准差对应的正态曲线,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.2随机变量的概率分布,随机变量的概率分布连续型正态分布标准正态分布的概率,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.2随机变量的概率分布,随机变量的概率分布连续型正态分布标准正态分布随机变量具有均值为0,标准差为1的正态分布任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布,标准正态分布的概率密度函数,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.2随机变量的概率分布,随机变量的概率分布连续型正态分布概率计算,#计算正态分布的概率和分位数,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.2随机变量的概率分布,随机变量的概率分布连续型卡方分布不同自由度的的卡方分布的图像,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.2随机变量的概率分布,随机变量的概率分布连续型卡方分布例题分析,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.2随机变量的概率分布,随机变量的概率分布连续型t分布,【例45】,4-,统计学Python实现贾俊平,2022-04-15,T分布与标准正态分布曲线的比较,第4章,4.2随机变量的概率分布,随机变量的概率分布连续型F分布,【例46】,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.3样本统计量的概率分布,统计量及其分布参数和统计量概率分布统计量的概率分布,4-,统计学Python实现贾俊平,2022-04-15,样本统计量的概率分布,也称抽样分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供样本统计量长远而稳定的信息,进行推断的理论基础,第4章,4.3样本统计量的概率分布,统计量及其分布样本均值的概率分布与中心极限定理,样本均值的分布,在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础,中心极限定理,从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,样本均值的分布与总体分布及样本量的关系,样本均值的分布,来自正态总体的样本,正态分布,来自非正态总体的样本,大样本,正态分布,小样本,非正态分布,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.3样本统计量的概率分布,统计量及其分布样本均值的概率分布与中心极限定理中心极限定理从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.3样本统计量的概率分布,统计量及其分布样本方差的概率分布来自正态总体的样本方差的分布模拟,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.3样本统计量的概率分布,统计量及其分布样本比例的概率分布样本比例的分布统计量的抽样分布的标准差,简称标准误差衡量统计量的离散程度,测度了用样本统计量估计总体参数的精确程度当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误,称为估计的标准误以样本均值为例:
当总体标准差未知时,可用样本标准差s代替,则在重复抽样条件下,样本均值的估计标准误为样本均值和样本比例的标准误分别为,4-,统计学Python实现贾俊平,2022-04-15,第4章,4.3样本统计量的概率分布,统计量及其分布统计量分布的标准误统计量的抽样分布的标准差,简称标准误差衡量统计量的离散程度,测度了用样本统计量估计总体参数的精确程度当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误,称为估计的标准误以样本均值为例:
当总体标准差未知时,可用样本标准差s代替,则在重复抽样条件下,样本均值的估计标准误为样本均值和样本比例的标准误分别为样本均值的标准误样本比例的标准误,4-,统计学Python实现贾俊平,2022-04-15,THEEND,THANKS2022-04-15,