第四章统计描述下.ppt

上传人:wj 文档编号:2508221 上传时间:2023-05-03 格式:PPT 页数:105 大小:1.05MB
下载 相关 举报
第四章统计描述下.ppt_第1页
第1页 / 共105页
第四章统计描述下.ppt_第2页
第2页 / 共105页
第四章统计描述下.ppt_第3页
第3页 / 共105页
第四章统计描述下.ppt_第4页
第4页 / 共105页
第四章统计描述下.ppt_第5页
第5页 / 共105页
第四章统计描述下.ppt_第6页
第6页 / 共105页
第四章统计描述下.ppt_第7页
第7页 / 共105页
第四章统计描述下.ppt_第8页
第8页 / 共105页
第四章统计描述下.ppt_第9页
第9页 / 共105页
第四章统计描述下.ppt_第10页
第10页 / 共105页
第四章统计描述下.ppt_第11页
第11页 / 共105页
第四章统计描述下.ppt_第12页
第12页 / 共105页
第四章统计描述下.ppt_第13页
第13页 / 共105页
第四章统计描述下.ppt_第14页
第14页 / 共105页
第四章统计描述下.ppt_第15页
第15页 / 共105页
第四章统计描述下.ppt_第16页
第16页 / 共105页
第四章统计描述下.ppt_第17页
第17页 / 共105页
第四章统计描述下.ppt_第18页
第18页 / 共105页
第四章统计描述下.ppt_第19页
第19页 / 共105页
第四章统计描述下.ppt_第20页
第20页 / 共105页
亲,该文档总共105页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

第四章统计描述下.ppt

《第四章统计描述下.ppt》由会员分享,可在线阅读,更多相关《第四章统计描述下.ppt(105页珍藏版)》请在冰点文库上搜索。

第四章统计描述下.ppt

问题:

萨姆说吉斯莫先生对,平均工资真的是300元吗?

吉斯莫先生:

这是我每周付出的酬金。

我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。

一名统计学家遇到一位数学家,统计学家调侃数学家说道:

“你们不是说若且,则吗!

那么想必你若是喜欢一个女孩,那么那个女孩喜欢的男孩你也会喜欢喽!

”数学家想了一下反问道:

“那么你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!

因为它们平均的温度不过是五十度而已!

”,统计学家与数学家,如果你的腳已經踩在爐子上,而頭卻在冰箱裡,統計學家會告訴你,平均而言,你相當舒服。

调侃统计学家,一、总体的集中趋势,平均指标的种类,种类,算数平均数调和平均数几何平均数众数中位数,数值平均数,位置平均数,基本形式:

例:

直接承担者,注意区分算术平均数与强度相对数,算术平均数,算数平均数中总体标志总量和总体单位总数有严格的相对应关系,总体标志总量必须是总体各单位标志值的总和,标志值和单位之间是一一对应的关系eg:

全国人均能源消费量指标强数相对数中分子分母之间不存在一一对应的关系eg:

全国人均能源生产量指标,式中:

为算术平均数;为总体单位总数;为第个单位的标志值。

算术平均数的计算方法,平均每人日销售额为:

算术平均数的计算方法,式中:

为算术平均数;为第组的次数;为组数;为第组的标志值或组中值。

算术平均数的计算方法,平均数水平高低受两个因素的影响:

变量x次数f,【例】某企业某日工人的日产量资料如下:

计算该企业该日全部工人的平均日产量。

算术平均数的计算方法,解:

算术平均数的计算方法,例.某商场食品部工人日销售资料如下,计算平均销售额,工人按日产量分组情况,据资料,以各组次数占总次数为权数,计算平均日产量。

采用公式,算术平均数的计算方法,交替标志平均数,交替标志又称是非标志,它是一个只有两种答案的标志.只有质的差异,不能直接计算平均数.将它的属性差异先数量化,然后在计算算术平均数,以反映其质量的一般水平方法:

1:

具有某属性的单位标志值;0:

不具有某种属性的单位标志值。

N:

全部总体单位数。

N1:

具有某种属性的总体单位数。

N2:

不具有某种属性的总体单位数。

具有某种属性的单位数所占的比重:

P=N1/N不具有某种属性的单位数所占的比重:

Q=N2/N其中:

P+Q=1交替标志平均数,是非标志的均值(成数),例:

某厂去年生产的产品中,合格率是98,计算该厂产品的平均合格率,【例】设X=(2,4,6,8),则其调和平均数可由定义计算如下:

再求算术平均数:

求各标志值的倒数:

,,再求倒数:

是总体各单位标志值倒数的算术平均数的倒数,又叫倒数平均数,调和平均数harmean(harmonicmean),A.简单调和平均数,适用于总体资料未经分组整理、尚为原始资料的情况,式中:

为调和平均数;为变量值的个数;为第个变量值。

调和平均数的计算方法,例某集贸市场西红柿的价格,早市每千克1元,午市每千克0.50元,晚市每千克0.25元,若早、中、晚各买1元钱,计算平均价格。

用算术平均数计算:

早、中、晚各买1元钱,合计花3元。

早上用1元钱可买111千克,中午用1元钱可买2千克,晚上用1元钱可买4千克,合计共买西红柿7千克。

平均价格数:

用简单调和平均数计算:

B.加权调和平均数,适用于总体资料经过分组整理形成变量数列的情况,式中:

为第组的变量值;为第组的标志总量。

调和平均数的计算方法,例资料如上题,早上买西红柿为3元,中午买2元,晚上买1元,则其平均价格为:

计算该企业该日全部工人的平均日产量。

调和平均数的应用,即该企业该日全部工人的平均日产量为12.1375件。

调和平均数的应用,在统计中,调和平均数常常作为算术平均数的变形来使用,所以它的计算内容和算术平均数一样,是标志总量除以总体单位数,调和平均数的权数是算术平均数中的标志值乘以总体单位数所得到的标志总量,即尽管二者的计算方法不同,但实质是一样的.应用调和平均数应注意问题变量x的值不能为0。

变量不同:

算术平均数是x,调和平均数是1/x。

权数不同:

算术平均数是f,代表次数(单位数),调和平均数是xf或M,代表标志总量。

联系:

调和平均数作为算术平均数的变形使用:

调和平均数与算术平均数的比较,x、f为已知,若只知x和xf,而f未知,则不能使用加权算术平均方式,只能使用其变形即加权调和平均方式。

苹果单价购买量总金额品种(元)(公斤)(元)红富士236青香蕉1.859,式中:

为几何平均数;为变量值的个数;为第个变量值。

几何平均数的计算方法,【例】某流水生产线有前后衔接的五道工序。

某日各工序产品的合格率分别为95、92、90、85、80,求整个流水生产线产品的平均合格率。

分析:

设最初投产100A个单位,则第一道工序的合格品为100A0.95;第二道工序的合格品为(100A0.95)0.92;第五道工序的合格品为(100A0.950.920.900.85)0.80;,因该流水线的最终合格品即为第五道工序的合格品,故该流水线总的合格品应为100A0.950.920.900.850.80;则该流水线产品总的合格率为:

即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。

思考,若上题中不是由五道连续作业的工序组成的流水生产线,而是五个独立作业的车间,且各车间的合格率同前,又假定各车间的产量相等均为100件,求该企业的平均合格率。

几何平均数的计算方法,因各车间彼此独立作业,所以有第一车间的合格品为:

1000.95;第二车间的合格品为:

1000.92;第五车间的合格品为:

1000.80。

则该企业全部合格品应为各车间合格品的总和,即总合格品=1000.95+1000.80,几何平均数的计算方法,分析:

不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。

又因为,应采用加权算术平均数公式计算,即,式中:

为几何平均数;为第组的次数;为组数;为第组的标志值或组中值。

几何平均数的计算方法,【例】某金融机构以复利计息。

近12年来的年利率有4年为3,2年为5,2年为8,3年为10,1年为15。

求平均年利率。

设本金为V,则至各年末的本利和应为:

第1年末的本利和为:

第2年末的本利和为:

第12年末的本利和为:

分析:

则该笔本金12年总的本利率为:

即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。

解:

某地区20年来经济发展速度如下表所示,求20年中经济平均发展速度。

20年中的经济平均发展速度为:

算术平均数、调和平均数、几何平均数关系,若根据未分组资料计算平均数,应采用简单算术平均数;若掌握分组的次数分配资料,则应采用加权算术平均数;若在分组资料中,缺少权数f项,而代之以总量xf的形式出现,考虑采用调和平均数。

若各变量间存在相互联系而非独立情况,如各年发展速度之间、流水作用各车间合格率之间,采用几何平均数。

若为未分组资料,采用简单几何平均数;根据分组资料,采用加权几何平均数。

1.算术平均数、调和平均数、几何平均数适用条件:

2.三者数量关系:

众数和中位数,有时众数是一个合适的代表值,比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。

众数(不惟一性),无众数原始数据:

10591268,一个众数原始数据:

659855,多于一个众数原始数据:

252828364242,1、由单项数列来确定众数将数据资料进行分组,编制次数分布数列;通过观察找出次数出现最多的那个标志值即可。

众数的确定,某年级女生的身高分布情况,求出众数,(单项数列),已知某企业职工工资水平如下:

(单项数列),计算该企业工人工资的众数。

不同品牌饮料的频数分布情况如下表所示,这里的变量为饮料品牌众数为:

可口可乐,(单项数列),方法:

确定众数所在的组通过公式计算众数值公式为:

2、由组距数列来计算众数,U:

众数所在组的上限L:

众数所在组的下限i:

众数所在组的组距:

众数组与前一组次数之差:

众数组与后一组次数之差,(组距数列),某车间50名工人月产量的资料如下:

计算该车间工人月产量的众数。

现检测某厂生产的一批电子产品的耐用时间,得到资料如下表所示:

众数位于第三组L=800U=1000i=1000-800=200244-16183244-15787,(组距数列),代入公式得:

405060708090100,5040302010,AGF,BC,人数,成绩,xy,LU,Mo=L+x=U-y,O,ED,绘图求得众数:

即先画相邻三组次数分布直方图,然后连接相邻两组次数差的对角线,再以对角线的交点向x轴引一条垂线,它与X轴的交点即为众数.,当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)。

众数的原理及应用,不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。

中位数的作用:

中位数的概念将被研究总体的各单位的标志值按大小顺序排列,处于中间位置的那个标志值就是中位数,用符号Me表示。

中位数的特点和作用代表整个总体各单位标志值的平均水平不受极端值的影响(缺乏敏感性),中位数,1.所给资料未分组(先按大小顺序排列)中位数位置:

当n为奇数时,中位数就是居于中间位置的那个标志值。

例19设有9个工人生产某种产品,其日产量件数按大小顺序排列为67778991014。

则中位数位次即处于第5位的那个标志值为中位数。

即Me=8件。

中位数的确定,例19设有10个工人生产某种产品,其日产量件数按大小顺序排列为6777899101418。

则其中位数位次:

中位数处在第5个标志值与第6个标志值之间中点的位置。

则Me=(8+9)/2=8.5,当n为偶数时,中位数是处于中间位置的那两个标志值的算术平均数。

2.所给的资料已分组

(1)根据单项数列确定中位数方法:

先计算单项数列得累积次数,确定中位数位置看其在数列累积次数得哪一组中,则该组对应的标志值即为中位数。

【例C】某企业某日工人的日产量资料如下:

计算该企业该日全部工人日产量的中位数。

中位数的位次:

中位数的确定,(单项数列),方法:

先确定中位数所在位置然后用公式计算中位数公式为:

该公式假定中位数组的频数在该组内均匀分布式中:

L:

中位数所在组下限U:

中位数所在组上限fm:

中位数所在组的次数i:

中位数所在组的组距Sm-1:

中位数所在组前面各组的累计次数Sm+1:

中位数所在组后面各组的累计次数,

(2)根据组距数列确定中位数,中位数的确定,(组距数列),【例D】某车间50名工人月产量的资料如下:

计算该车间工人月产量的中位数。

中位数的确定,(组距数列),共个单位,共个单位,共个单位,共个单位,L,U,中位数组,组距为d,共个单位,假定该组内的单位呈均匀分布,中位数下限公式为,第六节几种平均数关系,1.众数、中位数、平均数的特点和应用,众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用,算术平均数、众数、中位数数值关系,

(一)对称分布情况下,2.算术平均数、众数、中位数数值关系,

(二)偏态分布情况下,在一般的情况下,不论是右偏还是左偏,中位数总是位于众数和算术平均数之间,根据皮尔逊经验公式,三者具有如下的关系等式:

例子:

某厂上月产量的中位数为720,众数为640,则估计该厂的产量的算术平均数为?

右偏还是左偏?

假定某车间有两个小组工人的工资水平:

甲组:

500,600,700,800,900,乙组:

600,650,700,750,800,尽管两个小组的平均工资都是700,但各组工人工资的变异程度是不一样的。

测定离中趋势的意义,用来衡量和比较平均数代表性的大小;例:

某公司所属的三个企业三年来的年销售额资料:

年平均销售额都是1200万元,但年平均销售额1200万元对各个企业的代表性是不同的,用来反映社会经济活动过程的均衡性和节奏性;某公司下属两个企业销售额计划完成情况如表可以看出两个企业的销售计划虽都已完成,但两者计划执行过程的情况不同:

乙企业各季度的销售情况较为均衡,甲企业各季度销售变动幅度较大反映总体各单位标志值分布的离中趋势。

变异指标值越大,标志变量越分散,总体的同质性越差,例:

某公司所属的三个企业三年来的年销售额资料:

RA=Xmax-Xmin=1300-1100=200RB=Xmax-Xmin=3000-200=2800RC=Xmax-Xmin=1600-800=800计算结果表明,A企业销售额的变异程度最小,B企业变异程度最大。

运用上述方法计算左边数列的极差,对分组资料,不能确知最大值和最小值,求全距用最大组的上限减去最小组的下限对于开口组:

最高组的上限最高组的下限邻组的组距最低组的下限最低组的上限邻组的组距,【例】某季度某工业公司18个工业企业产值计划完成情况如下:

计算该公司该季度计划完成程度的全距。

优点:

计算方法简单、易懂;缺点:

易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差,全距的特点,简单平均差适用于未分组资料,是各个数据与其算术平均数的离差绝对值的算术平均数,用A.D表示,平均差,计算公式:

【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。

解:

即该售货小组5个人销售额的平均差为93.6元。

加权平均差适用于分组资料,平均差的计算公式,【例B】计算下表中某公司职工月工资的平均差。

解:

即该公司职工月工资的平均差为138.95元。

优点:

不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:

用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。

平均差的特点,一般情况下都是通过计算另一种标志变异指标标准差,来反映总体内部各单位标志值的差异状况,简单标准差适用于未分组资料,计算公式:

【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。

解:

(比较:

其销售额的平均差为93.6元),即该售货小组销售额的标准差为109.62元。

加权标准差适用于分组资料,标准差的计算公式,【例B】计算下表中某公司职工月工资的标准差。

解:

(比较:

其工资的平均差为138.95元),即该公司职工月工资的标准差为167.9元。

标准差的特点,不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.,测定标志变异度的绝对量指标(与原变量值名数相同),测定标志变异度的相对量指标(表现为无名数),全距,平均差,标准差,全距系数,平均差系数,标准差系数,标志变异指标的种类,可比,身高的差异水平:

cm,体重的差异水平:

kg,可比,变异系数指标,【例】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。

解:

一班成绩的标准差系数为:

二班成绩的标准差系数为:

因为,所以一班平均成绩的代表性比二班大。

是非标志总体,为研究是非标志总体的数量特征,令,是非标志总体的指标,具有某种标志表现的单位数所占的成数,不具有某种标志表现的单位数所占的成数,是非标志总体的指标,均值,标准差,是非标志总体的指标,方差,标准差系数,【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。

求产品质量分布的集中趋势与离中趋势。

是非标志总体的指标,解:

偏度与峰度分布的形状,偏度,峰度,偏态计算方法,利用算术平均数与位置平均数的关系测定分布偏态1.偏数的绝对值=X-M02.偏数系数3.动差法,采用动差法测定分布偏态,标准正态分布,右偏分布positiveskewness,左偏分布negativeskewness,偏态系数,峰度的测定,标准正态分布,尖峰分布,扁平分布,峰度系数,偏态与峰度(从直方图上观察),按纯收入分组(元),结论:

1.为右偏分布2.峰度适中,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 党团工作 > 入党转正申请

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2