统计学原理知识点复习.ppt
《统计学原理知识点复习.ppt》由会员分享,可在线阅读,更多相关《统计学原理知识点复习.ppt(99页珍藏版)》请在冰点文库上搜索。
第二节统计学的研究对象和性质,“统计”的涵义:
统计工作、统计资料和统计学(教材P1)统计工作是指对社会经济现象数量方面进行搜集、整理和分析工作的总称,它是一种社会调查研究活动。
统计资料是统计部门或单位进行工作所搜集、整理、编制的各种统计数据资料的总称。
统计学是关于统计过程的理论和方法的科学。
统计学是收集、处理、分析、解释数据并从数据中得出结论的科学(方法论统计学)。
第一章总论,“统计”一词,是指统计工作、统计资料和统计学的总称。
“统计”一词三种涵义之间的关系:
(1)统计工作(统计活动)是基础,统计工作的结果形成统计资料。
统计工作与统计资料是统计活动过程和结果之间的关系;
(2)统计工作为统计学研究打下了资料基础,统计学为统计工作开创了方向。
统计工作与统计学是统计实践和理论的关系。
(3)统计工作是实践,工作结果形成统计资料,统计学是理论方法,三者之间的关系是理论与实践的关系,而统计工作的成果便是统计资料。
一个完整的统计工作过程包括六个阶段(书P6-7):
统计设计,统计调查,统计整理,统计分析,统计任务的确定,是统计活动的首要问题和一切统计活动的依据。
统计数据的管理与提供,一、统计总体与总体单位,第三节统计学中的几个基本概念,二、统计标志与标志表现,三、统计指标与指标种类,
(一)统计总体与总体单位的概念,统计总体:
是根据一定目的确定的统计所要研究事物的全体。
它是由客观存在的具有某种共同性质的许多个别事物构成的整体。
(简称总体),总体单位:
指构成总体的个别事物。
一、统计总体与总体单位,
(二)统计总体与总体单位的关系,1、两者是包含与被包含的关系。
2、随着研究目的的不同(总体范围的不同),两者可以相互转化。
同质性:
构成总体的各单位必须在某一方面或某一点上具有共同性。
注意:
同质性是组成总体的前提条件,而变异性则是对总体进行研究的必要条件。
大量性:
总体是由大量的单位组成的,仅仅个别或少数单位不能形成总体。
变异性(差异性):
构成总体的各总体单位在某一方面具有共同性,但在其它方面必须存在着差异。
(三)统计总体的特征,二、统计标志与标志表现,
(一)统计标志,1、概念,是反映总体单位的特征和属性的名称。
简称标志。
例3,研究目的:
是全国工业企业生产经营情况时,统计总体,全国所有的工业企业,总体单位,每一个工业企业,经济类型、主管部门、所属行业,工业产值、产品利润、职工人数、工资总额、固定资产、流动资金,标志,用文字表示,用数值表示,品质标志,数量标志,2、标志的种类,根据标志的表现形式不同分为:
品质标志:
说明个体质的特征,用属性变量表示;数量标志:
说明个体量的特征,用数量变量表示。
根据标志的具体表现是否相同分为:
不变标志:
某一标志的具体表现在总体中各个体都相同;不变标志是总体同质性的基础。
可变标志:
某一标志的具体表现在总体中各个体不尽相同。
可变标志也称为变异标志。
统计总体的变异性体现在某一标志在总体各个单位上的具体表现上存在的差异,包括质的差异和量的差异。
注意:
总体单位、标志及标志表现三者之间的关系,总体单位是标志的承担者;标志是对总体单位的特征描述;标志表现是标志的实际体现。
三、统计指标,1、概念:
是反映统计总体数量特征的概念和数值。
工业企业名称:
甲乙丙X,数量标志(名称),工业产值(万元),90003708005600,标志值,(反映全国工业企业总体),统计指标(名称),全国工业总产值,98590(亿元),(指标数值),(综合汇总),统计指标的构成要素:
统计指标由指标名称和指标数值两个要素构成。
注意:
统计指标是对标志进行综合而来的。
2、统计指标的特点,统计指标的特点,
(2)综合性,
(1)数量性,(3)具体性,即任何指标都可以用数值表示。
没有不用数值表示的统计指标,数量性:
综合性:
具体性:
即任何指标都是综合说明总体数量特征的。
即说明的不是个别单位或部分单位的数量特征,而是构成总体的全部单位的综合结果。
即任何指标数值都是反映所研究现象在具体时间、地点、条件下的规模、水平。
3、统计指标的种类,
(1)按其反映现象的数量特点不同,
(2)按其数值表现形式不同,数量指标,质量指标,相对指标,总量指标,平均指标,注意:
数量指标,相对指标或平均指标,总量指标,质量指标,(3)按其作用和功能不同,评价指标,描述指标,预警指标,即反映现象总规模、总水平和工作总量的统计指标,又称总量指标,一般用绝对数来表示。
例如:
国内生产总值、钢产量、商品零售额、粮食总产量、职工人数、工资总额、人口总数等。
即反映现象相对水平和工作质量的统计指标。
它是总量指标的派生指标,一般用相对数或平均数来表示。
例如:
经济增长速度、人口自然增长率、职工平均工资、学生平均成绩、单位成本、产品价格等。
数量指标:
质量指标:
数量指标和质量指标是最基本的指标分类,注意:
总量指标是统计整理的直接成果,并作为统计分析基础的综合指标。
4、指标与标志的关系,区别:
(2)标志有品质标志(只能用文字表示)与数量标志(可以用数字表示)两种,而指标都可以用数字表示。
(1)标志是说明总体单位特征的,而指标是说明总体特征的;,联系:
(1)许多指标值都是由数量标志值汇总而来的;,由于总体和总体单位在一定条件下可以互相转化,故说明总体的指标与说明单位的标志也会随之而变。
即标志和指标之间关系是可变化的。
(2)指标与(数量)标志之间存在着变换关系。
两者之间既有区别也有联系。
例如:
如果改变研究目的,原来的统计总体成为统计单位后,则相对应的统计指标也就变成了数量标志了。
1)变异:
即标志的具体表现在同一总体不同总体单位之间的差异性。
变异标志即可变(品质或数量)标志。
2)变量:
即可变的(品质或数量)标志和所有的统计指标。
其具体表现或取值称为变量值。
包括标志值和指标值。
例如:
在全国工业企业总体中,每个工业企业是一个总体单位。
工业企业名称:
甲乙丙X,工业产值(万元),90003708005600,标志值,数量标志,变量,(变量值),5、变异与变量,
(2)按所受影响因素的性质不同分,确定性变量随机性变量,(3)按变量的量化层次分,定类变量分类变量定序变量顺序变量定距变量定比变量,变量的种类:
(1)按取值是否连续分,离散变量,连续变量,(只能用整数表示),(可以用小数表示),数值型变量,绝对数有多种表现形式,可从不同角度对其进行分类。
总量指标的种类,1、按其反映总体内容不同,总体单位总量,总体标志总量,2、按其反映时间状况不同,时期指标(时期数-流量),时点指标(时点数-存量),总量指标的种类,重点复习第四章综合指标,详细介绍了总量指标、相对指标、平均指标和变异指标。
相对指标的种类:
计划完成程度相对数;结构相对指标;比例相对指标;比较相对指标;动态相对指标;强度相对指标;,2.在上述相对指标中,分子和分母可以互换的有哪些?
比例相对数,比较相对数、强度相对数,3.比较指标与比例指标的区别?
比例相对指标是同一总体在同一时间不同部分(现象)的对比;而比较相对指标是同一现象在同一时间不同空间(总体)上的对比。
思考题:
1.计划完成相对指标数值越大,是否说明完成计划的情况越好?
平均指标,一、平均指标概述二、算术平均数三、调和平均数四、几何平均数,五、众数六、中位数和分位数七、各种平均数之间的关系八、平均指标的运用,平均指标的种类,1.按计算的方法不同,2.按反映的时间不同,平均指标种类,算术平均数(Arithmeticmean),调和平均数(Harmonicmean),几何平均数(Geometricmean),众数(mode),中位数(median),动态平均数(dynamicmean),静态平均数(staticmean),数值平均,位置平均数,简单平均:
未分组,加权平均:
分组数据,算术平均数的基本形式,计算条件:
分子与分母必须是同一总体,并且具有直接的一一对应关系。
这一计算要求也是平均指标与强度相对数的主要区别之一。
例如:
在2014年,我国人均粮食产量和我国粮食作物平均亩产量如下:
我国人均粮食产量=粮食总产量/人口总数=60710万吨/136782万人=0.444吨/人,(强度指标),(平均指标),我国粮食作物平均亩产量=粮食总产量/总亩数=60710万吨/169100万亩=0.359吨/亩,算术平均数的基本形式,加权算术平均数(适用于分组资料),简单算术平均数(适用于未分组资料),式中:
xi:
各单位标志值;n:
总体单位数,简单调和平均数的计算公式为:
(三)加权调和平均数(适用于分组资料),
(一)几何平均数的概念和应用场合,1.几何平均数(GM)的概念。
它是分布数列中n个单位标志值连乘积的n次方根。
设n个单位标志值分别为:
x1,x2,x3,xn,则几何平均数为,2.应用场合:
它适合于变量值是相对数,计算现象的平均比率或平均速度。
当变量值的连乘积(而不是各分量之和)等于总比率或总速度时,适合用几何平均法。
几何平均数(GM)(Geometricmean),注:
是均值的一种变形,也称对数平均,
(二)几何平均数的计算方法,根据所掌握资料不同,其计算分为简单几何平均数和加权几何平均数两种方法。
1.简单几何平均数,(适用于未分组资料),式中,GM:
几何平均数;x:
各单位标志值;n:
标志值的个数;:
连乘符号。
3.几何平均数的特点,受极端值的影响较小,故较稳健;若数列中有一个标志值是零或负值,则无法计算。
试计算19962000年钢产量年平均发展速度。
解:
例我国19962000年钢产量各年(环比)发展速度资料如下表:
(适用于分组资料),例如:
某企业19982008年产值发展速度如下表:
次数f,3,5,1,2,试计算19982008年该产品产量年平均发展速度。
解:
2.加权几何平均数.,一、(标志)变异指标的概念、作用和种类二、绝对形式的标志变异指标标准差三、标志变异系数(相对形式的变异指标),(标志)变异指标,平均指标是数据集中趋势特征的描述变异指标是数据离中趋势特征的描述,离中趋势(tendencyofdeviationfromthecentralvalue)反映的是数据的观察值之间的差异或远离中心值的程度,也称离散(dispersionorspread)程度.集中趋势和离中趋势是数据分布的两个不同侧面的特征.,标志变异指标的种类,全距(Range)即极差四分位差(Inter-quartileRange)平均差(Averagedeviation)标准差(standarddeviation)方差(variance)变异系数(coefficientofvariation),变异指标的种类,反映变量值差异的指标,反映分布差异指标,偏度(Skewness)峰度(Kurtosis),绝对形式,相对形式,1.标准差的概念,标准差是分布数列(总体)中各单位标志值与其算术平均数离差平方的平均数的平方根。
即标准差是各变量值离差平方平均数的平方根,又叫均方差。
用表示。
标准差是测定标志变异和风险最常用的方法,它的意义与平均差基本相同,也是各标志值对其算术平均数的平均离差,只是二者在数学处理方法上不同。
标准差,2.数量标志标准差的计算方法,标准差的计算方法,1).简单标准差,2).加权标准差,(未分组资料),(分组资料),例题仍用上例的资料,要求通过计算标准差比较,A、B两宿舍那一组学生的平均成绩更有代表性?
2.数量标志标准差的计算方法(书P112),表4-12:
平均数离差,离差平方,平均数离差,离差平方,-20-1001020,0,4001000100400,-2-1012,41014,0,10,1000,解:
故,B宿舍学生平均成绩比A宿舍更有代表性。
AB,表4-13某车间200名工人按日产量分组资料,解:
例题已知下列资料,要求计算标准差。
-17-7313,289499169,28903430810507012200,xifi,方差,方差是标准差的平方。
根据掌握的资料不同可分为简单方差和加权方差。
(1)简单方差(适合于未分组资料),
(2)加权方差(适合于分组资料),三、标志变异系数-相对形式的标志变异指标,
(一)概念,标志变异系数是总体中,绝对变异指标与其算术平均数之比,以反映标志值差异的相对水平。
也称离散系数。
最常用的是标准差系数。
它是对数据相对离散程度的测度,消除了数据水平高低和计量单位的影响;常用于对不同组别数据离散程度和风险的比较。
(二)变异系数的计算,如果两个数列平均水平不同,或两个数列的性质不同,计量单位不同时,要比较两个数列平均数的代表性大小或两个数列的离散程度大小,这时需消除平均水平不同或计量单位不同的影响,计算标志变异系数。
(三)变异系数的应用条件,在比较两个总体的平均数代表性大小(或说明其标志变异程度大小)时,若其平均水平相同,计量单位相同,可直接计算标准差进行比较;若其平均水平不相同(或其计量单位不同)时,则计算标准差系数进行离散程度或风险程度的比较。
例1:
现有C、D两个宿舍学生统计学考试成绩的有关资料如下表,试比较哪个宿舍学生的平均成绩的代表性大?
平均数离差,-10-505100,解:
离差平方,平均数离差,离差平方,-11-506100,10025025100250,12125036100,282,两平均值不同,D宿舍学生平均成绩更有代表性。
解:
乙城市从业人员之间的收入差异程度更大。
例2:
甲、乙两个城市从业人员工资的有关资料如下表,试比较哪个城市从业人员之间的收入差异程度更大?
第五章中介绍的相关内容时间序列动态对比分析的基本指标,
(一)时间序列的水平指标,
(二)时间序列的速度指标,发展水平,平均发展水平,增长量,平均增长量,发展速度,平均发展速度,增长速度,平均增长速度,发展水平是反映现象发展变化实际已经达到的规模或程度。
即时间数列中的每一项具体指标数值。
可以是总量指标,也可以是相对指标和平均指标。
一、发展水平的概念,二、平均发展水平,平均发展水平是不同时期发展水平的平均数,反映在一段时期内的发展水平的代表值,又称序时平均数或动态平均数。
(一)平均发展水平的概念,
(二)平均发展水平的计算,平均发展水平根据时间数列的性质不同,其计算方法有以下三种,即:
平均发展水平的计算,1.由绝对数时间数列计算,2.由相对数时间数列计算,3.由平均数时间数列计算,注意:
绝对数时间数列平均发展水平的计算是最基本的,相对数及平均数时间数列平均发展水平的计算,都可归结为绝对数时间数列平均发展水平的计算。
1.由绝对数时间数列计算平均发展水平,由于绝对数时间数列又分时期数列和时点数列两种,其计算平均发展水平的方法也不同。
绝对数时间数列的平均发展水平,
(1)时期数列的平均发展水平.,
(2)时点数列的平均发展水平.,间隔相等.,间隔不等.,
(1)时期数列平均发展水平的计算,假定各时期的指标数值分别为a1,a2,a3,an,,则简单平均,连续时点数列即数列中各个水平是逐日按标准时点连续取得的(设一日为一个时点)或现象发生变动时才登记一次,可分别按简单或加权算术平均数直接计算连续时点数列的序时平均数。
(2)时点数列平均发展水平的计算(书P127看书讨论是否有些不合适?
),
(2)时点数列平均发展水平的计算(间断时点序列情形,即书),间隔相等的时点数列平均发展水平的计算,先对两两相邻的指标值计算简单平均数,作为两两相邻各时间段的代表值,然后对这些代表值计算简单算数平均数。
也称“首末折半法”。
计算公式如下:
例某企业职工人数资料如下表,试计算该企业第三季度月平均职工人数。
1,4,间隔不等的时点数列平均发展水平的计算,表5-9某企业职工人数资料如下;,试计算该企业全年月平均职工人数。
1月初3月初7月初8月初12月末,解:
该企业全年月平均职工人数:
435452462576580,+,+,2415,+,2,5,12,(510人),计算出两个点值之间的平均数,用相隔的时期长度(Ti即fi)加权计算总的平均数,故间隔不等的时点数列平均发展水平的计算步骤:
因此,绝对数时间数列的平均发展水平的计算公式可归纳如下:
(1)时期数列,
(2)时点数列,间隔相等,间隔不等,加权平均,简单平均,2.由相对数时间数列计算平均发展水平,式中:
代表分母总量指标时间数列的平均发展水平,1)先分别求出构成相对数的分子和分母的平均数;2)再进行对比,即得相对数序列的序时平均数。
3.由平均数时间数列计算平均发展水平,式中:
代表分母总量指标时间数列的平均发展水平,(方法同相对指标时间数列序时平均数的计算),
(一)发展速度的概念,计算公式为:
(动态相对指标),例如:
某企业2009年某产品产量为300万吨,2008年为200万吨,则,,该产品产量的发展速度,发展速度是以相对数形式表示的动态指标,它是两个不同时期发展水平指标对比的结果。
发展速度主要用来说明报告期的水平是基期水平的百分之几或若干倍。
一、发展速度,
(二)发展速度的种类,发展速度根据基期的不同可分为环比发展速度和定基发展速度两种。
1.环比发展速度,表明报告期的水平对比前一期水平的逐期发展变动的情况。
2.定基发展速度(总速度),是时间数列中报告期水平与某一固定期水平对比,以说明现象在一个较长时间内的变动程度。
(三)环比发展速度和定基发展速度的关系,1.各个时期环比发展速度连乘积等于相应的定基发展速度;,2.相邻时期的定基发展速度之比等于相应的环比发展速度。
(一)增长速度的概念,是以相对数形式表示的动态指标,它是各期增长量与基期水平之比。
用以说明现象各期增长变化的相对程度。
即:
注意:
增长速度与发展速度不同,它说明报告期水平比基期水平增加了多少倍或百分之几,它可为正值,或负值。
二、增长速度(也称增长率),当两个百分数对比基数相同时,如果它们相减的结果差距相当于1,称为一个百分点。
百分点:
(二)增长速度的种类,增长速度根据基期的不同可分为环比增长速度和定基增长速度两种。
环比增长速度是时间数列中逐期增长量与前一期发展水平之比,或用环比发展速度减1,以表明现象逐期增长的速度。
即:
1.环比增长速度。
(分增长速度),2.定基增长速度。
定基增长速度是时间数列中累计增长量与某一固定期水平之比,或是定基发展速度减1,以表明现象在这一时期内总增长的速度。
如表517.,(总增长速度),(三)环比增长速度和定基增长速度的关系,注意:
各个时期环比增长速度的连乘积不等于相应的定基增长速度,即,如果要由各期环比增长速度求第n期的定基增长速度,必须先将各期环比增长速度加上1,还原成各期环比发展速度,然后将其连乘后,得出第n期的定基发展速度,再用所得的结果减1,得定基增长速度。
如表517.,三、平均发展速度与平均增长速度,
(一)平均发展速度的概念,平均发展速度是各个环比发展速度的动态平均数(序时平均数),说明某种现象在一个较长时期中逐年平均发展变化的程度。
(二)平均增长速度的概念,平均增长速度是各个环比增长速度的动态平均数(序时平均数),说明某种现象在一个较长时期中逐年平均增长变化的程度。
平均增长速度=平均发展速度1,
(二)平均发展速度的计算方法,1.几何平均法(水平法),各个时期环比发展速度的几何平均数。
其中:
书P133和134中校错,n为环比发展速度的个数,它等于观察数据的个数减去1;,为连乘符号。
为平均发展速度;,平均增长速度和平均发展速度的关系,平均发展速度等于时间数列各环比发展速度的几何平均数,但平均增长速度不等于时间数列各环比增长速度的几何平均数。
如果要由各期环比增长速度求平均增长速度,则必须先将各期环比增长速度加上1,还原成各期环比发展速度,然后求其几何平均得到平均发展速度,再用所得的结果减1,得平均增长速度。
平均增长速度=平均发展速度1,每增长1%所包含的绝对值,其表示增长率每增长一个百分点而增加的绝对数量。
计算公式为:
增长1%所包含的绝对值=前一期水平1%,简单移动平均是一种简单平滑预测技术,它的基本思想是:
逐项推移,依次计算包含一定项数的观察值的移动平均数,由这些平均数形成的新的时间数列对原时间数列的波动起到一定的修匀作用,削弱了原数列中短期偶然因素的影响,从而呈现出现象发展的变动趋势,即平滑(抵消)短期波动,反映长期趋势。
设时间数列的水平顺次为:
若取三项平均,即取长度(跨越期)L=3,则时间序列的每3个时期的移动平均形成的新数列为:
简单移动平均法,测定长期趋势的预测方法,时间序列的构成要素与组合模型,构成因素长期趋势T(Seculartrend)季节变动S(SeasonalFluctuation)循环波动C(CyclicalMovement)不规则波动I(IrregularVariations)组合模型乘法模型:
Yi=TiSiCiIi加法模型:
Yi=Ti+Si+Ci+Ii,思考:
影响动态数列水平变化的因素有哪些?
移动平均法应注意的问题,移动平均后的趋势值应放在各移动项的中间位置。
采用奇数项移动平均比较简单,一次即得趋势值;采用偶数项移动平均需要进行“中心化”。
由于偶数项移动平均数都是在两项中间位置,所以偶数项移动平均还需进行一次“两项移正平均”,即将第一次移动平均值再进行两项移动平均,得出移正值时间数列,以显示出现象的变动趋势。
移动间隔的长度应长短适中。
如果现象的发展具有一定的周期性,应以周期长度作为移动间隔的长度。
若时间序列是季度资料,应采用4项移动平均。
若为月份资料,应采用12项移动平均。
移动平均法应注意的问题,3.移动平均后的数列,比原数列项数要少。
一般情况下,移动平均项数(设为K)与趋势值的项数关系为:
奇数项移动平均时,首尾各少(k-1)/2项。
偶数项移动平均时,首尾各少k/2项。
线性模型法(线性趋势方程),线性方程的形式为,时间序列的预测值t时间标号b0趋势线在Y轴上的截距,t=0时的值b1趋势线的斜率,表示时间t变动一个单位时观察值的平均变动数量,其时序散点图呈线性趋势时,可采用线性模型拟合预测法.,线性模型法(b0和b1的求解方程),根据最小二乘法得到求解b0和b1的标准方程为,解得,预测误差可用估计标准误差来衡量,教材中P143,变量代换没有必要,季节指数(seasonalindex),刻画序列在一个年度内各月或季的典型季节特征;以各季节指数的平均数等于100%为条件而构成;反映某一月份或季度的数值占全年平均数值的大小;如果现象的发展没有季节变动,则各期的季节指数应等于100%;季节变动的程度是根据各季节指数与其平均数(100%)的偏差程度来测定;如果某一月份或季度有明显的季节变化,则各期的季节指数应大于或小于100%。
季节变动的测定,在按月或按季编制的时间序列中,往往存在着一种随季节周而复始的周期性变动。
季节变动的测定,就是测定各月(季)的季节比率,说明季节变动的一般规律。
测定季节变动的方法有同月(季)平均法和移动平均趋势剔除法。
前者不考虑长期趋势等因素对季节的影响;后者则考虑长期趋势等因素的影响,且先剔除长期趋势等因素的影响,再求季节变动的比率。
后者较准确。
主要介绍移动平均趋势剔除法。
-统计调查的种类,统计调查的组织形式,是指组织统计调查,搜集信息资料的方式方法,可从不同角度作不同分类。
(一)按调查对象包括的范围分类:
全面调查和非全面调查。
1、全面调查:
对构成总体的所有单位的调查。
如:
经济普查、农业普查、人口普查。
2、非全面调查:
对构成总体的一部分单位的调查。
如典型调查、重点调查、抽样调查。
注:
全面调查和非全面调查不是根据调查结果所取得的资料是否全面来划分的,而是按照是否调查所有总体单位来分。
第二章统计调查,分为经常性调查和一次性调查。
经常性(即连续)调查是指随着调查对象的变化,连续不断地进行调查登记,以了解事物在一定时期内发生、发展的全部过程。
如统计报表制度;对工业企业的产量、产值等的调查等。
经常性调