统计基础知识与统计实务讲义全文.docx
《统计基础知识与统计实务讲义全文.docx》由会员分享,可在线阅读,更多相关《统计基础知识与统计实务讲义全文.docx(62页珍藏版)》请在冰点文库上搜索。
统计基础知识与统计实务讲义全文
《统计基础知识与统计实务》
辅导人:
王力
统计基础知识
第一章总论
第二章统计调查
第三章统计整理
第四章统计指标
第五章时间序列
第六章统计指数
第七章抽样调查基础知识
第八章统计分析基础知识
第一章:
总论
本章知识点:
1、统计的涵义2、统计中三组基本概念3、统计的任务及统计过程
一、统计的涵义
统计:
指对某一现象有关的数据的搜集、整理、计算和分析等的活动。
现实中有三种涵义:
统计工作、统计资料、统计学。
三者关系:
①统计工作与统计资料是统计过程与活动的成果的关系;统计工作活动的目的就是取得统计资料;统计资料的取得必须依靠统计工作来进行。
②统计工作与统计学是统计实践与统计理论的关系。
统计学一方面是统计工作的经验总结和理论概括,另一方面又指导统计工作的实践。
③统计工作是先于统计学而发展起来的。
也就是说先实践,再形成理论。
二、统计中常用的三组概念
(一)总体与总体单位
总体是将同一性质基础上结合起来的许多个别事物的整体,也叫统计总体,简称总体。
总体单位:
构成总体的每一个事物的总称。
关系:
总体是由总体单位构成的,根据研究事物和对象的不同,有时总体单位也可以构成总体。
举例:
2010年全国第六次人口普查,如果要研究全国人口年龄、性别等情况,那么全国所有的人口就成了我们要研究的总体了,那么每个省、自治区、直辖市的人口数就是总体单位。
如果我们研究的范围缩小为省、自治区、直辖市的话,那么此时又变成了总体,而不是总体单位了。
再如我们想知道岳阳2011年8月止,全市产值过2000万元的1331家规模以上工业生产情况,那么全市1331家产值过2000万的企业就是我们需要统计的总体,每一个企业就是构成总体的总体单位。
当要研究某一个企业内部问题,如企业职工工资待遇等情况,那么这个企业的所有职工成了统计总体,每个职工则为总体单位。
结论:
总体和总体单位随着研究的对象改变是可以相互转换的。
(二)指标与标志
•指标:
反映总体现象数量特征的概念。
•标志:
用来说明总体单位特征的名称。
•两者区别与联系:
区别主要表现在:
指标是说明总体特征的,标志是说明总体单位特征的。
标志可以分为不能用数值表示的品质标志和能用数值表示的数量标志。
而指标是用数值表示的,没有不能用数值标志的指标。
联系:
许多指标的数值是从总体单位的数量标志值汇总出来的。
指标与数量标志之间存在变换关系。
根据研究目的的不同,总体与总体单位也会不同,有的指标可能变成标志,有的数量标志也可能变成指标。
(三)变异与变量
变异:
标志在同一总体不同总体单位之间的差异。
变量:
将数量变异标志称为变量。
数量变异标志的表现形式是具体的数值,称为变量值。
三、统计任务及工作过程
1.任务:
对经济社会发展情况进行统计调查、统计分析,提供统计资料和统计咨询意见,实行统计监督。
统计三大职能:
信息、咨询、监督。
2.统计工作过程:
依次为统计设计、统计调查、统计整理和统计分析四个阶段。
3.统计的认识过程:
从定性认识(统计设计)到定量认识(统计调查和统计整理),再到定性认识与定量认识相结合(统计分析)的过程。
第二章:
统计调查
概念及作用:
统计调查是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。
要求:
准确、及时。
一、分类
按调查对象范围不同:
全面调查和非全面调查。
按调查登记时间是否连续性:
连续调查和不连续调查。
按调查组织方式不同:
统计报表和专门调查
二、调查方案
1、内容
第一、调查目的;
第二、调查对象、调查单位和报告单位;
第三、调查项目和调查表;
第四、调查时间和调查期限;
第五、调查的组织计划。
2、第二条做为重点:
调查单位是调查总体中的个体,既每个被调查者;报告单位是负责向统计调查机关提交调查资料的单位。
两者有时是一致的,有时则不一致。
三、统计调查方式
1、一句话:
建立以必要的周期性普查为基础,以经常性的抽样调查为主体,同时辅之以重点调查、科学推算和有限的全面报表综合运用的统计调查方法体系。
2、主要调查方式:
定期统计报表、普查、重点调查、抽样调查和典型调查。
普查
普查是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。
如:
10年一次的人口普查和农业普查,人口普查逢“0”,农业普查逢“6”。
经济普查每5年普查一次,逢“3”、“8”。
抽样调查
1、概念
从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。
2、特点
第一、随机原则
第二、根据样本推断总体
四、统计资料搜集方法
1、初级资料与次级资料
未做任何加工整理的原始资料,称初级资料;
人为为其自己的研究目的调查、整理过的资料,称次级资料或文案资料。
2、初级资料搜集的方法
⑴直接观察法
⑵报告法
⑶面谈访问法
⑷邮寄访问法
⑸电话访问法
⑹互联网访问法
五、统计调查资料的质量控制
1、统计调查误差的种类
登记误差和代表性误差
登记误差是由于调查过程中各个有关环节上的工作不准确而产生的误差;代表性误差是指用部分总体单位的指标估计总体指标时,估计结果同总体实际指标之间的差别。
2、控制的途径
(1)控制登记性误差
(2)控制代表性误差
小结:
登记性误差是可以消除的,代表性误差是无法消除,只能尽可能缩小。
第三章:
统计整理
一、概念及内容
统计整理是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。
内容包括:
a:
对原始资料进行审核与检查,发现错误,及时订正;
b:
对各指标进行汇总,得到需要的各种数据;
c:
将汇总的结果编制成统计表与分析表,以便进一步分析
d:
对统计资料进行系统累积。
二、统计分组
统计分组是根据研究的任务和对象的特点,按照某种分组标志将统计总体分为若干个部分。
作用如下:
①发现社会经济现象的特点和规律;
②将复杂的社会经济现象划分为性质不同的各种类型;
③反映总体内部结构;
④揭示现象之间的依存关系。
三、统计分组体系
根据统计分组的要求,对同一总体进行多种不同分组而形成的体系。
分类:
四、次数分布
(一)概念及作用
将按某一标志进行分组后的总体再按一定的顺序进行排列,形成总体单位数在各组间的分布,称为次数分布,各组的总体单位数叫次数或频数。
把上述各组按顺序排列后,列出每个组的总体单位数就形成一个数列,叫次数分布数列,简称分配数列。
(二)分配数列的种类
根据分组标志不同,分配数列分为品质数列和变量数列。
按照变量是否连续,分为离散变量和连续变量。
变量数列也可以分为离散变量数列和连续变量数列。
(三)变量数列中几个概念
1、组距与组数
组距是每个组变量值中最大值与最小值之差,一般把最大值叫该组的上限,最小值叫该组的下限。
2、组限与组中值
组限是每个组的两端标志值,起点值为下限,终点值为上限。
组中值是每个组上限与下限的中点值。
划分组限,相邻可以重叠,可以不重叠,如果重叠,按照“上限不在组内”的原则计入下一组。
3、频数与频率
频数是分配数列中各组的单位数,也叫次数。
频率是将各组的单位数与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。
(四)变量数列的编制
1、组距式变量数列的编制方法(综合应用)
例:
某企业工人日产量资料如右表:
问:
1、上述数列属于:
变量数列、等距数列
2、上列数列中的变量是:
日产量
3、上述数列中工人数是:
频数
4、各组的频率分别为:
是各组工人数与合计数之商,分别为6%、11%、11%、13%、14%、17%、21%和7%。
日产量分组(件)
工人数
50-60
6
60-70
12
70-80
12
80-90
14
90-100
15
100-110
18
110-120
22
120-130
8
合计
107
(五)次数分布的表示方法
1、列表法2、图示法:
直方图、折线图、曲线图、饼图
五、统计表
统计表是由总标题、横行标题、纵栏标题和指标数值四部分构成。
统计表的内容
分两部分:
一部分是统计表所要说明的总体及分组的名称,这一部分习惯上称主词;另一部分则是说明总体的统计指标,包括指标名称和指标数值,这一部分习惯上成为宾词。
统计表的格式一般是“开口”式的,即表的左右两端不划纵线。
第四章统计指标
1、统计指标的涵义
反映总体现象数量特征的基本概念及其具体数值的总称。
三大要素:
指标名称、计量单位和计算方法
2、特点及作用
特点:
同质事物的可量性、量的综合性
作用:
一是记录社会经济现象发展变化情况的工具,同时又是反映社会经济现象数量规律的手段;另外它提供以数量表现的事实,是进行社会管理和科学研究的基本依据。
3、统计指标的种类:
总量指标
•概念:
反映社会经济现象在一定时间、空间条件下的总规模或总水平的最基本的综合指标,用绝对数表示。
•分类:
按反映的内容不同分总体单位总量单位和总体标志总量指标。
•时期指标和时点指标:
区别:
时期指标数值的大小与时期长短有关,时点指标无关;时期指标各期数可以相加,时点指标相加无实际意义。
相对指标
•概念:
应用对比的方法,将两个相互联系的指标数值加以对比计算的一种比值。
•计量形式:
有单位的复名数和无名数。
如:
万元GDP能耗;百分数、千分数、系数或倍数、成数。
相对指标的种类及计算原则
分两类:
同一总体内部对比和两个总体之间的对比
1、同一总体内部对比的相对指标主要有:
计划完成程度相对指标、计划执行进度相对指标、结构相对指标、比例相对指标和动态相对指标。
2、两个总体之间对比的相对指标有:
比较相对指标和强度相对指标。
举例:
1、某企业计划规定单位产品成本降低2%,实际降低7%,则其单位成本降低计划完成程度为:
(1-7%)/(1-2%=94.9%。
2、某建设施工对盖一栋大楼,计划320天完成,实际290天就完工了,则计划完成程度为:
290/320=90.63%,超额9.37%完成了计划。
3、某城市20万人,零售商业网点600个,下列选项正确的是(DE)
A:
商业网点密度正指标333人/个,逆指标3个/千人
B:
商业网点密度为比例相对指标
C:
商业网点密度为同一总体不同部分总量指数之比
D:
商业网点密度为强度相对指标
E:
商业网点密度正指标3个/千人,逆指标333人/个
平均指标
1、概念
平均指标是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。
2、作用
①可以消除因总体规模不同而带来的总体数量差异,从而使不同规模的总体具有可比性。
②可以反映同一总体在不同时期的发展变化趋势。
③可以分析现象之间的依存关系。
④可以进行数量上的推算和预测。
⑤对总量指标进行补充说明。
平均指标的分类
可分为数值平均指标和位置平均指标。
1、数值平均指标按计算方法分:
算术平均数、调和平均数和几何平均数。
2、位置平均数:
中位数、众数等。
加权算术平均数
1、概念:
利用各组变量分别与其次数相乘后加总求得标志总量,再除以总体单位数而求得的数值,公式为:
举例:
1、甲、乙两企业人数及月工资分组资料如下:
月工资(元)
甲企业人数(人)
乙企业人数(人)
400以下
4
2
400-600
15
18
600-800
84
73
800-1000
126
103
1000以上
28
42
(1)各组组中值分别为:
300、500、700、900、1100
(2)采用平均数计算方法为:
加权算术平均
(3)甲、乙两企业工人月平均工资为:
甲:
(300×4+500×15+700×84+900×126+1100×28)/(4+15+84+126+28)=211700/257=823.74(元)
乙:
(300×2+500×18+700×73+900×103+1100×42)/(2+18+73+103+42)=838.66(元)
调和平均数
1、应用范围:
在没有掌握各组单位数及总体单位数的情况下,只掌握各组的标志值和各组的标志总量及总体总量的条件下,适宜采用调和平均数来计算平均指标。
2、分类:
简单调和平均数和加权调和平均数。
例:
某总公司设甲、乙两家分公司,甲、乙两家分公司员工的月工资资料如下表:
月工资(元)
甲公司工资总额
乙公司工资总额
2000
100000
80000
2500
130000
150000
3000
9000
6000
问:
1、若计算两家分公司的月平均工资,采用什么方法?
加权调和平均数
2、三个档次的月工资员工数依次为多少人?
50,52,3;40,60,2
3、甲乙公司员工平均工资分别为多少?
2276.19元;2313.73元
几何平均数
1、概念:
是计算平均指标的一种方法,将n个变量值连乘再开n次方根。
2、应用:
大多用于计算平均发展速度。
此部分内容仅作了解。
标志变异指标
1、概念
表明总体中各个单位标志值的差异程度,或者说是离散程度的指标。
2、指标
全距:
最大值与最小值的差距
平均差:
总体各变量值与平均数之差
标准差:
总体各变量值与平均数的离差的算术平均数的平方根。
离散系数:
标准差和平均数的比值。
标志变异指标
(一)
1、全距
统计意义:
全距越小说明标志变动值越集中,全距越大说明标志变动值越分散。
全距只考虑变量的两个极端值的差异,不能反映各单位标志值的变异程度。
2、平均差
统计意义:
它不同于全距,它是根据所有变量值计算的,可以反映总体各单位标志值的离散程度,平均差愈大说明标志变动度愈大,平均数代表性愈小;反之,平均差愈小说明标志变动度愈小,平均数代表性愈大。
标志变异指标
(二)
1、标准差
标准差愈大说明标志变动程度愈大,因而平均数代表性愈小;反之标准差愈小说明标志变动程度愈小,因而平均数代表性愈大。
2、标准差系数(离散系数)离散系数小平均数的代表性越高,反之。
举例:
1、甲、乙企业工人月产量资料如下表:
按月产量分组(件)
工人数(人)
按月产量分组(件)
工人数(人)
甲
企
业
40-50
50
乙
企
业
40-50
10
50-60
100
50-60
18
60-70
120
60-70
54
70-80
80
70-80
50
80-90
60
80-90
60
90-100
30
90-100
8
合计
-
440
合计
-
200
问:
1、若比较两企业工人月平均产量,采用什么平均数的方法:
加权算术平均
2、两企业工人平均月产量为:
甲67件;乙72件。
甲=(45*50+55*100+65*120+75*80+85*60+95*30)/440=67件
乙=(45*10+55*18+65*54+75*50+85*60+95*8)/200=72件
3、两企业工人平均月产量标准差分别为:
甲=[(45-67)^2*50+(55-67)^2*100+(65-67)^2*120+(75-67)^2*80+(85-67)^2*60+(95-67)^2*30]/440得出的结果再开方=14.07件
同理算出乙=12.24件
4、两企业工人平均月产量标准差系数分别为:
甲=14.07/67=21%,乙=17%。
由于乙标准差系数小于甲,所以乙企业的工人平均月产量代表性大于甲。
第五章时间序列
1、概念:
将同一统计指标的数值按其发生的时间先后顺序排列而成数列成为时间数列,也称动态数列。
2、作用:
①、可以描述社会经济现象的发展状态和结果;
②、研究社会经济现象的发展趋势和发展速度;
③、探索社会经济现象的发展变化规律;
④、进行预测;
⑤、通过不同时间数列的对比,进行统计分析。
时间数列的种类
按其排列的统计指标不同分:
总量指标时间数列、相对指标时间数列、平均指标时间数列
总量指标时间数列
概念:
将同一总量指标的数值按其发生的时间先后排列而成的数列,叫总量指标时间数列。
分为时期数列和时点数列。
时期数列:
反映经济现象在某一段时期内发展过程的总量时。
如:
经济总量(GDP),财政收入等总量指标
特点:
指标数值可以相加;数值的大小与时间长短有关;数列中每个指标通常是经过连续不断地登记取得的。
时点数列:
反映经济现象在某一瞬间所达到的水平。
如:
人口数是最为典型的时点数列。
特点:
指标数值不能相加;数列中的指标数值的大小与时间长短没有直接联系;数值的取得是每隔一定时期登记一次取得。
时间数列的水平指标
主要有:
发展水平、平均发展水平、增长量、平均增长量。
重点关注:
序时平均数的计算。
例:
某市2009年城镇单位从业人员数列资料如下表
时间
1月1日
3月1日
7月1日
11月1日
12月31日
从业人员
140.2
142.5
144.1
149.5
148.8
分析:
此数列是属于时点数列,数列中的每个指标数值不能相加,如果要计算2009年该市年平均城镇单位从业人员人数就要采用加权算术平均法,具体算法:
[(140.2+142.5)/×2+(142.5+144.1)/2×4+(144.1+149.5)/2×4+(149.5+148.8)/2×2]/12=145.12(万人)
时间数列的水平指标
(一)
增长量与平均增长量
1、增长量是说明社会经济现象在一定时期内所增长的绝对数量的指标,它是报告期水平与基期水平之差。
按所采用的基期不同,分为逐期增长量和累计增长量。
累计增长量=∑(相应逐期增长量)
2、平均增长量用来说明社会经济现象在一定时期内平均每期增长的数量指标。
平均增长量=累计增长量/(时间数列项数-1)
时间数列的速度指标
主要有:
发展速度、增长速度、平均发展速度、平均增长速度
发展速度是表明发展程度的相对指标,它是根据不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几。
按采用的基期不同,发展速度分为定基发展速度和环比发展速度。
定基发展速度=ai/a0(i=1,2,3,…,n)
环比发展速度ai/ai-1(i=1,2,3,…,n)
关系:
定基发展速度等于相应各个环比发展速度的连乘积。
时间数列的速度指标
(一)
增长速度也是表明发展程度的相对指标,它是根据增长量与其基期水平求得,说明报告期水平是基期水平的几倍或百分之几。
按采用的基期不同,增长速度分为定基增长速度和环比增长速度。
定基增长速度=定基发展速度-1
环比增长速度=环比发展速度-1
关系:
两者不存在直接关系,不能直接相互推算,必须转化为相应的发展速度,才能再推算所需的增长速度。
计算平均发展速度通常采用水平法和累计法
举例:
某企业2004-2009年期间工业增加值资料如下表:
年份
2004年
2005年
2006年
2007年
2008年
2009年
工业
增加值
200
220
231
240
252
262
问:
1、该企业2004-2009年期间工业增加值数列属于(总量指标时间数列、时期数列)
2、该企业2004-2009年期间工业增加值年平均增长量(12.4)万元。
[(220-200)+(231-220)+(240-231)+(252-240)+(262-252)]/5=12.4万元
3、该企业2004-2009年期间工业增加值年平均增长速度是(5.5%)
(262/200)开5次方根-1
4、该企业2004-2009年期间年平均工业增加值为(234.17)万元
(200+220+231+240+252+262)/6=234.17万元
第六章统计指数
统计指数的涵义和分类
某指一经济现象在某一时期内的数值和同一现象在另一个作为比较标准的时期内的数值的比数。
按计入指数的项目多少不同,分为个体指数和总指数。
个体指数:
反映某一项目或变量变动的相对数。
总指数:
反映多种项目或变量变动的相对数。
总指数计算方法:
综合指数法和平均指数法。
综合指数是由两个总量指标对比而形成的指数;
平均指数是通过对个体指数加权平均核算的指数
6.1综合指数的编制方法
首先要明确同度量因素;其次:
确定同度量因素(权数)所属时期。
一定要记住:
编制数量指标综合指数时应将质量指标作为同度量因素,要将质量指标固定在基期。
编制质量指标综合指数时应将数量指标作为同度量因素,要将数量指标固定在报告期。
6.2指数因素分析
步骤:
1、确定分析的对象和影响因素;
2、确定分析对象指标和影响因素指标,并列出关系式;
3、建立分析指数体系及绝对增减量关系式;
4、分析各因素变动对对象变动的影响。
例1:
某商场三种商品销售量和销售价格资料如下表:
产品名称
价格(元/件)
销售量(件)
甲
200
220
4000
5000
乙
100
120
8000
6000
丙
160
150
3000
4000
根据上述资料编制三种商品的销售量指数和零售价格指数,并分析销售量和价格变动对销售额的影响。
销售量指数=(5000×200+6000×100+4000×160)÷(4000×200+8000×100+3000×160)=2240000/2080000=107.69%
零售价格指数=(5000×220+6000×120+4000×150)÷(5000×200+6000×100+4000×160)=2420000/2240000=108.04%
销售额总指数=销售量指数×零售价格指数=116.35%
统计意义:
由于销售量的变动,使得销售额增长了7.69%,增加了(224-208)16万元;由于商品价格的变动,使得销售额增长8.04%,增加了(242-224)18万元。
例2:
某企业三种产品的单位成本和产量资料如下表:
产品名称
单位产品成本(元/吨)
产量(万吨)
甲
350
320
50
60
乙
180
176
50
50
丙
30
30
160
200
根据上述资料编制三种产品的总成本指数、成本总指数、产量总指数,并分析由于单位产品成本和产量变动对产品总成本的影响。
总成本指数=(60×320+50×176+200×30)÷(50×350+50×180+160×30)=34000/31300=108.62%
成本总指数=(60×320+50×1