大学统计学课程整理.docx
《大学统计学课程整理.docx》由会员分享,可在线阅读,更多相关《大学统计学课程整理.docx(39页珍藏版)》请在冰点文库上搜索。
大学统计学课程整理
统计学原理
本课程的篇章结构:
第一篇统计基础篇①第一章绪论②第二章统计设计与统计调查
第二篇描述统计篇①第三章统计资料的整理——表格与图形法②第四章总量指标和相对指标分析③第五章统计特征值④第六章统计指数分析⑤第七章时间数列分析
第三篇推断统计篇①第八章概率及概率分布②第九章抽样推断分析③第十章假设检验④第十一章方差分析⑤第十二章相关与回归分析⑥第十三章统计预测
第四篇其他统计方法篇①第十四章统计决策方法②第十五章统计综合分析
第一章绪论
第一节统计学的产生和发展
一、统计的含义
–在不同的场合,分为:
1.统计工作—收集数据的活动2.统计资料(数据)—对现象计量的结果
3.统计学—描述和分析数据的方法与技术
–关系:
二、统计发展史:
★原始社会:
统计萌芽时期
★奴隶社会:
有了初步的国情统计
★封建社会:
开始了初步的发展
★资本主义社会:
统计成为一个独立部门
★社会主义社会:
认识社会的有力武器
三、统计学派及代表人物
第二节统计的基本问题
一、统计的研究对象
•统计工作的研究对象是社会经济现象的数量方面。
•统计学的研究对象是正确认识和反映社会经济现象的方法。
二、统计的作用及过程
•《统计法》规定:
“统计的基本任务是对国民经济和社会发展情况进行统计调查、统计分析,提供统计资料,实行统计监督。
”
–职能:
信息、咨询与监督;
–工作过程:
统计设计、统计调查、统计整理、统计分析等
三、统计的研究方法
大量观察法、统计分组法、综合指标法、归纳推断法
第三节统计学的若干基本概念
一、总体和样本
–总体:
同质个体所组成的整体。
•特征:
同质性、大量性、差异性;
•种类:
有限总体和无限总体;
•相关概念:
总体单位、总体容量和参数;样本单位、样本容量和统计量。
样本:
从总体中抽出的一部分单位构成的集合。
二、标志、指标和指标体系
(一)标志
1.概念:
说明总体单位特征的名称。
由标志名称+标志值组成。
2.标志的分类:
A.标志按其表现形式的不同:
①品质标志:
表示事物质的特征,其值只能用文字表示。
②数量标志:
表示事物量的特征,其值只能用数字表示。
B.标志按其变异情况不同:
①不变标志:
指某标志在总体各单位的具体表现是相同的。
②可变标志:
指某标志在总体各单位的具体表现不尽相同。
例:
中华人民共和国人口普查
•总体:
具有中华人民共和国国籍的所有公民
总体单位:
每一位公民标志名称标志值
•国籍:
中国(不变标志)
•姓名:
张三(可变标志、品质标志)
•年龄:
50(可变标志、数量标志)
(二)指标
1.概念:
是说明总体数量特征的概念。
由指标名称+指标值组成。
2.特点:
综合性、数量性和具体性
3.指标的分类:
①数量指标:
是指反映事物的规模
②质量指标:
是指反映事物内部数量对比关系和一般水平
例:
工业普查
•总体:
工业企业
指标名称指标值
工业企业总数:
10000000
工业企业职工数:
3亿人
工业总产值:
5千亿
平均工资:
7000元/年人
•总体单位:
每一个工业企业
(三)标志和指标的区别和联系
⑴区别:
A.指标是说明总体数量特征,而标志是说明总体单位特征。
B.指标都是用数值表示的,而标志有的是用数字表示,有的是用文字表示。
⑵联系:
A.许多统计指标是由各单位的数量标志值汇总而来的;
B.指标和标志之间存在转化关系。
(四)指标体系:
由若干个相互联系的统计指标组成的一个整体称为统计指标体系。
例:
各地区城市设施水平指标体系:
人均居住面积、城市人口用水普及率、城市煤气普及率、每万人拥有公共汽(电)车、人均拥有铺装道路面积等
三、流量与存量:
★流量:
一定时段测算的量,具有时间量纲,可加性;
★存量:
一定时点上测算的量,不具时间量纲,不可加性。
补充:
统计学的分科
一、从统计方法的构成角度分
(一)描述统计学(descriptivestatistics):
研究如何取得、整理和表现数据资料的方法。
(二)推断统计学(inferentialstatistics):
研究如何根据样本数据去推断总体数量特征的方法。
(三)描述统计学和推断统计学的关系:
描述统计学是基础和前提,推断统计学则是核心和关键。
二、从统计方法的研究和应用角度分
(一)理论统计学(theoreticalstatistics)
利用数学原理研究统计学的一般理论和方法的统计学,如概率论与数理统计
(二)应用统计学(appliedstatistics)
研究如何应用统计方法解决实际问题,大多是以数理统计为基础形成的边缘学科。
如自然科学领域的生物统计学、社会科学领域的社会经济统计学等。
三、统计学与其他学科的关系
(一)统计学与哲学的关系:
哲学为统计学提供世界观和方法论的指导。
(二)统计学与数学的关系
1.区别:
(1)研究对象不同:
数学研究抽象的量,统计研究具体的量。
(2)研究方法不同:
数学是演绎,统计是归纳和演绎的结合。
2.联系:
数学为统计研究提供数学公式、模型和分析方法。
(三)统计学与其他学科的关系
统计几乎与所有学科都有联系,本书课程着重介绍统计与管理学和经济学的关系。
本章小结
一、统计的三层含义:
统计工作、统计资料和统计学。
二、统计的研究对象、职能、工作过程和研究方法
三、统计学中的基本概念:
(一)总体、总体单位和样本;
(二)标志、指标和指标体系;
(三)流量和存量
第二章统计设计与统计调查第一节数据的计量与类型
第二节统计调查方案设计
第三节统计调查的组织形式
第四节统计调查误差
本章小结
第一节数据的计量与类型
一、数据的计量尺度
(一)定类尺度(nominalscale)
1.概念:
区分现象类别的一种测度。
2.举例:
人的性别、籍贯、民族、职称;企业的所有制性质、行业隶属。
3.特征:
(1)只能区分事物的类别,无法比较优劣或大小
(2)对事物的区分必须遵循穷尽和互斥的原则
(3)对定类尺度计量分析的统计量主要是频数和频率
(二)定序尺度(ordinalscale)
1.概念:
区分事物之间等级或顺序差别。
2.举例:
教师的职称、学历,商品的质量等级等。
3.特征:
(1)对事物可以分类、比较优劣和大小。
(2)对事物的分类要求穷尽和互斥。
(3)对定序尺度计量分析的统计量除频数和频率外,还有累计频数和累计频率。
(三)定距尺度(intervalscale)
1.概念:
测度事物类别或次序之间的间隔。
2.举例:
考试成绩、身高、温度等。
3.特征:
(1)能分类、排序、比较大小,计量差距。
(2)有确定意义的“零”位,即“0”是有意义的。
(四)定比尺度(ratioscale)
1.概念:
也称比率尺度,是对事物之间比值的一种测度。
2.举例:
人的收入、支出;企业的产值、利润;某地区的人口总数、失业人数等
3.特征:
(1)分类、排序、比较大小、求出差异、计算两个数值之间的比率。
(2)无确定意义的“零”位,即“0”是无意义的。
★四种计量尺度的比较
二、数据的类型
1.定性数据(品质数据)
(1)概念:
说明事物的品质特征,不能以数值表示,只能以文字表述,由定类和定序尺度计量形成。
(2)举例:
高校教师职称有助教、讲师、教授等。
2.定量数据(数量数据)
(1)概念:
说明现象的数量特征,以数值表示。
由定距和定比尺度计量形成。
(2)举例:
考试成绩80分、95分、100分,身高1.73米、1.80米等。
第二节统计调查方案设计
(一)确定调查目的
•调查之前必须明确:
①调查要达到的具体目标②回答“为什么调查?
”
(二)调查对象和调查单位:
调查对象:
调查研究的总体或调查范围
调查单位:
需要对之进行调查的单位
回答“向谁调查?
”
(三)调查项目和调查表:
①调查项目:
调查的具体内容②调查表:
表现调查项目的表格或问卷③回答“调查什么?
”
调查表
结构:
一般由表头、表体和表脚组成。
表头:
表名、封面信、指导语及调查单位的基本信息
表体:
调查表的主要部分,调查项目在各种问题上的落实
表脚:
包括调查者的签名和调查日期
种类:
⑴单一表:
每个调查单位填写一份,可以容纳较多的内容
⑵一览表:
把许多调查单位填写在一张表上
方案设计中的其他问题:
A.明确调查所采用的方法
B.确定调查(资料的所属)时间和调查(工作的)期限
C.调查的组织与实施细则
××牌牙膏用户市场调查方案
•调查目的:
为了了解××牌牙膏在市场上的信用情况和销量情况,以及目前市场用户喜欢什么样的牙膏,其他牙膏比××牌牙膏优越之处在哪里。
•调查对象:
所有牙膏用户
•调查单位:
每一位牙膏用户
•报告单位:
调查员
•调查项目及调查问卷见附表
•调查时间:
2008年10月
•调查地点:
各大商场牙膏销售柜台前
•调查方式:
随机抽样调查
•调查方法:
采访法
•调查工作的组织实施计划:
此项调查由××牌牙膏厂市场部组织领导和宣传,由某大学学生协助调查,预算经费为30,000元。
结果只作为该厂进行生产设计的参考,不公开发表。
××牌牙膏调查问卷
1、你用过××牌牙膏吗?
是()否()
2、你认为××牌牙膏怎么样?
很好()好()较好()
一般()差()
3、你所用过的牙膏有哪些?
()
a竹盐()b两面针()
c黑妹()d中华()
e黑人()f佳洁士()
g高露洁()h雕牌()
4、评分标准
很好10分;好8分;较好6分;一般4分;差2分
请按以上的评分标准给第三题中列出的牙膏质量评定分数,分数填入括号内。
•5、你对我厂生产的××牌牙膏有什么意见?
第三节统计调查的组织形式
统计报表
★概念:
统计报表是按照国家或上级部门统一规定的表式、统一的指标、统一的报送程序和报送时间,自下而上逐级提供基本统计资料的一种调查方式。
★特点:
统一性和时效性、全面性、资料的相对可靠性、连续性和周期性
★统计报表的种类:
按报送范围不同,有全面报表和非全面报表。
按报送的周期不同,有日报、月报、季报、年报等。
按报表的内容和性质不同,有国家统计报表、部门统计报表、地方统计报表。
普查
1、概念:
普查是专门组织的,一般用来调查属于一定时点上社会经济现象数量的一次性全面调查。
2、特点:
①一次性调查②专门组织的全面调查
3、作用:
A.搜集不宜用经常调查能搜集的全面、准确的统计资料
B.掌握全面、系统的国情国力统计资料
•每逢末尾数字为0的年份进行人口普查。
•每逢末尾数字为1或6的年份进行基本统计单位普查。
•每逢末尾数字为3的年份进行第三产业普查。
•每逢末尾数字为5的年份进行工业普查。
•每逢末尾数字为7的年份进行农业普查。
重点调查
概念:
①是一种非全面调查,选择一部分重点单位进行调查。
②重点单位的某一主要标志的标志总量在总体标志总量中有绝大比重。
重点调查的特点:
①实质上是范围比较小的全面调查②不能推断总体
③重点单位的选择不带有主观因素
典型调查
概念:
在对被调查对象进行全面了解的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。
优缺点:
优点:
①灵活②可取得详实的统计资料
缺点:
受主观认识的影响
方式:
①“解剖麻雀”②“划类选典”
抽样调查
概念:
抽样调查是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研究,以抽样样本的指标去推算总体指标的一种调查。
抽样调查的特点:
A.抽样调查是一种代表性调查
B.代表性调查,即用部分单位代表总体
目的:
通过样本来推断总体
★抽样调查是按照随机原则选取样本
★随机性原则:
调查单位的确定完全由随机因素来决定,单位中选或不中选不受主观因素的影响。
第四节统计调查误差
一、调查误差的概念和种类
1、概念:
抽样统计量与总体参数之间的差异
2、种类:
(1)登记性误差(可避免)
(2)代表性误差(不可避免、可减少)
二、控制调查误差的办法:
扩大样本容量
本章小结
一、统计数据的计量尺度:
定类尺度、定序尺度、定距尺度、定比尺度。
二、统计数据的类型:
(一)定性数据:
由定类和定序尺度计量而成,反映事物的品质特征。
(二)定量数据:
由定距和定比尺度计量而成,反映事物的数量特征。
三、统计调查:
(一)统计调查的种类和方法
(二)统计调查方案的设计
(三)统计调查的组织方式:
有普查、统计报表、抽样调查等,其中重点调查、抽样调查是最常用的科学的调查方法。
四、统计调查误差:
登记性误差、代表性误差
第三章统计资料的整理第一节统计整理的基本问题
第二节统计分组
第三节分配数列
第四节统计资料的显示
本章小结
第二节统计分组
统计分组:
按某种标志把总体分成若干部分的科学分类。
统计分组的关键:
①选择分组标志②划分各组界限
统计分组的种类:
按分组标志的多少分为:
简单分组和复合分组
按分组标志的性质分为:
品质分组和数量分组
分组的作用:
划分现象类型;揭示现象内部结构;分析现象的依存关系
分组标志的选择的要求:
A.要符合统计研究的目的和要求
B.必须选择最主要的标志作为分组依据
C.要考虑社会经济现象所处的具体历史条件
★组数、组距、组限、组中值
(一)组数:
即将总体分为几组
(二)组距:
各组的区间距离
组数和组距的确定分下面两种情况:
1、品质分组——由两个因素决定:
①事物本身的属性特征②统计研究的要求
2、数量分组:
全距=最大标志值-最小标志值
组距=各组最大标志值(上限)-各组最小标志值(下限)=全距÷组数
组数、组距确定的斯特杰斯经验公式
(三)组限:
指每组两端数值;分上限和下限
上限:
每组的终点数值(最大值)。
下限:
每组的起点数值(最小值)。
组限的形式:
A.重合式:
指相邻两组中,前一组的上限和后一组的下限数值重合。
一般用于连续型变量。
组距=上限-下限
B.不重合式:
指前一组的上限与后一组的下限,两值紧密相连而不相重复。
一般用于离散型变量。
组距=下组下限-本组下限或组距=本组上限-前组上限
(四)组中值:
是各组上下限之间的中点值。
代表各标志值的一般水平。
组中值(重合式组限)=(上限+下限)÷2
=下限+组距/2
=上限-组距/2
组中值(不重合式组限)=(本组上/下限+下一组上/下限)÷2
=本组下限+组距/2
=下组上限-组距/2
第三节分配数列
分配数列:
也称次数分布或次数分配,总体单位在各组分布状况。
分配数列组成要素:
1、组的名称2、各组次数(也称频数)或频率
分配数列的分类:
按分组标志按分组形式
品质数列
变量数列单项式数列
分组距式数列等距数列
布异距数列
数按次数分布特征
列钟形分布数列正态分布
偏态分布左偏分布
U形分布数列右偏分布
J形分布数列J形
倒J形
★分配数列的编制
1、品质数列的编制
•基本过程:
列出各类别计→→算各类别的频数→→制作分配数列
2、变量数列的编制:
(1)单项式分配数列的编制
要点:
①一个变量值作为一组②适合于离散变量③适合于变量值较少的情况
(2)组距式分配数列的编制
A、排序:
5659606063656566677072737476777778797979
8182828384848586878889899293949597989999
B、确定组数:
尽量取奇数(3、5、7、9),本例取“5”
C、确定组距:
组距=全距/组数=(99-56)/5=8.6,为方便计算本例取“10”
D、确定组限:
⑴离散型变量——上下限都可以用准确的数值表示
⑵连续型变量——前一组的上限与本组的下限为同一数值,“上组限不在内”
⑶考虑要反映总体质的区别,本例取第一组下限为50
E、计算各组频数:
分组数据------直方图与折线图
(五)累计次数分布
1.概念
2.种类:
①向上累计②向下累计
3.编制
第四节统计资料的显示
统计表是集中而有序地表现统计资料的表格
统计表的结构:
①从形式(组成因素):
横行、纵栏、标题、标目、数字资料
②从内容:
主词、宾词
统计表的种类:
按主词的分组情况分①简单表②分组表③复合表
宾词指标设计:
①平行设计②层叠设计
制表规则:
①标题醒目准确②内容简明扼要③项目排列有序④字迹清楚规范(数字按个位数上下对齐,无数填ª号,缺报填—号)⑤各栏应加编号
⑥规格合乎要求(上下粗线,左右开口,栏间划线,行间空白)
统计图:
是具体显示统计资料数量特征的图形
1、分布图:
直方图、折线图、累计折线图
2、形象图:
饼图、条形图
注:
直方图与条形图的区别
本章小结
一、统计数据整理的基本过程
二、统计分组的概念及种类
三、分配数列:
由两个要素构成,一是组别,二是各组次数或频率。
根据需要,可以编制简单次数分布表和累计次数分布表。
四、次数分布:
主要有钟形分布、U形分布和J形分布。
五、统计表和统计图:
直方图与条形图的区别
第四章总量指标和相对指标第一节总量指标
第二节相对指标
本章小结
第一节总量指标
含义:
总量指标又称绝对指标或简称绝对数,是反映社会经济现象在一定时间、地点条件下规模或绝对水平的综合指标。
表现形式:
绝对数。
如:
2000年中国GDP为89404亿元。
2000年中国外汇储备为1656亿美元。
二、总量指标的种类
1、按总量指标的总体内容不同分:
①总体单位总量:
指总体单位总数。
②总体标志总量:
指总体单位某一数量标志值的总和。
如:
研究某地区的工业企业职工工资情况,“职工人数”为总体总量,“工资总额”为标志总量。
2、按总量指标所反映的时间不同分:
①时期指标(时期数)
②时点指标(时点数)
如:
总产值、销售量为时期数;年末人口数、设备台数为时点数。
★时期数与时点数的比较
3、按计量单位不同分:
实物指标
价值指标
劳动量指标
三、计算和运用总量指标应注意的问题:
1、正确确定指标含义、计算范围、指标界限。
2、同类实物总量指标才能相加。
3、使用统一计量单位。
4、把总量指标与相对指标和平均指标结合起来使用。
第二节相对指标
一、相对指标的含义
相对指标是两个有联系的统计指标进行对比的比值。
也称为相对数。
表现形式:
①成数
无名数②系数和倍数
③百分数、千分数
有名数④复名数
二、相对指标的种类
(一)计划完成相对数
1、概念:
计划期内实际完成数与计划数之比
2、作用:
考核、反映计划完成的程度和进度
3、计算方法
基本计算公式:
(分子与分母位置不能互换)
超额完成(或未完成)绝对数=实际完成数-计划数
派生公式:
(1)产量、产值增长百分数:
(2)产品成本降低百分数:
中长期计划的检查方法:
(1)水平法:
将计划末期实际完成数与同期计划规定数之比。
(2)累计法:
计划期内各年累计实际完成数与同期计划规定的累计数之比。
计划执行进度相对数的计算方法
(二)结构相对数
1、概念:
部分占全体的比例。
2、作用:
反映事物的内部构成、性质、质量及其变化。
3、计算公式:
4、特点:
各部分所占比重之和为100%;分子与分母位置不能互换。
(三)比例相对数
1、概念:
同一总体某一部分数值与另一部分数值对比的比值。
2、作用:
反映总体各部分间的内在联系与比例关系。
(同一总体不同部分比较)
3、计算公式:
4、特点:
分子分母同属一个总体,而且分子与分母的位置可以互换。
(四)比较相对数
1、概念:
同一时间的同类指标在不同空间对比的比值。
2、作用:
反映同类现象在不同空间的数量差异,发现先进与后进。
3、计算公式:
4、特点:
用百分数或倍数表示,分子和分母可以互换。
(五)动态相对数
1、概念:
某一统计指标在不同时期的两个数值对比的比率。
又称发展速度或指数。
2、作用:
反映事物发展变化的方向与程度。
3、计算公式:
其中:
报告期又称计算期,是研究或计算时期。
基期是作为比较基础的时期。
4、特点:
分子与分母的位置一般不能互换。
常用百分数、倍数、千分数表示。
(六)强度相对数
1、概念:
两个性质不同而又相互联系指标之比。
2、作用:
①反映一国一地的发展水平、力量强弱。
②反映事物存在的密度、普遍程度、运动强度、负担强度。
③反映经济效益的高低。
3、计算公式:
4、特点:
有正指标和逆指标之分,数值大小与强度成正比为正指标,反之为逆指标。
有些指标分子与分母可互换。
计量单位常用复名数。
三、计算和运用相对数应遵循的原则
1、两个对比指标要有可比性。
2、相对数要和总量指标结合使用。
3、各种相对指标结合运用。
本章小结
总量指标:
概念、总体单位总量和总体标志总量、时期指标和时点指标
相对指标:
种类及计算
第五章统计特征值第一节统计平均数¡ª¡ª集中趋势的测度
第二节标志变动度¡ª¡ª离散程度的测度
第三节数据偏态与峰度的描述
第一节统计平均数——集中趋势的测度
一.定类数据:
众数
二.定序数据:
中位数和分位数
三.定距和定比数据:
算术平均数、调和平均数和几何平均数
四.众数、中位数和算术平均数的比较
什么是集中趋势:
一组数据向其中心值靠拢的倾向和程度
一般水平的代表值:
不同类型的数据用不同的集中趋势测度值
★低层次数据的集中趋势测度值适用于高层次的测量数据
★高层次数据的集中趋势测度值并不适用于低层次的测量数据
选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定
一.定类数据:
众数
(一)基本要点:
①集中趋势的测度值之一②出现次数最多的变量值
③不受极端值的影响④可能没有众数或有几个众数
⑤主要用于定类数据,也可用于定序数据和数值型数据(包括定距和定比数据)
(二)众数的测度:
无众数
原始数据:
10591268
①定类数据的众数②定序数据的众数③数值型分组数据的众数
★众数的值与相邻两组频数的分布有关
二.定序数据:
中位数和分位数
(一)中位数
1.要点:
①集中趋势的测度值之一②排序后处于中间位置上的值③不受极端值的影响
④主要用于定序数据,也可用数值型数据,但不能用于定类数据
⑤各变量值与中位数的离差绝对值之和最小,即
2.中位数位置的确定:
未分组数据的中位数:
3.中位数的测算
(2)数值型未分组数据的中位数
原始数据:
2422212620
排序:
2021222426
位置:
12345
原始数据:
10591268
排序:
56891012
位置:
123456
(3)数值型分组数据的中位数
根据位置公式确定中位数所在的组
采用下列近似公式计算:
(二)四分位数
1.要点:
①集中趋势的测