社会统计学期末复习提纲docx.docx
《社会统计学期末复习提纲docx.docx》由会员分享,可在线阅读,更多相关《社会统计学期末复习提纲docx.docx(21页珍藏版)》请在冰点文库上搜索。
社会统计学期末复习提纲docx
《社会统计学》课程期末复习提纲
•考试题型:
一、填空题(10X1分=10分)二、判断题(10X1分=10分)
三、单项选择题(20X1分=20分)四、简答题(2X6分=12分)五、计算题(4题共48分)
•各章复习要点
第一章总论
P.2统计的含义:
统计工作•统计资料•统计学。
其中:
统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。
“统计”一词包含三种涵义,并且具有密切的联系。
其中:
统计工作和统计资料之间是工作
与成果的关系;统计学和统计工作之间是理论和实践的关系。
(y)
p.11-P.13定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容)
量化尺度特征功能举例
1、定类尺度确定类别分类民族的测量
2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量
3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量
4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量
何谓定类尺度和定序尺度?
两者有何区别?
1定类尺度是确定事物类别的计量尺度一-高一个层次
2定类只能区分不同性质的现象并予以归类一-可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。
3定类不能进行数的比较和数学运算一能进行大小比较。
何谓定距尺度和定比尺度?
两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度一-最高的数据计量尺度
缺乏绝对零点一-有,02.0只表示一个值,即0值一-0是绝对零点,表示没有
3.只能加减,不能乘除一-加减乘除,高层次的各种统计分析。
P.13—P.14总体和总体单位
一、总体和总体单位
(一)总体
1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。
2、特点•客观性•大量性同质性•差异性
1、总体单位除了必须具备同质性外,还必须具备—1、差异性(或变异性)性,否则就没有必要对总体进行统计分析研究了,即该性质是对总体进行统计研究的前提条件。
14、对某市所有居民家庭的收入状况进行调查,则总体是,总体单位是。
14、该市全部居民家庭;该市每户居民家庭
3、分类
(1)按总体包括的范围大小划分
•有限总体•无限总体
(2)按总体单位的形态划分•实体总体•行为总体
(二)总体单位
总体单位(简称为单位或个体)是指构成总体的个别单位。
(三)总体和总体单位的关系
•总体和总体单位体现着全体和个体的关系。
•总体与总体单位具有相对性。
15、如果把一个班级的学生组成总体,那么每一个学生是(B)。
A调查对象B总体单位C标志D指标
P.14一P.16标志与指标
(一)标志(专业性别年龄(总体单位特征)
1、概念:
标志是指用来说明总体单位所具有属性或特征的名称。
2、分类
(1)按标志是否可以用数量表现划分•品质标志•数量标志(标志值)
(2)按标志是否变异划分•不变标志•可变标志
四、指标(总体特征)
1、概念:
指标(也成为统计指标)是指综合反映统计总体数量特征的概念和数值。
2、构成
•指标概念一反映了现象质的规定性。
•指标数值一反映了现象量的规定性。
3、特点•数量性•综合性•具体性
4、分类
(1)按指标所反映的数量性质不同划分
•数量指标(总额)•质量指标(平均率)
(2)按指标的作用或功能不同划分
•描述指标•评价指标•预警指标
(3)按指标数值的形式不同划分
绝对数指标(总量指标)
•相对数指标(相对指标)
•平均数指标(平均指标)
14、本学期期末某班学生平均英语成绩为80分,而该班张三同学的英语成绩也为80分,则
前后两个“英语成绩”分别是()。
A
A前者是质量指标,后者是数量标志B前者是数量指标,后者是数量标志
C前者是质量指标,后者是品质标志D前者是数量指标,后者是品质标志
P.16离散变量和连续变量
变量
1、概念:
将可变的数量标志抽象化就称其为变量,其取值称为变量值或标志值。
2、分类
(1)按变量所受影响因素的不同划分
•确定性变量
•随机性变量
(2)按变量取值是否连续划分
•离散型变量整数断开
•连续型变量无限分割
16、按变量取值是否连续划分,在校学生人数、企业个数、企业的职工人数、企业拥有的设备台数属于变量;粮食产量、职工工资、人体身高、企业的利润额属于变
量。
16、离散;连续
※社会统计研究的特点•数量性•总体性•具体性•社会性•广泛性
6、社会统计研究的特点包括数量性、总体性、具体性、社会性和广泛性。
(y)
第二章社会统计资料的搜集
P.26-P.28普遍调查;抽样调查;重点调查;典型调查
(一)普遍调查是为特定目的,而专门组织的一次性的全面调查。
2、组织原则•规定统一的标准时点•正确选择普查时期•规定普查的统一期限•规定统一的普查项目和指标•按周期开展同类普查
(二)重点调查是指在调查对象中,只选一部分重点单位进行的一种非全面调查。
12、调查大庆油田、胜利油田等大型石油基地,就可以了解我国石油生产的基本情况,这种
调查方式是抽样调查。
(x)
12、X;答案提示:
调查大庆油田、胜利油田等大型石油基地,就可以了解我国石油生产的
基本情况,这种调查方式是重点调查。
8、对总体中客观确定的重点单位所进行的调查是(A)。
A重点调查B典型调查C抽样调查D普遍调查
9、对主观确定的典型单位所进行的调查是(B)o
A重点调查B典型调查C抽样调查D普遍调查
12、抓阉、抽签,以及利用随机数字表抽选样本单位均属于(A)抽样常用的方法。
A简单随机B类型C机械D整群
8、对有限总体既可以进行全面调查也可以进行非全面调查,而对无限总体只能进行非全面调查。
(y)
(三)典型调查指在调查对象中有意识地选取若干具有典型意义的或有代表性的单位进行非全面调查。
(四)抽样调查抽样调查是按随机原则从调查对象中抽取一部分单位作为样本进行观察,再根据样本资料,对调查对象进行有一定可靠程度的推算的一种非全面调查。
2、抽样调查所遵循的基本原则是_2、随机原则,必须保证总体中的每一个单位都有同等的机会被抽中。
第三章社会统计资料的整理
P.56简单分组和复合分组
(一)按分组标志的多少划分
1、简单分组
【例】某校学生总体按性别可分为男生组和女生组。
2、复合分组
【例】某校学生总体先按性别可分为男生组和女生组两组,再同时按民族分组可分为男生汉族组、男生少数民族组、女生汉族组、女生少数民族组四组。
6、统计分组按所选择分组标志的多少不同可以分为—6、简单分组;和—复合分组—。
10、某企业职工总体先按学历分组,再按性别分组,这样的分组属于复合分组。
(y)
P.60组数与组距
组距d=U-L(组限重叠的组距式数列)=全距/组数
8、在变量数列编制过程中,组距可以通过—8、全距除以—组数;来确定。
因此,组
距的大小和组数的多少成反比关系。
P.61—P.62组限及其表示式
•上限一一一般用U表示。
•下限一一般用L表示。
上下限重叠连续变量上限不在内
上下限不重叠离散变量上下限均在内
P.62开口组与闭口组
•闭口组——上下限齐全的组。
•开口组——上下限不全的组。
淤组中值的计算(见课件相关内容或见教材P.Ill—P.112)
组中值=上限+下限(适合所有闭口组)
2
组中值=本组下限+邻组组距(适合缺上限开口组)
2
组中值=本组上限一邻组组距(适合缺下限开口组)
2
P.65统计表的结构
一、统计表
(一)定义
统计表是以纵横交叉的线条所绘制的表格来表现统计资料的一种形式。
(二)构成
1、形式:
总标题表名称、横行标题各组内容、纵栏标题统计指标名称、指标数值
2、内容:
主词表左、宾词表右
1、统计表从形式结构上看,(A)用以概况说明全表内容,置于表的上端正中位置。
A总标题B横行标题C纵栏标题D指标数值
2、统计表从形式结构上看,()用以说明统计表内各组的内容,置于表的左边。
B
A总标题B横行标题C纵栏标题D指标数值3、统计表从内容结构上看,(C)是统计表所要说明的总体或总体的各个组,通常写在表
的左边。
A横行标题B纵栏标题
C主词D宾词
4、统计表从内容结构上看,(
D)是用来说明统计指标的名称和数值,通常写在表的右边。
A横行标题B纵栏标题
C主词D宾词
淤钟形曲线、U形曲线、J形曲线的特征(见课件相关内容)
•钟形分布(丘形分布)一“两头小、中间大”
1对称分布(正态分布)
2非对称分布(偏态分布):
包括左偏分布(负偏分布)算术平均数、中位数和众数三者的关系递增右偏分布(正偏分布)
•U形分布一"两头大、中间小”
•J形分布一随着变量值的增大,分布次数也随之增多或减少。
1正J形分布——随着变量值的增大,分布次数也随之增多。
2反J形分布一随着变量值的增大,分布次数也随之减少。
、当数据呈左偏钟形分布时,算术平均数、中位数和众数三者的关系是(B
ABCo6、当数据呈右偏钟形分布时,算术平均数、中位数和众数三者的关系是(C
ABCo10、在频数分布中具有“中间大,两头小”特征的分布是(D)。
AS形分布BJ形分布CU形分布D钟形分布
11、在频数分布中具有“中间小,两头大”特征的分布是(C)o
AS形分布BJ形分布CU形分布D钟形分布
1、在频数分布中,人口死亡率和年龄的关系是钟形分布。
(x)
:
在频数分布中,人口死亡率和年龄的关系是U形分布
第四章总体(样本)数量特征的相对程度描述
P.85—P.91相对指标的种类与计算
以体全翻版值
10、某商场计划今年4月份销售成本比3月份降低2%,实际却降低了3%,则该商场销售成本
计划完成程度为。
10、98.98%;答案提示
12、强度相对指标的数值表现形式是或。
12、无名数;
有名数
计划完成相对指标=芝K壬严予x100%
同期计划数
比例相对指标=
总体中某一部分数值
总体中另一部分数值
5、反映不同空间(或总体)中同类指标对比的指标,即同类现象在不同空间上对比的指
标是比例相对指标。
()x比较
5、X;答案提示:
反映不同空间(或总体)中同类指标对比的指标,即同类现象在不同空间上对比的指标是比较相对指标。
13、商业网点密度、人口密度属于()。
B
A结构相对指标B强度相对指标C比较相对指标D动态相对指标
比较相对指标=
某一空间条件下某类指标数值
另一空间条件下同类指标数值
动态相对指标=
报告期水平
基期水平
xlOO%
强度相对指标=
某一总量指标数值
另一性质不同但有联系的总量指标数值
第五章总体(样本)分布特征的集中趋势描述
n
P.108-P.114算术平均数的含义、计算和数学性质
X
n
-_X\f\+X2fl+■■-+Xnfn__^Xf
X———_.
fi+£+...+/■"£无
i=l
1.同加减乘除A
2.各变量值与算数平均数的离差之和等于零。
3.各变量值与算数平均数的离差平方之和等于最小值。
4.算数平均数Xn=X和
5.各变量值与算数平均数的离差之和等于零。
(y)
6.各变量值与其算数平均数的离差平方之和等于()。
D7.A零B任意值C最大值D最小值
P.114—P.116调和平均数的含义和计算
7、某农贸市场,芹菜的价格分别为:
早市每斤1.60元,中市每斤1.00元,晚市每斤0.80元。
甲顾客在早、1中、晚三市各买1元芹菜,则应采用=_7、〃简单调和;平均数计算该顾客饼购拿蹄弊隼均•价格而乙顾客在*辄•晚即客碧了1乒元和5元的芹菜,则应面"胎缶调和/X平均我并算饷客所购矣舞菜的g价格。
n
+
新ym
P.11觇荷平戏耐皆妈
N个变量连乘积的几次方根
P.118—P.121中位数的含义
某一数量标志的各个数值按大小排列居于中间位置的变量值。
Me
一般水平,集中趋势
P.121—P,123众数的含义
总体中出现次数最多的标志数值
淤众数值与众数组前后各组次数的关系理解(结合课件相关内容):
由组距数列确定众数,如果众数所在组后一组的次数高于其前一组的次数,则众数值偏向众数组的上限;如果众数所在组后一组的次数低于其前一组的次数,则众数值偏向众数组的下限。
7、由组距数列确定众数,如果众数所在组后一组的次数高于其前一组的次数,则众数值偏向众数组的下限;如果众数所在组后一组的次数低于其前一组的次数,则众数值偏向众数组的上限。
(X)
7、X;答案提示:
由组距数列确定众数,如果众数所在组后一组的次数高于其前一组的次数,则众数值偏向众数组的上限;如果众数所在组后一组的次数低于其前一组的次数,则众数值偏向众数组的下限。
P.124-P.125众数、中位数与算术平均数之间的数量关系
左偏分布(负偏分布)算术平均数、中位数和众数二者的关系递增右偏分布(正偏分布)相反
第六章总体(样本)分布特征的离散程度描述
标志变异指标又称标志变动度,是用来测定总体各单位标志值之间差异程度的统计指标,它综合反映了标志值的离中趋势。
P.136—P.137全距的计算
P.137—P.141四分位差的含义
3、四分位差数值越小,说明—3、中位数;
代表性高;异众比率越小,说明众数的代表性越高。
P.141—P.142平均差的计算
P.143—P.145标准差的计算
P.148-P.149标志变异系数的含义;标准差系数的含义和计算
=—xlOO%x
P.149—P.150异众比率的含义
第七章抽样与抽样估计
P.156—P.157抽样推断的意义
利用样本有限信息了解掌握总体中未知的的数量特征。
P.159—P.162抽样的组织方式
(一)简单随机抽样(纯随机抽样)
简单随机抽样是按随机的原则,直接从含有N个单位的总体中,抽出n个单位
作为样本的一种抽样方法。
(二)类型抽样(分层抽样)
类型抽样是先对总体各元素按某一主要标志分成若干类型或层次,然后再从各个类型或
层次中按随机的原则抽选一定单位构成样本的抽样方法。
(三)等距抽样(系统抽样、机械抽样)
等距抽样是对先将总体各单位按某一标志排队,然后按相等的距离或间隔来抽取
单位组成样本的抽样方法。
11、某福利企业职工先按姓氏笔画排列,再按照排列顺序每隔10人抽取一名职工进行调查,
这样的抽样组织方式被称为。
11、等距抽样(系统抽样或机械抽样);
(四)整群抽样
整群抽样是将总体各元素划分成若干群,然后以群为单位从中随机抽取一些
群,对中选群的所有单位进行全面调查的抽样方法。
(五)多阶段抽样
多阶段抽样指按抽样单位的隶属关系或层次关系,把抽取样本单位的过程分为两个或
两个以上阶段进行的抽样方法。
P.167—P.168抽样误差的概念
严格遵循随机抽样原则抽样时,样本指标与未知总体指标之间的差数。
登记性误差
代表性误差系统性误差主观可避免,随机误差无法避免加以控制
5、在统计误差中,由于抽样的偶然因素而产生的—5、随机(或抽样)误差是不可
避免的,但可以通过科学计算加以控制。
第九章时间数列
P.220—P.221时期数列和时点数列的含义和特点
时期数列山反映某种现象在一段时间内发展过程的总量的一系列统计指标所形成的时间数列。
特点:
指标可相加,有经济意义,反映发展过程总量,与时间长短直接关系,连续登记取得的。
时点数列-某一时点上,指标不能相加,时间间隔无直接关系,一定时期登记一次取得。
9、将某福利企业各月月初的产品库存额按时间先后顺序排列而成的数列为时间数列中的时期数列;而将该单位各年的利润额按时间先后顺序排列而成的数列为时间数列中的时点数列。
(X)
9、X;答案提示:
将某福利企业各月月初的产品库存额按时间先后顺序排列而成的数列为时间数列中的时点数列;而将该单位各年的利润额按时间先后顺序排列而成的数列为时间数列中的时期数列
P.220—P.222时间数列的基本类型
(一)总量指标(绝对数)时间数列
总量指标时间数列是指将同类总量指标在不同时间上按时间上的数值先后顺序排列所形成的时间数列。
(二)相对指标(相对数)时间数列
相对指标时间数列是指将同类相对指标在不同时间上的数值按时间先后顺序排列所形成的时间数列。
不可加。
(三)平均指标(平均数)时间数列
平均指标时间数列是指将同类平均指标在不同时间上的数值按时间先后顺序排列所形成的时间数列。
不可加。
P.224—P.225序时平均数平均发展水平和一般平均数的联系和区别
联系都是将现象的数量差异抽象化,用来概括社会现象的一般状况。
区别1序时平均数所平均的是研究现象在不同时期或不同时点上的数量差异-一同一时间上。
2序时是将不同时期的指标数值综合与时间项数进行对比一-同一时期指标总数和总体总量。
3序时是从动态上说明现象的一般水平,计算依据时间数列-一静态上变量数列
P.224—P.232平均发展水平的计算
P.234-P.235定基发展速度和环比发展速度的含义及其换算关系;增长速度和发展速度之间的换算关系定基增长速度=定基发展速度T=环比发展速度连乘
环比发展速度=相邻定基发展速度之比
环比增长速度=环比发展速度-1
P.245—P.246移动平均法应注意的问题
1.所取项数多少应根据数列及现象的具体情况而定。
2.原数列中无明显周期变动,一般采取奇数项移动平均。
3.资料若呈周期性变动,应以周期的长度作为移动平均数的项数。
4.移动平均法一般只能对现有时间数列进行修匀,不能用来预测。
5.移动平均法和趋势线拟合法结合应用。
11、采用移动平均法修匀时间数列时,因为偶数项移动需二次移动平均,同时损失的信息较
奇数项移动多,所以一般采用奇数项移动。
同时移动平均法只用于对时间数列修匀,不能用
来预测。
(y)
13、固定构成指数=可变构成指数X结构影响指数。
()x答案提示:
可变构成指数=固定构成指数X结构影响指数。
P.246—P.249最小平方法拟合直线趋势方程
b=A
〃Z%2-(Ex)2
y=na+x
xy=aZX+尸p.254季节比率的含义各月发展水平比平均发展水平<1淡季
y-bY
P.255月份资料和季度资料的季节比率总和1200400
14、在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。
(y)
、2、在季节变动分析中,若按月平均计算,则季节比率之和为400%;若按季平均计算,则
季节比率之和为1200%o(x)
X;答案提示:
在季节变动分析中,若按月平均计算,则季节比率之和为1200%;若按季平
均计算,则季节比率之和为400%-
第十章统计指数
一、统计指数的概念
•广义:
凡是用来反映同类现象在不同空间、不同时间、实际与计划对比变动的相对数等都称为指数。
•狭义:
指用来反映由不能直接加总的多要素所构成的复杂现象综合变动程度的特殊相对数。
P.269数量指标指数和质量指标指数
按所表明的指标性质不同划分
•数量指标指数职工人数指标
•质量指标指数劳动生产率指标
P.272数量指标指数同度量因素时期的选择(结合课件相关内容)
所谓同度量因素,就是在综合指数编制中,将不能直接相加的因素,转化为能够直接相加的量的媒介因素,
1、基期权数(拉氏公式)
P.274质量指标指数同度量因素时期的选择(结合课件相关内容)
2、报告期权数(派氏公式)
13、从我国指数编制的实践来看,数量指标综合指数的同度量因素固定在,质量指
标综合指数的同度量因素固定在。
13、基期;报告期
P.276-P.279加权算术平均数指数和加权调和平均数指数的计算
P.281—P.282指数体系
P.283—P.285总量指标的两因素分析
P.288—P.293平均指标指数的两因素分析
第十一章相关与回归分析
P.306—P.307函数关系和相关关系
函数关系指变量之间存在严格的数量依存关系;而相关关系指变量之间不存在严格的数量依存关系。
4、在两个变量x与y中,如果y是由x独一无二地确定,这种关系称为_4、函数关
系;;如果y不是由x独一无二地确定,这种关系称为_相关关系。
16、相关关系指变量之间存在严格的数量依存关系;而函数关系指变量之间不存在严格的数量依存关系。
(x)
16、X;答案提示:
函数关系指变量之间存在严格的数量依存关系;而相关关系指变量之间不存在严格的数量依存关系
P.308—P.309正相关和负相关
正相关同增同减
15、按相关关系变动的方向不同,商品供应量与价格之间的关系、商品销售量与售货员服务态度之间的关系、家庭的消费支出与工资收入之间的关系均属于相关,此时相关系数;而商品需求量与价格之间的关系、产品产量和单位成本之间的关系、妇女受教育程度和平均生育子女数之间的关系均属于相关,此时相关系数。
15、正;r>0;负;r<0
P.324相关系数的取值范围和判断标准
在线性相关条件下,反映两个变量之间相关关系密切程度的统计分析指标,称为简单相
关系数,简称为相关系数。
1、r=0零相关
2、r=l——完全正相关
3、r=—l完全负相关
4、Ir|<0.3微弱相关5、0.3【R】轻微相关0.3低度相关0.5中度相关0.8高度相关一IWrWl(0W|r|W1)
P.330-P.332相关分析与回归分析的联系与区别(结合课件相关内容)
1、相关分析是回归分析的基础与前提,回归分析是相关分析的继续与深入。
2、相关系数与回归方程中的参数可以相互换算。
1、相关分析研究的变量都是随机变量,这些变量是对等的;而回归分析研究的变量不是对等的。
2、相关分析以计算相关统计量(如:
相关系数)为中心,而回归分析以建立回归方程为中心。
15、在简单线性相关分析中,变量x和y都是随机变量;在简单线性回归分析中,变量x和y中一个是随机变量,另一个是给定量。
()y
P.333回归系数的含义(结合课件相关内容)
回归分析是在对存在相关关系的变量中,分析出自变量与因变量,根据变量之间关系的形态,选择适当的数学表达式,把变量之间的平均变化关系近似地表达出来,并据此由给定的自变量的值,对因变量的可能值进行预测。
y=a+bx+ua为样本回归直线的截距,
b为样本回归直线的斜率,又称回归系数,表示x每变动一个单位,y的平均变化量。
y=a+bx
=na+b^jx
b=
Cl—
"ZU—
^^-b^-=y-bxnn
P.334—P.335一元线性回归方程的建立
P.335—P.337估计标准误差的意义回归直线的代表性大小。
离散程度大,回归直线的代表性小。