统计学期末复习整理docx.docx
《统计学期末复习整理docx.docx》由会员分享,可在线阅读,更多相关《统计学期末复习整理docx.docx(14页珍藏版)》请在冰点文库上搜索。
统计学期末复习整理docx
2013-2014学年第一学期《统计学》
第一章、数据与统计学
一、统计学定义:
统计学是一门收集、整理、显示和分析统计数据的科学,其目的在于探索事物内在的数量规律性。
二、统计学的一个源头:
英国经济学家威廉•配第的《政治算术》
三、统计学的分科
1、描述统计:
是用图形、表格和概括性的数字对数据进行描述的统计方法。
2、推断统计:
是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。
四、统计数据的来源
1、普查:
为某一特定目的,专门组织的一次性全面调查。
特点:
涉及范围广,耗费时间、人力、物力、财力,间隔较长时间实施,两次普查之间数据参考抽样调查结果。
2、抽样调查:
应用最广、最为重要,是通过随机样本对总体数据规律性进行推断的调查研究方法。
特点:
存在样本推断总体产生的误差,但是可以通过统计方法加以估计和进一步控制误差;节省人力、物力、财力;保证时效性。
3、重点调查
4、典型调查
普查不一定比抽样调查更准确:
如数沙子中的杂质。
五、统计数据的质量
1、非抽样误差:
可以避免,是指由于调查过程中各有关环节工作失误造成的。
2、抽样误差:
不可避免,是利用样本推断总体时产生的误差。
第二章、统计数据的描述
一、次数分配
1、分组原则:
“不重不漏”,上组限数值不算在该组内。
2、山表的上边向表的下边相加称为“向上累积”,反之称为“向下累积”。
二、分布集中趋势的测度
)+(/-/+!
)
L:
众数所在组的下限f:
众数所在组变量的个数/_1:
众数所在组前一组变量
f+1:
众数所在组后一组变量的个数
Yf
(;)-s妇
2、中位数:
下限公式:
Me=L+—^xd
f'n
L:
中位数所在组的下限fm:
中位数所在组数据的个数:
总个数
k
3、
均值:
5
Ez
i=\
、,•:
次数分配中变量分组的组中值Z:
各组次数k:
分组的组数
5、中位数(M,)、众数(M。
)、算术平均数(系)的关系:
三、分布离散程度的测度
1、内距(IQR):
内距=上四分位数-下四分位数=0-0
2、方差和标准差:
支(f
未分组数据S=1
\n-1
♦样本方差有自由度,总体方差没有自由度。
3、离散系数:
是用来对两组数据的差异程度进行相对比较的。
V=g或.=如
xx
4、偏态:
是指对分布偏斜方向及程度的测度。
(SK数值越大,表示偏斜的程度就越大。
)
SK=O,对称
SK>0,右偏
SK<0,左偏
5、峰度:
是指对数据分布平峰或尖峰程度的测度。
K=0,标准正态分布
K>0,尖峰分布
K<0,平峰分布
四、编制统计表的基本要求:
(1)合理安排统计表的结构
(2)表头一般应包括表号、总标题和表中数据的单位等内容
(3)表中的上下两条横线一般用粗线,中间的其他线要用细线
(4)左右两边不封口,列标题之间一般用竖线分开,行标题不必用横线隔开
(5)表中尽量少用横竖线,不要用斜线
(6)表中数据一般右对齐,有小数点应以小数点对齐,小数点位数应统一
(7)没有数据的表格单元,一般用“一”表示,填好的统计表不应出现空白单元格
(8)必要时可在表的下方加上注释,特别注意注明资料来源
第三章、抽样分布
一、常用的抽样方法
1、简单随机抽样:
在从总体抽取n个单位作为样本时,要使得每一个总体单位都有相同的机会(概率)被抽中。
2、分层抽样:
在抽样之前先将总体的单位划分为若干层(类),然后从各个层中抽取一定数量的单位组成一个样本。
3、系统抽样:
在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。
4、整群抽样:
调查时先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群,进而对抽中的各个群中包含的所有个体单位进行调查或观察。
二、X抽样分布的形式
1、如果原有总体是正态分布,那么,无论样本量的大小,样本均值的抽样分布都服从正态分布。
2、如果原有总体的分布是非正态分布,就要看样本量的大小。
随着样本量n的增大(通常要求n>30),不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布。
三、X抽样分布的特征
1、无论重复抽样还是不重复抽样,样本均值的数学期望始终等于总体均值。
E(X)=jLl
2、样本均值的方差与抽样方法有关。
_2
12b
(1)重复抽样(样本均值的方差为总体方差的土)〈气=—
nn
(2)不重复抽样(比重复抽样多一个修正系数)
2_a2N-n
CT-=()
“nN—1
♦不重复抽样的样本均值的方差与总体方差的误差小于重复抽样的样本均值的方差与总体方差的误差。
四、样本比率的抽样分布
1、P的数学期望E(p)等于总体比率〃,即E(p)=〃
2、P的方差与抽样方法有关:
(1)重复抽样
9兀Q_兀),N—n、
⑵不重复抽样吒二^(*
第四章、参数估计
一、一个总体均值的区间估计(大样本n>30)
总体均值〃在1-a置信水平下的估计(尸为样本方差,cP为总体方差)
2一工b
(非)正态总体cP已知X-^a
3vn
,~,s
未知工±运"亍
~2
二、一个总体比率的区间估计(只有大样本)(样本比率p,1-a置信水平)
三、两个总体均值之差的区间估计(大样本)
227q
也一)2在「a置信水平下的估计(A、$2为样本方差,er]、勇为总体方差)
(非)正态总体CT:
、已知:
(X1一丁2)土勺]号+号
1~22~
99/一一Pl^2
b;、b;未知:
(力―X2)±ZI
2\nin2
四、两个总体均值之差的估计:
匹配样本(大样本)
两个总体均值之差&="\一&在1-a的置信水平下的置信区间d+za^
7Vh
五、两个总体比率之差的区间估计(大样本)
两个总体比率之差(兀[一兀Q在1-a的置信水平下的置信区间
IV
六、样本量的确定
1、估计总体均值时样本量的确定
/\2_2
(私)尸
(1)重复抽样允许误差:
E=z-~^样本量公式:
〃=—
2、估计总体比率时样本量的确定
第五章、假设检验
一、总体均值的假设检验(大样本)
(非)正态总体cP已知
x-pi
z~b和土私比较
w未知
x-
z-s和土比较
777
二、单边检验解题步骤——总体均值、总体比率
原假设:
原来的
备择假设:
后来的,样本的情况,题目问的,样本的情况必须和备择假设一致一定要画图,空白的部分是原假设,阴影的部分是备择假设
1、计算样本均值(样本比率)
2、用样本均值(样本比率)和要比较的k(气)比较
4、根据表计算统计量值
5、查找临界值,并和统计量值比较
四、假设检验的P值:
拒绝%的力度
若P<0.1,则有微弱证据表明原假设H。
是不正确的;
若P<0.05,则有显著的证据表明原假设是不正确的;
若P<0.01,则有很强的证据表明原假设是不正确的;
若P<0.001,则有极强的证据表明原假设是不正确的。
(P值越小,拒绝原假设的可能性就越大)
五、两个总体均值之差的检验(大样本)
CT?
未知
(■X1-工2)-(//1一日2)
I—32-和±Z"比较
里+冬I
V"1n2
六、两个总体均值之差的单边检验解题步骤
1、计算样本均值之差:
X1-L
2、用样本均值之差X1-X2和要比较的k=0比较
4、根据表计算统计量值
5、查找临界值,并和统计量值比较七、两个总体均值之差的检验:
匹配样本
_d-一外)
,自由度为(n-1)
检验统计量:
*—"
4n
八、两个总体比率之差的检验
—P1—,2一S1一气)Z—~/
X+x9般都为。
,合并后的比率「=确小〃2
★重点补充
1、a=0.05,表示原假设为真时,拒绝原假设的概率为0.05。
2、原假设通常指研究者想收集证据予以反对的假设。
3、单侧检验中,如果研究者感兴趣的备择假设为<,则为左侧检验,反之〉为右侧检验。
4、当原假设为真时拒绝原假设:
第I类错误,
当原假设为假时没有拒绝原假设:
第II类错误。
5、如何求P值,例子:
查表p
双边:
经计算:
z=-2.475,则Zp=-2.475=>zp=2.475=>1-—=0.993=>p
—1/
22右
查表
单边:
经计算:
t=-0.936,则“=—0.936=>Zi_p=1.936nl-p=0.824np
第七章、相关与回归分析
一、相关关系的种类
1、按照相关关系涉及变量(或因素)的多少,分为单相关和多相关
2、按照相关关系的表现形式不同,分为线性相关和非线性相关
3、按照相关现象变化的方向不同,分为正相关和负相关二、相关系数
三、相关系数的特点
1-12、当r=0时,表明x和y没有线性相关关系。
3、当一1<时<1时,表明x和y存在一定的线性相关关系,若r>0表明x与y为正相关,若r<0表明x与y为负相关。
4、当|r|=l时,表明x与y完全线性相关,若r=1,称x与y完全正相关;若r=-1,称x与y完全负相关。
四、最小二乘估计:
y=a+0x
)2
若P3=0
五、拟合优度的度量
SST=SSR+SSE
SST:
总离差平方和:
每个数与总均值的离差平方和
SSR:
回归平方和(相当于组间平方和SSA):
每个数所在组的均值与总均值的离差平方
SSE:
残差平方和(相当于组内平方和):
每个变量值与本组均值的离差平方和
n,SSR
六、可决系数(或称判定系数):
^-=—T
WL
第八章、时间序列分析与预测
一、时间序列的速度分析
报告期水平=X,
基期水平——
In
riG,
i=l
平均发展速度:
G='\lGl»G2»-»Gn=ii
平均增长速度=平均发展速度-1
二、影响时间序列的构成要素:
长期趋势T、季节变动S、循环变动C、不规则变动I
月平均
三、季节变动分析的原始资料平均法:
季节比率=母扁
季节平均等于1,说明不受季节变化的影响。
远离1,说明受季节影响大。
第九章、指数
一、指数的概念:
是一种对比性的分析指标。
二、指数的分类
1、按指数的内容差异(即对比指标性质):
质量指标指数、数量指标指数
2、按指数的考察范围和计算方法:
个体指数、总指数
3、按指数的对比性质:
动态指数(时间指数)、静态指数(空间指数、计划完成情况指数)
Vq】Pn
三、销售量指数:
kq=——
l^oPo
Vp,<7,
四、价格指数:
kp=一
Lm
Vp,<7,
五、销售额指数:
kpq=—
yE—
六、对销售量指数的处理:
M1。
=—
2j0oPo2j0O〃O
2P.O_
七、对价格指数的处理:
以云—
乙Pl
P。
P\
八、个体指数:
价格个体指数二
Po
01
销售量个体指数」=1+产量增长(%)
00