统计学基础知识培训.pptx
《统计学基础知识培训.pptx》由会员分享,可在线阅读,更多相关《统计学基础知识培训.pptx(33页珍藏版)》请在冰点文库上搜索。
统计学基础知识培训,目录,统计学基础知识,1,抽样调查简介,2,描述统计,3,推断统计,4,统计学(statistics),统计学是一门收集、处理、分析、解释数据并从数据中得出结论的科学,什么是统计学?
统计是一门工具!
研究对象,总体(population)/样本(sample)总体:
根据研究目的确定的同质观察对象的全体。
有限总体、无限总体个体:
构成总体的基本单位样本:
从总体中随机抽取部分单位所构成的集合体调查总体:
对总体进行进一步限制,使对总体的调查具备可操作性,总体,样本,数据类型,参数与统计量(1/2),参数描述总体特征的指标参数常用希腊字母表示,如:
、等如广州电信移动用户1000W,其中3G用户500W,3G用户比率=50%统计量:
由样本计算的不含未知参数的函数一般情况下,总体中的个体数目往往较大或无限,因而总体指标(参数)往往是未知的,人们在实践过程中逐渐认识到,样本统计量与相应总体参数间有着某种联系,可以通过样本去了解总体情况,由样本信息来推断总体特征,参数与统计量(1/2),一,统计学分类,统计学,描述统计学,推断统计学,参数估计,假设检验,描述统计(descriptivestatistics):
研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。
推断统计(inferentialstatistics):
研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断,目录,统计学基础知识,1,抽样调查简介,2,描述统计,3,推断统计,4,调查方法,普查专门组织的,一般用来调查属于一定时点上的社会经济现象数量的全面调查。
句中三个关键词:
专门、时点、全面。
抽样调查最常用的调查方式,从总体中随机抽取一部分单位(样本)进行调查,目的是为了推断总体特征重点调查在总体中选择个别或部分重点单位进行调查,调查结果不能用于推断总体典型调查从调查对象的全部单位中选择少数典型单位进行调查,目的是描述与揭示事物的本质特征和规律,调查结果不能用于精确推断总体,抽样方法,抽样方法是指在总体中每个单位都具有同等可能性抽样中,每个单位被抽中的概率是已知的误差非抽样误差:
在统计调查中,由于主客观原因而引起的诸如测量、登录、计算等误差。
该误差可以避免抽样误差:
在抽样调查中由于抽样的随机性而产生的样本指标对总体指标的代表性误差。
样本虽然是总体的缩影,但是还不足以完全代表总体,从而产生了误差。
抽样误差是随机抽样固有的,可以计算并加以控制,但是不可以避免,抽样方法分类,抽样方法组织形式(1/2),简单随机抽样(纯随机抽样)方法:
将总体单位编成抽样框,而后用抽签或随机数表抽取样本单位适用:
总体规模不大;总体内部差异小类型抽样(分层抽样)方法:
将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本等距抽样(机械抽样)方法:
将总体单位按某一标志排序,而后按一定的间隔抽取样本单位,(总体单位按某一标志排序),抽样方法组织形式(2/2),整群抽样方法:
将总体全部单位分为许多个“群”,然后随机抽取若干“群”,对被抽中的各“群”内的所有单位登记调查适用:
总体规模不大;总体内部差异小多阶段抽样方法:
就是先从总体中抽出较大的范围的单位,再从中选的大单位中抽较小范围的单位,依次类推,最后从更小的范围抽出样本基本单位如:
广东省客户满意度调研的样本抽取,不同抽样组织设计的比较,提高样本的代表性,增加抽样的效果。
抽样要满足随机性要求。
抽样设计时,要充分考虑如何降低抽样的成本费用。
进行抽样设计时需要考虑的两个问题,在统计学上,一般的调查项目都是定在90的信心程度,不同的样本数产生的准确程度相应增加或减少。
置信度:
90的机会,样本数据是在可接受的误差范围内;有10的机会、样本数据是超出可接受的误差范围。
抽样误差:
样本统计量于相应总体参数的误差范围,样本量和抽样误差之间的关系,样本量取决于时间/成本以及需要的准确性简而言之,从统计学的角度来讲,抽样误差降低1倍,样本量需要提高大约4倍,抽样误差(+/-)%,样本量,样本量确定方法,目录,统计学基础知识,1,抽样调查简介,2,描述统计,3,推断统计,4,描述统计学概念,描述统计学(descriptivestatistics):
指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。
反映总体数量特征的综合指标有哪些呢?
可以用哪些图标形式展示呢?
反映总体数量特征的综合指标有哪些呢?
总体量数:
集中量数:
平均数、中位数、众数差异量数:
全距、方差、标准差、四分差相对量数:
结构相对数(如:
比率)比例相对数(如:
比例)比较相对数(如:
同比、环比)强度相对数(如同业比)计划完成相对数,1、集中量数,集中量数:
用来描述数据分布中心的统计量。
常用的有平均数、中位数、众数平均数:
一组数据的算术平均数中位数:
数轴上面使其左边和右边的数据个数相等的数据指标众数:
分布中出现频次最高的数据值平均数、中位数、众数之间的关系(根据分布),2、差异量数,差异量数:
以数字形式计算出某分布中数据差异的程度,反映一组数据围绕数轴中心分布的离散情况。
常用的有全距、方差、标准差、四分位差全距:
数据在数轴上分布的距离方差:
指离均差平方后的平均数;标准差是指方差的平方根四分位差:
第一个四分位点和第三个四分位点的距离,3、相对量数,相对量数:
结构相对数:
是在对总体分组的基础上,以总体总量作为比较标准,求出各组总量占总体总量的比重,来反映总体内部组成情况的综合指标(如:
比率)比例相对数:
是总体中不同部分数量对比的相对指标,用以分析总体范围内各个局部、各个分组之间的比例关系和协调平衡状况(如:
比例)比较相对数:
比较相对指标是不同单位的同类现象数量对比而确定的相对指标,用以说明某一同类现象在同一时间内各单位发展的不平衡程度,以表明同类实物在不同条件下的数量对比关系(如:
同业比)强度相对数:
是两个性质不同但有一定联系的总量指标之间的对比,用来表明某一现象在另一现象中发展的强度、密度和普遍程度计划完成相对数:
是用来检查、监督计划执行情况的相对指标。
它以现象在某一段时间内的实际完成数与计划数对比,来观察计划完成程度。
(如同比、环比;同比是指与历史同时期进行比较得到的数据,环比是指与前一统计期进行比较得到的数值),可以用哪些图表展示数据?
更多内容可以参照谁说菜鸟不会数据分析,目录,统计学基础知识,1,抽样调查简介,2,描述统计,3,推断统计,4,推断统计学,推断统计(inferentialstatistics):
研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断常见分支为参数估计与假设检验,1、参数估计,参数估计依据所获得的样本资料观察对所研究现象总体的水平,结构规模等数量特征进行估计。
包括点估计与区间估计,点估计:
指直接以样本指标来估计总体指标,也叫定值估计,优点:
简单,具体明确缺点:
无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况,2、假设检验,基本思想:
小概率原理,指如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。
总体(某种假设),抽样,样本(观察结果),检验,(接受),(拒绝),小概率事件未发生,小概率事件发生,假设检验的意义,所谓假设检验,就是对某一总体参数先作出假设的数值;然后搜集样本资料,用这些样本资料确定假设数值与样本数值之间的差异;最后,进一步判断两者差异是否显著,若两者差异很小,则假设的参数是可信的,作出“接受”的结论,若两者的差异很大,则假设的参数准确的可能性很小,作出“拒绝”的结论。
举例:
某地区去年职工家庭年收入为72000元,本年抽样调查结果表明,职工家庭年收入为71000元,这是否意味着职工生活水平下降呢?
我们还不能下这个结论,最好通过假设检验,检验这两年职工家庭收入是否存在显著性统计差异,才能判断该地区今年职工家庭年收入是否低于去年水平。
降了,升了,原假设与备择假设,原假设(又称虚无假设)是接受检验的假设,记作H0;备择假设(又称备选假设)是当原假设被否定时的另一种可成立的假设,记作H1;H0与H1两者是对立的,如H0真实,则H1不真实;如H0不真实,则H1为真实。
H0和H1在统计学中称为统计假设当原假设H0为真时,却因为样本指标的差异而被否定,这种否定真实的原假设的概率就是显著性水平。
用表示,常用的统计检验,均值检验:
单样本T检验两个独立样本T检验配对样本T检验比率检验:
卡方检验,统计是一门艺术!
谢谢!