大学基础统计学(新教材)第一章.pptx
《大学基础统计学(新教材)第一章.pptx》由会员分享,可在线阅读,更多相关《大学基础统计学(新教材)第一章.pptx(57页珍藏版)》请在冰点文库上搜索。
2011-1-26,suyl,1,统计学主讲教师:
苏远琳电子邮箱:
第一章总论为什么学习统计学什么是统计统计学中的基本概念用EXCEL进行统计分析,2011-1-26,suyl,2,2011-1-26,suyl,3,统计是用来处理数据的。
统计是从数据中找出信息,并且做出结论。
用的工具是图表和计算,加上常识判断。
统计学的世界【美】戴维.S穆尔(DavidS.Moore),什么是统计?
1.1为什么要学习统计学,2011-1-26,suyl,4,学习方法和要求,课堂思考课后作业参考文献,1.2什么是统计,2011-1-26,suyl,5,统计工作统计资料统计科学,2010-02,suyl,6,统计工作,统计工作即统计实践活动,是人们为了说明所研究对象的某种数量特征和数量规律性,而对该现象的数据进行收集、整理与分析的活动。
下一个,2010-02,suyl,7,统计资料,统计资料即统计数据,是通过统计工作所获得的能够说明现象某种特征的数据,是统计实践活动的成果。
下一个,2010-02,suyl,8,统计科学,统计科学即统计学,是一门研究收集数据、表现数据、分析数据、解释数据,从而认识数量规律的方法论科学。
下一个,2010-02,suyl,9,统计学是一门研究收集数据、表现数据、分析数据、解释数据,从而认识数量规律的方法论科学。
不列颠百科全书的定义:
统计学是:
“关于收集和分析数据的科学与艺术(艺术)”1、数据有随机性(带偶然误差)。
2、应用时有人的判断和主动性(“艺术”),不是死套公式。
2010-02,suyl,10,NEXT,上述例子说明:
通过多次观察和实验得到大量的统计数据,利用统计方法是可以探索出其内在的数量规律性的。
例2:
掷骰子的游戏,例1:
新生婴儿的性别比例107100,统计学与统计数据的关系,2010-02,suyl,11,抛掷硬币试验,N1为硬币花面出现次数,下一个,2010-02,suyl,12,统计学的产生和发展,
(一)统计实践活动的产生与发展有文字记载的统计实践活动,如埃及建造金字塔时期,中国大禹治水时期.资本主义生产方式出现以前,统计主要限于人口土地财产等;随着资本主义生产方式的推进,统计飞速发展_统计内容扩展,专门统计机构成立;20世纪50年代以后,统计又出现一次飞跃.,2010-02,suyl,13,
(二)统计学的产生与发展,国势学派海门尔康令(德国):
阿亨瓦尔1749年提出“统计学”。
最早使用“统计学”这一术语的是德国国势学派。
国势学派虽然创造了统计学这一名词,但他们主要使用文字记述方法对国情国力进行研究,其学科内容与现代统计学有较大差别。
有统计学之名,无统计学之实政治算术学派威廉配第(英国):
最早的统计学源于17世纪英国。
其代表人物是威廉配第(WilliamPatty,16231687年)。
威廉佩第在政治算术一书中,写到:
本书“不用比较级、最高级进行思辨或议论,而是用数字来表达自己想说的问题借以考察在自然中有可见的根据的原因。
”政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。
有统计学之实,无统计学之名,2010-02,suyl,14,数理统计学派凯特勒(比利时):
他所著的代表作社会物理学等将概率论和统计方法引入社会经济方面的研究。
认为统计学是一门通用的方法论科学。
从19世纪中叶到20世纪中叶,数理统计学得到迅速发展。
英国生物学家高尔顿提出并阐述了“相关”的概念;皮尔逊提出了计算复相关和偏相关的方法。
戈塞特建立了“小样本理论”,即所谓的“t分布”;费歇样本相关系数的分布、方差分析、实验设计等方面的研究中做出了重要贡献。
到20世纪中期,数理统计学的基本框架已经形成。
数理统计学派成为英美等国统计学界的主流。
2010-02,suyl,15,统计发展的进程,1.2.2统计学的类型,描述统计学推断统计学,2011-1-26,suyl,16,2010-02,suyl,17,统计学的学科体系理论统计学和应用统计学,历经300多年的发展,统计学目前已经成为横跨社会科学和自然科学领域的多科性的科学。
“统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。
”从横向看,各种统计学都具有上述共同点,因而能够形成一个学科“家族”。
从纵向看,统计学方法应用于各种实质性科学,同它们相结合,产生了一系列专门领域的统计学。
由此可见,现代统计学可以分为两大类:
一类是以抽象的数量为研究对象,研究一般的收集数据、整理数据和分析数据方法的理论统计学。
另一类是以各个不同领域的具体数量为研究对象的应用统计学。
2010-02,suyl,18,理论统计学把研究对象一般化、抽象化,以数学中的概率论为基础,从纯理论的角度,对统计方法加以推导论证,其中心内容是以归纳方法研究随机变量的一般规律。
理论统计学的特点是计量不计质,它具有通用方法论的理学性质。
应用统计学是有具体对象的方法论。
所谓应用既包括一般统计方法的应用,更包括各自领域实质性科学理论的应用。
应用统计学从所研究的领域或专门问题出发,视研究对象的性质采用适当的指标体系和统计方法,解决所需研究的问题。
应用统计学不仅要进行定量分析,还需要进行定性分析。
所以应用统计学通常具有边缘交叉和复合型学科的性质。
理论统计学和应用统计学总是互相促进,共同提高的。
理论统计的研究为应用统计提供方法论基础,应用统计学在对统计方法的实际应用中,又常常会对理论统计学提出新的问题,开拓理论统计学的研究领域。
2010-02,suyl,19,理论统计学描述统计与推断统计描述统计:
研究如何对客观现象的数量特征进行计量、观察、概括和表述。
用表和图表示,计算特征量(如平均值)等,所论不超出已有数据。
推断统计(统计推断)根据数据所提供信息对数据所来自的总体(母体)的性质作推断,推断会有错误、误差,用概率论的术语和方法来描述和论证。
误差的产生源于数据有误差。
怎样尽可能减少推断的错误和误差,是统计推断的中心问题。
2010-02,suyl,20,内容搜集数据整理数据展示数据目的描述数据特征找出数据的基本规律,描述统计,2010-02,suyl,21,推断统计,内容参数估计假设检验目的_对总体特征作出推断,2010-02,suyl,22,描述统计与推断统计的关系,反映客观现象的数据,描述统计(统计数据的搜集、整理、显示和分析等),图1-1统计学探索现象数量规律性的过程,2010-02,suyl,23,应用统计学,2010-02,suyl,24,1.2.3统计的特点,1数量性_统计研究现象的数量特征(从数量上来认识事物的性质和规律性).在质与量的辨证统一中研究;不同于纯数量的研究。
2总体性_研究大量个别事物构成的现象整体的数据。
研究目的在于说明总体特征,但常常从观察个体数量特征入手.现象的数量规律性只有在总体层面上才能体现出来;,1.2.4统计研究的基本方法,1大量观察法2统计分组法3综合分析法4归纳推断法,2011-1-26,suyl,25,大量观察法指为了对现象整体的数量规律有所了解,必须对所要研究现象的全部或足够多的个体进行调查的方法。
只有通过大量观察法才能消除偶然的、次要的因素的影响,以反映主要的、共同起作用的因素所呈现的规律性,达到对现象总体数量规律的认识。
大量观察法实际上不是指一种具体方法,而是一种统计思想方法统计分组法指根据统计研究的需要,按一定的标志把总体分成若干组别的方法。
综合分析法指运用各种经过科学分类汇总的综合指标和各种分析方法反映现象总体在一定时间、地点、条件下的规模、水平、对比关系、集中趋势、差异程度、依存关系、发展趋势和变化规律等。
归纳推断法指由个别事物的事实,概括为现象总体的一般特征的推理方法。
2011-1-26,suyl,26,2010-02,suyl,27,1.3统计学中的基本概念,1.3.1总体、个体与样本总体是在一定的研究目的下,所要研究事物的全体,它是由客观存在的、具有某种共同性质的众多个别事物构成的整体。
(调查对象)总体单位个体,构成总体的个别事物是个体。
总体单位是所要研究具体问题的承担者。
(调查单位),总体,个体,2010-02,suyl,28,研究某个班学生的学习情况总体:
全班所有的学生总体单位:
每一个学生某市的工业生产情况总体:
某市所有的工业企业总体单位:
某市每一个工业企业某市的工业生产设备情况总体:
所有的工业生产设备总体单位:
每一台工业生产设备,2010-02,suyl,29,一点说明,一般情况下,总体及总体单位是以实物形态表现的实体,但当总体单位及所研究的标志一经确定后,为了便于叙述,有时也把研究内容抽象化,把总体单位与反映总体单位特征的变量值(即标志值)等同起来,把变量值的集合看成总体。
如抽样推断中就把随机变量可能取值的全体组成的集合称为总体。
这是一种观念总体而不是实质总体,是一种数学上的定义,基于对随机变量性质的理论讨论的界定。
2010-02,suyl,30,总体的特点大量性:
指构成总体的总体单位必须足够多。
同质性:
构成总体的总体单位在某一方面性质是相同的。
差异性:
指构成总体的总体单位在某一方面性质是相同的,而在其它方面都是不尽相同的。
2010-02,suyl,31,按构成总体的总体单位是否可以计量,总体分为:
有限总体和无限总体。
有限总体是指总体的范围能够明确确定,而且元素的数目是有限可数的。
无限总体是指总体所包括的元素是无限的,不看数的。
例如在科学试验中,每一个试验数据可以看成一个总体的一个元素,而试验则可以无限地进行下去,因此有试验数据构成的总体就是一个无限总体。
总体的分类,2010-02,suyl,32,
(一)样本的概念按随机原则从总体中抽出的部分单位构成的整体。
(二)样本与总体的关系一个样本单位是一个总体单位;反之不一定;样本是总体的代表(它来源于总体,带来总体的信息,具有总体的特征);总体具有唯一性,样本具有随机性。
样本,2010-02,suyl,33,总体和样本,样本,2010-02,suyl,34,练习,1、给总统打分:
报纸上报道一项民意调查的结果说:
“43的美国人对总统的整体表现感到满意。
”报道最后写着:
“这份调查是根据电话访问1210位成人所得,访问对象遍布美国各地。
”这个调查中度量的变量是什么?
你觉得报纸感兴趣,想要获取信息的总体是什么?
样本是什么?
2010-02,suyl,35,答:
对总统工作上的表现是否满意;成年美国居民;被访问的1210位成人。
2010-02,suyl,36,2、,2010-02,suyl,37,上表中列示了10个公司的资料,问:
(1)这一数据集中有多少个体?
(2)这一数据集中有多少变量?
(3)哪些变量是品质型的,哪些变量是数量型的?
2010-02,suyl,38,答:
(1)10
(2)4(3)行业分类、首席执行官酬金对股东报酬等级是品质型的,首席执行官酬金和年销售额是数量型的。
2010-02,suyl,39,1.3.2标志、指标与变量,数量标志:
可以用数量表示的,“考试成绩”、“月工资”是数量标志。
品质标志:
不能直接用数量表示的人的性别表现要么为男,要么为女;企业的经济类型表现为国有经济、合资经济、私营经济等。
“性别”、“经济类型”就是,标志说明总体单位特征的数据,主要产生于统计调查阶段。
说明总体单位特征的概念称为标志,如性别、考试成绩都是说明个别人的特征的标志。
2010-02,suyl,40,统计指标和指标体系说明总体特征的概念与具体数字称为指标。
初步核算,2008年全年国内生产总值300670亿元,比上年增长9.0%。
分产业看,第一产业增加值34000亿元,增长5.5%;第二产业增加值146183亿元,增长9.3%;第三产业增加值120487亿元,增长9.5%。
说明总体数量特征的数据,主要产生于统计整理和分析阶段,是综合数据。
指标名称(概念):
指标名称是在一定理论指导下,对所研究现象本质的归纳和抽象,是对统计指标质的规定性,指标数值(字):
指标数值是在质的规定性下,对现象具体量化的结果。
计量单位:
指标数值是有计量单位的数字。
构成,2010-02,suyl,41,指标和标志既有区别又有联系:
联系:
(1)许多统计指标是由数量标志值汇总而来;
(2)指标与数量标志间存在变换关系。
区别:
(1)两者说明的对象不同;
(2)两者在可量性上的表现不同。
2010-02,suyl,42,统计指标分类(按表现形式)(按反映对象的特征),2010-02,suyl,43,统计指标的种类,
(一)根据指标所反映的内容不同,分为:
数量指标(外延指标)反映客观现象总体规模和水平,说明总体的外延范围的大小或数量的多少,数量指标的数值大小必然会随总体范围变化而变动。
质量指标(内涵指标)反映客观现象总体的一般水平或相对水平,说明总体的数量对比关系,其数值大小与总体范围大小的变动没有直接关系。
2010-02,suyl,44,统计指标的种类(续),
(二)根据指标数值的表现形式不同,分为:
总量指标也称为统计绝对数相对指标也称为统计相对数平均指标也称为统计平均数两种分类的关系数量指标总量指标质量指标相对指标、平均指标,2010-02,suyl,45,统计指标的种类(续),(三)统计指标按性质不同,可分为:
正指标指标数值越大越好如企业的利税总额、劳动生产率等逆指标指标数值越小越好如产品单位成本、废品率、犯罪率等适度指标在一定范围内波动才说明现象变化处于正常状态,过高或过低都不理想如基尼系数在0.30.4之间比较合理,指标体系,统计指标体系分为基本统计指标体系和专题统计指标体系。
基本统计指标体系反映经济和社会发展基本情况。
专题统计指标体系反映某一经济或社会现象的情况。
2011-1-26,suyl,46,2010-02,suyl,47,变量:
说明现象某种特征的概念称为变量(可以测量的变化的量)。
变量的特点是从一次观察到下一次观察会呈现出变化或差别。
如“商品销售额”、“受教育程度”、“产品的质量等级”等都是变量。
变量的具体表现称为变量值。
品质变量,变量,2010-02,suyl,48,变量按取值是否确定分为确定性变量和随机变量。
当变量的影响因素是确定的或可事先控制的时,变量取值的大小和方向是可以确定的,象这样的变量称为确定性变量。
当变量的影响因素是不确定的随机因素,或变量决定于众多细小的不确定因素时,变量的取值带有随机性,变量的取值不能事先确定,例如投掷一枚骰子可能出现的点数、当年的消费品价格指数,这样的变量称为随机变量。
在社会经济现象中既有确定性变量也有随机变量。
1.3.3统计数据的计量尺度,统计数据的种类按是否可以直接用数字表示,分为定性数据和定量数据按是否经过加工处理,分为原始数据和综合数据按时间状况,分为截面数据和时序数据,2011-1-26,suyl,49,2010-02,suyl,50,统计数据的计量层次,数据的计量尺度,不同计量尺度的数据有不同的表现形式,适合于不同的统计分析方法。
定比尺度,2010-02,suyl,51,定类尺度,计量层次最低对事物进行平行的分类各类别可以指定数字代码表示使用时必须符合类别穷尽和互斥的要求数据表现为“类别”具有或的数学特性,2010-02,suyl,52,定序尺度,对事物分类的同时给出各类别的顺序比定类尺度精确未测量出类别之间的准确差值数据表现为“有序的类别”、等级具有或的数学特性,定距尺度(间隔尺度、区间尺度),定距尺度是对现象类别或顺序之间的间距进行的测度。
定距数据之间的差是固定不变的,并且没有一个通常的零点。
可以进行、运算。
定距数据之间比值是没有意义的。
2011-1-26,suyl,53,2010-02,suyl,54,定比尺度,1.对事物的准确测度2.比定距尺度更高一层次3.数据表现为“数值”4.有绝对零点5.具有或的数学特性,2010-02,suyl,55,四种计量尺度的比较,计量尺度,数学特性,表示该尺度所具有的特性,1.3.4参数与统计量,1参数参数是反映总体某种特征的量,参数是根据总体所有数据来计算,如总体均值、总体方差或标准差、总体是非比率等,也经常称这些总体参数为总体指标。
参数的真实数值往往是未知的,需要利用样本数据去估计或推断。
2统计量统计量也称为样本指标,是根据样本数据计算的、不含有任何未知总体参数的量,如样本均值、方差或标准差、是非比率等。
统计量是可知的。
由于样本来源于总体,所以样本统计量必然在一定程度上可以用来推断有关的总体参数。
在用样本统计量去估计或推断总体参数时,往往需要通过一定的函数关系式对样本统计量进行再加工,这就形成了构造统计量。
常用的构造统计量有Z统计量、t统计量、统计量、F统计量等。
2011-1-26,suyl,56,1.4用EXCEL进行统计分析,EXCEL的统计函数功能EXCEL的统计图表功能EXCEL的数据分析工具,2011-1-26,suyl,57,