统计学实训报告.docx

上传人:b****1 文档编号:782323 上传时间:2023-04-30 格式:DOCX 页数:37 大小:890.20KB
下载 相关 举报
统计学实训报告.docx_第1页
第1页 / 共37页
统计学实训报告.docx_第2页
第2页 / 共37页
统计学实训报告.docx_第3页
第3页 / 共37页
统计学实训报告.docx_第4页
第4页 / 共37页
统计学实训报告.docx_第5页
第5页 / 共37页
统计学实训报告.docx_第6页
第6页 / 共37页
统计学实训报告.docx_第7页
第7页 / 共37页
统计学实训报告.docx_第8页
第8页 / 共37页
统计学实训报告.docx_第9页
第9页 / 共37页
统计学实训报告.docx_第10页
第10页 / 共37页
统计学实训报告.docx_第11页
第11页 / 共37页
统计学实训报告.docx_第12页
第12页 / 共37页
统计学实训报告.docx_第13页
第13页 / 共37页
统计学实训报告.docx_第14页
第14页 / 共37页
统计学实训报告.docx_第15页
第15页 / 共37页
统计学实训报告.docx_第16页
第16页 / 共37页
统计学实训报告.docx_第17页
第17页 / 共37页
统计学实训报告.docx_第18页
第18页 / 共37页
统计学实训报告.docx_第19页
第19页 / 共37页
统计学实训报告.docx_第20页
第20页 / 共37页
亲,该文档总共37页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

统计学实训报告.docx

《统计学实训报告.docx》由会员分享,可在线阅读,更多相关《统计学实训报告.docx(37页珍藏版)》请在冰点文库上搜索。

统计学实训报告.docx

统计学实训报告

试验1数据文件管理

一、试验目的与要求

通过本试验项目,使我理解并掌握SPSS软件包有关数据文件创建和整理的基本操作,学习如何将收集到的数据输入计算机,建成一个正确的SPSS数据文件,并掌握如何对原始数据文件进行整理,包括数据查询,数据修改、删除,数据的排序等等。

二、试验原理

SPSS数据文件是一种结构性数据文件,由数据的结构和数据的内容两部分构成,也可以说由变量和观测两部分构成。

SPSS数据文件如表2.1所示

SPSS变量的属性

SPSS中的变量共有10个属性,分别是变量名(Name)、变量类型(Type)、长度(Width)、小数点位置(Decimals)、变量名标签(Label)、变量名值标签(Value)、缺失值(Missing)、数据列的显示宽度(Columns)、对其方式(Align)和度量尺度(Measure)。

定义一个变量至少要定义它的两个属性,即变量名和变量类型,其他属性可以暂时采用系统默认值,待以后分析过程中如果有需要再对其进行设置。

在spss数据编辑窗口中单击“变量视窗”标签,进入变量视窗界面即可对变量的各个属性进行设置。

3、试验内容与步骤

某航空公司38名职员性别和工资情况的调查数据,如表2.3所示,试在SPSS中进行如下操作:

(1)将数据输入到SPSS的数据编辑窗口中,将gender定义为字符型变量,将salary定义为数值型变量,并保存数据文件,命名为“试验1-1.sav”。

(2)插入一个变量income,定义为数值型变量。

(3)将数据文件按性别分组

(4)查找工资大于40000美元的职工

(5)当工资大于40000美元时,职工的奖金是工资的20%;当工资小于40000美元时,职工的奖金是工资的10%,假设实际收入=工资+奖金,计算所有职工的实际收入,并添加到income变量中。

表2.3某航空公司38名职员情况的调查数据表

Id

Gender

Salary

Id

Gender

Salary

1

M

$57000

20

F

$26250

2

M

$40200

21

F

$38850

3

F

$21450

22

M

$21750

4

F

$21900

23

F

$24000

5

M

$45000

24

F

$16950

6

M

$32100

25

F

$21150

7

M

$36000

26

M

$31050

8

F

$21900

27

M

$60375

9

F

$27900

28

M

$32550

10

F

$24000

29

M

$135000

11

F

$30300

30

M

$31200

12

M

$28350

31

M

$36150

13

M

$27750

32

M

$110625

14

F

$35100

33

M

$42000

15

M

$27300

34

M

$92000

16

M

$40800

35

M

$81250

17

M

$46000

36

F

$31350

18

M

$103750

37

M

$29100

19

M

$42300

38

M

$31350

1.创建一个数据文件

数据文件的创建分成三个步骤:

(1)选择菜单【文件】→【新建】→【数据】新建一个数据文件,进入数据编辑窗口。

窗口顶部标题为“PASWStatistics数据编辑器”。

(2)单击左下角【变量视窗】标签进入变量视图界面,根据试验的设计定义每个变量类型。

(3)变量定义完成以后,单击【数据视窗】标签进入数据视窗界面,将每个具体的变量值录入数据库单元格内。

2.读取外部数据

当前版本的SPSS可以很容易地读取Excel数据,步骤如下:

(1)按【文件】→【打开】→【数据】的顺序使用菜单命令调出打开数据对话框,在文件类型下拉列表中选择数据文件

(2)选择要打开的Excel文件,单击“打开”按钮,调出打开Excel数据源对话框.对话框中各选项的意义如下:

工作表下拉列表:

选择被读取数据所在的Excel工作表。

范围输入框:

用于限制被读取数据在Excel工作表中的位置。

3.数据编辑

在SPSS中,对数据进行基本编辑操作的功能集中在Edit和Data菜单中

4.SPSS数据的保存

SPSS数据录入并编辑整理完成以后应及时保存,以防数据丢失。

保存数据文件可以通过【文件】→【保存】或者【文件】→【另存为】菜单方式来执行。

在数据保存对话框中根据不同要求进行SPSS数据保存。

5.数据整理

在SPSS中,数据整理的功能主要集中在【数据】和【转换】两个主菜单下。

(1)数据排序(SortCase)

对数据按照某一个或多个变量的大小排序将有利于对数据的总体浏览,基本操作说明如下:

选择菜单【数据】→【排列个案】,打开对话框.

(2)抽样(SelectCase)

在统计分析中,有时不需要对所有的观测进行分析,而可能只对某些特定的对象有兴趣。

利用SPSS的SelectCase命令可以实现这种样本筛选的功能。

基本操作说明如下:

♦打开数据文件实验1选择【数据】→【选择个案】命令,打开对话框,

♦指定抽样的方式:

【全部个案】不进行筛选;【如果条件满足】按指定条件进行筛选。

设置完成以后,点击continue,进入下一步。

♦确定未被选择的观测的处理方法,这里选择默认选项【过滤掉未选定的个案】。

♦单击ok进行筛选,结果如图

(3)增加个案的数据合并(【合并文件】→【添加个案】)

将新数据文件中的观测合并到原数据文件中,在SPSS中实现数据文件纵向合并的方法如下:

选择菜单【数据】→【合并文件】→【添加个案】选择需要追加的数据文件,单击打开按钮,弹出AddCases对话框

(4)增加变量的数据合并(【合并文件】→【添加变量】)

增加变量时指把两个或多个数据文件实现横向对接。

收集来的数据被放置在一个新的数据文件中。

在SPSS中实现数据文件横向合并的方法如下:

♦选择菜单【数据】¡ú【合并文件】¡ú【添加变量】,选择合并的数据文件,单击“打开”,弹出添加变量,如图2.12所示。

单击Ok执行合并命令。

这样,两个数据文件将按观测的顺序一对一地横向合并。

(5)数据拆分(SplitFile)

在进行统计分析时,经常要对文件中的观测进行分组,然后按组分别进行分析。

例如要求按性别不同分组。

在SPSS中具体操作如下:

♦选择菜单【数据】→【分割文件】,打开对话框,如图

♦选择拆分数据后,输出结果的排列方式,该对话框提供了3种方式:

对全部观测进行分析,不进行拆分;在输出结果种将各组的分析结果放在一起进行比较;按组排列输出结果,即单独显示每一分组的分析结果。

♦选择分组变量

♦选择数据的排序方式

♦单击ok按钮,执行操作

(6)计算新变量

在对数据文件中的数据进行统计分析的过程中,为了更有效地处理数据和反映事务的本质,有时需要对数据文件中的变量加工产生新的变量。

比如经常需要把几个变量加总或取加权平均数,SPSS中通过【计算】菜单命令来产生这样的新变量,其步骤如下:

♦选择菜单【转换】→【计算变量】,打开对话框,在目标变量输入框中输入生成的新变量的变量名。

单击输入框下面类型与标签按钮,在跳出的对话框中可以对新变量的类型和标签进行设置。

♦在数字表达式输入框中输入新变量的计算表达式。

♦单击【如果】按钮,弹出子对话框,如图2.15所示。

包含所有个体:

对所有的观测进行计算;如果个案满足条件则包括:

仅对满足条件的观测进行计算。

♦单击Ok按钮,执行命令,则可以在数据文件中看到一个新生成的变量。

 

(七)、当工资大于40000美元时,职工的奖金是工资的20%;当工资小于40000美元时,职工的奖金是工资的10%,假设实际收入=工资+奖金,计算所有职工的实际收入,并添加到income变量中

 

试验2描述统计

一、试验目的与要求

统计分析的目的在于研究总体特征。

但是,由于各种各样的原因,我们能够得到的往往只能是从总体中随机抽取的一部分观察对象,他们构成了样本,只有通过对样本的研究,我们才能对总体的实际情况作出可能的推断。

因此描述性统计分析是统计分析的第一步,做好这一步是进行正确统计推断的先决条件。

通过描述性统计分析可以大致了解数据的分布类型和特点、数据分布的集中趋势和离散程度,或对数据进行初步的探索性分析(包括检查数据是否有错误,对数据分布特征和规律进行初步观察)。

本试验旨在于:

引到我们利用正确的统计方法对数据进行适当的整理和显示,描述并探索出数据内在的数量规律性,掌握统计思想,培养我们学习统计学的兴趣,为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实的基础。

二、试验原理

描述统计是统计分析的基础,它包括数据的收集、整理、显示,对数据中有用信息的提取和分析,通常用一些描述统计量来进行分析。

集中趋势的特征值:

算术平均数、调和平均数、几何平均数、众数、中位数等。

其中均数适用于正态分布和对称分布资料,中位数适用于所有分布类型的资料。

离散趋势的特征值:

全距、内距、平均差、方差、标准差、标准误、离散系数等。

其中标准差、方差适用于正态分布资料,标准误实际上反映了样本均数的波动程度。

分布特征值:

偏态系数、峰度系数、他们反映了数据偏离正态分布的程度。

三、试验内容与步骤

1.频数分析(Frequencies)

基本统计分析往往从频数分析开始。

通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。

比如,在某项调查中,想要知道被调查者的性别分布状况。

频数分析的第一个基本任务是编制频数分布表。

SPSS中的频数分布表包括的内容有:

(1)频数(Frequency)即变量值落在某个区间中的次数。

(2)百分比(Percent)即各频数占总样本数的百分比。

(3)有效百分比(ValidPercent)即各频数占有效样本数的百分比。

这里有效样本数=总样本-缺失样本数。

(4)累计百分比(CumulativePercent)即各百分比逐级累加起来的结果。

最终取值为百分之百。

频数分析的第二个基本任务是绘制统计图。

统计图是一种最为直接的数据刻画方式,能够非常清晰直观地展示变量的取值状况。

频数分析中常用的统计图包括:

条形图,饼图,直方图等。

频数分析的应用步骤

在SPSS中的频数分析的实现步骤如下:

选择菜单“【文件】—>【打开】—>【数据】”在对话框中找到需要分析的数据文件“SPSS/实验21”,然后选择“打开”。

这里以实验21为例,选择菜单“【分析】—>【描述统计】—>【频率】”。

如图2.1所示

确定所要分析的变量,例如身高

在变量选择确定之后,在同一窗口上,点击“Statistics”按钮,打开统计量对话框,如下图2.2所示,选择统计输出选项。

◆实验一结果输出与分析

点击Frequencies对话框中的“OK”按钮,即得到下面的结果。

?

?

身高

N

有效

16

缺失

0

 

身高

?

百分比

有效百分比

累?

百分比

有效

150

1

6.3

6.3

6.3

154

1

6.3

6.3

12.5

155

1

6.3

6.3

18.8

156

1

6.3

6.3

25.0

157

1

6.3

6.3

31.3

160

1

6.3

6.3

37.5

169

2

12.5

12.5

50.0

170

1

6.3

6.3

56.3

171

1

6.3

6.3

62.5

172

1

6.3

6.3

68.8

173

1

6.3

6.3

75.0

174

1

6.3

6.3

81.3

177

1

6.3

6.3

87.5

178

1

6.3

6.3

93.8

180

1

6.3

6.3

100.0

合?

16

100.0

100.0

 

描述统计量分析的应用步骤

SPSS的【描述】命令专门用于计算各种描述统计性统计量。

本节利用某年国内上市公司的财务数据来介绍描述统计量在SPSS中的计算方法。

具体操作步骤如下:

选择菜单【分析】→【描述统计】→【描述】,将待分析的变量移入Variables列表框,对所选择的每个变量进行标准化处理,产生相应的Z分值,作为新变量保存在数据窗口中。

其变量名为相应变量名前加前缀z。

标准化计算公式:

单击【选项】按钮,如图2.8所示,选择需要计算的描述统计量。

在主对话框中单击ok执行操作。

实验2结果输出与分析

描述统计量

N

全距

极小值

极大值

均值

标准差

方差

偏度

峰度

统计量

统计量

统计量

统计量

统计量

统计量

统计量

统计量

标准误

统计量

标准误

重量

18

.46

1.59

2.05

1.8061

.10858

.012

.079

.536

.571

1.038

有效的N(列表状态)

18

如上图可以看出笔记本电脑重量平均达到1.8,最轻的1.59,最重的达到2.05,在重量方面差异比较大,此外从偏度和峰度可以看出重量的呈左偏分布

试验3:

统计推断

一、试验目的与要求

1.熟悉点估计概念与操作方法

2.熟悉区间估计的概念与操作方法

3.熟练掌握T检验的SPSS操作

4.学会利用T检验方法解决身边的实际问题

二、试验原理

1.参数估计的基本原理

2.假设检验的基本原理

三、试验演示内容与步骤

1.单个总体均值的假设检验(单样本T检验)

例1.某省大学生四级英语测验平均成绩为65,现从某高校随机抽取20份试卷,其分数为:

72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62,问该校英语水平与全区是否基本一致?

设α=0.05

♦假设形式为:

H0:

μ=μ0,H1:

μ≠μ0

♦软件实现程序打开已知数据文件,然后选择菜单“【分析】→【比较均值】→单样本T检验”,打开One-SampleTTest对话框。

从源变量清单中将“英语4级成绩”向右移入“TestVariables”框中。

 

在“TestValue”框里输入一个指定值(即假设检验值,本例中假设为65),T检验过程将对每个检验变量分别检验它们的平均值与这个指定数值相等的假设。

“One-SampleTTest”窗口中“OK”按钮,输出结果如下表所示。

(1)“One-SampleStatistics”(单个样本的统计量)表分别给出样本的容量、均值、标准差和平均标准误。

成绩均值为69.80

描述

?

?

?

准?

英?

4?

成?

均值

69.80

2.118

均值的95%置信?

?

下限

65.37

上限

74.23

5%修整均值

69.72

中值

69.00

方差

89.747

?

准差

9.474

极小值

54

极大值

87

范?

33

四分位距

14

偏度

.167

.512

峰度

-.788

.992

“95%ConfidenceInternaloftheDifference”,样本均值与检验值偏差的95%置信区间为(0.37,0.923),置信区间不包括数值0,说明该校英语水平与65有显著差异,不符合要求。

2.两独立样本的假设检验(两独立样本T检验)

2.分析某班级学生的高考数学成绩是否存在性别上的差异。

数据如表所示:

某班级学生的高考数学成绩

性别

数学成绩

男(n=18)

858975588680787684899995828760857580

女(n=12)

9296868378877065706570787256

◆打开SPSS,按如下图示格式输入原始数据,建立数据文件

◆计算两总体均值之差的区间估计,采用“独立样本T检验”方法。

选择菜单【分析】→【比较均值】→【独立样本T检验】”。

(1)从源变量清单中将“报酬”变量移入检验变量框中。

表示要求该变量的均值的检验。

(2)从源变量清单中将“会员”变量移入分组变量框中。

表示总体的分类变量。

◆定义分组单击定义组按钮,打开DefineGroups对话框。

在Group1中输入M,在Group2中输入F(M表示男生,F表示女生)。

完成后单击“继续”按钮回到主窗口。

◆计算结果单击上图中“OK”按钮,输出结果如下图所示。

(1)GroupStatistics(分组统计量)表

分别给出不同总体下的样本容量、均值、标准差和平均标准误。

从该表中可以看出,男生高考数学成绩均值为81.28,女生高考数学成绩均值为76.29。

(2)IndependentSampleTest(独立样本T检验)表

 Levene’sTestforEqualityofVariance,为方差检验,在Equalvariancesassumed(原假设:

方差相等)下,F=0.647,因为其P-值大于显著性水平,即:

Sig.=0.428>0.05,不能拒绝方差相等的原假设

T-testforEqualityofMeans为检验总体均值是否相等的t检验,由于在本例中,其P-值大于显著性水平,即:

Sig.=0.206>0.05,因此不应该拒绝原假设,也就是说没有显著差异。

表3.7独立样本T检验结果

IndependentSamplesTest

?

立?

本?

?

方差方程的Levene?

?

均值方程的t?

?

F

Sig.

t

df

Sig.(?

?

均值差值

?

准?

差值

差分的95%置信?

?

下限

上限

?

?

成?

假?

方差相等

.647

.428

1.292

30

.206

4.992

3.864

-2.898

12.882

假?

方差不相等

1.276

26.623

.213

4.992

3.912

-3.041

13.025

试验4:

方差分析

一、试验目标与要求

1.帮助我们深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理

2.掌握方差分析的过程。

3.增强我们的实践能力,使我们能够利用SPSS统计软件,熟练进行单因素方差分析、两因素方差分析等操作,激发我们的学习兴趣,增强自我学习和研究的能力。

二、试验原理

在现实的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多。

例如,农作物的产量受作物的品种、施肥的多少及种类等的影响;某种商品的销量受商品价格、质量、广告等的影响。

为此引入方差分析的方法。

方差分析也是一种假设检验,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本观测值之间可能存在的由该因素导致的系统性误差与随即误差加以比较,据以推断各组样本之间是否存在显著差异。

若存在显著差异,则说明该因素对各总体的影响是显著的。

方差分析有3个基本的概念:

观测变量、因素和水平。

观测变量是进行方差分析所研究的对象;因素是影响观测变量变化的客观或人为条件;因素的不同类别或不通取值则称为因素的不同水平。

在上面的例子中,农作物的产量和商品的销量就是观测变量,作物的品种、施肥种类、商品价格、广告等就是因素。

在方差分析中,因素常常是某一个或多个离散型的分类变量。

根据观测变量的个数,可将方差分析分为单变量方差分析和多变量方差分析;根据因素个数,可分为单因素方差分析和多因素方差分析。

在SPSS中,有One-wayANOVA(单变量-单因素方差分析)、GLMUnivariate(单变量多因素方差分析);GLMMultivariate(多变量多因素方差分析),不同的方差分析方法适用于不同的实际情况。

本节仅练习最为常用的单因素单变量方差分析。

三、试验演示内容与步骤

单因素方差分析也称一维方差分析,对两组以上的均值加以比较。

检验由单一因素影响的一个分析变量由因素各水平分组的均值之间的差异是否有统计意义。

并可以进行两两组间均值的比较,称作组间均值的多重比较。

主要采用One-wayANOVA过程。

采用One-wayANOVA过程要求:

因变量属于正态分布总体,若因变量的分布明显是非正态,应该用非参数分析过程。

若对被观测对象的试验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用RepeatedMeasure菜单项,进行重复测量方差分析,条件满足时,还可以进行趋势分析。

例1.用SPSS进行单因素方差分析。

某个年级有三个小班,他们进行了一次数据考试,现从各班随机地抽取了一些学生,记录其成绩如表。

原始数据文件保存为“数学考试成绩.sav”。

试在显著性水平0.05下检验各班级的平均分数有无显著差异。

数学考试成绩表

73

66

88

77

68

41

89

60

78

31

79

59

82

45

48

78

56

68

43

93

91

62

91

53

80

36

51

76

71

79

73

77

85

96

71

15

78

79

74

80

87

75

76

87

56

85

97

89

在SPSS中试验该检验的步骤如下:

♦步骤1:

选择菜单【分析】→【比较均值】→【单因素方差分析】,依次将观测变量成绩移入因变量列表框,将因素变量班级移入因子列表框。

♦单击两两比较按钮,如图,该对话框用于进行多重比较检验,即各因素水平下观测变量均值的两两比较。

方差分析的原假设是各个因素水平下的观测变量均值都相等,备择假设是各均值不完全相等。

假如一次方差分析的结果是拒绝原假设,我们只能判断各观测变量均值不完全相等,却不能得出各均值完全不相等的结论。

各因素水平下观测变量均值的更为细致的比较就需要用多重比较检验。

未假定方差齐性选项栏中给出了在观测变量不满足方差齐性条件下的多种检验方法。

这里选择Tamhane’sT2检验法;Significancelevel输入框中用于输入多重比较检验的显示性水平,默认为5%。

♦单击选项按钮,弹出options子对话框,如图所示。

在对话框中选中描述性复选框,输出不同因素水平下观测变量的描述统计量;选择方差同质性检验复选框,输出方差齐性检验结果;选中均值图复选框,输出不同因素水平下观测变量的均值直线图。

在主对话框中点击ok按钮,可以得到单因素分析的结果。

试验结果分析:

统计量对应的P值0.892大于0.05,所以满足方差齐性分析的结论。

总离差SST=15610.667,组间平方和SS

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2