SPSS基础教程讲解Word格式文档下载.docx

资源描述

SPSS基础教程讲解Word格式文档下载.docx

《SPSS基础教程讲解Word格式文档下载.docx》由会员分享，可在线阅读，更多相关《SPSS基础教程讲解Word格式文档下载.docx（30页珍藏版）》请在冰点文库上搜索。

SPSS基础教程讲解Word格式文档下载.docx

选取数据的观测子集

2.4.6

分析数据归类分组汇总

2.4.7

缺失值的替代

2.5

数据变量的操作

2.5.1

增加或删除一个变量

2.5.2

从原有变量构造新变量

2.5.3

数据排秩

2.5.4

产生计数变量

2.5.5

数据重新编码

2.5.6

产生自动分组变量

2.5.7

变量集的定义和使用

2.6

数据文件的合并与拆分

2.6.1

数据文件的纵向合并

2.6.2

数据文件的横向合并

2.6.3

数据文件的拆分

第一章

1.1SPSS

Statistical

package

for

Social

Science，社会科学统计软件包是一个组合式软件包，它集

数据整理、分析过程、结果输出等功能于一身，是世界上著名的统计分析软件之一。

但是

随着

产品服务领域的扩大和服务深度的增加，SPSS

公司已于

2000

年正式将英文

全称更改为“Statistical

Product

and

Service

Solutions”，意为“统计产品与服务解决

方案”，标志着

软件的应用领域有了重大拓展。

解决方案广泛应用于市场研究、

电讯、卫生保健、银行、财务金融、保险、制造业、零售等领域。

的

大特色

●智能操作，易学易用

●一般情况下无须编写程序

●数据转换接口有很好的兼容性

●具有丰富的统计分析功能和完善的分析报告功能

●Complex

Samples

模块增加了统计建模的功能

公司的历史

1968

年：

美国斯坦福大学的三位专业背景截然不同的研究生

Norman

Nie、C.

Hadlai

（Tex）

Hull

和

Dale

Bent

开发了最早的统计软件系统，他们称呼这个软件系

统为“社会科学统计软件包”，简称“SPSS”。

他们的出发点是使用统计方法来将原始数据转

变为决策所必需的信息。

Nie

是一位社会科学家、斯坦福大学的博士生，承担了用户的角

色，提出应用需求；

是斯坦福大学的运筹学博士生，拥有着数据分析方面的专业知

识，设计出了

系统文件结构；

刚从斯坦福大学获得

MBA

学位，由他来负责编

程。

1975

在芝加哥成立

总部

1984

推出用于个人电脑的

SPSS/PC+

1992

推出

Windows

版本，同时在纳斯达克上市，股票代码为

SPSS。

目前在全球

100

多个国家和地区有分支机构或合作伙伴，直系员工超过

人。

软件家族广泛应用于自然科学、技术科学、社会科学的各个领域，世界上许多有影

响的报刊杂志纷纷就

的自动统计绘图、数据的深入分析、使用方便、功能齐全等方

面给予了高度的评价与称赞。

是世界上应用最广泛的专业统计软件，全球约有

万家

公司产品的用户，它们分布于通讯、医疗、银行、证券、保险、制造、商业、

市场研究、科研教育等多个领域和行业，全球

500

强中有

80%的公司使用

SPSS，而在

市场研究和市场调查领域有超过

80%的市场占有率。

在国际学术界有条不成文的规定，

即在国际学术交流中，凡是用

软件完成的计算和统计分析，可以不必说明算法，由

此可见其影响之大和信誉之高。

SPSS窗口

基本功能

——建立

数据文件

主要构件

●标题栏和系统状态栏

●菜单栏

●工具栏

文件以.sav

为扩展名

2．输出窗口（Viewer）

∙以.spo

编辑

程序，通过运行主菜单的

RUN

命令将编辑好的程序一次性地提交给计算机

执行。

也可以将编好的程序保存为一个后缀为.sps

的文件供以后需要的时候调用。

选择对话框

Edit==>

Options

2.1.1

定义新变量

大多数情况下我们需要从头定义变量，在

10.0

中，定义变量的操作界面和

FoxPro

等数据库非常相似，只需单击左下方的

Variable

View

标签就可以切换到变量定义

界面开始定义新变量。

①

变量名必须以字母、汉字或＠开头,剩下的字符可以是字母,数字,句点,

@,#,_,$等

②

变量名不能以句点结尾

③

名字长度不能超过

个字符

④

空格和特殊字符不能被用,如?

`,*

⑤

每一个变量名必须是唯一的,重复的变量名是不被允许的

⑥

变量名无大小写之分

⑦

下列关键词不能用作变量名

allNEEQTOleltbyorgtandnotgewith

举例:

locationloc#5x.1over$500

2.变量类型（Type）:

变量类型可由变量类型对话框确定

在

数据集中，变量分为

种类型,主要有字符型变量

（String）和数值型变量（numeric）。

Numeric

——数值型

Comma

——加有逗号的数值型

Dot

——加有圆点的数值型

Scientific

notation

——科学计数型

Date

——日期型

Dollar

——货币型

Custom

currency

——用户自定义型

String

——字符型

变量值标签则在它右侧的

Value

框定义。

以性别

为例，单击

框右半部的省略号，会弹出变量值标签对话框如下：

上部的两个文本框分别为变量值输入框和变量值标签输入框，分别在其中输

入“f”和“女生”，此时下方的

Add

钮变黑，单击它，该变量值标签就会被加

入下方的标签框内。

与此类似定义变量值“m”为“男生”，最后按

OK，变量

值标签就设置完成。

切换回

Data

界面，然后选择菜单

View==>

Value

Labels.

定义缺失值的作用：

凡是在定义的缺失值范围内的数据不参与统计分析。

有两类缺失值：

系统缺失值和用户缺失值。

数据长方形中任何空的数字单元都被认为是系统缺失值，用点“．”表示。

由特殊原因造成的信息缺失值被认为是用户缺失值，例如调查问卷中，被调查

者不愿意回答的项目可定义为用户缺失值。

单击

missing

框下相应变量右侧的省略号，会弹出缺失值对话框如下：

values:

无缺失值,系统默认选项；

discrete

定义离散缺失值，选择该选项后，激活下面

个输入框，可

以在其中指定

个数值作为缺失值，也可以少于

个。

例如对于性别变量，值

2，3，4

都

被认为是非法的，在输入数据过程中有可能输入了这几个数，则可以把这

个值分别输入

到

个矩形框中；

range

puls

one

optional

miss:

定义一个缺失值的范围，选择该选项后，激

活下面

个输入框。

low

hight

输入框中分别输入缺失值的下限和上限。

可以在最下

方的

框中输入范围之外的一个离散值。

选择变量值显示时的对齐方式，系统默认是右对齐。

备选方式：

●Left

——左对齐

●Right

——右对齐

●Center

——居中对齐

为了区分变量在分析中的不同作用，又按变量的度量方式分为三类：

选择变量的度量方式，系统默认是定距变量。

●Scale

——定距变量必须是数值型变量，可以对其观测值进行四则运算。

●Ordinal

——顺序变量，可以是数值型的，也可以是字符型的，可以对其观测值进

行排序。

SPSS（*.sav）

数据文件（6.0～10.0

版）

SPSS/PC+（*.sys）

4.0

版数据文件

Systat（*.syd）

*.syd

格式的

Systat

Systat（*.sys）

*.sys

portable（*.por）

便携格式的数据文件

EXCEL（*.xls）

数据文件（从

5.0

版～2000

Lotus（*.w*）

Lotus

SYLK（*.slk）

SYLK

dBase（*.dbf）

dBase

系列数据文件，（从

II～IV）

Text（*.txt）

纯文本格式的数据文件

data（*.dat）

●Nominal

——名义变量

可以是数值型的，也可以是字符型的，常起分类作用。

使用该窗口，我们可以一次定义许多新变量，不会象老版本那样一个一个的定

义了。

2.1.2数据的输入

2.1.3数据的保存

在对数据做了修改后，保存数据文件是必不可少的工作之一。

选择菜单

File==>

Save，如果数据文件曾经存储过，则系统会自动按原文件名保存数据；

否则，就会弹出和选择

Save

菜单时相同的

对话框。

里面可以保存

的数据类型和可以打开的几乎一样多，选择合适的类型，确定就是了。

2.2

读如其他格式的数据文件

可以直接读入许多格式的数据文件，

选择菜单

Open==>

或直接单击快捷工具栏上的“”按钮，系统就会弹出

Open

对话框，单击“文件类型”列表框，在里面能看到直接打开的数据文件格

式，分别是：

选择所需的文件类型，然后选中需要打开的文件，SPSS

就会按你的要求打开你要使用

的数据文件，并自动转换为数据

格式。

2.3　File

【Disp

Info】

该菜单项用于显示数据的基本信息，选择它后会弹出非常类似于打开文件

的一个对话框用于选择数据文件，选择好后按

OK，系统就会在结果窗口中列出

所选数据的基本情况，如建立时间、标签设置、记录数、变量设置等。

【Apply

Dictionary】

即使用数据字典，该功能使你可以直接在新数据集中套用以前定义好的变

量设置（格式、标签等，但不包括数据类型），例：

打开

Li1_1.sav

文件，将

变量

的长度从

改为

4，标签删掉，然后选择菜单

Apply

Data

Dictionary，在文件对话框中选择

并按

OK（即将

的变量

设置按相同变量名一一套用在现在的数据集上）。

【Cache

Data】

建立数据缓冲区。

以前

每执行一条命令都会重新读取所需的数据，如

果是从远程用

SQL

调用数据库，这会非常的费时。

现在使用

Cache

Data，可以

将数据全部读入暂存盘，建立活动数据的缓冲区。

大大加快处理速度。

如果是

处理本机数据的话，该命令对速度的提升不是非常明显。

【Print

Preview】

这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来，其中

Preview

是新增加的，使用上和

WPS2000

的打印预览非常相似（其实用

的是同样的程序），不过和

结果的打印程序一样，用

直接打印数据

非常的浪费纸张。

【Stop

Processor】

用于停止执行当前的

命令。

由于

处理速度非常的慢，如果你正在

对一个大型的数据执行统计命令，等了半天都没有结束，可是你的结果还没有

存，执行命令时又存不了，怎么办呢？

试试这个命令吧。

但并非所有的命令都

可以喊停的，许多数据库操作命令（计算变量，合并等）好象就停不了。

中，数据文件的编辑、整理等功能被集中在了

Edit,Data

和

Transform

三个菜单项中。

Data：

Insert

Variable:

在选中的单元格之前的一列插入一个新变量。

Cases:

在选中的单元格之前的一行插入一个新观测。

Goto

Case:

定位到指定的观测值

Sort

按某变量的取值对观测值进行排序。

Transpose:

对数据文件进行转置。

Merge

Files:

合并数据文件。

Aggregate…:

对数据进行分类和不分类的汇总。

Orthogonal

Design:

正交设计。

Split

File:

按照某个分组变量对数据文件进行拆分。

Select

Cases…:

选择观测值。

Weight

对观测值加权。

下面我们将根据其功能来分别讲述。

观测与变量的查找

编辑（Edit）

⇒

转至个案（Go

Case）

转至（G）（Go

Case）对话框

●增加一个新的行

激活需要添加行的下一行的任意单元，选择

Edit

Case

●删除一个行

单击要删除行的行头，将该行全部选中，按

Delete

键

观测数据的排序，特别是逐级排序，可以从统计角度了解整体数据的取值情况。

将数据集补钙产品.sav

按“性别”降序，再按“问卷编号”升序排序

操作：

数据（Data）==>

排序个案（Sort

Cases），系统弹出排序个案（Sort

Cases）对话框

下方的排列顺序（Sort

Order）单选钮，有升序和降序两种选择。

请注意，该单

选钮是和上方的

框一起使用的，具体方法如下：

确认降序单选钮被选择，将“性别”选入

框；

选择升序单选钮，将“问卷编号”选入

框。

将观测（行）和变量（列）位置互换，特别适用于实现存/取

Excel

文件进行数据共享功能前

/后的预操作。

将数据集“补钙产品.sav”中的变量“性别”，“年龄”和“居住时间”进行转置

操作

①选择菜单

Transpose，打开

Transpose

对话框；

②将需要转置的变量移入

列表框；

③如果在数据文件中有一个变量是代表转置后各变量的变量名，则将该变量移入

Name

列表框中；

否则转置后数据集的变量将被分别命名为“Var001”,

“Var002”

“Var003”…；

选取观测的子集

在统计分析时，有时并不需要对所有的观测进行分析，只需要对某些观测进行分析，

例如在补钙产品的市场调查中，我们只对女性被调查者的情况感兴趣，或者只有在本市居

住时间超过

年的被调查者才具有统计分析价值。

另一种情况是在全部样品中抽取一小部

分样品进行分析，SPSS

Cases

可以实现这种样本筛选的功能。

仍以补钙产品数据

为例来说明。

①选择菜单数据（Data）=>

选择个案（Select

Cases）打开

Cases）对话

②制定样本筛选方式：

对话框右上

下共有

种筛选方式

∙

All

cases：

不进行筛选，选中它则分析所有的记录；

condition

satisfied：

按指定条件筛选，单击下面的

按钮

在弹出的

对话框可以设置筛选条件。

在右上方的输入框中输入条件表

达式。

条件表达式可以用键盘直接输入，也可以左侧的变量列表中选择变量，从下面的计

算器中选择数字和运算符号。

在右下方的

Functions

列表中有

的常用函数供用户选择。

在本例中如果只相对居住时间超过

年的被调查者进行分析，则在输入框中输入表达式

time>

Random

sample

随机抽取观测，单击下面的

按钮,

在弹出的

对话框中设定随机抽取的观测数，有两种选择：

按百分

比抽取记录，在本例中如果想从所有的观测中抽取

30%进行分析，则在

Approximately

后的框中输入

30；

或者精确设定从前

个观测中随机精确抽取一定量的观测，在本例

中如果想从前

个观测中随机抽取

个，则按下表填写。

Based

time

case

range：

按顺序抽样。

Range

按钮，在弹出的

Select

Cases：

子对话框中设定被筛选的观测的起止序号。

Use

filter

variable：

使用指定的过滤变量进行观测筛选。

选择这一项的前提是数

据文件中已经存在一个过滤变量。

所谓过滤变量即只取“0”“1”两个值的变量。

该

变量取值为“1”的观测将被选中，取值为“0”的观测将被删除。

③确定未被选中的观测的处理办法

对话框的左下

output

下有

种选择

Filter

out

unselect

则在数据文件中根据用户定义的选择条件自动生成一

个变量名为

filter_&

的新筛选变量，同时未被选择的观测左端的观测序号上将被打上

一个斜杠，以后的分析将把这些观测排除在外，但这些观测并没有从数据文件中删除。

Copy

select

new

dataset:

建立一个新数据集，仅包含选中的观测，

将新数据集的名输入

dataset

name

后的框中。

Deleted：

未被选中的观测将被删除，一般不要使用。

注意：

当对数据集做出筛选后，所做的筛选将在以后的分析中一直有效，直到再次改变

选择条件为止。

用于对数据进行分类汇总，所谓分类汇总就是按指定的一个或多个分类变量（一般为

离散型变量）对观测值进行分组，对每组观测的其余变量（一般为连续型变量）值进行指

定的描述统计分析，结果可以存入新数据文件，也可以替换当前数据文件。

例如在补钙产品的市场调查中，我们想要知道按性别分类后，男性和女性被调查者的

平均年龄、平均年收入以及收入差距的大小。

①选择菜单（Data）

分类汇总（Aggregate），打开

分类汇总（Aggregate）对话框

②选择分类变量：

把分类变量移入分组变量（BreakVariables）框，这里把变量

gender

移入

选择汇总变量：

即想要对其计算描述性统计量的变量，这里把变量

age

income

移入

Aggregate

Variable（s）列表框中。

由于收入要计算均值和标准差两个统计量，所

以这里要将变量

income

移入两次

选择要计算的统计量

系统默认计算的统计量是均值（mean）,要想改变计算的统计量，单击

Aggregate

列表框中的某个变量，在单击

Functions,打开

Function

子对话框

组函数

Summary:

为最常用的均值、中位数、标准差等统计量；

Specific

Value:

同组的第一个观测值、最后一个观测值、最小值和最大值

Number

cases:

分组后各组的观测数；

Percentages

Functions：

分别给出处于某个取值区间的观测占各组观测总数的

百分比和比率。

例如，可以计算男性和女性被调查者分别有多少人的年龄超过

岁。

Name

Lable

对产生的新变量重新命名。

选中

save

number

cases

break

group

variable

将各组的观测数作为新变量保存。

选择新生成的数据文件的保存方式，有两个选项：

Create

data

file：

定义一个新文件以存储汇总的结果，右侧的

钮用于

具体文件名的定义，默认文件名为

AGGR.sav；

Replace

working

file

单选钮：

用汇总的结果替换原来的数据。

⑧

OK.

由特殊原因

造成的信息缺失值被认为是用户缺失值，例如调查问卷中，被调查者不愿意回答的项目可

定义为用户缺失值。

统对用户缺失值有较好的替代方法

转换（Transform）

替换缺失值（Replace

values），打开替

换缺失值（Replace

values）对话框

选择左侧的变量名列表框中选择有缺失值的变量，将其添加到

展开阅读全文