SPSS基础教程讲解Word格式文档下载.docx

上传人:b****2 文档编号:3879598 上传时间:2023-05-02 格式:DOCX 页数:30 大小:30.63KB
下载 相关 举报
SPSS基础教程讲解Word格式文档下载.docx_第1页
第1页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第2页
第2页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第3页
第3页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第4页
第4页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第5页
第5页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第6页
第6页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第7页
第7页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第8页
第8页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第9页
第9页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第10页
第10页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第11页
第11页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第12页
第12页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第13页
第13页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第14页
第14页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第15页
第15页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第16页
第16页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第17页
第17页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第18页
第18页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第19页
第19页 / 共30页
SPSS基础教程讲解Word格式文档下载.docx_第20页
第20页 / 共30页
亲,该文档总共30页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

SPSS基础教程讲解Word格式文档下载.docx

《SPSS基础教程讲解Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《SPSS基础教程讲解Word格式文档下载.docx(30页珍藏版)》请在冰点文库上搜索。

SPSS基础教程讲解Word格式文档下载.docx

选取数据的观测子集

2.4.6 

分析数据归类分组汇总

2.4.7 

缺失值的替代

2.5 

数据变量的操作

2.5.1 

增加或删除一个变量

2.5.2 

从原有变量构造新变量

2.5.3 

数据排秩

2.5.4 

产生计数变量

2.5.5 

数据重新编码

2.5.6 

产生自动分组变量

2.5.7 

变量集的定义和使用

2.6 

数据文件的合并与拆分

2.6.1 

数据文件的纵向合并

2.6.2 

数据文件的横向合并

2.6.3 

数据文件的拆分

2

第一章 

1.1SPSS 

Statistical 

package 

for 

Social 

Science,社会科学统计软件包是一个组合式软件包,它集

数据整理、分析过程、结果输出等功能于一身,是世界上著名的统计分析软件之一。

但是

随着 

产品服务领域的扩大和服务深度的增加,SPSS 

公司已于 

2000 

年正式将英文

全称更改为“Statistical 

Product 

and 

Service 

Solutions”,意为“统计产品与服务解决

方案”,标志着 

软件的应用领域有了重大拓展。

解决方案广泛应用于市场研究、

电讯、卫生保健、银行、财务金融、保险、制造业、零售等领域。

的 

大特色

●智能操作,易学易用

●一般情况下无须编写程序

●数据转换接口有很好的兼容性

●具有丰富的统计分析功能和完善的分析报告功能

●Complex 

Samples 

模块增加了统计建模的功能

公司的历史

1968 

年:

美国斯坦福大学的三位专业背景截然不同的研究生 

Norman 

H. 

Nie、C.

Hadlai 

(Tex) 

Hull 

和 

Dale 

Bent 

开发了最早的统计软件系统,他们称呼这个软件系

统为“社会科学统计软件包”,简称“SPSS”。

他们的出发点是使用统计方法来将原始数据转

变为决策所必需的信息。

Nie 

是一位社会科学家、斯坦福大学的博士生,承担了用户的角

色,提出应用需求;

是斯坦福大学的运筹学博士生,拥有着数据分析方面的专业知

识,设计出了 

系统文件结构;

刚从斯坦福大学获得 

MBA 

学位,由他来负责编

程。

1975 

在芝加哥成立 

总部

1984 

推出用于个人电脑的 

SPSS/PC+

1992 

推出 

Windows 

版本,同时在纳斯达克上市,股票代码为 

SPSS。

目前在全球 

100 

多个国家和地区有分支机构或合作伙伴,直系员工超过 

人。

软件家族广泛应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影

响的报刊杂志纷纷就 

的自动统计绘图、数据的深入分析、使用方便、功能齐全等方

面给予了高度的评价与称赞。

是世界上应用最广泛的专业统计软件,全球约有 

25

万家 

公司产品的用户,它们分布于通讯、医疗、银行、证券、保险、制造、商业、

市场研究、科研教育等多个领域和行业,全球 

500 

强中有 

80%的公司使用 

SPSS,而在

市场研究和市场调查领域有超过 

80%的市场占有率。

在国际学术界有条不成文的规定,

即在国际学术交流中,凡是用 

软件完成的计算和统计分析,可以不必说明算法,由

此可见其影响之大和信誉之高。

3

SPSS窗口

基本功能 

——建立 

数据文件

主要构件

●标题栏和系统状态栏

●菜单栏

●工具栏

文件以.sav 

为扩展名

2.输出窗口(Viewer)

∙以.spo 

编辑 

程序,通过运行主菜单的 

RUN 

命令将编辑好的程序一次性地提交给计算机

执行。

也可以将编好的程序保存为一个后缀为.sps 

的文件供以后需要的时候调用。

选择对话框 

Edit==>

Options

4

2.1.1 

定义新变量

大多数情况下我们需要从头定义变量,在 

10.0 

中,定义变量的操作界面和

FoxPro 

等数据库非常相似,只需单击左下方的 

Variable 

View 

标签就可以切换到变量定义

界面开始定义新变量。

① 

变量名必须以字母、汉字或@开头,剩下的字符可以是字母,数字,句点,

@,#,_,$等

② 

变量名不能以句点结尾

③ 

名字长度不能超过 

个字符

④ 

空格和特殊字符不能被用,如?

!

`,*

⑤ 

每一个变量名必须是唯一的,重复的变量名是不被允许的

⑥ 

变量名无大小写之分

⑦ 

下列关键词不能用作变量名

allNEEQTOleltbyorgtandnotgewith

举例:

locationloc#5x.1over$500

2.变量类型(Type):

变量类型可由变量类型对话框确定

5

在 

数据集中,变量分为 

种类型,主要有字符型变量

(String)和数值型变量(numeric)。

Numeric 

——数值型

Comma 

——加有逗号的数值型

Dot 

——加有圆点的数值型

Scientific 

notation 

——科学计数型

Date 

——日期型

Dollar 

——货币型

Custom 

currency 

——用户自定义型

String 

——字符型

变量值标签则在它右侧的 

Value 

框定义。

以性别

为例,单击 

框右半部的省略号,会弹出变量值标签对话框如下:

6

7

上部的两个文本框分别为变量值输入框和变量值标签输入框,分别在其中输

入“f”和“女生”,此时下方的 

Add 

钮变黑,单击它,该变量值标签就会被加

入下方的标签框内。

与此类似定义变量值“m”为“男生”,最后按 

OK,变量

值标签就设置完成。

切换回 

Data 

界面,然后选择菜单 

View==>

Value

Labels.

定义缺失值的作用:

凡是在定义的缺失值范围内的数据不参与统计分析。

有两类缺失值:

系统缺失值和用户缺失值。

数据长方形中任何空的数字单元都被认为是系统缺失值,用点“.”表示。

由特殊原因造成的信息缺失值被认为是用户缺失值,例如调查问卷中,被调查

者不愿意回答的项目可定义为用户缺失值。

单击 

missing 

框下相应变量右侧的省略号,会弹出缺失值对话框如下:

8

no 

values:

无缺失值,系统默认选项;

discrete 

定义离散缺失值,选择该选项后,激活下面 

个输入框,可

以在其中指定 

个数值作为缺失值,也可以少于 

个。

例如对于性别变量,值 

2,3,4 

被认为是非法的,在输入数据过程中有可能输入了这几个数,则可以把这 

个值分别输入

到 

个矩形框中;

range 

puls 

one 

optional 

miss:

定义一个缺失值的范围,选择该选项后,激

活下面 

个输入框。

low 

hight 

输入框中分别输入缺失值的下限和上限。

可以在最下

方的 

框中输入范围之外的一个离散值。

选择变量值显示时的对齐方式,系统默认是右对齐。

备选方式:

●Left 

——左对齐

●Right 

——右对齐

●Center 

——居中对齐

为了区分变量在分析中的不同作用,又按变量的度量方式分为三类:

选择变量的度量方式,系统默认是定距变量。

●Scale 

——定距变量必须是数值型变量,可以对其观测值进行四则运算。

●Ordinal 

——顺序变量,可以是数值型的,也可以是字符型的,可以对其观测值进

行排序。

9

SPSS(*.sav)

数据文件(6.0~10.0 

版)

SPSS/PC+(*.sys)

4.0 

版数据文件

Systat(*.syd)

*.syd 

格式的 

Systat 

Systat(*.sys)

*.sys 

portable(*.por)

便携格式的数据文件

EXCEL(*.xls)

数据文件(从 

5.0 

版~2000 

Lotus(*.w*)

Lotus 

SYLK(*.slk)

SYLK 

dBase(*.dbf)

dBase 

系列数据文件,(从 

II~IV)

Text(*.txt)

纯文本格式的数据文件

data(*.dat)

●Nominal 

——名义变量 

可以是数值型的,也可以是字符型的,常起分类作用。

使用该窗口,我们可以一次定义许多新变量,不会象老版本那样一个一个的定

义了。

2.1.2数据的输入

2.1.3数据的保存

在对数据做了修改后,保存数据文件是必不可少的工作之一。

选择菜单

File==>

Save,如果数据文件曾经存储过,则系统会自动按原文件名保存数据;

否则,就会弹出和选择 

Save 

as 

菜单时相同的 

对话框。

里面可以保存

的数据类型和可以打开的几乎一样多,选择合适的类型,确定就是了。

2.2 

读如其他格式的数据文件

可以直接读入许多格式的数据文件,

选择菜单 

Open==>

或直接单击快捷工具栏上的“”按钮,系统就会弹出 

Open

对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格

式,分别是:

选择所需的文件类型,然后选中需要打开的文件,SPSS 

就会按你的要求打开你要使用

的数据文件,并自动转换为数据 

格式。

2.3 File 

【Disp 

Info】

该菜单项用于显示数据的基本信息,选择它后会弹出非常类似于打开文件

的一个对话框用于选择数据文件,选择好后按 

OK,系统就会在结果窗口中列出

所选数据的基本情况,如建立时间、标签设置、记录数、变量设置等。

10

【Apply 

Dictionary】

即使用数据字典,该功能使你可以直接在新数据集中套用以前定义好的变

量设置(格式、标签等,但不包括数据类型),例:

打开 

Li1_1.sav 

文件,将

变量 

的长度从 

改为 

4,标签删掉,然后选择菜单 

Apply 

Data

Dictionary,在文件对话框中选择 

并按 

OK(即将 

的变量

设置按相同变量名一一套用在现在的数据集上)。

【Cache 

Data】

建立数据缓冲区。

以前 

每执行一条命令都会重新读取所需的数据,如

果是从远程用 

SQL 

调用数据库,这会非常的费时。

现在使用 

Cache 

Data,可以

将数据全部读入暂存盘,建立活动数据的缓冲区。

大大加快处理速度。

如果是

处理本机数据的话,该命令对速度的提升不是非常明显。

【Print 

Print 

Preview】

这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来,其中

Preview 

是新增加的,使用上和 

WPS2000 

的打印预览非常相似(其实用

的是同样的程序),不过和 

结果的打印程序一样,用 

直接打印数据

非常的浪费纸张。

【Stop 

Processor】

用于停止执行当前的 

命令。

由于 

处理速度非常的慢,如果你正在

对一个大型的数据执行统计命令,等了半天都没有结束,可是你的结果还没有

存,执行命令时又存不了,怎么办呢?

试试这个命令吧。

但并非所有的命令都

可以喊停的,许多数据库操作命令(计算变量,合并等)好象就停不了。

中,数据文件的编辑、整理等功能被集中在了 

Edit,Data 

Transform 

三个菜单项中。

Data:

Insert 

Variable:

在选中的单元格之前的一列插入一个新变量。

Cases:

在选中的单元格之前的一行插入一个新观测。

Goto 

Case:

定位到指定的观测值

Sort 

按某变量的取值对观测值进行排序。

Transpose:

对数据文件进行转置。

11

Merge 

Files:

合并数据文件。

Aggregate…:

对数据进行分类和不分类的汇总。

Orthogonal 

Design:

正交设计。

Split 

File:

按照某个分组变量对数据文件进行拆分。

Select 

Cases…:

选择观测值。

Weight 

对观测值加权。

下面我们将根据其功能来分别讲述。

观测与变量的查找

编辑(Edit) 

⇒ 

转至个案(Go 

to 

Case) 

转至(G)(Go 

Case)对话框

●增加一个新的行

激活需要添加行的下一行的任意单元,选择 

Edit 

Case

●删除一个行

单击要删除行的行头,将该行全部选中,按 

Delete 

观测数据的排序,特别是逐级排序,可以从统计角度了解整体数据的取值情况。

将数据集补钙产品.sav 

按“性别”降序,再按“问卷编号”升序排序

操作:

数据(Data)==>

排序个案(Sort 

Cases),系统弹出排序个案(Sort

Cases)对话框

下方的排列顺序(Sort 

Order)单选钮,有升序和降序两种选择。

请注意,该单

选钮是和上方的 

By 

框一起使用的,具体方法如下:

确认降序单选钮被选择,将“性别”选入 

框;

12

选择升序单选钮,将“问卷编号”选入 

框。

将观测(行)和变量(列)位置互换,特别适用于实现存/取 

Excel 

文件进行数据共享功能前

/后的预操作。

将数据集“补钙产品.sav”中的变量“性别”,“年龄”和“居住时间”进行转置

操作

①选择菜单 

Transpose,打开 

Transpose 

对话框;

②将需要转置的变量移入 

列表框;

③如果在数据文件中有一个变量是代表转置后各变量的变量名,则将该变量移入 

Name

列表框中;

否则转置后数据集的变量将被分别命名为“Var001”, 

“Var002”

“Var003”…;

OK

选取观测的子集

在统计分析时,有时并不需要对所有的观测进行分析,只需要对某些观测进行分析,

例如在补钙产品的市场调查中,我们只对女性被调查者的情况感兴趣,或者只有在本市居

住时间超过 

年的被调查者才具有统计分析价值。

另一种情况是在全部样品中抽取一小部

分样品进行分析,SPSS 

Cases 

可以实现这种样本筛选的功能。

仍以补钙产品数据

为例来说明。

①选择菜单数据(Data)=>

选择个案(Select 

Cases)打开 

Cases)对话

13

②制定样本筛选方式:

对话框右上 

下共有 

种筛选方式

∙ 

All 

cases:

不进行筛选,选中它则分析所有的记录;

If 

condition 

is 

satisfied:

按指定条件筛选,单击下面的 

按钮

在弹出的 

对话框可以设置筛选条件。

在右上方的输入框中输入条件表

达式。

条件表达式可以用键盘直接输入,也可以左侧的变量列表中选择变量,从下面的计

算器中选择数字和运算符号。

在右下方的 

Functions 

列表中有 

的常用函数供用户选择。

在本例中如果只相对居住时间超过 

年的被调查者进行分析,则在输入框中输入表达式

time>

14

Random 

sample 

of 

随机抽取观测,单击下面的 

按钮, 

在弹出的

对话框中设定随机抽取的观测数,有两种选择:

按百分

比抽取记录,在本例中如果想从所有的观测中抽取 

30%进行分析,则在 

Approximately

后的框中输入 

30;

或者精确设定从前 

个观测中随机精确抽取一定量的观测,在本例

中如果想从前 

个观测中随机抽取 

个,则按下表填写。

Based 

on 

time 

or 

case 

range:

按顺序抽样。

Range 

按钮,在弹出的 

Select

Cases:

子对话框中设定被筛选的观测的起止序号。

Use 

filter 

variable:

使用指定的过滤变量进行观测筛选。

选择这一项的前提是数

据文件中已经存在一个过滤变量。

所谓过滤变量即只取“0”“1”两个值的变量。

变量取值为“1”的观测将被选中,取值为“0”的观测将被删除。

③确定未被选中的观测的处理办法

对话框的左下 

output 

下有 

种选择

Filter 

out 

unselect 

则在数据文件中根据用户定义的选择条件自动生成一

个变量名为 

filter_&

的新筛选变量,同时未被选择的观测左端的观测序号上将被打上

一个斜杠,以后的分析将把这些观测排除在外,但这些观测并没有从数据文件中删除。

Copy 

select 

new 

dataset:

建立一个新数据集,仅包含选中的观测,

将新数据集的名输入 

dataset 

name 

后的框中。

Deleted:

未被选中的观测将被删除,一般不要使用。

注意:

当对数据集做出筛选后,所做的筛选将在以后的分析中一直有效,直到再次改变

选择条件为止。

用于对数据进行分类汇总,所谓分类汇总就是按指定的一个或多个分类变量(一般为

离散型变量)对观测值进行分组,对每组观测的其余变量(一般为连续型变量)值进行指

定的描述统计分析,结果可以存入新数据文件,也可以替换当前数据文件。

例如在补钙产品的市场调查中,我们想要知道按性别分类后,男性和女性被调查者的

平均年龄、平均年收入以及收入差距的大小。

①选择菜单(Data) 

=>

分类汇总(Aggregate),打开 

分类汇总(Aggregate)对话框

15

②选择分类变量:

把分类变量移入分组变量(BreakVariables)框,这里把变量

gender 

移入

选择汇总变量:

即想要对其计算描述性统计量的变量,这里把变量 

age 

income

移入 

Aggregate 

Variable(s)列表框中。

由于收入要计算均值和标准差两个统计量,所

以这里要将变量 

income 

移入两次

选择要计算的统计量

系统默认计算的统计量是均值(mean),要想改变计算的统计量,单击 

Aggregate

列表框中的某个变量,在单击 

Functions,打开 

Function 

子对话框

16

共有 

组函数

Summary:

为最常用的均值、中位数、标准差等统计量;

Specific 

Value:

同组的第一个观测值、最后一个观测值、最小值和最大值

Number 

cases:

分组后各组的观测数;

Percentages 

Functions:

分别给出处于某个取值区间的观测占各组观测总数的

百分比和比率。

例如,可以计算男性和女性被调查者分别有多少人的年龄超过 

40

岁。

Name 

&

Lable 

对产生的新变量重新命名。

选中 

save 

number 

cases 

in 

break 

group 

variable 

将各组的观测数作为新变量保存。

选择新生成的数据文件的保存方式,有两个选项:

Create 

data 

file:

定义一个新文件以存储汇总的结果,右侧的 

钮用于

具体文件名的定义,默认文件名为 

AGGR.sav;

Replace 

working 

file 

单选钮:

用汇总的结果替换原来的数据。

⑧ 

OK.

17

由特殊原因

造成的信息缺失值被认为是用户缺失值,例如调查问卷中,被调查者不愿意回答的项目可

定义为用户缺失值。

统对用户缺失值有较好的替代方法

转换(Transform) 

替换缺失值(Replace 

values),打开替

换缺失值(Replace 

values)对话框

选择左侧的变量名列表框中选择有缺失值的变量,将其添加到 

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 人文社科 > 设计艺术

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2