2数据文件的建立与编辑.docx

资源描述

2数据文件的建立与编辑.docx

《2数据文件的建立与编辑.docx》由会员分享，可在线阅读，更多相关《2数据文件的建立与编辑.docx（32页珍藏版）》请在冰点文库上搜索。

2数据文件的建立与编辑.docx

2数据文件的建立与编辑

第二讲：

数据文件的建立与编辑管理

一、数据文件的建立

1、测量方式（Measure）

运用统计学方法分析时十分强调“对号入座”。

SPSS中变量有三种测量方式，分别是：

尺度变量（Scale）

顺序变量（Ordinal）、

分类变量（Nominal）：

各对应与统计学中的计量资料、等级资料以及计数资料（包括二分类与无序多分类）。

在SPSS的默认的情况下，所有的数值、文字输入都将被作为Scale处理，不同的是输入数值将完整保留，而文字全都是被转变为

。

2、定义变量（VariableView）

运行SPSS后，将进入DataEditor界面，如下：

窗口顶部显示为“SPSSDataEditor”，表明现在所看到的是SPSS的数据管理窗口。

这是一个典型的Windows软件界面，有菜单栏、工具栏。

特别的，工具栏下方的是数据栏，数据栏下方则是数据管理窗口的主界面。

该界面和EXCEL极为相似，由若干行和列组成，每行对应了一条记录（Case），每列则对应了一个变量（Variable）。

由于现在我们没有输入任何数据，所以行、列的标号都是灰色的。

请注意第一行第一列的单元格边框为深色，表明该数据单元格为当前单元格。

如果直接输入数据很可能不能满足统计分析的要求，所以首先要定义变量。

单击VariableView：

这就是变量定义窗口，我们需要对变量名称（Name）、类型（Type）、宽度（Width）、小数位数（Decimals）、变量标签（Label）、变量值标签（Values）、缺失值（Missing）、显示数据的宽度（Columns）、对齐方式（Align）、测量方式（Measure）。

Name：

总长度不可以超过8个字符（4个汉字）；系统不分大小写，首字符必须是字母（或汉字），其后可接字母或数字，尽量不要在变量名称中使用标点符号或运算符号（例如：

？

、－、！

、*等）；不可以将下划线“_”和圆点“.”作为变量名的最后一个字符（但是在中文输入法，例如清华紫光时上述法则有时不成立）；变量名不可使用“all、and、by、eq、ge、gt、le、ne、not、or、to、with等SPSS系统保留字。

Type：

在SPSS系统中，共有8种类型的变量设置，单击Type：

Numeric：

标准数值型；这是系统默认型别，可以在width和decimal中调节总长度与小数位数（小数点也占一位）。

Comma：

带逗号的数值型；整数部分从右向左每3位加一个逗号；例如原始数据是6789.401，如果选择comma，则按照6,789.401录入；在dataview中SPSS将它还原为6789.401。

Dot：

带句号的数值型；整数部分从右向左每3位加一个圆点而小数点表达为逗号；例如原始数据是7889.12，如果选择dot，则按照7.889,12录入；在dataview中SPSS仍将表达为7.889,12。

Scientificnotation：

科学计数型；例如原始数据为78.123，输入时仍可按照78.123输入，但是SPSS将会把它转变为7.8E+01（7.8123×101）表达。

Date：

日期型；使用者可以从系统提示的日期显示形式中选择自己需要的；

例如选择dd-mmm-yyyy，则2009年2月20日应该输入为20-FEB-2009；如果选择mm/dd/yyyy，则应该输入为02/20/2009。

但是无论是何种输入方式，data型资料将不能直接参与运算，必须通过有关的日期转换函数转换后才行。

Dollar：

带美元符号的数值型；使用者可以从系统提供的形式中选择，系统将自动生成美元符号。

默认为11位数（1000亿），如果超出将按照科学计数法表达，同时数据前加美元符号。

Customcurrency：

自定义数值型；共有5种形式，系统将其分别命名为CCA（CC为customcurrency的简写，A表示第一种）至CCE，可以在edit-option-currency选项卡中作定义，定义之后可以从sampleoutput预览修改结果。

String：

字符串型；选择该中表达类型后，使用者可以在dataview中输入中文或英文。

字符串型变量不能参与统计运算，而且字符串中大小写字母将被系统辨认为两个完全不同的字符。

Width：

输入时的变量值宽度，默认为8位。

Decimals：

小数位数，默认为2位。

Label：

变量标签；用于说明变量所代表的实际意义，特别对于在name中无法准确表达的变量名称可以通过标签详细说明。

Values：

变量值标签；用于详细说明变量值的具体意义，特别是对于分类变量或等级变量往往用具体数值代替分类或等级，此时最好定义数值的变量标签以备分析与查阅方便。

例如变量名称为sex，其label为调查对象性别，values分别是0代表男性、1代表女性。

Missing：

缺失值定义；在统计数据录入过程中有时会遇到观察值不详或数据录入失误，此时可以定义缺失值。

Nomissingvalues：

无缺失值，系统默认。

Discretemissingvalues：

离散的缺失值；例如性别的取值定义为0－男，1－女；但是在输入过程中有时可能会误录为3或其他非0、1数值，此时可以设定2、3、4为缺失值，如果在数据输入时出现2、3、4系统将按照缺失值处理，该单元格为一个空格。

Rangeplusoneoptionaldiscretemiss：

定义某一个范围，同时还有一个不在此范围的单一数值作为缺失值（区间）；例如人群身高调查，正确的数值介于（0，1.9），可在low中填入1.9，high中可以任意填一个十分大的数值如1000。

以上定义常常可以与frequencies命令结合使用。

Columns：

显示时的变量值宽度；显示宽度不影响机内计算，只影响显示。

Align：

对齐方式；可选择左/中/右对齐。

Measure：

意义如前所述；该项设置在绘制交互作用统计图时十分有用。

通常，即使是分类变量与等级变量，输入时仍然将变量当作数值录入，并在values中说明，使得这些变量参与统计分析。

3、数据的录入：

单击DataView选项卡，将鼠标移到单元格上，单击该单元格就可以输入数据。

要注意数据编排的顺序：

变量编排方向

数据输入方向

在SPSS中变量以及数据编排的顺序是有一定规律的：

变量总是在最上方，从左到右编排；而数据总是在所对应的变量下方，自上而下编排；这一特点与Excel不同，在Excel中变量所对应的数值既可以横排，也可以纵排。

另外，要注意变量值的格式（Type），一旦在variableview中定义完毕，就要按照要求输入，否则系统会将其作为缺失值处理。

*请将课本P8-9，例2.1的数据输入SPSS中。

*请将课本P13，习题1、2的数据输入SPSS中

4、查看变量信息与文件信息：

变量值输入之后可以用Utilities菜单中的Variable命令，或单击工具栏中的“

”图标，即可打开变量信息对话框。

对话框显示的是光标所在位置变量值对应的变量信息。

该对话框中的第一行是变量名（name），其后有“<”号，表示该变量是字符串变量（string）；变量标签栏（label）没有信息；第三行是变量格式（type），A表示字符串型，8表示长度；往下是缺失值定义（missingvalues），none表示没有规定缺失值；接着是测量方式（measurement），表示为分类变量（nominal），所以该变量所对应的变量值11、12、15没有大小之别，仅仅起区分作用。

如果数据库中有很多变量，如果要一一点击查看比较麻烦，可以通过查看文件信息，显示该数据库中所有变量的信息。

具体操作方法为：

Utilities—FileInfo，我们将在结果输出窗口（SPSSViewer）看到该数据库变量信息。

二、数据文件的编辑整理

1、数据文件的编辑与管理——File菜单

新建

打开

打开数据库

从文本文档读取

保存

另存为

显示数据文件信息

建立数据缓冲区

打印

打印预览

切换服务器

停止运算