SPSS教程2利用SPSS进行统计描述.docx

资源描述

SPSS教程2利用SPSS进行统计描述.docx

《SPSS教程2利用SPSS进行统计描述.docx》由会员分享，可在线阅读，更多相关《SPSS教程2利用SPSS进行统计描述.docx（14页珍藏版）》请在冰点文库上搜索。

SPSS教程2利用SPSS进行统计描述.docx

SPSS教程2利用SPSS进行统计描述

SPSS教程2：

利用SPSS进行统计描述

来源：

生物谷2006-09-0518:

一、统计描述方法

在教育技术研究过程中收集到大量的资料数据，但从这些杂乱无章的资料中，很难对其总体水平与分布状况做出评价判断。

因此，必须采用一些适当的方法对这些资料进行处理，使之简约化、分类化、系统化，从中发现它们的分布规律，掌握总体的特征，以便对其水平做出客观的评价。

  　　统计描述方法，是研究简缩数据并描述这些数据的统计方法。

将搜集来的大量数据资料，加以整理、归纳和分组，简缩成易于处理和便于理解的形式，并计算所得数据的各种统计量，如平均数、标准差、以及描述有关事物或现象的分布情况、波动范围和相关程度等，以揭示其特点和规律。

（一）数据资料的整理和表示  　　在教育技术研究中，我们用各种方法搜集来的资料，一般是零散的，它只反映个别现象的个别特征，必须经过整理加工，使之系统化，才能计算统计指标，进行统计分析，为进一步研究提供有用的信息，首先要进行的是统计整理，它包含以下几部分内容：

  　　1．数据检查   　　主要检查数据的完整性与正确性。

统计资料完整性的检查，就是要根据调查项目检查是否填写齐全，避免遗漏，删去重复。

正确性检查，就是检查搜集的资料是否真实可靠。

特别是统计数字的真实性是统计工作的生命，统计资料的检查整理必须抓紧这一环。

   　　数据检查可分为逻辑检查和计算检查两种方法。

逻辑检查，是从理论和一般常识上来检查资料内容是否合理，指标之间是否矛盾。

计算检查是检查统计数字在计算方法和计算结果上有否错误。

  　　2．数据分类  　　数据分类就是把搜集来的数据进行分组归类。

数据分类要做到既不重复、不遗漏，又不混淆，一般又可分为品质分类和数量分类。

   　　品质分类：

是按事物性质划分为不同的组别、种类。

如以性别为标志可分为男与女；按“理解能力”、“学习态度”等为标志，又可分为好、较好、一般、差等几种水平，每种水平可看成类，每一类可给以相当的数量。

可以通过各类所包含的数据再进行数量化的比较和分析。

   　　数量分类：

是按数量的属性分类。

有顺序排列法、等级排列法和次数分布法等。

  　　⒊数据的排序  　　数据排序：

将各数据从大到小或从小到大进行排列。

这样就可以看出最高分和最低分是多少，各分数出现的次数和位于中间的是什么数等。

包括等级排列和次数排序。

  　　等级排列：

即根据顺序排列划分等级。

但与顺序排列不同，它是按数值所含的意义确定的。

若是学习成绩，应以数值大的排为第一等级；若是反映时间，则将最小的数值排为第一等级。

  　　次数排序：

即根据在指定的数值范围内，数据出现的频数大小排序。

  　　⒋数据统计表  　　就是把所研究的教育技术现象和过程的数字资料，以简明的表格形式表现出来。

它可以避免文字的冗长叙述，便于比较各项目之间的相互关系，便于总计、平均和其他统计值的计算，便于检查计算错误和项目遗漏。

   　　⒌数据的图示法   　　数据的图示法是利用几何图形或其他图形等的描绘，把所研究对象的特征、内部结构、相互关系和对比情况等方面的数据资料，绘制成整齐简明的图形。

它是用以说明研究对象和过程的量与量之间对比关系的一种方法。

它能准确地表现统计资料，有助于对统计资料进行比较、对照、分析和研究。

图示法，具有直观、形象，便于记忆和思考以及表达语言难以说清的内容之优点。

   　　在教育技术研究中常用的有条形图、曲线图、直方图和圆形图等，其绘制方法是大家所熟知的，这里不作介绍。

（二）特征参数的计算  　　为了分析研究对象总体的特征，不必对总体中每一个单位都进行研究。

而是通过抽样方法，按照随机性原则，从全部对象中，只抽取部分单位（样本组）加以研究，对于每组样本，首先应对其基本特征参数进行计算，以给出整体特征的统计描述。

并根据统计数据，对总体对象作出具有一定可靠程度的估计和推测。

常用的特征参数包括：

  　　⒈集中量数   　　

（1）算术平均数，用

表示，设

为各次观察的结果，则有:

 　　上式中，

表示平均分

表示每个学生的得分，n表示学生人数。

（2）中数，是指一组按大小顺序排列起来的量数中的中间点的数，又称中位数，用Mdn来表示。

  　　（3）众数，是指一列数中出现次数最多的数值，常用M表示。

   　　2．差异量数 

差异量数是表示量数之间的差异程度的一些统计量的总称，它是用以表示一群量数的离散情况或离中趋势。

 　　集中量数在量尺上是一个点，表示各量数所在的位置。

差异量数在量尺上是一段距离，表示一个量数与另一个量数或中心点之间的距离。

只有知道了差异量数的大小，才能了解集中量数的代表性如何。

差异量数愈大，集中量数的代表性愈小；差异量数愈小，则集中量数的代表性愈大。

  　　在统计分析中经常应用的是标准差，它是与平均数的差数的平方和的平均数的算术平方根。

　　上式中，S为标准差   　　

，为每个学生的得分与平均分的离差，上述公式计算步骤如下：

（1）先求出各数据与平均分的离差

； 　　

（2）求各个离差的平方和

； 　　（3）将

除以n再开方，即得标准差。

  　　3．标准分数 

标准分数，又称Z分数。

是以标准差为单位表示一个分数在团体分数中所处的位置。

　　标准分数的计算公式：

　　公式中x－原始分数，

－平均分数，S－标准差。

  　　（三）次数分布

次数分布又称次数分配。

是指总体或样本按随机变量（数据）大小次序在出现频率上的排列。

 　　一般采用次数分布表、次数分布直方图或次数分布曲线来表示。

【例6-1】现有50名学生的成绩，原始数据如表6-1所示：

（n=50）

操作步骤：

　　⒈录入数据  　　录入数据的过程分为两个步骤，一是定义变量，二是录入变量值。

（1）定义变量：

“学号”、“组别”与“成绩”。

（2）录入变量值：

在数据编辑窗口中，按照表1的内容，将各变量值一一录入。

录入后的部分界面如图6-14所示。

　　⒉数据的等级排序  　　

（1）选择“Data→SortCases”命令，弹出“SortCases”对话框，把“成绩”变量选入“Sortby”中，并在SortOrder中选择“Descending（降序）”选项，将学生成绩按降序排列，如图6-15所示，单击“OK”按钮。

（2）排序结果 　 　　排序结果在数据编辑窗口可以即时浏览，如图6-16所示，并可以通过选择“File→Print…”命令，将结果打印输出。

　　⒊平均分与标准差的计算  　　

（1）计算总平均分与标准差  　　①选择“Analyze→DescripitiveStatistic→Descripitives…”命令，弹出“Descripitive”对话框，从左侧将“成绩”变量选入“Variables”栏中，如图6-17所示。

　　②单击“OK”按钮，提交运行，输出结果如表6-8所示。

（2）分别计算两组学生的平均分和标准差  　　由于录入数据时两组数据是混合一列，所以在统计之前要将两组学生的数据拆分，在进行统计处理。

  　　①数据拆分  　　选择“Data→SplitFile…”命令，弹出“SplitFile”对话框，激活“Organizebygroup”选项，从左侧选择“性别”变量进入“GroupsBasedon”栏目，最后激活“Sortthefilebygroupingvariables”选项，如图6-18所示。

单击“OK”按钮。

 　　②与计算总平均分与标准差相同，选择“Analyze→DescripitiveStatistic→Descripitives…”命令，弹出“Descripitive”对话框，从左侧将“成绩”变量选入“Variables”栏中。

如图6-17所示。

  　　③单击“OK”按钮，提交运行，输出结果如表6-9所示。

　　⒋统计特征分析  　　根据SPSS的统计处理所得结果如表6-10所示。

四、次数分布表的形成

　　【例6-4】根据表6-1中给出的50名学生的学习成绩，计算60分以下，60-70，70-80，80-90，90分以上的次数分布表。

　　操作步骤：

  　　1．录入数据  　　定义变量“学号”和“成绩”，并按表3内容输入数据  　　2．转换数据，生成新变量  　　

（1）选择“Transform→Recode→IntoDifferentVaribles…”命令，弹出“RecodeintoDifferentVariables”对话框，将“成绩”选入“NumericVariable”框中，并在“OutputVariable”中输入新变量的名字“分组”，单击框后的“Change”按钮，如图6-19所示。

（2）单击“OldandNewValues…”按钮，弹出“RecodeintoDifferentVariables:

OldandNewValues”对话框。

  　　在对话框中左侧第二个“Range”框中输入60，然后在“NewValue”框中的“Value”后输入1，单击“Add”按钮，右侧的文本框中显示“Lowestthru60→1”，表示用1代表60以下的分数。

  　　在第一个“Range”框中输入“60”though“70”，然后在“Value”后输入2，单击“Add”按钮加入，即用2代表60到70之间的分数。

同样，用3代表70到80之间的分数，用4代表80到90之间的分数。

  　　在第三个“Range”框中输入“90”，然后在“NewValue”框中的“Value”后输入5，单击“Add”按钮加入，即用5代表90以上的分数。

 设置完成后如图6-20所示。

 　　（3）单击“Continue”按钮，回到图11的对话框中，单击“OK”按钮，生成新的变量“分组”，界面如图6-21所示。

　　3．统计分析  　　

（1）选择“Analyze→DescriptiveStatistic→Frequencies”命令，弹出“Frequencies”对话框，从左侧选择“分组”，使其进入“Variable（s）”框中，如图6-22所示。

（2）选中“Displayfrequencytables”复选框，表示显示次数分布表。

  　　（3）单击“Statistics”按钮，弹出“Frenquency:

Statistics”对话框，视需要进行选择，如图6-23所示。

本例中采用默认值，设置完成后单击“Continue”按钮。

　　（4）在图6-22所示的对话框中，单击“Charts”按钮，弹出“Frenquencies:

Charts”对话框，如图6-24所示。

本例中选择“Histograms”（直方图）和“Withnormalcurve”（带有正态曲线）两项，单击“Continue”按钮。

　　（5）在图6-22所示的对话框中，单击“Format”按钮，弹出“Frenquencies:

Format”对话框，如图6-25所示。

本例中取默认值，设置完成后单击“Continue”按钮。

 （6）在图6-22所示的对话框中，单击“OK”按钮，提交运行，输出结果如表6-11所示。

　　4．结果分析  　　根据表6-11的输出结果可知，在60分以下的有8人，60-70分之间的有6人，70-80分之间的有12人，80-90之间的有18人，90分以上的有6人。

展开阅读全文