二SPSS基本统计分析报告文档格式.docx

资源描述

二SPSS基本统计分析报告文档格式.docx

《二SPSS基本统计分析报告文档格式.docx》由会员分享，可在线阅读，更多相关《二SPSS基本统计分析报告文档格式.docx（21页珍藏版）》请在冰点文库上搜索。

二SPSS基本统计分析报告文档格式.docx

均值（Mean）

算术平均值

众数（Mode）

n个数据中出现次数最多的数

中位数（Median）

排在中间位置的数

百分位数（Percentile）

数据从小到大排序，处在k%位置的数称为第k百分位数

表示离散程度的统计量

方差（Variance）

标准差（Std.Deviation）

极差（Range）

最大值与最小值之差

四分位极差（Interquartile）

第75百分位数与第25百分位数之差

表示分布形状特征的统计量

偏度（Skewness）

接近0，对称分布；

0，右偏态；

0，左偏态。

峰度（Kurtosis）

接近0，为正态分布；

0，陡峭；

0，平缓。

1.2.1主要作用

可对数据按组进行归类整理，形成对某一变量不同水平的频数分布表和图形，以便于对数据的分布趋势作出初步判断。

1.2.2实例分析

打开文件《世界500强公司》，对世界500强公司数据进行频数分析：

（1）对世界500强公司主营业务进行频数分析；

（2）对世界500强公司的营业收入进行频数分析并画出直方图；

（3）对我国进入500强的公司进行频数分析。

具体操作如下：

题1.对世界500强公司主营业务进行频数分析：

AnalyzeDescriptiveStatisticsFrequencies，打开Frequencies对话框，如下图。

题2.对世界500强公司的营业收入进行频数分析并画出直方图

题目分析：

由于营业收入属于数值型变量，其中每一数值都不相同，所以直接做频数分析没有意义。

应将其按数值大小分成不同区间，然后作频数分析；

而这一步应首先基于对数值进行描述统计，找出最小值和最大值。

具体步骤分为描述统计、分组（通过“重新编码”（Recode））、频数分析等三步。

描述统计：

AnalyzeDescriptiveStatisticsDescriptives，打开如下对话框。

根据最小值和最大值，对原数据中营业收入进行重新分组：

（0-29999.9），（30000-59999.9），（60000-89999.9），（90000-119999.9），（120000-149999.9），（150000-179999.9），（180000-209999.9），（210000-）

分组（通过“重新编码”（Recode））：

TransformRecodeIntoDifferentVariables（重新编码为新的变量）

此时我们会看到数据编辑窗口中变量栏多了一个：

收入分组。

频数分析：

现在可以对新的变量：

收入分组进行频数分析了（Charts选项中选择histograms，并勾选正态曲线）。

步骤同一。

结果如下两图。

题3：

对我国进入500强的公司进行频数分析。

（1）首先挑选出中国的公司，可以通过筛选观测量来完成。

具体操作：

DataSelectCases，点选If对话框，然后设定“总部所在”为“中国”（总部所在=“中国”）。

将未被选中的数据进行删除，将选中的数据以“中国”为名另存到桌面上。

见下图。

Ok之后将文件另存到桌面。

（2）对中国进入500强公司进行频数分析。

打开中国.sav文件，AnalyzeDescriptiveStatisticsFrequencies，打开Frequencies对话框，在charts选项中选择“BarCharts”，输出结果如下。

1.3.1主要作用

对变量进行描述性统计分析，计算均值、标准差、全距和均值标准误差等。

1.3.2实例分析

刚才已经使用过。

可对500强进行描述统计，操作后输出结果如下：

对结果的解释可参照教科书。

习题：

✓对“frequencies-舒张压.sav”文件中的数据进行频数分析（以10分组）；

✓练习2

1.4.1主要功能：

此过程可检查数据是否有错误、考察样本分布特征及对样本分布规律作初步考察。

剔除奇异值和错误数据。

探测数据的错误来源

✓人为的数据差错

✓仪器测量的误差

✓输入数据时的手误，如：

小写的“l”与“1”、“o”与“0”

数据探测的重要性

由于数据的采集和输入可能出现的差错，在分析之前要检查数据的真实性。

1.4.2实例分析

（1）对日本进入500强的企业进行探索分析，并用茎叶图和箱线图显示。

首先筛选出日本公司，步骤同上。

Analyze--DescriptiveStatistics--Explore顺序单击，打开Explore主对话框。

如图：

点击ok后，会出现输出窗口，如下：

百万美元Stem-and-LeafPlotfor

filter_$=Selected

FrequencyStem&

Leaf

33.001.000000000000011112222233333333444

15.001.556666666778999

11.002.00001122333

6.002.555669

2.003.03

.003.

7.004.0011333

1.004.9

12.00Extremes（>

=54997）

Stemwidth:

10000.0

Eachleaf:

1case（s）

茎叶图从左到右分为三部分：

频数、茎和叶、茎是整数部分，叶是小数部分，Stemwidth表示茎宽。

每行的茎和叶组成的数字再乘以茎宽，即得到实际数据的近似值，实际数据中与该近似值靠近的值的个数即为频数表示的个数。

例如：

从茎叶图中可以看出，25000<

cases<

30000的数据一共6个，分别大致为25000、25000、25000、26000、26000、29000（根据所在位数的数字，而非四舍五入）。

（2）按主营业务绘制日本500强公司的箱线图

首先用SelectCases选出500强中的所有银行业（If=”银行”）。

然后用GraphsBoxplot，打开箱线图对话框，如图：

421/17

对“explore-合金温度测试.sav”数据文件进行探索分析，并利用Boxplot绘制新型合金的箱线图，找出其中的极端值。

作用：

对数据进行整理汇总，并作统计分析（仅举例均值、标准差、最大值及最小值），以便于阅读和分析。

1.5.1样品汇总报告（CaseSummaries）

打开文件“房屋地段与销售情况.sav”，具体操作如下：

AnalyzeReportsCaseSummaries，即会出现如下对话框。

随后可见输出结果（对所需图表右击来选择输出形式：

图-以图像形式；

表-可以两种形式，图像和表格）：

1.5.2行形式报告（ReportSummariesinRows）

统计量以行的形式列出。

AnalyzeReportsReportSummariesinRows，即会出现如下对话框。

房屋Page1

地段标价出售价格

________________________

城中心

Mean32503330

Minimum28002800

Maximum36003650

StdDev328338

近郊区

Mean18921835

Minimum17801650

Maximum22502300

StdDev179245

卫星城

Mean20642070

Minimum19001950

Maximum24002350

StdDev197168

远郊区

Mean17681726

Minimum16701650

Maximum18801800

StdDev9672

GrandTotal

Mean22272221

StdDev627681

1.5.3列形式报告（ReportSummariesinColumns）

操作过程和行形式报告相似

Page1

标价标价标价出售价格出售价格出售价格

地段MeanMinimumMaximumMeanMinimumMaximum

____________________________________________________________

城中心325028003600333028003650

近郊区189217802250183516502300

卫星城206419002400207019502350

远郊区176816701880172616501800

根据“各地区普通高等学校（机构）教职工情况（2005年）.xls”

（1）建立“各地区普通高等学校（机构）教职工情况”的spss数据文件；

（2）对其中“正高级”人数进行描述统计；

（3）用“列形式报告”汇总文件中五种职称类型人数的均值、最大值和最小值。

展开阅读全文