二SPSS基本统计分析报告文档格式.docx
《二SPSS基本统计分析报告文档格式.docx》由会员分享,可在线阅读,更多相关《二SPSS基本统计分析报告文档格式.docx(21页珍藏版)》请在冰点文库上搜索。
![二SPSS基本统计分析报告文档格式.docx](https://file1.bingdoc.com/fileroot1/2023-4/30/e4e1af77-423d-4f7f-aa36-4437dba441ee/e4e1af77-423d-4f7f-aa36-4437dba441ee1.gif)
均值(Mean)
算术平均值
众数(Mode)
n个数据中出现次数最多的数
中位数(Median)
排在中间位置的数
百分位数(Percentile)
数据从小到大排序,处在k%位置的数称为第k百分位数
表示离散程度的统计量
方差(Variance)
标准差(Std.Deviation)
极差(Range)
最大值与最小值之差
四分位极差(Interquartile)
第75百分位数与第25百分位数之差
表示分布形状特征的统计量
偏度(Skewness)
接近0,对称分布;
>
0,右偏态;
<
0,左偏态。
峰度(Kurtosis)
接近0,为正态分布;
0,陡峭;
0,平缓。
1.2.1主要作用
可对数据按组进行归类整理,形成对某一变量不同水平的频数分布表和图形,以便于对数据的分布趋势作出初步判断。
1.2.2实例分析
打开文件《世界500强公司》,对世界500强公司数据进行频数分析:
(1)对世界500强公司主营业务进行频数分析;
(2)对世界500强公司的营业收入进行频数分析并画出直方图;
(3)对我国进入500强的公司进行频数分析。
具体操作如下:
题1.对世界500强公司主营业务进行频数分析:
AnalyzeDescriptiveStatisticsFrequencies,打开Frequencies对话框,如下图。
题2.对世界500强公司的营业收入进行频数分析并画出直方图
题目分析:
由于营业收入属于数值型变量,其中每一数值都不相同,所以直接做频数分析没有意义。
应将其按数值大小分成不同区间,然后作频数分析;
而这一步应首先基于对数值进行描述统计,找出最小值和最大值。
具体步骤分为描述统计、分组(通过“重新编码”(Recode))、频数分析等三步。
描述统计:
AnalyzeDescriptiveStatisticsDescriptives,打开如下对话框。
根据最小值和最大值,对原数据中营业收入进行重新分组:
(0-29999.9),(30000-59999.9),(60000-89999.9),(90000-119999.9),(120000-149999.9),(150000-179999.9),(180000-209999.9),(210000-)
分组(通过“重新编码”(Recode)):
TransformRecodeIntoDifferentVariables(重新编码为新的变量)
此时我们会看到数据编辑窗口中变量栏多了一个:
收入分组。
频数分析:
现在可以对新的变量:
收入分组进行频数分析了(Charts选项中选择histograms,并勾选正态曲线)。
步骤同一。
结果如下两图。
题3:
对我国进入500强的公司进行频数分析。
(1)首先挑选出中国的公司,可以通过筛选观测量来完成。
具体操作:
DataSelectCases,点选If对话框,然后设定“总部所在”为“中国”(总部所在=“中国”)。
将未被选中的数据进行删除,将选中的数据以“中国”为名另存到桌面上。
见下图。
Ok之后将文件另存到桌面。
(2)对中国进入500强公司进行频数分析。
打开中国.sav文件,AnalyzeDescriptiveStatisticsFrequencies,打开Frequencies对话框,在charts选项中选择“BarCharts”,输出结果如下。
1.3.1主要作用
对变量进行描述性统计分析,计算均值、标准差、全距和均值标准误差等。
1.3.2实例分析
刚才已经使用过。
可对500强进行描述统计,操作后输出结果如下:
对结果的解释可参照教科书。
习题:
✓对“frequencies-舒张压.sav”文件中的数据进行频数分析(以10分组);
✓练习2
1.4.1主要功能:
此过程可检查数据是否有错误、考察样本分布特征及对样本分布规律作初步考察。
剔除奇异值和错误数据。
探测数据的错误来源
✓人为的数据差错
✓仪器测量的误差
✓输入数据时的手误,如:
小写的“l”与“1”、“o”与“0”
数据探测的重要性
由于数据的采集和输入可能出现的差错,在分析之前要检查数据的真实性。
1.4.2实例分析
(1)对日本进入500强的企业进行探索分析,并用茎叶图和箱线图显示。
首先筛选出日本公司,步骤同上。
Analyze--DescriptiveStatistics--Explore顺序单击,打开Explore主对话框。
如图:
点击ok后,会出现输出窗口,如下:
百万美元Stem-and-LeafPlotfor
filter_$=Selected
FrequencyStem&
Leaf
33.001.000000000000011112222233333333444
15.001.556666666778999
11.002.00001122333
6.002.555669
2.003.03
.003.
7.004.0011333
1.004.9
12.00Extremes(>
=54997)
Stemwidth:
10000.0
Eachleaf:
1case(s)
茎叶图从左到右分为三部分:
频数、茎和叶、茎是整数部分,叶是小数部分,Stemwidth表示茎宽。
每行的茎和叶组成的数字再乘以茎宽,即得到实际数据的近似值,实际数据中与该近似值靠近的值的个数即为频数表示的个数。
例如:
从茎叶图中可以看出,25000<
cases<
30000的数据一共6个,分别大致为25000、25000、25000、26000、26000、29000(根据所在位数的数字,而非四舍五入)。
(2)按主营业务绘制日本500强公司的箱线图
首先用SelectCases选出500强中的所有银行业(If=”银行”)。
然后用GraphsBoxplot,打开箱线图对话框,如图:
421/17
对“explore-合金温度测试.sav”数据文件进行探索分析,并利用Boxplot绘制新型合金的箱线图,找出其中的极端值。
作用:
对数据进行整理汇总,并作统计分析(仅举例均值、标准差、最大值及最小值),以便于阅读和分析。
1.5.1样品汇总报告(CaseSummaries)
打开文件“房屋地段与销售情况.sav”,具体操作如下:
AnalyzeReportsCaseSummaries,即会出现如下对话框。
随后可见输出结果(对所需图表右击来选择输出形式:
图-以图像形式;
表-可以两种形式,图像和表格):
1.5.2行形式报告(ReportSummariesinRows)
统计量以行的形式列出。
AnalyzeReportsReportSummariesinRows,即会出现如下对话框。
房屋Page1
地段标价出售价格
________________________
城中心
Mean32503330
Minimum28002800
Maximum36003650
StdDev328338
近郊区
Mean18921835
Minimum17801650
Maximum22502300
StdDev179245
卫星城
Mean20642070
Minimum19001950
Maximum24002350
StdDev197168
远郊区
Mean17681726
Minimum16701650
Maximum18801800
StdDev9672
GrandTotal
Mean22272221
StdDev627681
1.5.3列形式报告(ReportSummariesinColumns)
操作过程和行形式报告相似
Page1
标价标价标价出售价格出售价格出售价格
地段MeanMinimumMaximumMeanMinimumMaximum
____________________________________________________________
城中心325028003600333028003650
近郊区189217802250183516502300
卫星城206419002400207019502350
远郊区176816701880172616501800
根据“各地区普通高等学校(机构)教职工情况(2005年).xls”
(1)建立“各地区普通高等学校(机构)教职工情况”的spss数据文件;
(2)对其中“正高级”人数进行描述统计;
(3)用“列形式报告”汇总文件中五种职称类型人数的均值、最大值和最小值。