数据正态性检验及正态转化在spss中的实现.docx

资源描述

数据正态性检验及正态转化在spss中的实现.docx

《数据正态性检验及正态转化在spss中的实现.docx》由会员分享，可在线阅读，更多相关《数据正态性检验及正态转化在spss中的实现.docx（11页珍藏版）》请在冰点文库上搜索。

数据正态性检验及正态转化在spss中的实现.docx

数据正态性检验及正态转化在spss中的实现

数据正态性检验及正态转换在spss中的实现

1数据正态性检验

1.1观察分布，预先判断

主要观察直方图，以及根据峰度和偏度粗略估计研究变量的分布。

采用spss中描述统计中的频率分析来实现，具体操作如下：

（1）在spss中打开数据资料文件，依次点击“分析—描述统计—频率”，如下图：

（2）在弹出的对话框中，选择左边方框中要研究的变量，点击中间的箭头，将其选入右边的对话框，本文选择“胫围”作示

（3）

（4）

（5）

（6）然后点击“确定”选项，得出如下结果：

统计一栏中包括有偏度及其标准误差、峰度及其标准误差。

由结果可知：

2.486（偏度）>1.96*0.061（偏度标准误差）；23.951（峰度）>1.96*0.126（峰度标准误差），推测该胫围数据不符合正态分布。

1.2正态分布显著性检验

采用spss中非参数分析方法对数据资料进行正态性检验，具体步骤如下：

（1）在spss中打开数据资料文件，依次点击“分析—非参数检验—单样本k-s”，如下图：

（2）在弹出的对话框中，选择左边方框中要研究的变量，点击中间的箭头，将其选入右边的对话框，本文选择“胫围”作示例分析，如下图：

（3）之后，点击最右边的“精确”选项卡，在弹出的对话框中有三个选项，1、“仅渐进法”：

是基于渐进分布的显著性水平的检验指标，适用于大样本，如果样本过小或者分布不好，就会影响检验的效力；2、“蒙特卡洛法”：

适用于精确显著性水平的无偏估计，如果样本过大，数据处理过程太长，就应该使用这个选项；3、“精确”：

精确计算概率值，可以设定数据处理的时间，如果数据处理时间超过了所设定时间30分钟，就应该使用“蒙特卡洛法”。

本文选择“仅渐进法”进行正态显著性检验，点击继续，如下图：

（4）然后，点击“选项”的选项卡，在弹出的对话框中勾选要输出的参数，可以全部勾选，本文仅勾选“描述”和“按检验排除个案”，点击“继续”，如下图：

（5）点击“确定”，弹出如下结果。

由结果可知：

渐近显著性（双尾）=0.000<0.05，拒绝原假设，说明该胫围数据分布不符合正态分布。

2数据正态转换

2.1数据正态转换的方法

变量数据转化为正态分布，需要根据原始变量及其分布形状确定相应的转换公式，常用的变量正态变换方法有对数变换、平方根变换、倒数变换、平方根反正弦变换等。

1、对数变换：

即将原始数据X的对数值作为新的分布数据：

X’=lgX。

当原始数据中有小值及零时，亦可取X=lg（X+1），还可根据需要选用X’=lg（X+k）或X’=lg（k-X）。

对数变换常用于：

（1）使服从对数正态分布的数据正态化。

如环境中某些污染物的分布，人体中某些微量元素的分布等，可用对数正态分布改善其正态性。

（2）使数据达到方差齐性，特别是各样本的标准差与均数成比例或变异系数CV接近于一个常数时。

2、平方根变换：

即将原始数据X的平方根作为新的分布数据：

X’=sqrt（X）。

平方根变换常用于：

（1）使服从泊松分布的计数资料或轻度偏态资料正态化，可用平方根变换使其正态化。

（2）当各样本的方差与均数呈正相关时，可使资料达到方差齐性。

3、倒数变换：

即将原始数据X的倒数作为新的分析数据：

X’=1/X。

倒数变换常用于资料两端波动较大的资料，可使极端值的影响减小。

4、平方根反正弦变换：

即将原始数据X的平方根反正弦值作为新的分析数据：

X’=sin-1sqrt（X）。

平方根反正弦变换常用于服从二项分布的率或百分比资料。

一般认为等总体率较小如＜30%时或较大（如＞70%时），偏离正态较为明显，通过样本率的平方根反正弦变换，可使资料接近正态分布，达到方差齐性的要求。

上述公式只能减轻或消除变量的正偏态，但如果用于负偏态的变量（即不观察偏态和峰度），则会使负偏态变得更加严重。

如果是负偏态的分布，则需要先对原始变量做反向转换，即将所有的值反过来，如将最大值变成最小值、最小值变成最大值等等。

一般而言，根据原始数据分布来选择转换方法：

（1）如果是中度偏态（如偏度为其标准误差的2-3倍），可以考虑取根号值来转换。

（2）如果是高度偏态（如偏度为其标准误差的3倍以上），则可以取对数，其中又可分为自然对数和以10为基数的对数，两者区别在于以10为底数的对数比自然对数的纠偏作用更强，甚至会将正偏态转换为负偏态。

2.2数据正态转换在spss中的实现

（1）以上文的胫围数据为例，在spss中打开胫围数据资料，依次点击“转换--计算变量”，如下图：

（2）弹出如下对话框。

首先，在“目标变量”对话框中填入所要转换成的变量名称，方便理解，本文以胫围为例，将转换成的变量名称设为“胫围（转换）”；然后，在“函数组”对话框中选择“全部”；其次，在“函数和特殊变量”对话框中根据需要选择函数，本文胫围的偏度为2.486，远大于其标准误差0.061，因此本文选用纠偏作用最强的函数，即以10为底数的对数，因此选择“函数和特殊变量”对话框中的函数“Lg10”，点击本对话框左上角向上的箭头，将所选函数选入“数字表达式对话框”；之后，点击“类型与标签”对话框中所要转换的变量，本文选择“胫围”，再点击本对话框右上角的箭头，将该变量选入“数字表达式”中函数的相应部位（即代替标着“？

”的部位）；最后点击确定。

（3）得出如下结果：

最后一列的“胫围（转换）”变量即为原始变量“胫围”经过该正态转换后的结果。

（4）再次按照前文所述的数据正态性检验的方法，检验该转换后的“胫围（转换）”变量是否符合正态分布。

若不符合，可根据需要再次进行正态化转换。

展开阅读全文