ImageVerifierCode 换一换
格式:DOCX , 页数:21 ,大小:362.53KB ,
资源ID:16344332      下载积分:1 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-16344332.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(试验数据的正态性检验数据的转换及卡方检验.docx)为本站会员(b****7)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

试验数据的正态性检验数据的转换及卡方检验.docx

1、试验数据的正态性检验数据的转换及卡方检验试验数据的正态检验、数据的转换和卡方检验在对试验数据进行方差分析前,应对数据的三性(即同质性、独立性和正态性)进行检验。本文介绍对资料的正态性进行检验的方法,主要介绍3种检验方法:(1)频数检验作频率分布图、看偏度系数和峰度系数,(2)作Q-Q图检验,(3)非参数检验单个样本K-S检验。下面以两个试验数据为例,例1为84头育肥猪的体重数据,通常符合正态分布。例2为生长育肥猪7个试验处理组的腹泻率(百分数资料)统计结果,这类资料往往不符合正态,而大多数人以为是符合正态分布,进行方差分析的,因而不能得出正确的结论,却可能得出错误结论。一、符合正态分布的例子【

2、例1】 84头生长育肥猪的“体重”数据如表1-1,检验该数据是否呈正态分布。表1-1 84头育肥猪的“体重”数据(排序后)No.体重No.体重No.体重No.体重No.体重No.体重No.体重No.体重No.体重155.31171.62178.33181.24184.65188.66192.07199.481107.4258.21272.12278.73282.24284.75288.86292.072100.782109.0360.21372.82378.83382.44384.75389.26392.273102.483112.8464.81473.62479.13482.84485.05

3、489.96493.074103.084113.2565.81575.92579.33582.84585.35590.46594.275105.4666.71676.12679.73682.84685.75690.96695.376105.4767.91777.02780.23783.54786.45791.06797.077105.4868.41877.12880.63883.74886.85891.16897.878106.0970.11977.22981.13984.34987.35991.26 998.479106.21070.82078.13081.14084.45087.46091

4、.47098.580107.3检验方法一:频数检验作频率分布图、看偏度系数和峰度系数步骤1:数据录入SPSS中,如图1-1。图1-1 体重数据录入SPSS中步骤2:在SPSS里执行“分析描述统计频率”,然后弹出“频率”对话框(图1-2a),变量选择“体重”; 再点右边的“统计量”按钮,弹出图“频率:统计量”对话框(图1-2b),选择“偏度”和“丰度”(图1-2b);再点右边的“图表”按钮,弹出图“频率:图表”对话框(图1-2c),选择“直方图”,并选中“在直方图显示正态曲线” 图1-2a “频率”对话框 图1-2b “频率:统计量”对话框 图1-2c “频率:图表”对话框 设置完后点“确定”后

5、,就会出来一系列结果,包括2个表格和一个图,我们先来看看“统计量”表,如下:统计量体重N有效84缺失0偏度.040偏度的标准误.263峰度-.202峰度的标准误.520偏度系数=0.040,峰度系数-0.202;两个系数都小于1,可认为近似于正态分布。再看直方图(图1-3),如下:图1-3 84头育肥猪体重的频数分布直方图图1-3中横坐标为“增重”,纵坐标为增重出现的“频数”。根据直方图及绘出的曲线,可以认为该数据近似正态分布。检验方法二:Q-Q图检验步骤1:数据录入SPSS中,如图1-1。步骤2:在SPSS里执行“描述统计Q-Q图”,弹出“Q-Q图”对话框,变量选择“体重”,检验分布选择“正

6、态”(见图1-4),其他选择默认,然后“确定”。 图1-4 “Q-Q图”对话框最后可以得到Q-Q图检验结果,结果很多,我们只需要看最后一个图,见图1-5 。所有数据几乎在一条直线上,表明近似正态分布。图1-5 84头生长育肥猪的正态Q-Q图检验方法三:非参数检验单个样本K-S检验步骤1:数据录入SPSS中,如图1-1。步骤2:在SPSS里执行“分析非参数检验旧对话框单个样本K-S检验”,弹出对话框,检验变量选择“期初平均分”,检验分布选择“常规”(即正态分布),然后点“确定”(图1-6)。图1-6 单样本K-S检验对话框从以下结果可以看出,K-S检验中,Z值为0.563,渐近显著性(双侧) (

7、即P值)=0.9090.05,因此数据呈近似正态分布。单样本 Kolmogorov-Smirnov 检验体重N84正态参数a,b均值85.9654标准差12.67824最极端差别绝对值.061正.061负-.056Kolmogorov-Smirnov Z.563渐近显著性(双侧).909a. 检验分布为正态分布。b. 根据数据计算得到。二、不符合正态分布的例子【例2】7个处理组,每个处理4个重复,每重复3头生长育肥猪全期(98天)的腹泻次数统计结果见表1-2。“腹泻率”统计结果,检验其是否符合正态分布?(腹泻指数为每天有1头猪发生腹泻,记为1头次)。表2-1 生长育肥猪全期98天腹泻次数统计及

8、腹泻率计算表分组重复(头数)饲养天数腹泻指数(腹泻头次)总指数(总头数)(=3*98)全期腹泻率%(=腹泻头次/总头次)1 3 98 3294 1.02 1 3 98 11294 3.74 1 3 98 2294 0.68 1 3 98 5294 1.70 2 2 3 98 10294 3.40 2 3 98 6294 2.04 2 3 98 6294 2.04 3 3 98 12294 4.08 3 3 98 7294 2.38 3 3 98 55294 18.71 3 3 98 12294 4.08 4 3 98 23294 7.82 4 3 98 1294 0.34 4 3 98 229

9、4 0.68 4 3 98 11294 3.74 5 3 98 74294 25.17 5 3 98 45294 15.31 5 3 98 83294 28.23 5 3 98 4294 1.36 6 3 98 7294 2.38 6 3 98 14294 4.76 6 3 98 6294 2.04 6 3 98 22294 7.48 7 3 98 73294 24.83 7 3 98 3294 1.02 7 3 98 4294 1.36 7 3 98 36294 12.24 检验方法一:频数检验作频率分布图、看偏度系数和峰度系数步骤1:数据录入SPSS中,如图2-1。图2-1 腹泻率数据录入

10、SPSS中步骤2:在SPSS里执行“分析描述统计频率”,然后弹出“频率”对话框(图2-2a),变量选择“腹泻率”; 再点右边的“统计量”按钮,弹出图“频率:统计量”对话框(图2-2b),选择“偏度”和“丰度”(图2-2b);再点右边的“图表”按钮,弹出图“频率:图表”对话框(图2-2c),选择“直方图”,并选中“在直方图显示正态曲线”图2-2a “频率”对话框 图2-2b “频率:统计量”对话框 图2-2c “频率:图表”对话框设置完后点“确定”,就后会出来一系列结果,包括2个表格和一个图,我们先来看看“统计量”表,如下:统计量腹泻率N有效27缺失1偏度1.623偏度的标准误.448峰度1.4

11、33峰度的标准误.872偏度系数=1.623,峰度系数1.433;两个系数都大于1,可认为不服从正态分布。再看直方图(图2-3),如下:图2-3 腹泻率的频数分布直方图图2-3中横坐标为“腹泻率”,纵坐标为增重出现的“频数”。根据直方图可以看出,分布显然是偏态的,与正态分布曲线相差甚远。检验方法二:Q-Q图检验步骤1:数据录入SPSS中,如图2-1。步骤2:在SPSS里执行“描述统计Q-Q图”,弹出“Q-Q图”对话框,变量选择“腹泻率”,检验分布选择“正态”(见图2-4),其他选择默认,然后“确定”。 图2-4 “Q-Q图”对话框最后可以得到Q-Q图检验结果,结果很多,我们只需要看最后一个图,

12、见图2-5 。腹泻率数据不在一条直线上,表明不符合正态分布。图2-5 腹泻率的正态Q-Q图检验方法三:非参数检验单个样本K-S检验步骤1:数据录入SPSS中,如图2-1。步骤2:在SPSS里执行“分析非参数检验旧对话框单个样本K-S检验”,弹出对话框,检验变量选择“腹泻率”,检验分布选择“常规”(即正态分布),然后点“确定”(图2-6)。图2-6 单样本K-S检验对话框检验结果为:从结果可以看出,K-S检验中,Z值=1.544,渐近显著性(双侧) (即P值)=0.016Q-Q图”,弹出“Q-Q图”对话框,变量选择“腹泻率”,检验分布选择“正态”,在转换中选择“自然对数转换”(见图3-1),其他

13、选择默认,然后“确定”。 图3-1 腹泻率自然对换转换后的“Q-Q图”对话框输出结果见图3-2。可见所有数据几乎在一条直线上,可认为近似正态分布。图3-2腹泻率自然对换转换后的“Q-Q图”3.2 对自然对数转换后的数据作频率分布图、看偏度系数和峰度系数将以上【例2】的腹泻率数据时行自然对数转换,结果如下表。分组重复(头数)饲养天数腹泻指数(腹泻头次)总指数(总头数)全期腹泻率自然对数转换后的腹泻率1 3 98 3294 1.02 0.02 1 3 98 11294 3.74 1.32 1 3 98 2294 0.68 -0.39 1 3 98 5294 1.70 0.53 2 2 3 98 1

14、0294 3.40 1.22 2 3 98 6294 2.04 0.71 2 3 98 6294 2.04 0.71 3 3 98 12294 4.08 1.41 3 3 98 7294 2.38 0.87 3 3 98 55294 18.71 2.93 3 3 98 12294 4.08 1.41 4 3 98 23294 7.82 2.06 4 3 98 1294 0.34 -1.08 4 3 98 2294 0.68 -0.39 4 3 98 11294 3.74 1.32 5 3 98 74294 25.17 3.23 5 3 98 45294 15.31 2.73 5 3 98 83

15、294 28.23 3.34 5 3 98 4294 1.36 0.31 6 3 98 7294 0.024 -3.738 6 3 98 14294 0.048 -3.045 6 3 98 6294 0.020 -3.892 6 3 98 22294 0.075 -2.593 7 3 98 73294 0.248 -1.393 7 3 98 3294 0.010 -4.585 7 3 98 4294 0.014 -4.297 7 3 98 36294 0.122 -2.100 自然对数转换后腹泻率的频率分布图(直方图)、偏度系数和峰度系数如下:图3-3 自然对数转换后的腹泻率的直方图(近似正态

16、分布)统计量自然对数转后的腹泻率N有效27缺失57偏度.212偏度的标准误.448峰度-.656峰度的标准误.872自然对数转换后的腹泻率的偏度系数=0.213,峰度系数=-0.656,均小于1.0,表明符合正态分布。3.3 数据转换前后的方差分析结果的比较腹泻率数据转换前与转换后的各组平均数如下:描述性统计量分组均值标准 偏差N腹泻率11.78501.37058422.4933.78520337.31257.64048443.14503.471504517.517512.10036464.16502.51960479.862511.257014总计6.76418.3021327自然对数转后的

17、腹泻率1.3700.7367042.8800.29445331.6550.8873044.47751.45973452.40251.42003461.2875.60665471.51131.585384总计1.23911.1991927SPSS一般线性模型方差分析结果如下:主体间效应的检验源因变量III 型平方和df均方FSig.分组腹泻率735.4436122.5742.320.073自然对数转后的腹泻率12.14062.0231.603.198误差腹泻率1056.6152052.831自然对数转后的腹泻率25.250201.262总计腹泻率3027.38127自然对数转后的腹泻率78.84

18、327方差分析结果显示:腹泻率数据转换前的P=0.0730.05,差异不显著;而转换后的腹泻率P=0.1980.05,仍然差异不显著。四、次数分布资料的卡方检验以上猪腹泻次数统计数据属于次数性资料,虽然换算成百分数后属于连续性资料,但经检验,不满足正态分布,因此不宜采用方差分析来检验各组腹泻率差异的显著性。而经自然对数转换后,腹泻率基本满足正态分布条件,可采用方差分析。但无论是转换前还转换后的腹泻率百分数资料,经以上方差分析显示,各组间腹泻率均差异不显著。因此,有必要寻求其他种检验方法次数性资料的差异显著检验方法卡方检验来试一试。表4-1 生长育肥猪(98天)腹泻次数统计表分组头数饲养天数腹泻

19、指数(腹泻头次)总指数(总头数)全期腹泻率1 12982111761.79%2 998228822.49%3 12988611767.31%4 1298206117617.52%5 12984911764.17%6 129811611769.86%7 12983711763.15%表 4-2 生长育肥猪(98天)腹泻次数资料卡方检验表腹泻次数观察值分组腹泻头次(n1)正常头次(n2)合计头次(N)腹泻率1 21115511761.79%2 228608822.49%3 86109011767.31%4 206970117617.52%5 49112711764.17%6 11610601176

20、9.86%7 37113911763.15%合计53774017938比例0.0680.9321腹泻次数理论值计算结果分组腹泻头次(n1)正常头次(n2)合计头次(N)1 79.61096.41176.02 59.7822.3882.03 79.61096.41176.04 79.61096.41176.05 79.61096.41176.06 79.61096.41176.07 79.61096.41176.0合计537.07401.07938.0腹泻次数卡方值计算结果分组腹泻头次(n1)正常头次(n2)合计头次(N)1 43.103.1346.232 23.781.7325.503 0.520.040.564 200.9714.58215.555 11.740.8512.596 16.701.2117.917 22.761.6524.42合计319.5623.19342.75合计卡方值=342.75,查卡方分布表知其对应的P值=5.56E-71,差异极显著。该检验结果与前面方差分析结果大相径庭(见第三部分:不符合正态分布数据的转换及转换数据的方差分析)。后记:可见以上腹泻次数资料(腹泻率百分数资料)不宜采用方差分析,而应考虑采用卡方检验。

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2