ImageVerifierCode 换一换
格式:DOCX , 页数:14 ,大小:83.48KB ,
资源ID:6786086      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-6786086.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(实验3美国50个州七种犯罪比率的数据分析.docx)为本站会员(b****3)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

实验3美国50个州七种犯罪比率的数据分析.docx

1、实验3美国50个州七种犯罪比率的数据分析实验三 美国 50 个州七种犯罪比率的数据分析【实验目的】 1.通过使用 SAS 软件对实验数据进行主成分分析和因子分析, 熟悉 数据分析方法,培养学生分析处理实际数据的综合能力。【实验内容】表 3 给出的是美国 50 个州每 100000 个人中七种犯罪的比率数据。 这七种犯罪是: Murder(杀人罪),Rape(强奸罪),Robbery(抢劫罪),Assault (斗殴罪),Burglary(夜盗罪),Larceny(偷盗罪),Auto(汽车犯罪)。表3美国 50个州七种犯罪的比率数据StateMurderRapeRobberyAssaultBur

2、glaryLarcenyAutoAlabama14.225.296.8278.31135.51881.9280.7Alaska10.851.696.8284.01331.73369.8753.3Arizona9.534.2138.2312.32346.14467.4439.5Arkansas8.827.683.2203.4972.61862.1183.4California11.549.4287.0358.02139.43499.8663.5Colorado6.342.0170.7292.91935.23903.2477.1Connecticut4.216.8129.5131.81346.02

3、620.7593.2Delaware6.024.9157.0194.21682.63678.4467.0Florida10.239.6187.9449.11859.93840.5351.4Georgia11.731.1140.5256.51351.12170.2297.9Hawaii7.225.5128.064.11911.53920.4489.4Idaho5.519.439.6172.51050.82599.6237.6Illinois9.921.8211.3209.01085.02828.5528.6Indiana7.426.5123.2153.51086.22498.7377.4Iowa

4、2.310.641.289.8812.52685.1219.9Kansas6.622.0100.7180.51270.42739.3244.3Kentucky10.119.181.1123.3872.21662.1245.4Louisiana15.530.9142.9335.51165.52469.9337.7Maine2.413.538.7170.01253.12350.7246.9Maryland8.034.8292.1358.91400.03177.7428.5Massachusetts3.120.8169.1231.61532.22311.31140.1Michigan9.338.92

5、61.9274.61522.73159.0545.5Minnesota2.719.585.985.81134.72559.3343.1Mississippi14.319.665.7189.1915.61239.9144.4Missouri9.628.3189.0233.51318.32424.2378.4Montana5.416.739.2156.8804.92773.2309.2Nebraska3.918.164.7112.7760.02316.1249.1Nevada15.849.1323.1355.02453.14212.6559.2New Hampshire3.210.723.276.

6、01041.72343.9293.4New Jersey5.621.0180.4185.11435.82774.5511.5New Mexico8.839.1109.6343.41418.73008.6259.5New York10.729.4472.6319.11728.02782.0745.8North Carolina10.617.061.3318.31154.12037.8192.1Ohio7.827.3190.5181.11216.02696.8400.4North Dakota0.99.013.343.8446.11843.0144.7Oklahoma8.629.273.8205.

7、01288.22228.1326.8Oregon4.939.9124.1286.91636.435061388.9Pennsylvania5.619.0130.3128.0877.51624.1333.2Rhode Island3.610.586.5201.01489.52844.1791.4South Carolina11.933.0105.9485.31613.62342.4245.1South Dakota2.013.517.9155.7570.51704.4147.5Tennessee10.129.7145.8203.91259.71776.5314.0Texas13.333.8152

8、.4208.21603.12988.7397.6Utah3.520.368.8147.31171.63004.6334.5Vermont1.415.930.8101.21348.22201.0265.2Virginia9.023.392.1165.7986.22521.2226.7Washington4.339.6106.2224.81605.63386.9360.3West Virginia6.013.242.290.9597.41341.7163.3Wisconsin2.812.952.263.7846.92614.2220.7Wyoming5.421.939.7173.9811.6277

9、2.2282.01、1)分别用样本协方差矩阵和样本相关矩阵作主成分分析, 二者的结果有何差 异?2)原始数据的变化可否由三个或者更少的主成分反映, 对所选取的主成分给 出合理的解释。3)计算从样本相关矩阵出发计算的第一样本主成分的得分并予以排序 .2、从样本相关矩阵出发,做因子分析。【实验所使用的仪器设备与软件平台】计算机、 SAS9.4(简体中文 )【实验方法或步骤】1. 先将数据输入到 Excel 中,再通过 SAS 系统导入数据。程序代码:procprincomp data=work.crime covariance;procprincomp data=work.crime out=de

10、fen;run ;procsort data=defen;by prin1;run ;procprint data=defen;run ;procfactor data=work.crime simplecorr ;run ;procfactor data=work.crime priors =smc msascree residualpreplotrotate =promax reorderplotoutstat =fact_all;run ;【实验原理】因子分析与主成分分析有区别: 主成分分析只是简单的变量代换, 而因子分 析要构造因子模型; 主成分分析时将一组具有相关关系的变量变换为一组

11、互不相 关的变量,而因子分析的目的是要用尽可能少的因子构造一个结构简单的因子模 型,主成分分析是将主成分表示成原始变量的线性组合, 而因子分析时将原始变 量表示成公共因子和特殊因子的线性组合。【实验结果】1、1)分别用样本协方差矩阵和样本相关矩阵作主成分分析, 二者的结果有何差 异?1 样本协方差矩阵:均值和标准差:协方差矩阵和总方差:协方差矩阵的特征值:特征值、差分、比例、累积:可以得出主成分为 Murder (杀人罪) 特征向量:Larceny(偷盗罪)与 Murder(杀人罪)高度相关;Burglary(夜盗罪)与 Rape (强奸罪)高度相关;Robbery(抢劫罪)与 Auto(汽车

12、犯罪)高度相关;Robbery(抢劫罪)与 Larceny(偷盗罪 )高度相关; Murder( 杀人罪 )与 Auto(汽车犯罪 ) 高度相关陡坡图和已解释方差:2 样本相关矩阵:均值和标准差:相关矩阵:相关矩阵的特征值:特征值、差分、比例、累积:可以看出主成分为 Murder( 杀人罪 ),Rape(强奸罪 ),Robbory(抢劫罪 )0.9特征向量:由上图可知,各成分间没有很高的相关性,没有两个成分的相关度达到以上Robbory(抢劫罪)与 Larceny(偷盗罪)的相关系数为 0.736050;Rape(强奸 罪 )与 Auto(汽车犯罪)的相关系数为 0.750208。样本协方差矩

13、阵和样本相关矩阵的差别:1. 主成分发生了变化。用样本协方差矩阵求得主成分为 Murder (杀人罪);用 样本相关矩阵求得主成分为 Murder( 杀人罪 ), Rape(强奸罪 ), Robbory(抢劫 罪)。2. 各成分间的相关系数不不相同。 所以由样本协方差矩阵,样本相关矩阵求得的主成分一般是不同的。陡坡图和已解释方差:2)原始数据的变化可否由三个或者更少的主成分反映, 对所选取的主成分给 出合理的解释。1 用样本协方差矩阵求出的主成分 Murder (杀人罪),它的贡献率为 98.94%可以用它来代替其他六个变量,其信息损失量是很小的。2 用样本相关矩阵求出的主成分为 Murder

14、( 杀人罪 ),Rape(强奸罪 ),Robbory(抢 劫罪)。Murder(杀人罪)的贡献率为 52.96%,Murder(杀人罪)和 Rape(强奸罪) 的累计贡献率为 69.31%,Murder(杀人罪),Rape(强奸罪 ),Robbory(抢劫罪)三个的累计贡献率为 83.89%。可以用这三个主成分来代替 7 个原始变量,而 且也不至于损失原始变量中的太多信息。3)计算从样本相关矩阵出发计算的第一样本主成分的得分并予以排序。2、从样本相关矩阵出发,做因子分析50 个观测的均值和标准差:相关性:相关矩阵的特征值:特征值、差分、比例、累积:因子模式:每个因子的已解释方差:最终的公因子方差估计:控制所有其他变量的偏相关和 Kaiser 抽样适当性测度:先验公因子方差估计:缩减相关矩阵的特征值:特征值、差分、比例、累积:特征值的陡坡图:因子模型:每个因子已解释方差:最终的公因子方差估计:对角线上唯一的残差相关:【结果分析与讨论】通过此次的实验 ,得出以下结论 :1.一般由样本协方差矩阵和样本相关矩阵求得的主成分是不 一样的。 在实际应用中 ,当涉及的各变量的变化范围差异较大 时,从样本相关矩阵出发求主成分比较合理。2.原始数据的变化可以由三个或者更少的主成分反映而不至 于损失原变量中的太多信息。

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2