1、11.549.4287.0358.02139.43499.8663.5Colorado6.342.0170.7292.91935.23903.2477.1Connecticut4.216.8129.5131.81346.02620.7593.2Delaware6.024.9157.0194.21682.63678.4467.0Florida10.239.6187.9449.11859.93840.5351.4Georgia11.731.1140.5256.51351.12170.2297.9Hawaii7.225.5128.064.11911.53920.4489.4Idaho5.519.41
2、72.51050.82599.6237.6Illinois9.921.8211.3209.01085.02828.5528.6Indiana7.426.5123.2153.51086.22498.7377.4Iowa2.310.641.289.8812.52685.1219.9Kansas6.622.0100.7180.51270.42739.3244.3Kentucky10.119.181.1123.3872.21662.1245.4Louisiana15.530.9142.9335.51165.52469.9337.7Maine2.413.538.7170.01253.12350.7246
3、.9Maryland8.034.8292.1358.91400.03177.7428.5Massachusetts3.120.8169.1231.61532.22311.31140.1Michigan9.338.9261.9274.61522.73159.0545.5Minnesota2.719.585.985.81134.72559.3343.1Mississippi14.319.665.7189.1915.61239.9144.4Missouri9.628.3189.0233.51318.32424.2378.4Montana5.416.739.2156.8804.92773.2309.2
4、Nebraska3.918.164.7112.7760.02316.1249.1Nevada15.849.1323.1355.02453.14212.6559.2New Hampshire3.210.723.276.01041.72343.9293.4New Jersey5.621.0180.4185.11435.82774.5511.5New Mexico39.1109.6343.41418.73008.6259.5New York29.4472.6319.11728.02782.0745.8North Carolina17.061.3318.31154.12037.8192.1Ohio7.
5、827.3190.5181.11216.02696.8400.4North Dakota0.99.013.343.8446.11843.0144.7Oklahoma8.629.273.8205.01288.22228.1326.8Oregon4.939.9124.1286.91636.435061388.9Pennsylvania19.0130.3877.51624.1333.2Rhode Island3.610.586.5201.01489.52844.1791.4South Carolina11.933.0105.9485.31613.62342.4245.1South Dakota2.0
6、17.9155.7570.51704.4147.5Tennessee29.7145.8203.91259.71776.5314.0Texas33.8152.4208.21603.12988.7397.6Utah3.520.368.8147.31171.63004.6334.5Vermont1.415.930.8101.21348.22201.0265.2Virginia23.392.1165.7986.22521.2226.7Washington4.3106.2224.81605.63386.9360.3West Virginia13.242.290.9597.41341.7163.3Wisc
7、onsin2.812.952.263.7846.92614.2220.7Wyoming21.939.7173.9811.62772.2282.01、1)分别用样本协方差矩阵和样本相关矩阵作主成分分析,二者的结果有何差异? 2)原始数据的变化可否由三个或者更少的主成分反映,对所选取的主成分给出合理的解释。 3)计算从样本相关矩阵出发计算的第一样本主成分的得分并予以排序.2、从样本相关矩阵出发,做因子分析。【实验所使用的仪器设备与软件平台】计算机、SAS 9.4(简体中文)【实验方法或步骤】1. 先将数据输入到Excel中,再通过SAS系统导入数据。程序代码:proc princomp data=
8、work.crime covariance;run; proc princomp data=work.crime out=defen;proc sort data=defen;by prin1;proc print data=defen;proc factor data=work.crime simple corr;proc factor data=work.crime priors=smc msa scree residual preplot rotate=promax reorder plot outstat=fact_all;【实验原理】因子分析与主成分分析有区别:主成分分析只是简单的变
9、量代换,而因子分析要构造因子模型;主成分分析时将一组具有相关关系的变量变换为一组互不相关的变量,而因子分析的目的是要用尽可能少的因子构造一个结构简单的因子模型,主成分分析是将主成分表示成原始变量的线性组合,而因子分析时将原始变量表示成公共因子和特殊因子的线性组合。【实验结果】样本协方差矩阵:均值和标准差:协方差矩阵和总方差:协方差矩阵的特征值:特征值、差分、比例、累积:可以得出主成分为Murder(杀人罪)。特征向量:Larceny(偷盗罪)与Murder(杀人罪)高度相关;Burglary(夜盗罪)与Rape (强奸罪)高度相关;Robbery(抢劫罪)与Auto(汽车犯罪)高度相关;Rob
10、bery(抢劫罪)与Larceny(偷盗罪)高度相关;Murder(杀人罪)与Auto(汽车犯罪)高度相关。陡坡图和已解释方差:样本相关矩阵:相关矩阵:相关矩阵的特征值:可以看出主成分为Murder(杀人罪),Rape(强奸罪),Robbory(抢劫罪)。由上图可知,各成分间没有很高的相关性,没有两个成分的相关度达到0.9以上。Robbory(抢劫罪)与Larceny(偷盗罪)的相关系数为0.736050;Rape(强奸罪)与Auto(汽车犯罪)的相关系数为0.750208。样本协方差矩阵和样本相关矩阵的差别:1. 主成分发生了变化。用样本协方差矩阵求得主成分为Murder(杀人罪);用样本相
11、关矩阵求得主成分为Murder(杀人罪),Rape(强奸罪),Robbory(抢劫罪)。2. 各成分间的相关系数不不相同。所以由样本协方差矩阵,样本相关矩阵求得的主成分一般是不同的。用样本协方差矩阵求出的主成分Murder(杀人罪),它的贡献率为98.94%可以用它来代替其他六个变量,其信息损失量是很小的。用样本相关矩阵求出的主成分为Murder(杀人罪),Rape(强奸罪),Robbory(抢劫罪)。Murder(杀人罪)的贡献率为52.96%,Murder(杀人罪)和Rape(强奸罪)的累计贡献率为69.31%,Murder(杀人罪),Rape(强奸罪),Robbory(抢劫罪)三个的累计
12、贡献率为83.89%。可以用这三个主成分来代替7个原始变量,而且也不至于损失原始变量中的太多信息。 3)计算从样本相关矩阵出发计算的第一样本主成分的得分并予以排序。50个观测的均值和标准差:相关性:因子模式:每个因子的已解释方差:最终的公因子方差估计:控制所有其他变量的偏相关和Kaiser抽样适当性测度:先验公因子方差估计:缩减相关矩阵的特征值:特征值的陡坡图:因子模型:每个因子已解释方差:对角线上唯一的残差相关:【结果分析与讨论】通过此次的实验,得出以下结论:1.一般由样本协方差矩阵和样本相关矩阵求得的主成分是不一样的。在实际应用中,当涉及的各变量的变化范围差异较大时,从样本相关矩阵出发求主成分比较合理。2.原始数据的变化可以由三个或者更少的主成分反映而不至于损失原变量中的太多信息。
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2