ImageVerifierCode 换一换
格式:DOCX , 页数:56 ,大小:487.28KB ,
资源ID:16290830      下载积分:5 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-16290830.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(SPSS因子分析法很全面很全面.docx)为本站会员(b****7)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

SPSS因子分析法很全面很全面.docx

1、SPSS因子分析法很全面很全面实验课:因子分析实验目的理解主成分(因子)分析的基本原理,熟悉并掌握SPSS中的主成分(因子) 分析方法及其主要应用。因子分析一、基础理论知识1概念因子分析(Factor analysis):就是用少数几个因子来描述许多指标或因素之间的联系, 以较少几个因子来反映原资料的大部分信息的统计学分析方法。 从数学角度来看,主成分分析是一种化繁为简的降维处理技术。主成分分析(Principal component analysis):是因子分析的一个特例,是使用最多的因 子提取方法。它通过坐标变换手段, 将原有的多个相关变量, 做线性变化,转换为另外一组不相关的变量。选取

2、前面几个方差最大的主成分, 这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。两者关系:主成分分析(PCA)和因子分析(FA)是两种把变量维数降低以便于描述、 理解和分析的方法,而实际上 主成分分析可以说是因子分析的一个特例 。2特点(1) 因子变量的数量远少于原有的指标变量的数量 ,因而对因子变量的分析能够减少 分析中的工作量。(2) 因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能 够反映原有变量大部分的信息。(3) 因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分 变量之间多存在较显著的相关关系。(4) 因

3、子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。在保证数据信息丢失最少的原则下, 对高维变量空间进行降维处理(即通过因子分析或主成分分析)。显然,在一个低维空间解释系统要比在高维系统容易的多。3类型根据研究对象的不同,把因子分析分 为R型和Q型两种。当研究对象是变量时,属于 R型因子分析; 当研究对象是样品时,属于 Q型因子分析。但有的因子分析方法兼有 R型和Q型因子分析的一些特点,如因子分析中的对应分析 方法,有的学者称之为双重型因子分析,以示与其他两类的区别。4分析原理当p较大时,在p维空间中考察问题比较麻烦。 这就需要进行降维处理, 即用较少几个综合指标代替原来指标, 而

4、且使这些综合指标既能尽量多地反映原来指标所反映的信息, 同时它们之间又是彼此独立的。线性组合:记x1 , x2,xP为原变量指标,z1, z2,,zm ( m0.9,非常适合;0.8KMO0.9,适合; 0.7KMO0.8,般;0.6KMO0.7,不太适合;KMO0)和相应的标准正交的特征向量 li ;根 据相关系数矩阵的特征根,即公共因子 Zj的方差贡献(等于因子载荷矩阵 L中第j列各元 素的平方和),计算公共因子Zj的方差贡献率与累积贡献率。主成分分析是在一个多维坐标轴中, 将原始变量组成的坐标系进行平移变换, 使得新的坐标原点和数据群点的重心重合。 新坐标第一轴与数据变化最大方向对应。

5、通过计算特征根(方差贡献)和方差贡献率与累积方差贡献率等指标, 来判断选取公共因子的数量和公共因子(主成分)所能代表的原始变量信息。公共因子个数的确定准则:1)根据特征值的大小来确定,一般取大于 1的特征值对应的几个公共因子/主成分。2)根据因子的累积方差贡献率来确定,一般取累计贡献率达 85-95%的特征值所对应的第一、第二、第 m (mW p)个主成分。也有学者认为累积方差贡献率应在80 %以上。5.3因子变量的命名解释因子变量的命名解释是因子分析的另一个核心问题 。经过主成分分析得到的公共因子 /主成分Z1,Z2,Zm是对原有变量的综合。 原有变量是有物理含义的变量, 对它们进行线性变换

6、后,得到的新的综合变量的物理含义到底是什么?在实际的应用分析中,主要通过对载荷矩阵进行分析, 得到因子变量和原有变量之间的关系,从而对新的因子变量进行命名。 利用因子旋转方法能使因子变量更具有可解释性。计算主成分载荷,构建载荷矩阵 A。计算主成分载荷,构建载荷矩阵A。载荷矩阵A中某一行表示原有变量 Xi与公共因子/因子变量的相关关系。载荷矩阵A中某一列表示某一个公共因子 /因子变量能够解释的原有 变量Xi的信息量。有时 因子载荷矩阵的解释性不太好,通常需要进行因子旋转 ,使原有因子变量更具有可解释性。因子旋转的主要方法:正交旋转、斜交旋转 。1ana12 .a1m rI117 扎 1丨12 J

7、-2 .l1 m寸上m A=a21a21 .a2m=121出人121廿-2 .Lm -m1a p1a p1 .apm1l p -2 .丨pmT九m正交旋转和斜交旋转是因子旋转的两类方法。 前者由于保持了坐标轴的正交性, 因此使用最多。正交旋转的方法很多,其中以方差最大化法最为常用。方差最大正交旋转(varimax orthogonal rotation) 基本思想:使公共因子的相对负荷的方差之和最大,且保持原公共因子的正交性和公共方差总和不变。 可使每个因子上的具有最大载荷的变量数最小,因此可以简化对因子的解释。斜交旋转(oblique rotation) 因子斜交旋转后,各因子负荷发生了变化

8、,出现了两极分化。各因子间不再相互独立, 而是彼此相关。各因子对各变量的贡献的总和也发生了改变。斜交旋转因为因子间的相关性而不受欢迎。 但如果总体中各因子间存在明显的相关关系则应该考虑斜交旋转。适用于大数据集的因子分析。无论是正交旋转还是斜交旋转, 因子旋转的目的:是使因子负荷两极分化, 要么接近于0,要么接近于1。从而使原有因子变量更具有可解释性。5.4计算因子变量得分因子变量确定以后,对于每一个样本数据, 我们希望得到它们在不同因子上的具体数据值,即因子得分。估计因子得分的方法主要有:回归法、 Bartlette法等。计算因子得分应首先将因子变量表示为原始变量的线性组合。即:回归法,即Th

9、omson法:得分是由贝叶斯 Bayes思想导出的,得到的因子得分是有偏 的,但计算结果误差较小。贝叶斯( BAYES )判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断。Bartlett法:Bartlett因子得分是极大似然估计,也是加权最小二乘回归,得到的因子得 分是无偏的,但计算结果误差较大。因子得分可用于模型诊断,也可用作进一步分析如聚类分析、回归分析等的原始资料。 关于因子得分的进一步应用将在案例介绍一节分析。5.5结果的分析解释此部分详细见案例分析二、案例分析1研究问题石家庄18个县市14个指标因子,具体来说有人均 GDP(元/人)、人均全社会固定资产投资额、人均

10、城镇固定资产投资额、人均一般预算性财政收入、第三产业占 GDP比重(%)、人均社会消费品零售额、人均实际利用外资额(万美元 /人)、人均城乡居民储蓄存款、农民人均纯收入、在岗职工平均工资、人才密度指数、科技支出占财政支出比重( %)、每万人拥有执业医师数量、每千人拥有病床数。要求根据这14项内容进行因子分析,得到维度较少的几个因子 。2实现步骤【1】在“Analyze”菜单“ Data Reduction”中选择“ Factor”命令,如下图所示。File Edit View Data Transform AnalyzeGraphs yilities Add-ons Window HelpH

11、S R ? Reports1:楷标re指际AiijGD1市区2丘定县3高邑县45平山县B1鹿泉市8新乐市9无极县W晋州市11藁城市12赞皇县13井陀县栾城县15行磨县16元氏島1718灵尋县19Descriptive StatisticsTellesRFM AnalysisCoriipare MeafieGeneralised Linear Mociel?Mixed ModelsCorrelateRegressiQriLoglireafMeural Met worksdassifyEimerisior ReductionGeneral Linear Model人均城缜固定贵净按24721 65

12、10153.337396.949696.315904.315309.3917143.628701.03factor.Forecasting1 UJT .CTISurvival15357,53hjltiple Response11560 90Missing Value Analysis.7437.92Multiple Irnputationk3334.12Complsx Samplesk6899 29dually Controlk13194.04团 ROC Curve.ScaleMpnpara metric TestsIX Cprrespondftnce Analysis. 血 Optirnal

13、 Scahng人均一般预館性驰政收人2557 7;549.7C332 92529.51926.61342.0:350. BE03.BE726.6:529 32303304.21214.K290空【2】在弹出的下图所示的Factor Analysis对话框中,从对话框左侧的变量列表中选择这14个变量,使之添加到Variables 框中。Factor AnalysisVariables:Selection Variable:人均GDP元F人)人 人均全祛会固走穩 人均城躍固老费产一” A均一展负覽惟财第三产业占GDP出嚏 人均it会淆费品零 人均实歸利用外资T1Descriptives.Extra

14、ction.Rcrtatiori.Scores.Options.OKPasteResetCancel Helpxlu【3】点击“ Descriptives” 按钮,弹出“ Factor Analysis: Descriptives” 对话框, 如图所示。Factor Analysis: DemeriptivesStatistics框用于选择哪些相关的统计量,其中:Univariate descriptives (变量描述):输出变量均值、标准差;In itial solution (初始结果)Correlation Matrix框中提供了几种检验变量是否适 合做引子分析的检验方法,其 中:Co

15、efficie nts (相关系数矩阵)Significanee leves (显著性水平)Determinant (相关系数矩阵的行列式)In verse (相关系数矩阵的逆矩阵)Reproduced (再生相关矩阵,原始相关与再生相关的差值)An ti-image (反影像相关矩阵检验)KMO and Bartlett s test of sphericity (KMO 检验和巴特利特球形检验) 本例中,选中该对话框中所有选项,单击 Continue按钮返回Factor Analysis对话框。【4】单击“Extraction” 按钮,弹出“ Factor Analysis: Extrac

16、tion” 对话框,选择 因子提取方法,如下图所示:Me CorrO 8蜀nweiglited least squares Generalized least squares Maxirriuin likelihood Principal factoringAlpha factoringExtractbrisge factorins” Based on tigenvsiueEigenvalues greater then:Fixed rxirriber of factorsFactors to sxlracl:因子提取方法在Method下拉框中选取,SPSS共提供了 7种方法:Principl

17、e Components Analysis (主成分分析)Un weighted least squares(未加权最小平方法)Generalized least squares (综合最小平方法)Maximum likelihood (最大似然估价法)Prin cipal axis factori ng (主轴因子法)Alpha factoring ( a 因子)Image factori ng (影像因子)Analyze框中用于选择提取变量依据,其中:Correlation matrix (相关系数矩阵)Covarianee matrix (协方差矩阵)Extract框用于指定因子个数的标

18、准,其中:Eigenvaluse over (大于特征值)Number of factors (因子个数)Display框用于选择输出哪些与因子提取有关的信息,其中:Un rotated factor solution (未经旋转的因子载荷矩阵)Screen plot (特征值排列图)Maximun interations for Convergenee框用于指定因子分析收敛 的最大迭代次数, 系统默认的最大迭代次数为25。本例选用Principal components方法,选择相关系数矩阵作为提取因子变量的依 据,选中Un rotated factor solution和Scree plo

19、t项,输出未经过旋转的因子载荷 矩 阵与其特征值的碎石图;选择 Eigenvaluse over项,在该选项后面可以输入1,指定提取特征值大于1的因子。单击Continue按钮返回Factor Analysis对话框。【5】单击 Factor Analysis对话框中的 Rotation按钮,弹出 Factor Analysis: Rotation 对话框,如下图所示:该对话框用于选择因子载荷矩阵的旋转方法。 旋转目的是为了简化结构,以 帮助我们解释因子。SPSS默认不进行旋转(None)。Method框用于选择因子旋转方法,其中:None (不旋转)Varimax (正交旋转)Direct

20、Oblimin (直接斜交旋转)Quanlimax (四分最大正交旋转)Equamax (平均正交旋转)Promax (斜交旋转)Display框用于选择输出哪些与因子旋转有关的信息,其中:Rotated solution (输出旋转后的因子载荷矩阵)Loading plots (输出载荷散点图)本例选择方差极大法旋转 Varimax,并选中Rotated solution和Loading plot 项,表示输出旋转后的因子载荷矩阵和载荷散点图, 单击Continue按钮返回Factor Analysis对话框。【6】单击 Factor Analysis 对话框中的 Scores按钮,弹出 F

21、actor Analysis: Scores 对话框,如下图所示:叵 Save as variables-Me(h od i. i RegressionBartlettArder son-Rubin廈 fECtDF wear亡 coefficient 耳 该对话框用以选择对因子得分进行设置,其中:Regression (回归法):因子得分均值为0,采用多元相关平方;Bartlett (巴特利法):因子得分均值为0,采用超出变量范围各因子平方和 被最小化;Anderson-Rubin (安德森-洛宾法):因子得分均值为0,标准差1,彼此不 相关;Display factor score coef

22、ficient matrix:选择此项将在输出窗口中显示因子得 分系数矩阵。【7】单击 Factor Analysis对话框中的 Options按钮,弹出 Factor Analysis: Options 对话框,如下图所示:Factor Analysis OptionsMissing Values 丿 Exclude cases listvvie Exclude crises irwise Replace with meanCoefficient Display Format叵 ported by size.Suppress rnall coefficients11Absolute valu

23、e below:该对话框可以指定其他因子分析的结果,并选择对缺失数据的处理方法, 其中:Missi ng Values框用于选择缺失值处理方法:Exclude cases listwise去除所有缺失值的个案Exclude cases pairwise含有缺失值的变量,去掉该案例Replace with mean用平均值代替缺失值Cofficient Display Format框用于选择载荷系数的显示格式:Sorted by size载荷系数按照数值大小排列Suppress absolute values less tha n不显示绝对值小于指定值的载荷量 本例选中 Exclude case

24、s listwise 项,单击 Continue 按钮返回 Factor Analysis 对话框,完成设置。单击 OK,完成计算。3结果与讨论(1)SPSS输出的第一部分如下:第一个表格中列出了 18个原始变量的统计结果,包括平均值、标准差和分 析的个案数。这个是步骤3中选中Univariate descriptives项的输出结果。Descriptive StatisticsMeanStd. DeviationAnalysis N人均GDP(元/人)22600.52118410.5546418人均全社会固定资产投资额15190.95155289.1449918人均城镇固定资产投资额10270.36424874.1461618人均一般预算性财政收入585.1712550.4565918第三产业占GDP比重(%)29.06129.4685818人均社会消费品零售额6567.25663068.7546318人均实际利用外资额(万美元/23.566740.3136118人)人均城乡居民储

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2