怎样对大数据做相关性检验.docx
《怎样对大数据做相关性检验.docx》由会员分享,可在线阅读,更多相关《怎样对大数据做相关性检验.docx(10页珍藏版)》请在冰点文库上搜索。
怎样对大数据做相关性检验
怎样对数据做相关性检验?
最简单直观的方法就是做相关系数矩阵了,另外就是Pearson相关系数或者Spearman相关系数
用SPSS软件或者SAS软件都可以分析。
用SPSS更简单。
如果你用SPSS软件,分析的步骤如下:
1.点击“分析(Analyze)”
2.选中“相关(Correlate)”
3.选中“双变量(Bivariate)”
4选择你想要分析的变量
5选择Pearson相关系数(或者Spearman相关系数)
6选择恰当的统计检验(单边或双边)
7点击“OK”即可
SPSS中pearson(皮尔逊相关系数)确定相关性,数据分析如下图,请问1与2的相关性是什么。
急。
。
。
。
。
。
图片01
为什么显著相关,请分析一下。
。
不是相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱么。
回答
<0.4显著弱相关,0.4-0.75中等相关,大于0.75强相关
追问
可我的pearson相关系数是-0.39。
是负数,怎么是显著负相关呢。
。
回答
你好像一点都不会啊。
看sig的,小于0.05
提问者评价
原来是这样,感谢!
相关性分析的表格输出是一个矩阵
你只需要看横向或者纵向的1和2的交叉系数都可以
pearson相关性表示的是两者相关系数的大小,-0.397表示两者是负相关,相关性大小为0.397
显著性的0.000也就是p值,用来判断相关性是否显著
如何使用SPSS进行皮尔森相关系数分析?
?
Pearson’scorrelationcoefficients
1.单击“Analyze”,展开下拉菜单
2.下拉菜单中寻找“Correlate”弹出小菜单,从小菜单上寻找“Bivariate...”,单击之,则弹出相关分析“BivariateCorrelations”对话框
3.把左边的源变量中要分析相关的变量调入右边的“Variables:
”下的矩形框内
4.勾选“CorrelationCoelficients”中的“Pearson”选项
5.点击“OK”即可
求问了:
因子分析明明是基于相关系数矩阵的,但为什么大家都直接把数据导进去就分析呢?
==!
因子分析是有一定条件需求的,变量之间要存在一定的相关性,而因子分析时也会有一个检验,从过程上将必须先做了这些之后才做因子分析的,所以说很多人都是在想当然的用,很多发表的论文上都存在用法不当的问题
利用SPSS,相关系数矩阵怎么算
analyze-correlate-bivariate-选择变量
OK
输出的是相关系数矩阵
相关系数下面的Sig.是显著性检验结果的P值,越接近0越显著。
另外,表格下会显示显著性检验的判断结果,你看看表格下的解释就知道,比如“**.Correlationissignificantatthe0.01level(2-tailed).”
就是说,如果相关系数后有"**"符号,代表在0.01显著性水平下显著相关
粗略判断的方法是,相关系数0.6以上,可以认为显著相关了
、
eviews相关系数矩阵是什么。
怎么做截面数据的相关系数矩阵!
急急急!
相关系数啊,就是自变量和变量之间的相关程度
相关系数多大才算相关性比较好啊
大于0.8
相关系数多少算具有相关性?
我做教育统计,发放过问卷后统计相关性,我想问下相关性系数怎么界定具体相关程度的大小呢?
1.相关性的强、弱、不相关系数分别是多少?
2.界定的标准从何而来,论文中想引用一下
3.相关性系数我自己做的统计方法算出来的数据,也能用上面的强弱系数的标准么?
谢谢各位了~~万分感激!
相关系数的强弱仅仅看系数的大小是不够的。
一般来说,取绝对值后,0-0.09为没有相关性,0.3-弱,0.1-0.3为弱相关,0.3-0.5为中等相关,0.5-1.0为强相关。
但是,往往你还需要做显著性差异检验,即t-test,来检验两组数据是否显著相关,这在SPSS里面会自动为你计算的。
样本书越是大,需要达到显著性相关的相关系数就会越小。
所以这关系到你的样本大小,如果你的样本很大,比如说超过300,往往分析出来的相关系数比较低,比如0.2,因为你样本量的增大造成了差异的增大,但显著性检验却认为这是极其显著的相关。
一般来说,我们判断强弱主要看显著性,而非相关系数本身。
但你在撰写论文时需要同时报告这两个统计数据。
提问者评价
谢谢!
相关性是什么意思
就是有关系的,比如一件事因另一件事而发生的,这件事与另一件事具有,比如一笔费用因某个业务而发生的,两者具有相关性。
这是数学方向的问题.相关是非确定性问题,用于统计分析.与函数相对自变量和函数不是一一对应的关系
SPSS关于两组数据的相关性分析的操作方法,越简单越好,急!
可使用Statistics菜单->Correlate子菜单->Bivariate过程
观察CorrelationCoefficients值和TestofSignificance值即可,
惟必须注意,变量须为等距尺度(intervallevelofmeasurement)。
若变项只属顺序尺度(ordinarylevelofmeasurement),
则可选择计算Kendall's等级相关系数和Spearman相关系数。
spss相关性分析相关性
相关性
X1X2X3X4X5X6X7X8
X1Pearson相关性1-.022-.447.999**.999**.982**.994**.975**
显著性(双侧).972.451.000.000.003.001.005
N55555555
X2Pearson相关性-.0221.261-.059-.025-.179-.117-.206
显著性(双侧).972.671.925.969.773.852.740
N55555555
X3Pearson相关性-.447.2611-.481-.415-.405-.448-.469
显著性(双侧).451.671.413.488.499.450.426
N55555555
X4Pearson相关性.999**-.059-.4811.997**.982**.994**.977**
显著性(双侧).000.925.413.000.003.001.004
N55555555
X5Pearson相关性.999**-.025-.415.997**1.985**.994**.975**
显著性(双侧).000.969.488.000.002.001.005
N55555555
X6Pearson相关性.982**-.179-.405.982**.985**1.996**.995**
显著性(双侧).003.773.499.003.002.000.000
N55555555
X7Pearson相关性.994**-.117-.448.994**.994**.996**1.994**
显著性(双侧).001.852.450.001.001.000.001
N55555555
X8Pearson相关性.975**-.206-.469.977**.975**.995**.994**1
显著性(双侧).005.740.426.004.005.000.001
N55555555
**.在.01水平(双侧)上显著相关。
一般直接看相关系数和显著性双侧。
你这个一列一列的看要方便些,比如第一列,表示为x1和其他各变量之间的相关性,x1和x2的相关系数为-.022,显著性双侧为0.972,说明这两个变量间无相关性,依次类推。
只要是显著性<0.05即可说明两变量具有相关性,而相关性的大小取决于相关系数,相关系数越接近1,相关性越好。
看了一下你的x1和x4-x8的相关系数都在0.9以上了。
是非常好的。
利用SPSS,相关系数矩阵怎么算
analyze-correlate-bivariate-选择变量
OK
输出的是相关系数矩阵
相关系数下面的Sig.是显著性检验结果的P值,越接近0越显著。
另外,表格下会显示显著性检验的判断结果,你看看表格下的解释就知道,比如“**.Correlationissignificantatthe0.01level(2-tailed).”
就是说,如果相关系数后有"**"符号,代表在0.01显著性水平下显著相关
粗略判断的方法是,相关系数0.6以上,可以认为显著相关了
person系数是什么意思
皮尔森系数
皮尔森相关系数
皮尔森相关系数(Pearson correlation coefficient)
也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数。
皮尔森相关系数是用来反映两个变量线性相关程度的统计量。
相关系数用r表示,其中n为样本 量,分别为两个变量的观测值和均值。
r描述的是两个变量间线性相关强弱的程度。
r的绝对值越大 表明相关性越强。
person是人的意思
SPSS中pearson(皮尔逊相关系数)看r值还是P值,确定相关性
两个值都要看,r值表示在样本中变量间的相关系数,表示相关性的大小;p值是检验值,是检验两变量在样本来自的总体中是否存在和样本一样的相关性。
相关系数为0.61,能否证明两个变量相关性较高?
实验结果表明两个变量的相关系数是0.61,能否表明这2个变量有较高的相关性?
目前研究这2个变量表示的内容的关系的人还比较少,所以我没法和别人的对比。
所以想问问数学系的同学,这个结果够不够“充分”?
谢谢!
可根据相关系数的临界值去判断。
追问
能否说的具体一些?
谢谢!
回答
1.可根据相关系数r的临界值去判断。
可查资料,资料很多。
2.“当0<|r|<1时,表示两变量存在一定程度的线性相关。
且|r|越接近1,两变量间线性关系越密切;|r|越接近于0,表示两变量的线性相关越弱。
一般可按三级划分:
|r|<0.4为低度线性相关;0.4≤|r|<0.7为显著性相关;0.7≤|r|<1为高度线性相关。
”这是一种简单的判断方法:
因此
r=0.61为显著相关。
追问
(1)我这个不是“线性相关系数”
(2)“显著相关”是什么概念?
若2个变量“显著相关”,能不能作为一个较好的结果?
其他2条回答
2013-04-0416:
16热心网友
皮尔森相关(简单相关)检验的应该就是线性相关楼上说的是对的
相关性大小是指相关系数的绝对值
是否显著、极显著是指显著性水平,即看P值的大小
相关系数多大才算相关性比较好啊
大于0.8
为什么会出现相关系数小但是相关性显著的情况呢
当显著性水平小于0.05时说明两个变量之间存在显著相关,反之则不存在。
相关系数是表示两个变量之间的相关性强弱的。
假设检验只是判断相关系数是否为0,r<0.4为低度相关。
相关系数为0.59表示相关性大还是不大?
你可以把它理解为两个量以某种方式相关的概率,则0.59表示它们有59%的可能性相关。
若为1,则表示100%相关。
所以此处相关系数为0.59,我们认为其相关性不大。
SPSS中pearson(皮尔逊相关系数)看r值还是P值,确定相关性
两个值都要看,r值表示在样本中变量间的相关系数,表示相关性的大小;p值是检验值,是检验两变量在样本来自的总体中是否存在和样本一样的相关性。
相关系数是0.9985,是否能说明相关性很好?
已经很好了
楼上说的不对
相关系数不表示概率
用SPSS软件进行相关性分析时,得出的相关系数为负值。
进行逐步回归分析时,得出的系数确为正值。
为什么?
这种情况是可以出现的。
在相关性分析时,你看到的是两个变量之间的关系,其他变量的影响是不被考虑的;但是,进行逐步回归分析时,如果入选的变量不止一个,那么入选变量之间可以产生影响,这种影响甚至可以改变一些原来不算强的相关性的方向。
这表明你的数据存在偏相关、部分相关或伪相关等情况。
相关系数说明两个现象之间相关关系密切程度的统计分析指标。
相关系数用希腊字母γ表示,γ值的范围在-1和+1之间。
γ>0为正相关,γ<0为负相关。
γ=0表示不相关;γ的绝
对值越大,相关程度越高。
两组数据的相关系数如果是负数则表示一组数据增大,另一组数据也反而减小;一组数据减小,另一组数据反而增大。
相关系数如果是负数表明两种资产的收益率呈反方向变动,负数代表负相关.正数代表正相关.0代表不相关.
你好,请教一下,主成分分析中,综合得分都是负值怎么比较?
你是用什么软件操作?
SPSS中,主成分分析实现是利用因子分析,只要累计方差贡献率达到80%以上即可,你说的综合得分指的是因子分析的得分?
追问
谢谢!
是的,是各因子的得分,以下是计算结果
第一次用,是不是哪里出错了,数据不知道怎么解释?
我的qq:
2628230137
回答
首先,你要先确定你的变量不存在问题:
不存在共线、异方差等,在做因子分析前,你是否进行了KMO检验?
是否有必要做因子旋转?
累计方差贡献率是否达到80%以上
以上问题都排除之后,说明你的变量应该是不存在问题。
那么一般因子分析得分出现负数,只能说明因子得分是在平均分以下,我头一次见到所有因子和主因子得分都是负数……建议你先看下变量是否存在问题,我晚上不上QQ,如果你白天有时间,可以加个QQ聊下。
用SPSS进行主成分分析,最后得出的一个综合指标关系式,但是带入相应的数据后为负值。
请问原因及解决方法
有负值是正常的
因为所有评价对象的综合指标的和为0
不同评价对象的综合指标必须有正有负的
主成分分析要求数据必须正态分布吗?
聚类分析对数据有什么要求?
主成分分析要求数据接近正态分布,不一定要严格的正态分布条件,一般来说样本量在100以上就基本符合条件。
聚类分析对数据的要求是聚类的各组的组内方差较小,而组间方差较大,正常来说只要方法选择得当,这个要求会比较容易做到的。