空间统计工具箱Word文档下载推荐.docx
《空间统计工具箱Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《空间统计工具箱Word文档下载推荐.docx(39页珍藏版)》请在冰点文库上搜索。
1.1.3用法
“平均最近邻”工具将返回五个值:
平均观测距离、预期平均距离、最近邻指数、z得分和p值。
您可通过结果窗口访问这些值,也可以将这些值作为派生输出值进行传递,以满足模型或脚本中的潜在使用需要。
z得分和p值结果是统计显著性的量度,用来判断是否拒绝零假设。
但是应注意,此方法的统计意义受研究区域大小的强烈影响(请参阅下文)。
对于“平均最近邻”统计,零假设表明要素是随机分布的。
“最近邻指数”的表示方式是“平均观测距离”与“预期平均距离”的比率。
预期平均距离是假设随机分布中的邻域间的平均距离。
如果指数小于1,所表现的模式为聚类;
如果指数大于1,则所表现的模式趋向于离散或竞争。
平均最近邻方法对“面积”值非常敏感(面积参数值的细微变化都能导致z得分和p值结果产生巨大变化)。
因此,平均最近邻工具最适用于对固定研究区域中不同的要素进行比较。
下图是关于相同要素分布如何根据指定的研究区域进行分散或聚类的一个典型示例。
此工具将用于处理面或线数据,但它最适用于事件、事件点或其他定点要素数据。
对于线要素和面要素,会在计算中使用每个要素真正的几何质心。
对于多点、折线(polyline)或由多部分组成的面,使用所有要素部分的加权平均中心来计算质心。
点要素的加权项是1,线要素的加权项是长度,而面要素的加权项是面积。
1.1.4语法
参数
说明
数据类型
Input_Feature_Class
要对平均最近邻距离进行计算的要素类(通常是点要素类)。
FeatureLayer
Distance_Method
指定计算每个要素与邻近要素之间的距离的方式。
·
EUCLIDEAN_DISTANCE—两点间的直线距离(笔直地)
MANHATTAN_DISTANCE—沿垂直轴度量的两点间的距离(城市街区);
计算方法是对两点的x和y坐标的差值(绝对值)求和。
String
Generate_Report
(可选)
NO_REPORT—不会创建图形汇总。
这是默认设置。
GENERATE_REPORT—图形汇总将以HTML文件形式创建。
Boolean
Area
表示研究区域大小的数值。
默认值是包含所有要素(或所有选定要素)的最小外接矩形的面积。
单位应与“输出坐标系”的单位一致。
Double
1.2高/低聚类
1.2.1简介
高/低聚类(Getis-OrdGeneralG)工具是一种推论统计,这意味着分析结果将在零假设的情况下进行解释。
高/低聚类(GeneralG)统计的零假设规定不存在要素值的空间聚类。
此工具返回的p值较小且在统计学上显著,则可以拒绝零假设。
如果零假设被拒绝,则z得分的符号将变得十分重要。
如果z得分值为正数,则观测的GeneralG指数会比期望的GeneralG指数要大一些,表明属性的高值将在研究区域中聚类。
如果z得分值为负数,则观测的GeneralG指数会比期望的GeneralG指数要小一些,表明属性的低值将在研究区域中聚类。
当存在完全均匀分布的值并且要查找高值的异常空间峰值时,首选高/低聚类(Getis-OrdGeneralG)工具。
高值和低值同时聚类时,它们倾向于彼此相互抵消。
如果在高值和低值同时聚类时测量空间聚类,则使用空间自相关工具。
高/低聚类(Getis-OrdGeneralG)和空间自相关(GlobalMoran'
sI)工具的零假设都具有完全空间随机性(CSR);
在数据集的要素中值是随机分布的,将在运行时反映随机空间过程。
不过,“高/低聚类(Getis-OrdGeneralG)”工具的z得分的解释与“空间自相关(GlobalMoran'
sI)”工具的z得分的解释有很大的差别:
结果
p值不具有统计学上的显著性。
不能拒绝零假设。
要素属性值的空间分布很有可能是随机空间过程的结果。
也就是说,所观测到的值的空间模式很可能是完全空间随机性的众多可能结果之一。
p值具有统计学上的显著性,且z得分为正值。
可以拒绝零假设。
如果基础空间过程是完全随机的,则数据集中高值的空间分布与预期的空间分布相比在空间上的聚类程度更高。
如果基础空间过程是完全随机的,则数据集中高值和/或低值的空间分布在空间上聚类的程度要高于预期。
p值具有统计学上的显著性,且z得分为负值。
如果基础空间过程是完全随机的,则数据集中低值的空间分布与预期的空间分布相比在空间上的聚类程度更高。
如果基础空间过程是完全随机的,则数据集中高值和低值的空间分布在空间上离散的程度要高于预期。
离散的空间模式通常反映某种类型的竞争过程:
具有高值的要素排斥具有高值的其他要素;
类似地,具有低值的要素排斥具有低值的其他要素。
1.2.2可能的应用
在访问急症室的次数中查找出现的异常峰值,可能表明在局部或区域的健康问题的爆发。
比较在城市中不同种类零售业的空间模式,利用比较购物的方式来了解哪类行业充满竞争性(如汽车经销商)以及哪类行业拒绝竞争(如健康中心/健身房)。
汇总空间现象聚类的程度以检查不同时期或不同位置的变化。
例如,众所周知的城市及其人口聚类。
使用高/低聚类分析时,可以随时间来比较某个城市的人口聚类的程度(城镇发展以及密集度的分析)。
1.2.3用法
“高/低聚类”工具可返回四个值:
GeneralG观测值、GeneralG期望值、z得分及p值。
输入字段应包含多种非负值。
如果输入字段包含负值,将显示错误消息。
此外,此统计数学方法要求待分析的变量存在一定程度的变化;
例如,如果所有输入都是1便无法求解。
如果要使用此工具分析事件数据的空间模式,应考虑聚合事件数据。
优化的热点分析工具也可以用于分析事件数据的空间模式。
z得分越高(或越低),聚类程度就越高。
如果z得分接近零,则表示研究区域内不存在明显的聚类。
z得分为正表示高值的聚类。
z得分为负表示低值的聚类。
空间关系的概念化参数的选择应反映要分析的要素之间的固有关系。
对要素在空间中彼此交互方式构建的模型越逼真,结果就越准确。
这些建议在选择空间关系的概念化:
最佳做法中进行了概述。
以下是一些额外提示:
建议针对此统计使用二进制权重方案:
固定距离、面邻接、K最近邻或Delaunay三角测量。
为标准化参数选择NONE。
FIXED_DISTANCE_BAND
默认的距离范围或距离阈值将确保每个要素至少拥有一个相邻要素,这一点十分重要。
但通常,此默认值并不是适用于分析的最合适的距离。
为分析选择适合的比例(距离范围)的其他策略在选择固定距离范围值中进行了概括介绍。
INVERSE_DISTANCE或INVERSE_DISTANCE_SQUARED(不建议使用)
如果为距离范围或阈值距离参数输入0,则所有要素均被视为所有其他要素的相邻要素;
如果将此参数留空,则将采用默认距离。
如果距离权重小于1,则对其取倒数时将变得不稳定。
因此,对于分隔距离小于1单位的要素权重,权重值将指定为1。
对于反距离选项(不建议对此工具使用),为避免产生除数为零的情况,任何重合两点的权重值均将指定为1。
这样便可确保将要素包含在分析之内。
空间关系的概念化参数的附加选项(包括空间-时间关系)在使用生成空间权重矩阵或者生成网络空间权重工具时可用。
要利用这些附加选项,请使用上述任一工具构造空间的权重矩阵文件,然后进行分析;
为空间关系的概念化参数选择GET_SPATIAL_WEIGHTS_FROM_FILE,为权重矩阵文件参数指定您所创建的空间权重文件的路径。
地图图层可用于定义输入要素类。
在使用带有选择内容的图层时,分析只会包括所选的要素。
如果提供的是一个带.swm扩展名的权重矩阵文件,则此工具需要输入的是一个使用生成空间权重矩阵或生成网络空间权重工具创建的空间权重矩阵文件;
否则,此工具需要输入一个ASCII格式的空间权重矩阵文件。
在某些情况下,工具行为将根据所使用的空间矩阵文件类型的不同而有所区别:
ASCII格式的空间权重矩阵文件:
权重“按原样”使用。
所缺失的要素与要素之间的关系被视为零。
如果对权重进行了行标准化,则选择集的分析结果很有可能不正确。
如果需要对选择集运行分析,则通过以下方法将ASCII空间权重文件转换为SWM文件:
将ASCII数据读入表,然后将CONVERT_TABLE选项与生成空间权重矩阵工具结合使用。
SWM格式的空间权重矩阵文件:
如果对权重进行了行标准化,则会将其选择集重新标准化;
否则,权重将“按原样”使用。
使用ASCII格式的空间权重矩阵文件运行您的分析会占用大量内存。
如果要分析的要素超过5,000个,则考虑将ASCII格式的空间权重矩阵文件转换为SWM格式的文件。
首先,将ASCII权重置入一个带格式的表中(例如,使用Excel)。
接下来运行生成空间权重矩阵工具,并使用空间关系的概念化参数的CONVERT_TABLE。
输出将是SWM格式的空间权重矩阵文件。
1.2.4语法
将计算GeneralG统计的要素类。
Input_Field
要评估的数值字段。
Field
Conceptualization_of_Spatial_Relationships
指定要素空间关系的定义方式。
INVERSE_DISTANCE—与远处的要素相比,附近的邻近要素对目标要素的计算的影响要大一些。
INVERSE_DISTANCE_SQUARED—与
INVERSE_DISTANCE类似,但它的坡度更明显,因此影响下降得更快,并且只有目标要素的最近邻域会对要素的计算产生重大影响。
FIXED_DISTANCE_BAND—将对邻近要素环境中的每个要素进行分析。
在指定临界距离(Distance_Band_or_Threshold)内的邻近要素将分配有值为1的权重,并对目标要素的计算产生重大影响。
在指定临界距离外的邻近要素将分配值为零的权重,并且不会对目标要素的计算产生任何影响。
ZONE_OF_INDIFFERENCE—在目标要素的指定临界距离(Distance_Band_or_Threshold)内的要素将分配有值为1的权重,并且会影响目标要素的计算。
一旦超出该临界距离,权重(以及邻近要素对目标要素计算的影响)就会随距离的增加而减小。
CONTIGUITY_EDGES_ONLY—只有共用边界或重叠的相邻面要素会影响目标面要素的计算。
CONTIGUITY_EDGES_CORNERS—共享边界、结点或重叠的面要素会影响目标面要素的计算。
GET_SPATIAL_WEIGHTS_FROM_FILE—将由指定空间权重文件定义空间关系。
指向空间权重文件的路径由Weights_Matrix_File
参数指定。
Standardization
当要素的分布由于采样设计或施加的聚合方案而可能偏离时,建议使用行标准化。
NONE—不对空间权重执行标准化。
ROW—对空间权重执行标准化;
每个权重都会除以行的和(所有相邻要素的权重和)。
Distance_Band_or_Threshold_Distance
为“反距离”和“固定距离”选项指定中断距离。
将在对目标要素的分析中忽略为该要素指定的中断之外的要素。
但是,对于ZONE_OF_INDIFFERENCE,指定距离之外的要素的影响会随距离的减小而变弱,而在距离阈值之内的影响则被视为是等同的。
输入的距离值应该与输出坐标系的值匹配。
对于空间关系的反距离概念化,值为
0
表示未应用任何阈值距离;
当将此参数留空时,将计算并应用默认阈值。
此默认值为确保每个要素至少具有一个邻域的欧氏距离。
当选择了面邻接(CONTIGUITY_EDGES_ONLY
或CONTIGUITY_EDGES_CORNERS)或GET_SPATIAL_WEIGHTS_FROM_FILE
的空间概念化时,该参数无效。
Weights_Matrix_File
包含权重(其定义要素间的空间关系以及可能的时态关系)的文件的路径。
File
1.3增量空间自相关
1.3.1简介
当看到地表上的空间聚类时,您将看到正在进行的基础空间过程。
了解基础过程运行的空间比例有助于选择适当的分析距离。
增量空间自相关工具为一系列增大的距离运行空间自相关(GlobalMoran’sI)工具,同时测量各距离空间聚类的程度。
聚类的程度由返回的z得分确定。
通常情况下,距离的增大(z得分也增大)表示聚类增强。
但是,对于某些特定距离,z得分通常为峰值。
有时您会看到多个峰值。
1.3.2用法
此工具有助于为具有这些参数(如热点分析或点密度)的工具选择合适的距离阈值或半径。
此增量空间自相关工具可测量一系列距离增量的空间自相关,并为每项距离增量报告相关的Moran指数、预期指数、方差、z得分和p值。
右键单击消息条目并选择视图,在结果窗口中访问这些值。
作为派生输出值,此工具也可传递可能会在模型或脚本中使用的第一个峰值z得分和最大峰值z得分。
当显示多个具有统计显著性的峰值时,聚类在这些距离处均很明显。
选择与您感兴趣的分析比例对应的峰值距离;
通常为遇到的第一个具有统计显著性的峰值。
输入字段应包含多种值。
此统计数学方法要求待分析的变量存在一定程度的变化;
对于线和面要素,距离计算中会使用要素的质心。
对于多点、折线或由多部件组成的面,将会使用所有要素部件的加权平均中心来计算质心。
对于面要素,几乎始终需要为行标准化参数选择ROW。
如果每个要素所具有的邻域数目由聚合方案或者采样过程决定,而不是反映您所分析的变量的实际空间分布,则行标准化将减少偏移。
如果未给定开始距离,则默认值为最小距离,在该距离处,数据集中的每个要素至少具有一个相邻要素。
如果您的数据集中存在位置异常值,那么此距离可能不是最合适的开始距离。
如果未给定增量距离,则使用平均最近邻距离或(Td-B)/I(其中Td为最大阈值距离,B为开始距离,I为距离段数量)二者当中的较小者。
该算法可确保始终根据指定的距离段数量来执行计算,确保最大距离段不会过大以致一些要素以所有其它要素或几乎所有其它要素作为其相邻要素。
如果指定的开始距离和/或增量距离所生成的距离段大于最大阈值距离,增量距离将自动减小。
为避免该调整,可以减小指定的增量距离和/或距离段数量。
运行此工具时,可能会发生内存不足的情况。
这种情况通常发生在开始距离和/或增量距离导致要素具有很多相邻点时。
您通常不会希望在具有上千个相邻要素的要素处创建空间关系。
增量距离使用更小的值并临时移除位置异常值,以便以更小的开始距离值启动。
即使您用工具计算开始距离与增量距离,大数据集的处理时间也可能比较长。
您可以通过以下方式提高性能:
临时移除位置异常值。
不运行所有要素的分析,而是选择研究区的典型部分中的要素,然后只分析这些要素。
从数据集中随机选择要素的样本,只分析这些样本要素。
距离通常基于输出坐标系环境设置。
输出坐标系环境的默认设置为“与输入相同”。
进行分析之前将输入要素投影到输出坐标系。
可选输出表将包含各迭代处的距离值、MoranI指数值、预期MoranI指数值、方差、z得分和p值。
峰值为z得分值升高、然后降低处的值。
例如,如果此工具查找到50、100和150米距离的z得分分别为:
2.95、3.68和3.12,则峰值应为100米。
可选输出报表文件以PDF文件格式创建,通过双击文件名可从结果窗口访问此文件。
此工具将选择性地创建汇总结果的PDF报表。
PDF文件不会自动显示在目录窗口中。
如果要在“目录”中显示PDF文件,可打开ArcCatalog应用程序,选择自定义菜单选项,单击ArcCatalog选项,然后选择文件类型选项卡。
单击新建类型按钮,并指定PDF作为文件扩展名,如下图所示。
1.3.3语法
Input_Features
要对一系列距离进行测量的空间自相关的要素类。
用于评估空间自相关的数值字段。
Number_of_Distance_Bands
针对空间自相关而递增邻域大小和分析数据集的次数。
分别在Beginning_Distance
和
Distance_Increment
参数中指定的增量的起点和大小。
Long
Beginning_Distance
开始空间自相关分析的距离和开始增量的距离。
为此参数输入的值应使用“输出坐标系”环境设置的单位。
Distance_Increment
每次迭代后要增加的距离。
分析中使用的距离于
Beginning_Distance
处开始,以
中指定的数量增加。
EUCLIDEAN—两点间的直线距离(笔直地)
MANHATTAN—沿垂直轴度量的两点间的距离(城市街区);
Row_Standardization
Output_Table
要创建的表格包含各距离范围和相关z得分结果。
Table
Output_Report_File
要创建的PDF文件包含汇总结果的折线图。
1.4多距离空间聚类分析(Ripley’sK函数)
1.4.1简介
基于Ripley'
sK函数的多距离空间聚类分析工具是另外一种分析事件点数据的空间模式的方法。
该方法不同于此工具集中其他方法(空间自相关和热点分析)的特征是可对一定距离范围内的空间相关性(要素聚类或要素扩散)进行汇总。
在许多要素模式分析研究中,都需要选择适当的分析比例。
例如,该分析通常需要距离范围或距离阈值。
在多个距离和空间比例下研究空间模式时,模式会发生变化,而这通常可反映对运行中的特定空间过程的控制。
Ripley'
sK函数可表明要素质心的空间聚集或空间扩散在邻域大小发生变化时是如何变化的。
使用此工具时,需要指定要计算的距离个数,同时也可选择指定起始距离和/或距离增量。
该工具可利用此信息计算与每个要素关联的相邻要素的平均数量;
相邻要素是指小于计算距离的要素。
随着计算距离的增大,各要素所具有的相邻要素数通常会越多。
如果某个特定计算距离的平均相邻要素数高于/大于整个研究区域内要素的平均密度,该距离的分布方式将被视为聚类分布。
如果有兴趣研究要素的聚类/扩散如何相对于不同距离(不同的分析规模)进行变化,您可以使用此工具。
Measureofspatialclustering/dispersionoverarangeofdistances.
1.4.2用法
此工具需要投影数据来准确测量距离。
工具输出是一个包含以下字段的表:
ExpectedK
ObservedK
分别包含K预期值和K观测值。
由于应用了
L(d)变换,因此
值始终与距离值相匹配。
DiffK
字段包含K观测值与K预期值的差值。
如果指定了置信区间选项,则附加字段
LwConfEnv
HiConfEnv
也将包含在输出表中。
这些字段包含工具的每个迭代(由距离段数量参数指定)的置信区间信息。
K函数还可以创建图层汇总结果。
如果特定距离的K观测值大于K预期值,则与该