计量地理学丁利旺.docx
《计量地理学丁利旺.docx》由会员分享,可在线阅读,更多相关《计量地理学丁利旺.docx(25页珍藏版)》请在冰点文库上搜索。
计量地理学丁利旺
南阳师范学院
本科学生实验报告
姓名丁利旺院(系)环旅科学与旅游学院
专业地理信息科学班级13级4班
实验课程名称计量地理学
指导教师及职称白景锋
开课时间2015至2016学年一学期
南阳师范学院教务处编印
实验名称目录
实验一:
数据分布
实验二:
统计图表、空间罗伦兹曲线
实验三:
相关分析、一元回归模型构建
实验四:
多元回归模型构建
实验五:
聚类分析
学生姓名:
丁利旺专业:
地理信息科学班级:
13级4班
课程名称:
计量地理学
实验名称:
数据分布
实验编号:
No1
指导教师:
白景锋
实验地点:
逸夫楼机房1
实验时间:
2015年11月24日
小组合作:
是()
否(√)
小组成员:
实验目的:
了解地理数据分布的基本特征,掌握地理数据分布特征的主要表征值。
实验设备:
计算机
实验内容及步骤:
实验内容:
运用SPSS应用软件中的DescripitivesAnallysis模块,重点掌握标准差、最大值、最小值、方差、全距、算术平均数、众数、中位数、算数和以及偏态、峰度的计算等。
实验步骤与结果分析:
建立或打开数据文件后,进行一维频数分布分析——按statistucs----descriptives---frequencies顺序逐一单击鼠标键,打开frequencies频数分布对话框——在左侧的源变量框中选择一个或多个变量,单击向右箭头按钮使其进入右侧的Variables框中——选中Displayfrequencytable复选项,将显示频数分布表
(1)单击statistics按钮,打开frenquencystatistics对话框,如图所示,在对话框中去定将要在输出结果中出现统计量。
可选择的统计量分为X组,其中我们主要需要以下统计量:
(2)Dispersion离差栏,选择此栏中各复选项计算的统计量如下:
1std.deviation标注差
2Variance方差
3Range全距,级最大值与最小值的差
4Miuimum最小值
5Maxmmum最大值
6S.E.mean均数的标准误
(3)centralTendency中心趋势栏
1Mean算术平均数
2Median中位数
3Mode众数
4Sun算术和
(4)distribution分布参数栏
单击Charts按Frequency:
chart钮,展开对话框,在对话框中对图形的类型及坐标轴等进行设置。
(1)charttype栏。
选择图形类型。
①None选项,不输出图形,这是默认系统。
②Barcharts选项,输出条形图,各亮度代表变量各分类的观测量数。
频数为0的分类不显示在此图中。
③Piecharts选项,输出圆图,圆图中各块代表变量各分类的观测频数。
频数为0的分类不显示在此图中
④Histograms选项,要求做直方图,此图仅仅用于连续的数值型变量。
如果选择了直方图还可以选择withnormalcurve复选项即直方图中带有正态曲线。
(2)chartvalue拦,纵轴表达的统计量。
只有选择了条形图和圆图栏中的选项才有效。
①Frequencies选项,纵轴表示频数
②Percentage选项,纵轴表示百分比
运行方法二(SPSS操作)
以课本第19页表2-3数据为例
(1)录入数据
定义变量“降水量”,并按表2-3内容输入数据,见图1-1
(2)转换数据,声称新变量
①选择“Transfrom→Recode→intoDifferentVaribles。
。
。
”命令,弹出“RecodeintoDifferentVaribles”对话框,将“降水量”选入“NumericVariable”框中,并在“outputVariable”中输入新变量的名字“分组”,单击框后的“Change”按钮,如图1-2所示
②单击“oldandNewValues”按钮,弹出“RecodeintoDifferentVaribles:
oldandNewValues”对话框。
在对话框中左侧第二个“Range”框中输入92.97,然后在“NewValues”框中的“Value”后输入1,单击“Add”按钮,右侧的文本框中显示“Lowestthru92.67→1”,表示用1代表92.67以下的降水量值。
在第一个“range”框中输入“92.68”though“199.67”,然后在“Value”后输入2,单击“add”按钮加入,即用2代表92.68到199.67之间的降水量值。
同样,用3代表199.68到306.67之间的降水量值,用4代表306.68到413.67之间的降水量值,用5表示413.68到520.67之间的降水量值,用6表示520.68到627.67之间的降水量值,用7表示627.68到734.67之间的降水量值。
在第三个“Range”框中输入“734.67”然后在”Newvalue”框中的”value”后输入8,单击”Add’按钮加入,即用8代表734.67以上的降水量。
设置完成后如图1-3所示。
③单击“Continnue”按钮,回到图中的对话框中,单击OK按钮,生成新的变量“分组”,界面如图所示。
(3)统计分析
①选择“Analyzer→DescriptiveStatistic→Frequencies”命令,弹出“Frequencies对话框从左侧选择分组,使其进入“Variable”框中,如图所示
②选中“Displaytables”复选框,表示显示次数分布表。
③单击“statistics”按钮,弹出“Frenquency:
Statistics”对话框,视需要进行选择,如图所示,本例采用默认值,设置完成后单击“Continue”按钮。
④在图中所示的对话框中,单击“Charts”按钮,弹出“Frenquencies:
Charts”对话框,本题中采用“Histograms”和“Withnormalcurve”两项,单击“Continue”按钮
⑤在所示的对话框中,单击“Format”按钮,弹出“Frenquencies:
Format”对话框,如图所示本体采用默认值,设置完成后单击“Continnue”按钮
⑥在图中所示的对话框中,单击“OK”按钮,提交运行,输出结果如图所示
分组
Frequency
Percent
ValidPercent
CumulativePercent
Valid
1
8
15.1
15.1
15.1
2
9
17.0
17.0
32.1
3
3
5.7
5.7
37.7
4
5
9.4
9.4
47.2
5
11
20.8
20.8
67.9
6
13
24.5
24.5
92.5
7
2
3.8
3.8
96.2
8
2
3.8
3.8
100.0
Total
53
100.0
100.0
(1)录入数据
定义变量“降水量”,并按表2-3内容输入数据,见图1-10
(2)录入下限值,调用Frequency函数,生成函数值用鼠标选择区域C2到C10,在编辑栏内输入“=Frequency(A2:
A101,B2:
B10)”;按“Ctrl+Shift+Enter”组合键产生数组公式”={Frequency(C2:
C56,B58:
B69)}”,这里要注意“{}”不能手工键入,必须按下“Ctrl+Shift+Enter”组合键有系统自动生成,完成后C2:
C10将显示如图1-11所示的降水值分布情况。
(3)绘制频数分布图
根据频数值计算频率值,然后在EXCEL表中录入组中值,并把频数、频率复制到组中值并列的单元格里,插入图表,图表类型选用双轴线—柱图,然后绘制频数分布图
实验小结
通过本实验的学习我了解到了地理数据分布的基本特征,掌握了地理数据分布特征的主要表征值。
指导教师评语及成绩:
学生姓名:
丁利旺专业:
地理信息科学班级:
13级4班
课程名称:
计量地理学
实验名称:
统计图表、空间罗仑兹曲线
实验编号:
No2
指导教师:
白景锋
实验地点:
逸夫楼机房1
实验时间:
2015年12月1日
小组合作:
是()
否(√)
小组成员:
实验目的:
掌握地理研究中常用的统计图表的方法,空间洛伦兹曲线的作法。
实验设备:
计算机
实验内容及步骤:
实验内容:
运用Excel绘图模块,对地理研究中常用的图表进行绘制,重点掌握曲线图、直方图、立方图、双轴曲线图等。
运用Excel的计算模块,绘制空间洛伦兹曲线。
实验步骤与结果分析
[(单要素)空间洛伦兹曲线的绘制]
——基本原理:
作一长方形,长方形的水平轴为部门或区域单元,垂直轴为累计百分率。
对角线OX表示各部门或区域单元的要素分布是均等的。
曲线的上凸程度,表示要素的部门或区域单元集中化程度,上凸程度越大,就表示要素越是集中于某些产业部门。
——主要步骤:
(1)将1989年全国各省的GDP及其占总GDP比重表(百分比),从大到小重新排序;将1989年全国各省的总人口数及其占全国总人口数比重表(百分比),从大到小重新排序。
(2)从大到小,逐次计算累计百分;
1988年人口比重:
各省代码
指标
总人口(年末)(万人)
人口比重
人口累计百分比
22
四川省
10706
9.690179
9.69017858
16
河南省
8231
7.450015
17.140194
15
山东省
8160
7.385752
24.525945
10
江苏省
6536
5.915842
30.441787
19
广东省
6025
5.453328
35.895115
18
湖南省
6009
5.438846
41.333961
3
河北省
5881
5.322991
46.656952
12
安徽省
5469
4.950083
51.607035
17
湖北省
5259
4.760008
56.367043
11
浙江省
4208
3.808731
60.175774
20
广西壮族自治区
4151
3.757139
63.932913
6
辽宁省
3876
3.508232
67.441145
14
江西省
3695
3.344406
70.785551
24
云南省
3648
3.301865
74.087416
8
黑龙江省
3510
3.176959
77.264376
26
陕西省
3191
2.888227
80.152603
23
贵州省
3169
2.868315
83.020917
13
福建省
2896
2.621218
85.642135
4
山西省
2793
2.527991
88.170126
7
吉林省
2403
2.174995
90.345121
27
甘肃省
2172
1.965913
92.311034
5
内蒙古自治区
2122
1.920657
94.231692
30
新疆维吾尔自治区
1454
1.316040
95.547731
9
上海市
1276
1.154929
96.702660
1
北京市
1037
0.938606
97.641266
2
天津市
856
0.774780
98.416046
21
海南省
639
0.578370
98.994415
29
宁夏回族自治区
455
0.411828
99.406243
28
青海省
440
0.398251
99.804495
25
西藏自治区
216
0.195505
100.000000
1988年GDP比重:
各省代码
指标
地区生产总值(亿元)
GDP比重
GDP累计百分比
19
广东省
1381.39
8.520414
8.520413922
10
江苏省
1321.85
8.153171
16.67358511
15
山东省
1293.94
7.981022
24.6546074
6
辽宁省
1003.80
6.191439
30.8460461
16
河南省
850.71
5.24718
36.09322562
11
浙江省
849.44
5.239346
41.33257179
3
河北省
822.83
5.075216
46.40778747
22
四川省
744.98
4.595037
51.00282433
17
湖北省
717.08
4.42295
55.42577398
9
上海市
696.54
4.296259
59.7220329
18
湖南省
640.80
3.952455
63.67448749
8
黑龙江省
630.60
3.889541
67.56402847
12
安徽省
616.25
3.80103
71.36505865
13
福建省
458.40
2.827411
74.19246998
1
北京市
455.96
2.812361
77.00483139
7
吉林省
391.65
2.415697
79.42052871
20
广西壮族自治区
383.44
2.365058
81.78558674
14
江西省
376.46
2.322005
84.10759213
4
山西省
376.26
2.320772
86.42836392
24
云南省
363.05
2.239293
88.66765643
26
陕西省
358.37
2.210426
90.87808269
5
内蒙古自治区
292.69
1.805312
92.68339469
2
天津市
283.49
1.748566
94.4319611
23
贵州省
235.84
1.454661
95.88662229
30
新疆维吾尔自治区
217.29
1.340245
97.22686707
27
甘肃省
216.84
1.337469
98.56433625
21
海南省
91.32
0.563262
99.12759804
28
青海省
60.37
0.372362
99.49996022
29
宁夏回族自治区
59.21
0.365207
99.86516751
25
西藏自治区
21.86
0.134832
100
(3)以代码为横坐标(X),累计百分比为纵坐标(Y);以(代码,累计百分比)为坐标点,连成一个上凸的曲线,即罗伦次曲线。
(4)[(双要素)空间洛仑兹曲线的绘制]
(5)----基本原理;
(6)做一正方形,正方形的水平轴和垂直轴窦唯积累百分率。
对角线ox表示沿两种分布之间是完全对应的,有相同的百分率和积累百分率。
曲线离开对角线的远近就是这两种分布的差异程度的测度。
(7)--------主要步骤:
(8)
(1)确立研究对象
(9)主要是考虑那两种或几种事物与另外一种事物或现象进行比较。
一般来讲,可以考虑人
口与GDP,GDP与面积、利用资源与面积等进行比较。
(2)求研究对象的比重
(3)计算r值:
R=GDP比重/人口比重
(4)把各地区的R值由大到小顺序排列,相应的计算出GDP和人口的累计百分比
(5)分别以GDP和人口的累计百分比为纵轴和横轴,把各个地区的数值点在直角坐标系内。
若折线越接近对角线,则表明GDP的分布和人口分布比较一致,越远离对角线,则表明与人口的分布不一致,即GDP的内部差异较大。
实验小结:
通过本实验的学习我学会了地理研究中常用的统计图表的方法以及空间洛伦兹曲线的作法。
指导教师评语及成绩:
学生姓名:
丁利旺专业:
地理信息科学班级:
13级4班
课程名称:
计量地理学
实验名称:
相关分析、一元回归模型构建
实验编号:
No3
指导教师:
白景锋
实验地点:
逸夫楼机房1
实验时间:
2015年12月8、15日
小组合作:
是()
否(√)
小组成员:
实验目的:
掌握相关分析、回归分析的定义、内涵,重点掌握一般相关系数的计算公式、利用所给数据能够建立一元线性与非线性回归方程,并能够进行检验。
实验设备:
计算机
实验内容及步骤:
实验内容:
运用SPSS应用软件中的Correlate模块进行两两要素间的相关分析,并能够进行检验;运用SPSS应用软件中的Regression模块建立一元线性和非线性方程,并进行检验,利用所给数据进行预测。
实验步骤与结果分析:
【spss计算简单相关系数】
主要步骤:
(1)打开analyze—correlate—brivative顺序逐一单击鼠标,展开BrivariteCorrelations二元变量相关分析对话框。
(2)在变量栏中选中所要求的变量,将选择的变量移到Variables矩形框中。
(3)从主对话框中选择correlationcoefficient的方法,系统默认的是Pearson,即皮尔逊相关(常用的一种方法)。
显著性检验系统默认的是Tow-tailed,即双尾T检验,表示相关系数为0的假设检验成立的概率。
如果是先不知道相关方向时选用Tow-tailed;如果事先知道方向时,选用One-tailed.
(4)要求想好似实际的显著性水平。
“**”相关系数的显著性概率水平为0.01。
“*”表示显著性水平为0.05。
Correlations
粮食产量
受灾面积
粮食产量
PearsonCorrelation
1
.803**
Sig.(2-tailed)
.005
N
10
10
受灾面积
PearsonCorrelation
.803**
1
Sig.(2-tailed)
.005
N
10
10
**.Correlationissignificantatthe0.01level(2-tailed).
表3-1
从表3-1中我们可以得到相关系数为0.803,通过查课本51页表格我们能够知道当a=0.01,f=10-2=8时,对应的值为0.7646,而0.803>0.7646,所以通过了相关检验。
【spss计算偏相关系数】
主要步骤:
(1)打开analyze—correlate—Partial顺序逐一单击鼠标,展开PartialCorrelations变量偏相关分析主对话框。
(2)在变量栏中选中进行偏相关分析的变量,移到Variables矩形框中,把不参与偏相关分析的变量,移到Controllingfor矩形框中。
(3)显著性检验系统默认的是Tow-tailed,即双尾T检验,表示相关系数为0的假设检验成立的概率。
如果是先不知道相关方向时选用Tow-tailed;如果事先知道方向时,选用One-tailed。
(4)要求想好似实际的显著性水平。
“**”相关系数的显著性概率水平为0.01。
“*”表示显著性水平为0.05,点“OK”。
【spss建立一元线性模型】
主要步骤:
(1)建立数据库
(2)作散点图,按Graphs—LegacyDialogs—Scatter/Dot—SimpleScatter顺序逐一单击鼠标,展开simpiescatterplot对话框,将因变量、自变量依次选入YAxisXAxis,单击ok键,观察散点图的分布状况。
(3)按anlayze—Rggression—linear顺序逐一单击鼠标,打开LinearRgeresstion对话框。
(4)在左侧的源变量中,选择一个变量进入Dependent框中作为因变量,选择一个变量进入Independent框中,作自变量。
自变量和因变量必须是数值型变量。
(5)在methord框中选择一种回归分析方法
enter选项,强行进入法,即所选择的变量全部进入回归方程中。
该选项是默认方式。
RegressionConefficient栏,有关回归系数的选择项
Estimates复选项,输出回归系数B、B的标准误、标准回归系数beta、B的T值以及T的双测检验的显著水平Sig
与模型拟合及其拟合效果有关的选择项
Modelfit复选项,输出引入模型和从模型中剔除的变量,提供负相关系数R,负相关系数平方,及其修正值,估计值的标准误差,方差分析表。
Dscriptives复选项,输出合法观测量的数目、变量的平均数,标准差、相关系数矩阵和单测检验显著性水平矩阵
Partandpartialcorrelation复选项,输出变量之间的简单相关系数
【spss建立一元非线性模型】
序号
水土流失面积
土壤含氮量
1
0.8
6.6
2
1.4
5.2
3
2.0
4.8
4
2.7
3.9
5
3.3
3.7
6
4.1
3.2
7
5.6
2.4
8
6.5
2.3
9
7.1
2.1
10
7.7
2.3
11
8.3
1.7
12
9.2
1.5
表1-2
我们用spss软件进行非线性回归分析拟合计算。
用spss进行回归分析你和计算
在spss中可以直接进行非线性拟合,步骤如下:
Analysis→Regression→S,在弹出的对话框中选择拟合的变量和自变量,本题中分别选择y(土壤含氮量),x(水土流失面积)为因变量(Dependent)和自变量(Independent),并且本题在Models中选择Logarithmic模型。
①对数曲线方程:
Logarithmic:
Y=b0+b1*㏑(x)
②选中DisplyANOVATable。
ANOVA为Analysis-Of-Variance的缩写,选择此选项会在最终结果中显示回归平方和、剩余平方和、自由度、拟合度、拟合方程的常数和系数等。
③可以单击Save按钮,在弹出的对话框中选中PredictedValues和Residuls,得出利用各种方法拟合的结果和残差,并将它们作为列插入到原始数据表中,方便进行对比。
5确认后运行得到了各个模型拟合的拟合效果。
包括F检验、R2检验等检验效果,各个方程的常数项、变量系数、原始数据曲线和拟合曲线。
拟合曲线如下图3-2:
图3-2
同时我们还得到了以下表格:
Logarithmic
ModelSummary
R
RSquare
Adjuste