互联网+时代的出租车资源配置论文.docx

上传人:b****4 文档编号:11354911 上传时间:2023-05-31 格式:DOCX 页数:46 大小:494.04KB
下载 相关 举报
互联网+时代的出租车资源配置论文.docx_第1页
第1页 / 共46页
互联网+时代的出租车资源配置论文.docx_第2页
第2页 / 共46页
互联网+时代的出租车资源配置论文.docx_第3页
第3页 / 共46页
互联网+时代的出租车资源配置论文.docx_第4页
第4页 / 共46页
互联网+时代的出租车资源配置论文.docx_第5页
第5页 / 共46页
互联网+时代的出租车资源配置论文.docx_第6页
第6页 / 共46页
互联网+时代的出租车资源配置论文.docx_第7页
第7页 / 共46页
互联网+时代的出租车资源配置论文.docx_第8页
第8页 / 共46页
互联网+时代的出租车资源配置论文.docx_第9页
第9页 / 共46页
互联网+时代的出租车资源配置论文.docx_第10页
第10页 / 共46页
互联网+时代的出租车资源配置论文.docx_第11页
第11页 / 共46页
互联网+时代的出租车资源配置论文.docx_第12页
第12页 / 共46页
互联网+时代的出租车资源配置论文.docx_第13页
第13页 / 共46页
互联网+时代的出租车资源配置论文.docx_第14页
第14页 / 共46页
互联网+时代的出租车资源配置论文.docx_第15页
第15页 / 共46页
互联网+时代的出租车资源配置论文.docx_第16页
第16页 / 共46页
互联网+时代的出租车资源配置论文.docx_第17页
第17页 / 共46页
互联网+时代的出租车资源配置论文.docx_第18页
第18页 / 共46页
互联网+时代的出租车资源配置论文.docx_第19页
第19页 / 共46页
互联网+时代的出租车资源配置论文.docx_第20页
第20页 / 共46页
亲,该文档总共46页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

互联网+时代的出租车资源配置论文.docx

《互联网+时代的出租车资源配置论文.docx》由会员分享,可在线阅读,更多相关《互联网+时代的出租车资源配置论文.docx(46页珍藏版)》请在冰点文库上搜索。

互联网+时代的出租车资源配置论文.docx

互联网+时代的出租车资源配置论文

 

“互联网+”时代的出租车资源配置

毕业设计(论文)原创性声明和使用授权说明

原创性声明

本人郑重承诺:

所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。

尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。

对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。

作者签名:

     日 期:

     

指导教师签名:

     日  期:

     

使用授权说明

本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:

按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。

作者签名:

     日 期:

     

学位论文原创性声明

本人郑重声明:

所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。

除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。

对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。

本人完全意识到本声明的法律后果由本人承担。

作者签名:

日期:

年月日

学位论文版权使用授权书

本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。

本人授权    大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。

涉密论文按学校规定处理。

作者签名:

日期:

年月日

导师签名:

日期:

年月日

注意事项

1.设计(论文)的内容包括:

1)封面(按教务处制定的标准封面格式制作)

2)原创性声明

3)中文摘要(300字左右)、关键词

4)外文摘要、关键词

5)目次页(附件不统一编入)

6)论文主体部分:

引言(或绪论)、正文、结论

7)参考文献

8)致谢

9)附录(对论文支持必要时)

2.论文字数要求:

理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。

3.附件包括:

任务书、开题报告、外文译文、译文原文(复印件)。

4.文字、图表要求:

1)文字通顺,语言流畅,书写字迹工整,打印字体及大小符合要求,无错别字,不准请他人代写

2)工程设计类题目的图纸,要求部分用尺规绘制,部分用计算机绘制,所有图纸应符合国家技术标准规范。

图表整洁,布局合理,文字注释必须使用工程字书写,不准用徒手画

3)毕业论文须用A4单面打印,论文50页以上的双面打印

4)图表应绘制于无格子的页面上

5)软件工程类课题应有程序清单,并提供电子文档

5.装订顺序

1)设计(论文)

2)附件:

按照任务书、开题报告、外文译文、译文原文(复印件)次序装订

指导教师评阅书

指导教师评价:

一、撰写(设计)过程

1、学生在论文(设计)过程中的治学态度、工作精神

□优□良□中□及格□不及格

2、学生掌握专业知识、技能的扎实程度

□优□良□中□及格□不及格

3、学生综合运用所学知识和专业技能分析和解决问题的能力

□优□良□中□及格□不及格

4、研究方法的科学性;技术线路的可行性;设计方案的合理性

□优□良□中□及格□不及格

5、完成毕业论文(设计)期间的出勤情况

□优□良□中□及格□不及格

二、论文(设计)质量

1、论文(设计)的整体结构是否符合撰写规范?

□优□良□中□及格□不及格

2、是否完成指定的论文(设计)任务(包括装订及附件)?

□优□良□中□及格□不及格

三、论文(设计)水平

1、论文(设计)的理论意义或对解决实际问题的指导意义

□优□良□中□及格□不及格

2、论文的观念是否有新意?

设计是否有创意?

□优□良□中□及格□不及格

3、论文(设计说明书)所体现的整体水平

□优□良□中□及格□不及格

建议成绩:

□优□良□中□及格□不及格

(在所选等级前的□内画“√”)

指导教师:

(签名)单位:

(盖章)

年月日

 

评阅教师评阅书

评阅教师评价:

一、论文(设计)质量

1、论文(设计)的整体结构是否符合撰写规范?

□优□良□中□及格□不及格

2、是否完成指定的论文(设计)任务(包括装订及附件)?

□优□良□中□及格□不及格

二、论文(设计)水平

1、论文(设计)的理论意义或对解决实际问题的指导意义

□优□良□中□及格□不及格

2、论文的观念是否有新意?

设计是否有创意?

□优□良□中□及格□不及格

3、论文(设计说明书)所体现的整体水平

□优□良□中□及格□不及格

建议成绩:

□优□良□中□及格□不及格

(在所选等级前的□内画“√”)

评阅教师:

(签名)单位:

(盖章)

年月日

 

教研室(或答辩小组)及教学系意见

教研室(或答辩小组)评价:

一、答辩过程

1、毕业论文(设计)的基本要点和见解的叙述情况

□优□良□中□及格□不及格

2、对答辩问题的反应、理解、表达情况

□优□良□中□及格□不及格

3、学生答辩过程中的精神状态

□优□良□中□及格□不及格

二、论文(设计)质量

1、论文(设计)的整体结构是否符合撰写规范?

□优□良□中□及格□不及格

2、是否完成指定的论文(设计)任务(包括装订及附件)?

□优□良□中□及格□不及格

三、论文(设计)水平

1、论文(设计)的理论意义或对解决实际问题的指导意义

□优□良□中□及格□不及格

2、论文的观念是否有新意?

设计是否有创意?

□优□良□中□及格□不及格

3、论文(设计说明书)所体现的整体水平

□优□良□中□及格□不及格

评定成绩:

□优□良□中□及格□不及格

教研室主任(或答辩小组组长):

(签名)

年月日

教学系意见:

系主任:

(签名)

年月日

摘要

现在,我国许多城市上下班高峰时段、拥挤路段,打车难问题普遍存在。

建立模型分析造成打车难的内在原因,以此通过合理的补贴政策优化出租车供求资源配置,具有重要的理论意义和实际价值。

针对问题一,本文从两方面入手,一是利用滴滴快的大数据爬取的深圳市2015年9月4日出租车分布数据,根据文献[1]中对深圳市交通小区的划分,用聚类分析方法以12个交通小区的中心坐标为初始聚类中心,进行一次迭代k-均值距离聚类,将离散的经纬度分布数据分类汇总,得到12个交通小区出租车供应数,提供地段划分依据。

再利用泊松分布和极大似然思想预测出深圳市每天出租车需求数。

二是从宏观上考虑影响出租车“供”和“求”的各指标因素并搜集相关数据,建立因子分析模型将多个错综复杂的变量归结为少数几个综合指标因子,并通过因子旋转对公因子做出命名和解释。

针对问题二,了解各出租车公司针对司机的补贴方案,看其是否对缓解“打车难”,搜集2000年到2013年出租车拥有量来反映出租车的供给量,对数据进行拟合预测,可以从公司开始实施补贴方案时,看深圳市出租车的拥有量与预测值的关系,来体现实施补贴方案对出租车供给量的影响效果,结果显示补贴方案对缓解“打车难”有一定的帮助。

针对问题三,创建一个新的打车软件服务平台,设计一个补贴方案,规定:

顾客在高峰期返现要比在正常的时期返现少,司机在高峰期少用甚至不用打车软件,若用打车软件的话,可以对司机的奖励减少。

说明其流程,通过收集有关数据和科研成果进行论证,应征新的补贴方案是合理的。

关键词:

出租车;聚类分析;泊松分布;因子分析;补贴政策

一、问题重述

如今,各大城市普遍存在“打车难”现象,尤其是上下班的高峰时段。

是出租车公司车辆供应不足,还是出租车资源没有得到有效的合理配置,导致部分城区出租车难打,而另一部分城区出租车空驶。

考虑解决如下问题:

(1)搜集影响出租车供求的指标数据,建立合理的综合指标,分析和描述不同时段、不同地域出租车供求匹配的程度。

(2)各出租车公司也在不断出台一些针对司机的补贴方案,以缓解打车难的问题,分析这些补贴方案是否有效。

(3)滴滴、快的等打车软件通过打车软件服务平台,在解决客户和司机信息不对称造成的出租车资源浪费方面,效果显著。

同时,他们也给司机和客户提供补贴,但这种补贴更像是恶性竞争,对出租车资源更优化配置作用不明显。

如果依托这类软件平台,应该怎么设计更优的补贴方案。

二、问题分析

对于问题一,我们从两方面考虑:

一方面是搜集某个城市(本文选择深圳市)出租车的GPS数据,找到不同时段、不同区域的出租车分布数据,以及打车数据。

通过网络爬虫从滴滴快的大数据平台查到按日期的出租车分布数据(经纬度点出现的出租车数)和需求(经纬度点的叫车数)。

分布数据相对较全,我们选取一天根据文献[1]中用出租车对深圳市做交通小区划分的数据,也对这些经纬度点进行归类,考虑用固定初始聚类中心为那些交通小区的中心的聚类分析实现。

由于出租车需求数的数据不齐全不能和分布数据结合来用,为了得到需求数据,我们考虑到固定时段能来打车的人数服从泊松分布,用极大似然思想和泊松分布来对出租车需求做出预测。

再比较供应数和需求数,从总体供求上做出判断。

另一方面,由于微观数据的缺乏,我们从宏观上考虑影响出租车“供”和“求”的各指标因素并搜集相关数据,对这些因素作因子分析,从而将多个错综复杂的变量归结为少数几个综合指标因子,并通过因子旋转对公因子做出命名和解释。

问题二对各个公司的补贴方案进行了解,通过了解这些补贴方案,研究这些方案对“缓解打车难”问题有没有帮助。

研究各公司对员工的补贴,实施时间,查找深圳市在一时间先后的出租车拥有量用实施前的的数据预测实施后的数据,将实际值与预测值相比较,来判断出租车的供给量是否比预测的大,间接说明这些补贴方案对“缓解打车难”帮助性。

问题三根据滴滴,快的等打车软件,要求创建一个新的打车软件服务平台,设立一个更好的补贴方案,并判断其合理性。

根据前面的问题一、二的结果,提出一个补贴方案,通过收集信息判断其合理性。

三、模型假设

1.假设长期来看,深圳各交通小区每天高峰时段、非高峰时段的打车需求是稳定的;

2.由假设1,可以进一步假设本文抓取的9月4日出租车分布的原始数据能够代表深圳市每天出租车分布数;

3.假设9月4日出租车分布的数据中,每个经纬度点统计的出租车数,是该经纬度点每天平均出租车数(如果有更多天的数据,分别用文中方法处理,用均值即可);

4.假设一段时间内(一天),来某个经纬度点的打车人数近似服从泊松分布;

5.假设深圳市一年出租车的拥有量可以反映一年出租车的供给量;

6.假设搜集到的出租车数据是真实可靠的。

4、符号说明

符号

说明

Col

经度

Lat

纬度

xi

第i个经纬度点出租车数

Yi

随机变量,第i个经纬度点打车需求数

Y

深圳市每天出租车的需求数

Class

交通小区的分类号

泊松分布参数

参数为

泊松的分布

Z

出租车的年度拥有量

(注:

其它未提及的符号在文中说明)

五、模型建立与求解

5.1问题一的模型建立与求解

5.1.1数据来源

我们利用网络爬虫从滴滴快的苍穹数据网站得到,深圳市2015年9月4日至9月9日出租车分布:

……..

图1原始数据示例

复制粘贴到Excel,用数据分列功能进行分列,得到三个变量经度(Log)、纬度(Lat)、该位置的出租车数(x)的数据。

再将Excel数据导入SPSS(共7224条记录):

……

图2将数据导入SPSS

5.1.2出租车供应

1.数据预处理

按经度(Log)对数据排序,观察经度分布:

有24条记录在102附近、23条记录在108附近、13条记录在116附近、10条记录在117附近、23条记录在120附近、24条记录在121附近。

而其余7120条记录的经度都介于113.7970~116.5649之间。

可见,那7120条记录位于主城区,是出租车分布的主要区域;其余都是偏远地区出租车数也很少。

故本文只考虑主城区数据即可。

2.对数据进行区域汇总

文献[1]中,利用出租车GPS数据分析研究深圳道路交通拥堵情况,将深圳主城区分为12个交通小区及其经纬度范围为[1]:

第1小区(22.7,2.77)(113.78,113.89)

第2小区(22.68,22.74)(114.22,114.3)

第3小区(22.6,22.67)(114,114.08)

第4小区(22.58,22.63)(114.09,114.16)

第5小区(22.5,22.6)(113.84,113.92)

第6小区(22.52,22.57)(113.9,114.01)

第7小区(22.528,22.546)(114.01,114.08)

第8小区(22.53,22.58)(114.08,114.18)

第9小区(22.47,22.522)(113.87,113.95)

第10小区(22.6,22.66)(113.8,113.9)

第11小区(22.546,22.572)(114.01,114.08)

第12小区(22.528,22.546)(114.01,114.08)

每个交通小区的中心经纬度为[1]:

第1小区:

谭海酒店(113.841904,22.748808)

第2小区:

龙岗镇(114.262398,22.733534)

第3小区:

珠三角环线高速公路(114.041931,22.620899)

第4小区:

吉华路(114.112,22.599)

第5小区:

创业立交(113.892,22.568)

第6小区:

深南南海立交(113.962234,22.542618)

第7小区:

福强路与新洲路(114.042,22.521)

第8小区:

红岭北路,红岭中路与笋岗西路,笋岗东路交叉口(114.115,22.558)

第9小区:

南海大道与东滨路交叉口(113.92,22.508)

第10小区:

沈海高速公路与京港澳高速公路交叉口(113.858,22.625)

第11小区:

新洲路与红荔路交叉口(114.044,22.557)

第12小区:

深南新洲立交桥与新洲路交叉口(114.043,22.536).

根据上面的交通小区划分,我们考虑将这12个交通小区的中心坐标作为k均值聚类的初始聚类中心,以经度和纬度变量对数据做聚类分析,聚类数=12类。

操作步骤如下:

(1)用前文12个交通小区的中心坐标创建初始聚类中心数据集center.sav(注意:

为了格式规范可用,先不设置初始聚类中心进行12类聚类分析,得到聚类中心数据集,再用12个交通小区的中心坐标替换对应数据)。

(2)SPSS操作界面依次点击:

分析——分类——k-均值聚类,打开聚类分析窗口,再将变量Log、Lat放入变量窗口,聚类数设为12;

(3)为了尽量保证小区中心固定不变,设置迭代-最大迭代次数设1次,保存-勾选聚类成员,选项-勾选初始聚类中心和每个个案的聚类信息;

(4)聚类中心—选择读取初始聚类中心—外部数据文件,选择center.sav文件,确定。

图3聚类分析运行结果

(5)将新出现的聚类号的数据列QCL_1修改变量名为Class

图4合并聚类号到数据集

(6)分类(交通小区)汇总出租车数,得到各交通小区9月4日分布的出租车数。

先按Class对数据排序,点击数据——分类汇总,打开分类汇总窗口,分组变量选为Class,汇总变量选为x,修改函数为:

总和。

保存-选择创建只包含汇总变量的新数据集,并命名为sumche94.sav.确定。

图5深圳市12个交通小区分布的出租车数(9月4日)

根据各个交通小区出租车的分布数,后续就可以分别讨论不同交通小区(地段)出租车的供求问题。

另外,再做汇总得到深圳市9月4日出租车分布总数为243401台次。

5.1.3出租车需求

和前文同样的处理方法,可以分别处理9月5日—9日深圳市出租车需求的数据,将这些数据汇总,并求出各小区9月5日—9日出租车需求数和均值。

但是由于我们抓取的出租车需求数据有较大缺失:

9月4日只有3829条记录,其余几天只有1100左右条记录,处理之后发现和需求数相差较大,不足以作为研究深圳市出租车供应和需求匹配的依据。

为了得到出租车的需求数,我们考虑用泊松分布来预测。

以固定的平均瞬时速率

(或称密度)随机且独立地出现时,则该事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布[2,114-116]。

由假设4,一段时间内(一天),来某个经纬度点的打车人数近似服从泊松分布:

(1)

其中,t为时间间隔,

为某地点t时间间隔的打车人数为k的概率,

为人们来打车平均速率。

,为t时间间隔内平均打车人数,故

(2)

即通常的泊松分布

.注意

是泊松分布的均值。

利用极大似然法来估计打车人数k,即让概率

最大。

可推得

.再令

故当

为整数时,

时,概率最大;当

不为整数时,

时,概率最大。

用xi表示第i个经纬度点出租车数,由假设3,xi也即深圳市第i个经纬度点每天出租车的供应数。

表示第i个经纬度点一天内来打车的人数,它是随机变量,由假设4,

(3)

现在需要每天第i个经纬度点一天内来打车的平均人数

空驶率[3]分为时间空驶率

和空间空驶率

两类,单位时间内非载客时间与运营时间的比值,称为时间空驶率;单位时间内非载客里程与运营里程的比值,称为空间空驶率。

(4)

根据出租车协会对国内外城市出租车交通供求关系的调查分析[3],城市出租车交通达到基本饱和(供求平衡)时,出租车的空驶率在30%左右;当空驶率超过40%时,出租车交通呈现出明显的供过于求的状态,而当空驶率低于25%时,出租车交通就呈现出明显的供不应求的状态。

文献[3]得到:

深圳市出租车的日平均时间空驶率介于集44%~54%之间,日平均空间空驶率介于37%~45%之间。

我们取空驶率K=40%,用

(5)

来修正各经纬度点的出租车供应数以得到各经纬度点出租车需求数。

用SPSS转换—计算变量实现(具体步骤略)。

由(3)式,注意到泊松分布的均值为

,则

(6)

用Y表示深圳市每天出租车需求数,由泊松分布的可加性,有

(7)

因此,由极大似然法可得

(8)

注意:

这里的

是车人次,一台出租车每天可以搭乘很多人次。

比较深圳市9月4日,出租车总供应台次243401>146041,故从总体来看深圳市公交车是供大于求的。

5.2多指标因素交互影响的因子分析模型

因子分析是从研究相关系数矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。

简言之,即用少数不可观测的隐变量来解释原始变量之间的相关性或协方差关系。

因子分析的作用是减少变量个数,根据原始变量的信息进行重组,能反映原有变量大部分的信息;原始部分变量之间多存在较显著的相关关系,重组变量(因子变量)之间相互独立;因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。

问题一是要用合理的指标,并分析不同时空出租车资源的“供求匹配”程度,需要分析并搜集影响出租车“供”和“求”的指标因素以及一定量的数据,再利用因子分析模型,分析影响“供”和“求”内在综合指标。

但是,由于国家大数据刚刚起步,多数大数据并未做到开放,影响出租车“供”和“求”的时段因素:

高峰时段(早7:

00-9:

00和晚16:

00-19:

00)、白天非高峰时段、晚间时段;地段因素:

不同的出租车需求程度的交通小区,这些数据都很难找到。

为此,我们这节主要建立宏观出租车需求的因子模型,只要数据到位可以替换数据代入模型,就能得到想要的结果。

我们搜集到与出租车行业有关的一些来自统计年鉴的数据,如表1所示:

表11999-2013与出租车有关的统计年鉴数据

年份

出租车

/辆

GDP/万元

常住人口/万人

第三产业产值/万元

公共汽车/辆

燃油价格

(元/升)

家庭总收入

元/每人每月

公路

总里程

1999

8505

18040176

632.56

8884245

2772

7.64

1645.37  

1343.5

2000

8505

21874515

701.24

10858007

2920

7.52

1756.22  

1356.5

2001

8505

24824874

724.57

12366796

3495

7.64

1923.40  

1360.5

2002

9705

29695184

746.62

14881426

3495

7.7

2194.78  

1510

2003

10255

35857235

778.27

17540952

4885

7.99

2308.45  

1539.9

2004

10305

42821428

800.8

20585811

5376

7.99

2450.30  

1540.3

2005

10305

49509078

827.75

22986438

6091

7.64

1880.25  

1579.9

2006

10305

58135624

871.1

27465059

7305

7.28

1973.19  

1929.5

2007

11205

68015706

912.37

33780554

8188

7.28

2167.90  

1938

2008

12991

77867920

954.28

39180316

8396

7.28

2392.00  

1619.1

2009

13411

82013176

995.01

43675520

11928

7.44

2661.02  

1619.1

2010

14340

95815101

1037.2

50516743

12456

7.21

2960.31  

1617.4

2011

14735

115055298

1046.74

61556537

15365

7.54

3362.66  

1617.7

2012

15300

129500601

1054.74

72061210

14546

7.78

3785.31  

1659

2013

15973

145002302

1062.89

81981396

14617

7.54

4168.54

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 职业教育 > 其它

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2