工程硕士论文全文模板参考.docx
《工程硕士论文全文模板参考.docx》由会员分享,可在线阅读,更多相关《工程硕士论文全文模板参考.docx(13页珍藏版)》请在冰点文库上搜索。
![工程硕士论文全文模板参考.docx](https://file1.bingdoc.com/fileroot1/2023-7/14/78f558a9-8a2a-403a-b20c-8688498143ef/78f558a9-8a2a-403a-b20c-8688498143ef1.gif)
工程硕士论文全文模板参考
透水性混凝土路面材料的研究
(申请**大学工程硕士专业学位论文)
培养单位
:
***系
工程领域
:
****工程
申请人
:
李某
指导教师
:
某某某
教授
联合指导教师
:
某某某
副教授
二○一四年五月
透水性混凝土路面材料的研究
李
某
ResearchontheTheoryandApplicationofUnitRoot,CointegrationandStructuralChange
ThesisSubmittedto
TsinghuaUniversity
inpartialfulfillmentoftherequirement
fortheprofessionaldegreeof
MasterofEngineering
by
WangShaoping
(NuclearEnergyandNuclearTechnologyEngineering)
ThesisSupervisor
:
Professor****
AssociateSupervisor
:
Professor****
May,2014
关于学位论文使用授权的说明
本人完全了解**大学有关保留、使用学位论文的规定,即:
**大学拥有在著作权法规定范围内学位论文的使用权,其中包括:
(1)已获学位的研究生必须按学校规定提交学位论文,学校可以采用影印、缩印或其他复制手段保存研究生上交的学位论文;
(2)为教学和科研目的,学校可以将公开的学位论文作为资料在图书馆、资料室等场所供校内师生阅读,或在校园网上供校内师生浏览部分内容。
本人保证遵守上述规定。
(保密的论文在解密后遵守此规定)
作者签名:
导师签名:
日期:
日期:
摘要
论文的摘要是对论文研究内容和成果的高度概括。
摘要应对论文所研究的问题及其研究目的进行描述,对研究方法和过程进行简单介绍,对研究成果和所得结论进行概括。
摘要应具有独立性和自明性,其内容应包含与论文全文同等量的主要信息。
使读者即使不阅读全文,通过摘要就能了解论文的总体内容和主要成果。
论文摘要的书写应力求精确、简明。
切忌写成对论文书写内容进行提要的形式,尤其要避免“第1章……;第2章……;……”这种或类似的陈述方式。
关键词是为了文献标引工作、用以表示全文主要内容信息的单词或术语。
关键词不超过5个,每个关键词中间用分号分隔。
关键词:
关键词1;关键词2;关键词3;关键词4;关键词5
Abstract
Anabstractofadissertationisasummaryandextractionofresearchworkandcontributions.Includedinanabstractshouldbedescriptionofresearchtopicandresearchobjective,briefintroductiontomethodologyandresearchprocess,andsummarizationofconclusionandcontributionsoftheresearch.Anabstractshouldbecharacterizedbyindependenceandclarityandcarryidenticalinformationwiththedissertation.Itshouldbesuchthatthegeneralideaandmajorcontributionsofthedissertationareconveyedwithoutreadingthedissertation.
Anabstractshouldbeconciseandtothepoint.Itisamisunderstandingtomakeanabstractanoutlineofthedissertationandwords“thefirstchapter”,“thesecondchapter”andthelikeshouldbeavoidedintheabstract.
Keywordsaretermsusedinadissertationforindexing,reflectingcoreinformationofthedissertation.Anabstractmaycontainamaximumof5keywords,withsemi-colonsusedinbetweentoseparateoneanother.
Keywords:
keyword1;keyword2;keyword3;keyword4;keyword5
目录
第1章绪论1
1.1本章引论1
1.1.1无偏向性搜索1
1.1.21
1.1.31
1.1.41
1.2本章引论1
1.1.51
第2章对等网络中宽松约束的一般性搜索的理论模型1
2.1本章引论1
1.33.2模型基本假设2
3.2.1无偏向性搜索3
3.2.2结点特性4
3.2.3短时稳态性4
3.2.4模型假设的总体叙述4
1.43.3宽松约束的一般性搜索性能理论模型4
3.3.1单次搜索的带宽开销以及系统总带宽开销5
3.3.2索引分布与搜索开销的关系6
第3章对等网络中宽松约束的一般性搜索8
说明
此处引用的目录例子,只作为书写格式的示范,并不代表论文研究内容的示范。
望周知。
阅后删除此框及内容。
第1章绪论
1.1本章引论
本章为P2P中宽松约束的一般性搜索建立理论模型,以研究此类搜索的效率和带宽开销。
根据本章的理论模型可以很好地测算出各种条件下及不同应用中的P2P搜索效率和带宽开销,为P2P中宽松约束搜索的研究建立了基础。
通过模型求解可以得到搜索所需的瓶颈资源(即结点带宽)的理论下限,并可算出不同系统参数下最优的搜索性能以及达到此性能时的最优数据索引分布,从而为P2P系统搜索算法的设计、性能优化、性能比较以及可行性分析提供了一般性方法。
后面第四章提出的近似最优的实用搜索算法就是直接应用本章模型和结论而设计的。
1.1.1无偏向性搜索
本章为P2P中宽松约束的一般性搜索建立理论模型,以研究此类搜索的效率和带宽开销。
根据本章的理论模型可以很好地测算出各种条件下及不同应用中的P2P搜索效率和带宽开销,为P2P中宽松约束搜索的研究建立了基础。
通过模型求解可以得到搜索所需的瓶颈资源(即结点带宽)的理论下限,并可算出不同系统参数下最优的搜索性能以及达到此性能时的最优数据索引分布,从而为P2P系统搜索算法的设计、性能优化、性能比较以及可行性分析提供了一般性方法。
后面第四章提出的近似最优的实用搜索算法就是直接应用本章模型和结论而设计的。
1.1.2
1.1.3
1.2本章引论
1.1.4
第2章对等网络中宽松约束的一般性搜索的理论模型
2.1本章引论
本章为P2P中宽松约束的一般性搜索建立理论模型,以研究此类搜索的效率和带宽开销。
根据本章的理论模型可以很好地测算出各种条件下及不同应用中的P2P搜索效率和带宽开销,为P2P中宽松约束搜索的研究建立了基础。
通过模型求解可以得到搜索所需的瓶颈资源(即结点带宽)的理论下限,并可算出不同系统参数下最优的搜索性能以及达到此性能时的最优数据索引分布,从而为P2P系统搜索算法的设计、性能优化、性能比较以及可行性分析提供了一般性方法。
后面第四章提出的近似最优的实用搜索算法就是直接应用本章模型和结论而设计的。
从第2章讨论可知,宽松约束搜索的用途非常广泛,是广域网上多服务器系统的基础功能和服务。
为了明确起见,这里重述一下定义:
所谓“宽松约束”是指搜索不要求返回全部符合条件的结果,而只要返回一个或若干个(根据用户要求而定)即可;所谓“一般性搜索”是指搜索算法必须是普适的,具体来说就是搜索条件任意和数据存放位置任意。
目前尚不能很好地解决此类搜索问题,主要面临的问题是算法网络通信量过大,很容易超过结点和网络的承受能力,造成严重的带宽开销和系统不可扩展(non-scalable)的问题。
现有算法中,结构化P2P中精确匹配数据标识的数据定位算法无法支持各种非精确匹配的搜索(如子串匹配的搜索)。
Gnutella等非结构化P2P系统依靠消息转发的随机搜索方法虽然符合一般性搜索的要求,但是存在严重的性能问题。
由于P2P巨大的结点数和数据量,不加优化的随机搜索面临“大海捞针”的困境,搜索消息通常要游历很多无关结点并产生大量冗余消息之后才能找到数据。
因此,不论使用消息洪泛[2]或是性能稍好的随机走步[45],普遍认为Gnutella式的随机搜索算法不具可扩展性[47],当结点较多时带宽约束将造成非常严重的系统瓶颈。
带宽约束正是制约此类P2P搜索的最大问题。
为了解决通信量过大的问题,人们尝试了很多优化措施来改进基础设施和搜索算法的各个方面,包括使用冗余更少和通信方面更“温和”的消息转发算法、采用混合结构、使用超级结点的偏向性搜索、扩散数据索引和缓存搜索结果等等[42-54,106]。
其中最为重要的手段就是主动扩散数据索引,即结点不只存储自身数据,同时缓存其他结点所存数据的索引(参见2.3.1节)。
由于数据的分布是任意的,搜索不可避免地带有盲目性,平均搜索跳数总是依赖于“知道”目标数据的结点个数而难于进一步提高(详见3.2节的分析)。
因此在一般性搜索问题中,通过扩散索引来增加数据知名度的方法成为本质上的解决途径。
然而索引扩散并不总是有效率的,它也会带来带宽开销。
一方面,扩散更多的索引可以使搜索更快地返回,减少了搜索带宽开销;另一方面,由于P2P中结点和数据处于不断动态变化之中,当数据失效或更新时(如结点离线、删除或更新数据),数据的索引也相应失效,必须加以更新维护。
因此,扩散更多的索引意味着维护开销的增加。
于是在带宽开销方面,搜索开销与索引维护开销之间存在着折衷关系(trade-off)。
与以往工作中仅考虑搜索开销不同,本章的模型中我们同时考虑搜索和维护两方面,给出了索引扩散方法对搜索整体性能的影响和数学关系。
通过模型我们发现索引数量是决定宽松约束一般性搜索性能的至关重要的因素,采用最优索引分布可以很大程度上提高性能,降低系统开销。
与一般认为的P2P无偏向性搜索难于扩展(non-scalable)恰恰相反,模型显示在最优的索引扩散策略下,基于无偏向性搜索具备很好的可扩展性,其结点负载和带宽开销随系统规模N(结点数)增长具有O(
)的增长关系。
这种平方根关系保证了对大规模P2P系统很好的适应性。
本章剩余部分按照如下方式组织:
3.2节给出模型假设;3.3节推导出带宽开销和搜索效率的计算公式,给出性能模型;3.4节通过优化索引分布得到了理论最优的宽松约束搜索,证明了对可扩展性具有重要意义的“平方根关系”;3.5节对模型结论和意义进行了总结;3.6节讨论模型适应性并和相关工作进行了比较,最后是本章小结。
3.2模型基本假设
一般性搜索要解决任意可能的数据存放方式和任意的查询条件下的搜索问题。
任意可能的数据存放意味着数据与存放结点之间可以不存在任何相关性,因而无法利用类似兴趣偏好、结点特性或数据存放的规则来指导消息转发或优化性能,单步搜索效率等同于盲目搜索(blindsearch)。
任意的查询条件,意味着只有获得了完整的元数据(数据中用来被查询的部分)才可以判断出该数据是否符合查询条件,单靠部分元数据不能解决所有可能的查询请求。
这样以往针对特定搜索条件的倒排式索引(如关键词倒排表等)无法发挥作用,只能使用正排式的数据索引。
这样,一般性搜索限制了可能采取的优化措施,使搜索性能存在理论极限。
虽然在特定应用中使用的不一定是严格的“一般性搜索”,其数据与结点之间可能存在一定的相关性,并且可以借助搜索条件的特性来优化性能,但是本章只讨论最一般的情况,目的在于建立基础性的模型,研究和寻找适用于绝大多数应用的宽松约束搜索算法。
针对特定搜索条件的高效搜索算法可参见第五章,利用数据和结点的语义相关性来优化性能的研究参见第六章。
本节针对P2P中一般性搜索的特点给出模型的基本假设,具体包括搜索的“无偏向性”、结点特性以及系统的短时稳态假设。
我们首先讨论这三方面问题,最后给出模型假设的总体叙述。
3.2.1无偏向性搜索
如果P2P中所有结点都以相同或相近的概率接收到搜索请求,那么称此搜索算法为“无偏向性搜索(unbiasedsearch)”。
无偏向搜索可看作是对等网络搜索的基础,也是应用最多的一种。
这是由于对等网络中单结点能力较弱,只有让所有结点均摊巨大的总体搜索负载,才可能支撑起高强度的搜索算法。
如果搜索消息不能近似均匀地散落在所有结点上,那么负载重的结点很容易发生过载。
均衡负载的思想正是对等网络存在和发展的基础,即集合众多微小的力量(大量弱结点)形成巨大的总体服务能力。
实际应用中,只要搜索算法在选择邻居结点转发消息时没有特殊的偏向性,那么就可以近似认为是无偏向性搜索,譬如最常用的洪泛和随机走步就是无偏向性算法。
模型中我们假设搜索算法是无偏向性的。
对于使用了超级结点的偏向性搜索,通常可认为是将结点划分为不同类别。
同一类别的结点运行相同的算法和协议,因此各类别内部仍然是无偏向性搜索,符合模型假设。
此时可针对每个类别的结点群体分别使用模型,从而得出整体算法的性能(详见3.5节)。
由于数据分布是随机的,且结点收到搜索消息的概率彼此相同,因此无偏向性条件下单步搜索的成功概率不会优于盲目搜索的性能。
虽然搜索途中遇到的结点可带来历史信息并指导后续遍历,但由于巨大的结点数和数据量以及数据随机存放的特点,小量历史信息的作用非常有限,且与特定应用的性质相关。
因此模型中对此不作考虑,仍然以盲目搜索作为无偏向性搜索单步性能。
3.2.2结点特性
P2P中结点总处于不断地动态变化之中,随时有结点加入和离开系统。
动态性显著地影响系统性能和索引的有效性。
按照P2P中通常的假设,结点的行为(在线或离线)独立于其他结点,并且所有结点具有统一的动态特性以及在线时间分布,这种分布一般用指数分布来刻画。
具体来说,设结点的平均在线服务时间(sessiontime)为Tsession,则单个结点在线时间长度符合参数λ=1/Tsession的指数分布。
由于结点动态变化彼此独立,因此一段时间之内发生的动态变化次数符合泊松分布,其参数与指数分布参数一致。
3.2.3短时稳态性
我们假设P2P系统具有短时稳态特性,即一段不长的时间中系统的性质(如结点平均在线时间Tsession、数据总量、数据访问频度分布)以及系统规模(结点数N)不会发生显著的变化。
尽管长时程中系统性质可能会明显变化,但是这种变化总是靠缓慢的积累而产生的。
因此,可以用一个稳态模型来描述P2P系统,而P2P系统的长程变化可以用同一个稳态模型的不同参数取值点来刻画。
3.2.4模型假设的总体叙述
综合以上三方面就得到本章理论模型的基本假设。
具体而言,模型假设P2P系统和一般性搜索算法具有如下特点:
一般性搜索算法对结点不具有偏向性,所有结点以相同或相近的概率收到搜索请求;结点在线时间可用独立同分布的指数分布来描述;P2P系统在相对较短的时间段内可看作是稳态,系统主要参数保持不变。
以上假设是针对P2P系统及一般性搜索的特点而做出的,具有广泛的适应性,可用来研究目前大多数P2P宽松约束搜索系统的性能。
关于模型适应性将在3.6.1节做进一步讨论。
1.33.3宽松约束的一般性搜索性能理论模型
本节建立无偏向性搜索的理论模型,模型统一解决无偏向性搜索的带宽开销计算、带宽开销的理论下限、最优的搜索性能以及最优索引分布。
模型中用到的符号及说明参见表3.1。
表3.1无偏向搜索模型的符号表
符号
意义及说明
N
结点总数。
代表了系统规模
M
彼此不同的数据的个数。
注意数据副本不计入M中
f1,f2…fM
系统中M个彼此不同的数据
q1,q2,…qM
数据的访问频度分布向量
Ci
数据fi的索引个数。
亦即fi的应答结点的个数
INVi
数据fi的索引失效率。
每1秒内失效的fi索引占全部fi索引的比例
INV
当数据具有相近的更新频度时,索引失效率用统一的INV表示
INVmax
,即所有失效率的最大值。
如果不考虑数据之间更新频度的差异,则INVmax=INVi=INV
Rsearch,LS
搜索消息冗余数和搜索消息的比特数。
刻画搜索的消息转发开销
Rupdate,LU
维护消息冗余数和维护消息的比特数。
刻画维护索引的消息开销
BWsearch,BWmaintain
系统中搜索使用的总带宽开销和维护使用的总带宽开销
BWtotal,bwpeer
系统总带宽开销与单个结点上的带宽开销。
是搜索与维护开销之和
Ci*
使带宽开销最小化的索引数量(指数据fi的索引)
bw*peer
结点的理论带宽下限。
当所有fi的索引数都等于对应的Ci*时取到
BA
结点的可用带宽约束。
BA必须不小于bw*peer
Hops
单次搜索所需遍历的不同结点数的期望。
刻画搜索等待时间
ξ
索引的放大系数,即约束下的最优索引数Ci与最小化带宽的索引数Ci*的比值。
ξ由带宽约束BA与带宽下限bw*peer的比值决定
θ
与N无关的系统常量,刻画了搜索与维护之间的折衷关系。
用θ可简化索引比例ki的表示
3.3.1单次搜索的带宽开销以及系统总带宽开销
无偏向性搜索中,单次搜索的带宽开销与索引数量之间存在如下基本关系。
考虑对等网络中有N个结点,其中有Cf个结点存放了数据f的索引(存储数据f本身的那些结点也被认为包含f的索引)。
称这些结点为f的“应答结点”,只有它们能够应答以f为目标的搜索。
考虑某个需要f的结点发起一次搜索请求,显然当且仅当该请求的消息被转发到f的应答结点上,该请求才能够得以回应。
因此,每当搜索消息被发送到一个尚未遍历过的新结点,如果该结点上具有f的索引,则搜索过程结束,成功返回;否则搜索继续,寻求尚未遍历的新结点。
于是搜索成为一个随机过程,可用贝努利实验来刻画。
由于总共有N个结点,其中有Cf个应答结点,所以无偏向性搜索中新遍历的结点可使搜索结束的概率是Cf/N。
由贝努利实验可知,搜索到f需要遍历的结点个数的期望满足:
(3-1)
为了计算搜索过程占用的网络带宽,定义“搜索消息冗余数”Rsearch,表示平均每个结点在一次搜索请求中收到的重复的搜索消息数。
显然在一次搜索中,同一个结点收到多次转发来搜索消息是没有意义的,只会带来带宽的浪费。
但是现实搜索算法并非都是无冗余的,譬如洪泛算法使用并发的消息广播,搜索消息会沿着不同路径多次抵达同一结点,因此其Rsearch值就相当大。
随机走步算法通过记录遍历结点的办法实现无冗余的消息转发,可以认为Rsearch=1。
从上述分析可以看出,索引分布数量对搜索效率和带宽消耗有很大影响。
数据索引分布越广(即Cf越大),该数据就越容易被搜索,使用的搜索带宽也就越小。
另一方面索引会因为所指向的实际数据的变动而失效,需要持续不断地维护,否则就有效的数据索引个数就会不断减少,直至为零。
因此系统总带宽开销BWtotal由搜索带宽开销BWsearch和索引的维护带宽开销BWmaintain两部分组成的,即:
(3-2)
下面分别计算BWsearch和BWmaintain,从而得到性能模型。
3.3.2索引分布与搜索开销的关系
首先计算搜索的带宽开销。
考虑P2P系统有N个结点,共享了M个彼此不同的数据f1,f2,...,fM。
注意同一个数据f可以有多个副本(replicas)存储在不同结点上。
这种情况在P2P中很常见,譬如P2P文件共享应用中的多个文件副本,以及多服务器联合服务时由不同服务器提供的相同服务。
这里副本不计入M中。
考察数据索引分布情况,设数据fi有Ci个索引。
为计算搜索带宽消耗,需要考察系统中搜索任务以及在各数据上的分配。
假设系统单位时间内总共产生Q次搜索。
每一个数据根据自身情况,具有不同的访问频度(popularity)。
访问频度高的(即热门的)数据被搜索和使用的更多,因而在Q中占据更多的份额。
我们用分布向量q=表示各数据的访问频度,其中qi为正数,表示对于一次系统中出现的搜索,数据fi满足搜索条件的概率,而全部qi的总合为1。
这样根据3.2.2小节可得到搜索带宽开销BWsearch为:
(3-3)
第3章对等网络中宽松约束的一般性搜索
的理论模型
如果章标题过长需要分行书写的话,则第一行段前空24磅,段后空0磅,回车后,第二行段前空0磅,段后空24磅。
见上面的样式例子。