研究生软件工程考试试卷1Word文档下载推荐.docx

资源描述

研究生软件工程考试试卷1Word文档下载推荐.docx

《研究生软件工程考试试卷1Word文档下载推荐.docx》由会员分享，可在线阅读，更多相关《研究生软件工程考试试卷1Word文档下载推荐.docx（12页珍藏版）》请在冰点文库上搜索。

研究生软件工程考试试卷1Word文档下载推荐.docx

5、在UML描述整体和部分关系时，有（组合）和（聚合）两种方式，前者的部分不能被整体共享，而后者的整体却能被若干整体共享。

6、Python语言定义类的成员是在（构造/内建）函数中定义。

7、在敏捷软件开发中，Scrum是一种（迭代增量）式软件开发过程，就像橄榄球赛的争球过程：

快速、自组织和有适应性，其开发团队复责（开发团队负责在每个冲刺阶段结束，交付潜在可发布的"

已完成"

产品增量。

）。

8、SysML是对UML的一种扩展，用于系统工程建模，新增的图包括（需求图）和（参数图）两种。

二、简答题

1.Petri网和Petri网系统有何区别？

什么是有色Petri网？

Petri网是一种用于系统描述和分析的数学工具，Petri网是对离散并行系统的数学表示。

通常在Petri网的图形表示中,用圆圈表示库所,矩形表示变迁,黑点表示令牌（token）,库所和变迁之间是有向弧

Petri网是一种用来研究具有异步、并发特征的离散事件系统的合适的工具，当用Petri网来模拟一个实际系统时，关心的问题之一就是要确定这个Petri网模型是否具有一些所期望的特生，如活性、有界性等，这些特性均是系统的重要动态行为。

有色Petri网是在经典的Petri网基础上发展起来的一种高级网系统，是一种适于描述异步并发系统的图形工具和数学工具。

它以简洁的图形方式和精确的语义定义表现系统状态，并用形式化分析方法分析系统未来的状态转换。

2.什么是集群？

Hadoop采用哪些实现集群？

简单的说，集群（cluster）就是一组计算机，它们作为一个整体向用户提供一组网络资源。

这些单个的计算机系统就是集群的节点（node）。

一个理想的集群是，用户从来不会意识到集群系统底层的节点，在他/她们看来，集群是一个系统，而非多个计算机系统。

并且集群系统的管理员可以随意增加和删改集群系统的节点。

在Hadoop部署中，有三种服务器角色，他们分别是客户端、Masters节点以及Slave节点。

Master节点，Masters节点又称主节点，主节点负责监控两个核心功能：

大数据存储（HDFS）以及数据并行计算（MapReduce）。

Slave节点则负责具体的工作以及数据存储。

所有的集群配置都会存在于客户端服务器，但是客户端服务器不属于Master以及Salve，客户端服务器仅仅负责提交计算任务给Hadoop集群，并当Hadoop集群完成任务后，客户端服务器来拿走计算结果。

3.简要描述SOA的特点，SOA有哪些好处？

版本一答案：

特点：

可从企业外部访问、随时可用、粗粒度的服务接口分级、松散耦合、可重用的服务、服务接口设计管理、标准化的服务接口、支持各种消息模式、精确定义的服务契约

好处:

第一、更易维护

　　业务服务提供者和业务服务使用者的松散耦合关系及对开放标准的采用确保了该特性的实现。

建立在以SOA基础上的信息系统，当需求发生变化的时候，不需要修改提供业务服务的接口，只需要调整业务服务流程或者修改操作即可，整个应用系统也更容易被维护。

　　第二、更高的可用性

　　该特点是在于服务提供者和服务使用者的松散耦合关系上得以发挥与体现。

使用者无须了解提供者的具休实现细节。

　　第三、更好的伸缩性

　　依靠业务服务设计、开发和部署等所采用的架构模型实现伸缩性。

使得服务提供者可以互相彼此独立地进行调整，以满足新的服务需求。

版本二答案：

1）以业务为中心

SOA更多关注于用户业务，通过业务人员参与SOA系统的规划、设计和管理，使得IT系统能在对业务的深刻理解的基础上进行构建，实现IT系统与用户业务的密切结合。

在具体实施中，通过把完成实际业务流程中的一项任务所需的IT资源组织为服务进行封装，从而达到以业务为核心，通过业务选择技术，避免技术制约业务的问题。

2）灵活适应变化

IT系统围绕用户业务构建，用户业务在实现层通过表现为一系列松散耦合的”服务“来实现，这些服务可以根据用户需求随需组合，使得IT系统对于业务的适应能力明显提高。

3）重用IT资源，提升开发效率

SOA强调对”服务“的重用，对原有IT资源的重用度提升是SOA带来的关键效果之一，大量具有高重用的服务资源，为快速构建新的业务功能和业务系统奠定基础，使得IT系统的开发和软件生产效率得到提升。

同时，重用过程有利于保护用户前期的信息化投资和IT资产积累，节省IT系统开发成本，实现用户信息化的可持续性建设与发展。

4）更强调标准

SOA的实现强调基于统一的标准，SOA系统建立在大量的开放标准和协议之上，以实现系统及信息的互联互通和互操作。

因此，SOA系统从规划到实施，标准都至关重要。

好处同答案一一样。

版本三答案：

1、可重用

一个服务创建后能用于多个应用和业务流程。

2、松耦合

服务请求者到服务提供者的绑定与服务之间应该是松耦合的。

因此，服务请求者不需要知道服务提供者实现的技术细节，例如程序语言、底层平台等等。

3、明确定义的接口

服务交互必须是明确定义的。

Web服务描述语言（WebServicesDescriptionLanguage，WSDL）是用于描述服务请求者所要求的绑定到服务提供者的细节。

WSDL不包括服务实现的任何技术细节。

服务请求者不知道也不关心服务究竟是由哪种程序设计语言编写的。

4、无状态的服务设计

服务应该是独立的、自包含的请求，在实现时它不需要获取从一个请求到另一个请求的信息或状态。

服务不应该依赖于其他服务的上下文和状态。

当产生依赖时，它们可以定义成通用业务流程、函数和数据模型。

5、基于开放标准

当前SOA的实现形式是Web服务，基于的是公开的W3C及其他公认标准．采用第一代Web服务定义的SOAP、WSDL和UDDI以及第二代Web服务定义的WS-*来实现SOA。

SOA的主要好处：

SOA有助于建立IT和业务线之间的无缝对接，通过产生更多的IT灵活性，以支持更大的业务灵活性。

您的业务流程变化越来越快以及全球剧烈竞争需要SOA能够提供高的灵活性。

SOA能够帮助您更好地重用现有的IT投资和服务。

SOA通过定义服务之间良好接口更易于集成。

SOA还提供了业务伙伴，客户和供应商的服务集成到一个企业的业务流程体系结构模型中。

这降低了成本，提高了客户满意度。

4.描述Spark集群计算中RDD的含义和作用。

Spark的核心概念是RDD（resilientdistributeddataset），指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。

Spark解决迭代计算的主要实现思想就是RDD，把所有计算的数据保存在分布式的内存中。

迭代计算通常情况下都是对同一个数据集做反复的迭代计算，数据在内存中将大大提升IO操作。

这也是Spark涉及的核心：

内存计算。

Spark和RDD的关系可以理解为：

RDD是一种具有容错性基于内存的集群计算抽象方法，Spark则是这个抽象方法的实现。

5.简要描述瀑布模型的优缺点。

瀑布模型的优缺点

1、瀑布模型有以下优点：

1）为项目提供了按阶段划分的检查点。

2）当前一阶段完成后，您只需要去关注后续阶段。

3）可在迭代模型中应用瀑布模型。

瀑布模型有以下缺点：

1）在项目各个阶段之间极少有反馈。

2）只有在项目生命周期的后期才能看到结果。

3）通过过多的强制完成日期和里程碑来跟踪各个项目阶段。

6.简要描述如何采用Axis实现Web服务。

AXIS提供了两种发布方式，一种是即时发布，另外一种是定制发布。

1.即时发布JWS

即时发布提供了一种非常简单发布方式，发布者只要有Java源代码（也就是.java文件），然后把其后缀名改成jws拷贝到相应发布目录下即完成了所有的发布工作。

2.定制发布CustomDeployment-IntroducingWSDD

比起即时发布定制发布更加烦琐也更复杂，但是换来的却是更大的灵活性，因此在实际项目中定制发布还是不二的选择。

定制发布需要你自己编写一个WSDD文件进行发布。

7.简要说明什么是设计模式，设计模式有哪些类型。

设计模式（DesignPattern）是一套被反复使用、多数人知晓的、经过分类的、代码设计经验的总结。

设计模式主要分三个类型:

创建型、结构型和行为型。

8.简要描述大数据的特点，大数据对软件工程有何影响？

大数据的三大特点：

　　首先，“海量数据”最大限度解决了人类主观世界与客观世界之间的信息不对称性难题。

其次，“相关分析”突破了传统简单的因果分析方法，并利用数据一致性法多方验证。

最后，“瞬间互动”节约了巨大的社会创新的试错成本。

大数据是随着互联网的普及应运而生的，大数据和云是分不开的，数据存储，数据的分类，数据挖掘，数据的分析，如何把一堆在硬盘，内存，服务器中存储的数据通过分析，处理，转换成能够为我们带来实际利益的东西，或者说实际能有用处的东西，就是大数据的解决问题。

其实云现在在中过是个双刃剑（不说了，硬伤。

。

无耐），大数据也因此受到了限制，不过云时代和大数据的到来是早晚的问题，而且近两年是有相当的趋势的，那么大数据对软件工程的影像无非就是方展方向上面和数据的安全问题，怎样防止数据的丢失被盗，IT技术又是如何对大数据进行存储和解析处理，都是当前软件工程的热门和必然的趋势，做好数据分析，数据挖掘，以后真的是不用发愁钱的问题

大数据主要特点：

1.准确（Veracity）这是一个在讨论大数据时时常被忽略的一个属性，部分原因是这个属性相对来说比较新，尽管它与其他的属性同样重要。

这是一个与数据是否可靠相关的属性，也就是那些在数据科学流程中会被用于决策的数据（而这不同于与传统的数据分析流程），精确性与信噪比（signal-to-noiseratio）有关。

2.高速（Velocity）大数据是在运动着的，通常处于很高的传输速度之下。

它经常被认为是数据流，而数据流通常是很难被归档的。

这就是为什么只能收集到数据其中的某些部分。

3.体量（Volume）大数据由大量数据组成，从几个TB到几个ZB。

这些数据可能会分布在许多地方，通常是在一些连入因特网的计算网络中。

一般来说，凡是满足大数据的几个V的条件的数据都会因为太大而无法被单独的计算机处理。

单单这一个问题就需要一种不同的数据处理思路，这也使得并行计算技术（例如MapReduce）得以迅速崛起。

4.多样（Variety）在过去，数据或多或少是同构的，这种特点也使得它更易于管理。

这种情况并不出现在大数据中，由于数据的来源各异，因此形式各异。

这体现为各种不同的数据结构类型，半结构化以及完全非结构化的数据类型。

三、综合题

1.借阅者和图书管理员的用例图，并画出类图

（系统管理员用例图题目未要求画出）

2．银行存款数据流图

（1）soap消息传输的协议是什么？

（2）soap消息风格是什么？

（3）操作的输入输出是什么类型？

绑定端口是什么？

（1）SOAP使用因特网应用层协议作为其传输协议。

SMTP以及HTTP协议都可以用来传输SOAP消息，但是由于HTTP在如今的因特网结构中工作得很好，特别是在网络防火墙下仍然正常工作，所以被广泛采纳。

SOAP亦可以在HTTPS上传输。

（2）RPC风格与Message风格

（3）"

literal"

指结果SOAP消息包含以抽象定义（Types,Messages,和PortTypes）指定格式存在的数据,输入输出都以literal编码。

绑定端口：

tns:

StockQuotePortType

类型：

tns:

端口：

（最后一题协议应该是http,风格是document，类型是literal，端口是tns:

StockQuotePortType吧？

？

）

对大数据时代软件技术面临挑战的若干思考和认识

我们现在生活在信息时代，更确切地说是生活在大数据的年代，可用数据的爆炸增长是我们社会计算机化和功能强大的数据收集和存储工具快速发展的结果，但同时，随着数据的爆炸性增长、广泛可用和巨大数量不仅对各行各业的发展和变革产生了深刻的影响，而且给传统的软件技术带来了一系列新的挑战。

认识大数据问题的科学和技术本质，研究其在软件编程语言、系统软件、软件开发方法等方面的新需求，思考大数据对软件甚至计算机学科未来发展可能形成的变革和影响，对我们深入理解数据科学与技术、准确掌握研究方向具有重要意义。

迅速发展的互联网产业正在逐步演化为“一台全球泛在的计算机，也催生了一个“创新”的代。

在技术方面，网格计算、云计算、服务计算、普适计算以及物联网等新概念不停被提出。

怎样利用以互联网为焦点的多网融合技术，实现高性价比、高效能、高可信的信息化技术已获得社会广泛关注。

在应用方面，智慧地球、虚拟世界、社交网络等新的应用模式不停涌现，怎样利用以互联网为焦点的信息化技术，实现成本控制、资产增值、业务创新，也成了企业竞争的热点。

其中，大数据、云计算和移动互联网是近期“最热”的几个概念。

云计算围绕数据中央提供计算、存储、网络和应用服务；

大数据提供海量、异构、实时数据的存储、组织、剖析和处置服务；

移动互联网支持用户通过种种智能移动终端设备更加广泛便利地接入互联网。

这三者本质上均是互联网计算及其延伸，相互交叠，相辅相成，只是呈现的视角和关注点有所差别。

这些热点形成的背景包括3个方面：

技术能力的不停进步，我们现在拥有更快的网络带宽、更广的网络接入方式、更强的计算能力、更小的计算设备、更低的计算成本；

应用需求的促进，需要更方便、更优惠的服务，需要实时买卖、社交网络、位置服务等多种多样、无处不在、融入社会生活各个角落的服务；

IT巨头的市场战略，跨国IT企业顺势而为、乘势而上、革故鼎新，不停推动热点技术连续升温。

大数据的一个定义是“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合”。

所以，大数据是信息技术普适应用所带来的“自然”现象和客观存在。

大数据技术则指以大数据为“对象”而开展的有效、高效的数据处置方法的研究，而不仅仅是用基于数据的方法来解决问题。

就其本质特性而言，大数据不会是一个可完全“解决”的问题，只能通过种种技术手段逐步“迫近”它，以缓解大数据给我们带来的困扰。

因此，当前尚不存在有效的大数据技术，大数据和计算技术亲密相关。

大数据问题源于互联网及其延伸带来的无处不在的信息技术应用以及信息化成本的不停降低。

解决大数据问题，而且有效、高效地应用基于数据的方法，其关键依然是需要依赖有效、高效的计算技术。

而大数据给传统软件行业带来了一系列新的挑战。

主要体现在业界常说的4V特征，通过对大数据的这些特征的思考，从事软件行业者能更好地把握未来软件行业的走向，从而更好地面临挑战。

以下是个人分析的大数据对软件产业的发展几个方面的看法，如有偏颇，欢迎指正。

一、数据复杂性带来的挑战

大数据的涌现使人们处理计算问题时获得了前所未有的大规模样本，据了解，天文学和基因学是最早产生大数据变革的领域，2000年，斯隆数字巡天项目启动时，位于新墨西哥州的望远镜，在短短几周内搜集到的数据已经比天文学历史上总共搜集的数据还要多；

2003年，人类第一次破译人体基因密码时，用了10年才完成了30亿对碱基对的排序，而在10年之后，世界范围内的基因仪15分钟就可以完成同样的工作量。

而更为让人头疼的一点是数据对象也变的更加复杂，其典型的特性是类型和模式多样、关联关系繁杂、质量良莠不齐。

大数据内在的复杂性（包括类型的复杂、结构的复杂和模式的复杂）使得数据的感知、表达、理解和计算等多个环节面临着巨大的挑战,导致了传统全量数据计算模式下时空维度上计算复杂度的激增,传统的数据分析与挖掘任务如检索、主题发现、语义和情感分析等变得异常困难.然而目前,人们对大数据复杂性的内在机理及其背后的物理意义缺乏理解,对大数据的分布与协作关联等规律认识不足,对大数据的复杂性和计算复杂性的内在联系缺乏深刻理解,加上缺少面向领域的大数据处理知识,极大地制约了人们对大数据高效计算模型和方法的设计能力。

因此,如何形式化或定量化地描述大数据复杂性的本质特征及其外在度量指标,进而研究数据复杂性的内在机理是个根本问题。

通过对大数据复杂性规律的研究有助于理解大数据复杂模式的本质特征和生成机理,简化大数据的表征,获取更好的知识抽象,指导大数据计算模型和算法的设计。

为此,需要建立多模态关联关系下的数据分布理论和模型,理清数据复杂度和时空计算复杂度之间的内在联系,通过对数据复杂性内在机理的建模和解析,阐明大数据按需约简、降低复杂度的原理与机制,使其成为大数据计算的理论基石。

二、信息可视化、人机交互、可视分析等大数据关键技术需要进一步成熟

这里主要通过以下八个方面来说明，一是原位分析，传统的先将数据存储于磁盘、然后读取进行分析的后处理方式对于超过PB量级以上的数据来说，可能并不适合。

相反，原位可视分析则在数据仍在内存中时就会做尽可能多的分析。

然而，它也带来了一系列设计与实现上的挑战,包括交互分析、算法、内存、I/O、工作流和线程的相关问题。

真正可能的解决方案会要求高性能计算社区做出运作、规则与策略等一系列重大调整以及相应硬件供应商系统和技术的支持。

二是以人为中心的用户界面与交互设计面临的挑战是复杂和多层次的，并且在不同领域都有交叠。

机器自动处理系统对于一些需要人类参与判断的分析过程往往表现不佳。

其他的挑战则源于人的认知能力，现有技术不足以让人的认知能力发挥到极限。

三是可视分析中的数据呈现方式，包括可视化技术和信息的可视化显示。

在可视化中更多程度的数据投影与降维意味着数据表示得更加抽象与简约。

这样的表现形式对于用户进行可视分析、推理和信息获取来说，需要更深入的洞察与诠释。

并且，尽管在超大规模数据可视分析中我们可以建造更大、更清晰的视觉显示设备，但人类视觉敏锐程度制约了大屏幕显示的有效性。

而由于人和机器的限制，大数据的可视化问题在可以预见的将来都会是一个重要的挑战。

四是数据库与存储的问题，处理EB量级数据是一个现实的而且需要关注的挑战。

一个基于云端的解决方案可能满足不了。

这些超大规模数据库技术的挑战是软件和硬件都需要解决的问题。

五是需要设计出既考虑数据大小又考虑视觉感知的高效的算法。

需要引入创新的视觉表现方法和用户交互手段。

更重要的是，用户的偏好和习惯必须要与自动学习算法有机结合起来,这样可视化的输出才具有高度适应性。

六是数据移动、传输和网络架构带来的考虑，随着计算成本的持续下降，数据移动很快就成为了可视分析中付出代价最高的部分。

由于数据源常常分散在不同的地理位置,并且数据规模十分巨大,应用程序对数据移动的需求也有所增加,使得问题变得更加富有挑战性。

七是不确定性的量化，如今，如何量化不确定性已经成为许多科学与工程领域的重要问题。

了解数据中不确定性的来源对于决策和风险分析十分重要。

随着数据规模增大，直接处理整个数据集的能力也受到了极大的限制。

许多数据分析任务中引入数据亚采样，来应对实时性的要求，由此也带来了更大的不确定性。

三、大数据时代，能耗问题更加凸显

能耗是大数据资源治理中的另一个突出问题。

2012年《纽约时报》中的数据显示，全球范围内的数据中央服务器和散热系统每年消耗约莫30亿瓦的电能，相当于20座核电站的发电量。

一个数据中央的耗电量甚至比美国一座中型城市还要高。

针对怎样降低大数据应用的能耗这一问题，现在国际上也开展了多方面研究，包括选择合适的硬件和算法、提高数据选择和取舍的智能性、设计特定的数据存储分布和计算调剂迁移机制等。

例如，美国伊利诺伊大学香槟分校和雅虎公司在一项团结研究中提出了绿色数据存储方法（GreenHDFS），把数据根据访问频率分为热数据和冷数据，并分别存放。

在Hadoop集群上的实验结果显示，冷数据约莫占全部数据的70%，优化之后可有效降低24%的系统能耗。

但尽管如此，更加有效的减少大数据分析对能源消耗的方法急需研究者们去开发并应用到实际中去。

尽管现今存在这些令人生畏的挑战，但并不是完全没有希望。

桌面计算平台的多线程技术已经近在眼前。

计算能力更加强大且能耗更低的高性能计算系统即将到来。

尽管人类的认知能力不存在摩尔定律，但是要在可视化、算法以及数据库领域取得长足的进步,机会还是存在的。

目前,工业界与政府已经认识到当前形势的紧迫性，并在许多超大规模数据领域投入了大量的研发。

大学里也拓展了更多关于并行计算的课程，正在培养新一代EB量级数据时代的大学毕业生。

在我写下这些文字之时，技术仍在不断发展，新的挑战也在不断涌现。

但我们仍然满怀信心前进,因为相信在不远的将来所有这些问题都会得到解决或极大地缓解。

展开阅读全文