南开大学20春学期大数据导论在线作业2.docx

上传人:聆听****声音 文档编号:511660 上传时间:2023-04-29 格式:DOCX 页数:7 大小:18.27KB
下载 相关 举报
南开大学20春学期大数据导论在线作业2.docx_第1页
第1页 / 共7页
南开大学20春学期大数据导论在线作业2.docx_第2页
第2页 / 共7页
南开大学20春学期大数据导论在线作业2.docx_第3页
第3页 / 共7页
南开大学20春学期大数据导论在线作业2.docx_第4页
第4页 / 共7页
南开大学20春学期大数据导论在线作业2.docx_第5页
第5页 / 共7页
南开大学20春学期大数据导论在线作业2.docx_第6页
第6页 / 共7页
南开大学20春学期大数据导论在线作业2.docx_第7页
第7页 / 共7页
亲,该文档总共7页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

南开大学20春学期大数据导论在线作业2.docx

《南开大学20春学期大数据导论在线作业2.docx》由会员分享,可在线阅读,更多相关《南开大学20春学期大数据导论在线作业2.docx(7页珍藏版)》请在冰点文库上搜索。

南开大学20春学期大数据导论在线作业2.docx

南开大学20春学期《大数据导论》在线作业

试卷总分:

100得分:

100

一、单选题(共15道试题,共30分)

1.PaaS是()的简称

A.软件即服务

B.平台即服务

C.基础设施即服务

D.硬件即服务

答案:

B

2.基础设施即服务的英文简称是

A.SaaS

B.PaaS

C.IaaS

答案:

C

3.数据清洗的方法不包括

A.重复数据记录处理

B.缺失值处理

C.噪声数据清除

D.一致性检查

答案:

A

4.下列哪个R语言扩展包可以创建带有点和边的网络图()

A.network

B.ggplot2

C.ggmaps

D.animation

答案:

A

5.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()

A.network

B.ggplot2

C.ggmaps

D.animation

答案:

D

6.GFS中的文件切分成()的块进行存储

A.32MB

B.64MB

C.128MB

D.1G

答案:

B

7.数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段()。

A.运营式系统阶段

B.用户原创内容阶段

C.感知式系统阶段

答案:

B

8.下列不属于商业大数据类型的是

A.社交数据

B.电子商务数据

C.机器和传感器数据

D.传统企业数据

答案:

C

9.用于描述相等时间间隔下连续数据随时间变化趋势的是()

A.饼图

B.条形图

C.散点图

D.折线图

答案:

D

10.数据仓库是随着时间变化的,下列不正确的是()

A.数据仓库随时间变化不断增加新内容

B.数据仓库随事件变化不断删去旧的数据内容

C.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合

D.捕捉到的新数据会覆盖原来的快照

答案:

B

远程教育复学科的教学和研究工作有利于总结我国远程教育的实践经验并进行理论概括和创新,开创开放与远程教育的中国模式和中国学派,为世界制远程教育的繁荣和发展作出我们的贡献;有利于借鉴世界各国远程教育的实践经验和理论研究成果,使我国远程教育学科理论研究和教学的起点高、成效快;同时,将有利于更好百地以理论指导教育决策。

这是因为,远程教育度已经成为世界各国教育发展新的增长点,旅得了国际社会和教育界的关注,成为各国教育决策的新的热点之一,奥鹏全部辅导资料微25437451

11.以下不是数据仓库基本特征的是()

A.数据仓库的数据是相对稳定的

B.数据仓库的数据是反映历史变化的

C.数据仓库是面向事务的

D.数据仓库是面向主题的

答案:

C

12.哪个选项不属于大数据4V特点?

A.Volume

B.Variety

C.Value

D.Valid

答案:

D

13.以下哪项不是数据可视化工具的特性()

A.简单操作

B.更丰富的展现

C.实时性

D.仅需一种数据支持方式即可

答案:

D

14.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。

A.运营式系统阶段

B.用户原创内容阶段

C.感知式系统阶段

答案:

C

15.大数据的特点不包含

A.数据体量大

B.数据不统一

C.处理速度快

D.价值密度高

答案:

B

二、多选题(共15道试题,共30分)

16.大数据在社交网络中的应用

A.预测外部趋势

B.舆情监控、突发事件预警

C.用户画像、精准推荐

D.用户偏好、情感、社交网络结构

答案:

ABCD

17.离群点检测的应用包括()等。

A.疾病的不寻常模式

B.欺诈检测

C.故障检测

D.入侵检测

答案:

ABCD

18.百度大数据引擎主要包含三大组件()

A.百度大脑。

B.数据工厂

C.开放云

答案:

ABC

19.KNIME(KonstanzInformationMiner)是一个对用户友好的、智能、开源的平台。

该平台包括了##、##、##、##。

A.数据集成

B.数据处理

C.数据分析

D.数据挖掘

答案:

ABCD

20.可视化工具包括()

A.ppt

B.GoogleChart

C.Gephi

D.Excel

答案:

BCD

21.云计算是##,##,##的发展?

是虚拟化、效用计算、IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。

A.网络计算

B.流计算

C.并行计算

D.分布式计算

答案:

ACD

22.医疗领域如何利用大数据

A.社保资金安全

B.用户行为分析

C.临床决策支持

D.个性化医疗

答案:

ABCD

23.可使用##,##,##进行光滑。

A.箱边界

B.箱均值

C.箱中位数

D.最大值

答案:

ABC

24.大数据智能感知层:

主要包括()及软硬件资源接入系统

A.网络通信体系

B.智能识别体系

C.数据传感体系

D.传感适配体系

答案:

ABCD

25.下列属于传统统计学展示方法的是()

A.饼状图

B.网络图

C.柱状图

D.曲线图

答案:

ACD

26.层次方法可以分为()

A.分裂法

B.凝聚法

C.K均值算法

D.K中心点算法

答案:

AB

27.一个HDFS集群由一个##和##构成。

此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。

A.一个名字节点

B.若干个名字节点

C.一个数据节点

D.若干个数据节点

答案:

AD

28.交通数据分析可用于:

A.实时路况查询播报

B.合理进行道路规划

C.信号灯智能调度

D.交通流量实时分析

答案:

ABCD

29.数据变换(DataTransformation)的方法有()

A.规范化

B.聚集

C.数据泛化

D.光滑

答案:

ABCD

30.医疗大数据特点:

除了包含了大数据4个“V”的特点之外还有()

A.时效性

B.多态性

C.冗余性

D.不完整性

答案:

ABCD

三、判断题(共20道试题,共40分)

31.在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等领域的半结构化数据和非结构化数据

答案:

正确

32.Flume的数据流由RDD贯穿始终。

答案:

错误

33.ID3算法的核心思想就是以信息增益度量属性选择

答案:

正确

34.大数据数据量一定是PB,TB级的

答案:

错误

35.网络数据采集是利用互联网搜索引擎技术对数据进行针对性、行业性、精准性的抓取,并按照一定规则和筛选标准将数据进行归类,形成数据库文件的一个过程。

答案:

正确

36.规则性分析(PrescriptiveAnalysis)用于解决决策制定和提高分析效率

答案:

正确

37.数据分析是大数据发展面临的挑战

答案:

正确

38.直接拿Python输出的图片用于印刷效果很好

答案:

错误

39.通常将统计指标的数值按时间顺序排列所形成的数列,称为时间序列。

答案:

正确

40.结构化数据是用excel结构表现的数据

答案:

错误

41.多维数据指的是具有多个维度属性的数据变量。

答案:

正确

42.时间序列分析是对随时间变化的数据对象的变化规律和演化趋势进行建模分析

答案:

正确

43.BI分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。

答案:

错误

44.基于大数据研究个体或群体行为,发现活动中蕴含的空间认知规律及空间行为和交互模式,建立以人为本的地理信息服务,进而支持个体或群体时空行为决策。

答案:

正确

45.利用大数据技术对电子病历中的数字化信息进行分析处理,既能够让医生的诊疗有迹可循,还可以发现最有效的临床路径,从而及时为医生提供最佳的诊疗建议。

答案:

正确

46.数据分析是大数据价值链中最终和最重要的阶段,其目的是挖掘数据中潜在的价值以提供相应的建议或决策。

通过分析不同领域中的数据集可以使数据在不同层面发挥最大价值。

答案:

正确

47.数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据

答案:

正确

48.数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。

答案:

正确

49.大数据的挑战仅仅来自于数据的增长。

答案:

错误

50.Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流;或者是从小数据开始,但数据每年增长速率至少为60%。

答案:

错误

远程教育复学科的教学和研究工作有利于总结我国远程教育的实践经验并进行理论概括和创新,开创开放与远程教育的中国模式和中国学派,为世界制远程教育的繁荣和发展作出我们的贡献;有利于借鉴世界各国远程教育的实践经验和理论研究成果,使我国远程教育学科理论研究和教学的起点高、成效快;同时,将有利于更好百地以理论指导教育决策。

这是因为,远程教育度已经成为世界各国教育发展新的增长点,旅得了国际社会和教育界的关注,成为各国教育决策的新的热点之一,奥鹏全部辅导资料微25437451

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2