南开大学21春学期《大数据导论》在线作业文档格式.docx

上传人:b****3 文档编号:8202250 上传时间:2023-05-10 格式:DOCX 页数:10 大小:17.35KB
下载 相关 举报
南开大学21春学期《大数据导论》在线作业文档格式.docx_第1页
第1页 / 共10页
南开大学21春学期《大数据导论》在线作业文档格式.docx_第2页
第2页 / 共10页
南开大学21春学期《大数据导论》在线作业文档格式.docx_第3页
第3页 / 共10页
南开大学21春学期《大数据导论》在线作业文档格式.docx_第4页
第4页 / 共10页
南开大学21春学期《大数据导论》在线作业文档格式.docx_第5页
第5页 / 共10页
南开大学21春学期《大数据导论》在线作业文档格式.docx_第6页
第6页 / 共10页
南开大学21春学期《大数据导论》在线作业文档格式.docx_第7页
第7页 / 共10页
南开大学21春学期《大数据导论》在线作业文档格式.docx_第8页
第8页 / 共10页
南开大学21春学期《大数据导论》在线作业文档格式.docx_第9页
第9页 / 共10页
南开大学21春学期《大数据导论》在线作业文档格式.docx_第10页
第10页 / 共10页
亲,该文档总共10页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

南开大学21春学期《大数据导论》在线作业文档格式.docx

《南开大学21春学期《大数据导论》在线作业文档格式.docx》由会员分享,可在线阅读,更多相关《南开大学21春学期《大数据导论》在线作业文档格式.docx(10页珍藏版)》请在冰点文库上搜索。

南开大学21春学期《大数据导论》在线作业文档格式.docx

C

下列哪个R语言扩展包可以创建带有点和边的网络图()

ggplot2

network

ggmaps

animation

B

数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段()。

A

IaaS是()的简称

软件即服务

平台即服务

基础设施即服务

硬件即服务

以下不是数据仓库基本特征的是()

数据仓库是面向主题的

数据仓库是面向事务的

数据仓库的数据是相对稳定的

数据仓库的数据是反映历史变化的

基础设施即服务的英文简称是

IaaS

PaaS

SaaS

哪个选项不属于大数据4V特点?

Volume

Valid

Variety

Value

SAN是一种()

存储设备

专为数据存储而设计构建的网络

光纤交换机

HBA

PaaS是()的简称

下列不属于商业大数据类型的是

传统企业数据

机器和传感器数据

社交数据

电子商务数据

用于描述数据分散情况的是()

分布图

箱式图

饼图

折线图

DAS代表的意思是()

两个异步存储

数据归档软件

连接一个可选的存储

直连存储

数据仓库是随着时间变化的,下列不正确的是()

数据仓库随时间变化不断增加新内容

捕捉到的新数据会覆盖原来的快照

数据仓库随事件变化不断删去旧的数据内容

数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合

数据清洗的方法不包括

缺失值处理

噪声数据清除

一致性检查

重复数据记录处理

常见的非结构化数据有()

web网页

即时消息

富文本文档

实时多媒体数据

A,B,C,D

网络数据采集常用的是通过##或##等方式从网站上获取数据信息。

网络爬虫

网站公开API

手动获取

A,B

对于数值属性,我们使用()来评估一个属性的值如何随另一个属性变化。

欧式距离

相关系数

协方差

B,C

传感器工作模式类别包括()

基于位置

基于活动

基于设备

A,B,C

层次方法可以分为()

K均值算法

K中心点算法

凝聚法

分裂法

C,D

下列正确的是()

D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用

D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行

D3采用的是SelectorsAPI的第一级标准

基础R已经包含支撑包括协同图(Coplot)、拼接图(MosaicPlot)和双标图等多类图形的功能。

大数据在教育中的应用

网上公开课

慕课

智慧校园

翻转课堂

基于大数据的临床决策支持系统的架构包括

支撑层

大数据分析层

网络层

应用层

A,B,D

按照数据量的大小,可将数据分析分为()

内存级数据分析

Bl级数据分析

海量级数据分析

巨量级数据分析

医疗大数据特点:

除了包含了大数据4个“V”的特点之外还有()

多态性

时效性

不完整性

冗余性

借助于大数据提供的##和##,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。

消费能力

趋势报告

购物结果

交通数据处理包括以下几个步骤()

数据清洗

数据映射

数据组织

数据聚类

统计图表的可视化方法主要包括()

散点图

条形图

##和##,它们把原数据变换或投影到较小的空间。

小波变换

中心化变换

主成分分析

对数变换

A,C

XX大脑包括()

深度学习

超大规模机器学习

大规模GPU并行化平台

利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。

结构化数据是用excel结构表现的数据

关联分析又称为关联规则学习

大数据处理的关键技术主要包括:

数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。

原始交通数据记录是离散样本点而且可能不能映射到城市的道路网络中。

饼图以二维或者三维的形式表示某一数据相对于数据总量的大小,用于数据之间比重的比较。

Pentaho是最流行的开源商业智能软件之一

数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。

数据可根据作用方式的不同分为交互数据和交易数据

由于数据变成资源,成为有价值的东西,数据私有化和独占问题就是客观存在的,成为关注的焦点。

数据产权界定问题日益突出,在数据权属确定的情况下,数据商品化将成为必然选择

ID3算法的核心思想就是以信息增益度量属性选择

预测性分析(PredictiveAnalysis)用于预测未来事件发生的概率和演化趋势

交通数据的来源包括车辆GPS数据,人类移动的GPS位置信息或者单位站点记录,和监视设备的视频图像技术记录。

每个变量的最大值和最小值之差称为极差

频繁项集的子集是频繁项集,非频繁项集的超集是非频繁项集。

云计算出现后,数据存储服务衍生出了新的商业模式,数据中心的出现降低了公司的计算和存储成本。

所有关系型数据中的数据全部为结构化数据。

半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。

云存储中用户需要按需付费并使用存储服务

数据会吸引更多的潜在攻击者,成为更具吸引力的目标。

大数据需要对多种数据混合访问,催生出了新的、需要考虑安全性的问题。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 党团工作 > 入党转正申请

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2