精选新版最新公需科目《大数据》模拟考试含答案.docx
《精选新版最新公需科目《大数据》模拟考试含答案.docx》由会员分享,可在线阅读,更多相关《精选新版最新公需科目《大数据》模拟考试含答案.docx(17页珍藏版)》请在冰点文库上搜索。
精选新版最新公需科目《大数据》模拟考试含答案
2020年最新公需科目《大数据》考试题(含答案)
一、填空题
1.MapReduce任务过程分为两个处理阶段.map阶段和reduce阶段。
二、多选题
2.贵州电子商务的发展路径是.与阿里.京东.腾讯等电商企业强化合作,改善信息基础条件.物流条件,培育电商主体和平台,积极发展()。
A.电子商务+跨境
B.电子商务+社区
C.电子商务+物流
D.电子商务+农村
3.第一个提出大数据概念的公司是()。
A.微软公司B.谷歌公司C.脸谱公司
■D.麦肯锡公司
4.1982以来,内存的价格下降了4.5万倍,硬盘的价格下降了360万倍。
对
5.下列哪些国家已经将大数据上升为国家战略?
ABCD
分
A.日本
B.英国
C.美国
D.法国
6.吴军博士认为未来二十年就是()为王的时代。
C
A.文化
B.工业
C.数据
D.农业
7.《国务院办公厅关于深入实施“互联网+流通”行动计划的意见》要求.支持建设农产品流通全程冷链系统。
正确
错误
8.根据涂子沛先生所讲,现在非结构化数据已经占人类数据总量的25%。
正确
错误
9.宁家骏委员指出,()主导了21世纪。
A.移动支付
B.大数据
C.物联网
D.云计算
10.林雅华博士指出,网络时代的国家治理必须要借鉴互联网多元向度.扁平化.相互竞合的方式进行。
√
正确
错误
11.宁家骏委员指出,()主导了21世纪。
ACD
A.云计算
B.移动支付
C.大数据
D.物联网
12.根据周琦老师所讲,高德交通日均采集数十亿定位请求,系统处理月均(A)公里驾驶里程覆盖。
A.100亿
B.150亿
C.50亿
D.80亿
13.第一个提出大数据概念的公司是D
A.谷歌公司
B.微软公司
C.脸谱公司
D.麦肯锡公司
14.对于大数据而言,最基本.最重要的要求就是减少错误.保证质量。
因此,大数据收集的信息量要尽量
精确。
(F)(判断题)
是
否
15.云计算使得使用信息的存储是一个()的方式,它会大大地节约网络的成本,使得网络将来越来越泛在.越来越普及,成本越来越低。
■A.分布式
B.密闭式C.密集式
■D.共享式
16.全球信息化发展六大趋势包括()。
ABCD
分
A.全球制造业互联网化进程加速
B.全球信息化发展向智慧化阶段迈进
C.信息技术对促进创新的作用日益凸显
D.全球进入移动互联网全面爆发时期
17.以下选项中,不属于大数据对人才能力的要求是
A.业务能力B.数学统计能力C.IT技术能力
■D.逻辑思维能力
18.郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?
ABCD
A.农作物病虫害监测
B.农业精准生产控制
C.农田环境监测
D.农作物长势苗情监测
19.建立大数据需要设计一个什么样的大型系统?
ABCD
A.能够把应用放到合适的平台上
B.能够开发出相应应用
C.能够处理数据
D.能够存储数据
20.数据再利用的意义在于(ABC)。
A.挖掘数据的潜在价值
实现数据重组的创新价值
C.利用数据可扩展性拓宽业务领域
D.优化存储设备,降低设备成本
E.提高社会效益,优化社会管理
21.2009年,甲型H1N1流感在全球爆发,谷歌(5000万条历史记录,做了4.5亿个不同的数学模型)测算出的数据与官方最后的数据相关性非常接近,达到了()。
A.77%
B.67%
C.97%
D.87%
22.根据涂子沛先生所讲,现在非结构化数据已经占人类数据总量的25%。
×
正确
错误
三、简答题
23.什么是分布式计算
答.分布式计算是一门计算机科学,主要研究分布式系统。
一个分布式系统包括若干通过网络互联的计算机。
这些计算机互相配合以完成一个共同的目标(我们将这个共同的目标称为“项目”)。
具体的过程是.将需要进行大量计算的项目数据分割成小块,由多台计算机分别计算,再上传运算结果后统一合并得出数据结论。
在分布式系统上运行的计算机程序称为分布式计算程序;分布式编程就是编写上述程序的过程。
四、论述题
24.发展现代农业,要发展高产.优质.高效.生态安全农业,可以利用信息技术进行精准控制,实现农业的()和规模化运行。
(多选题3分)
分
A.集约化经营√
B.自动化控制√
C.智能化管理√
D.标准化生产√
25.下列关于聚类挖掘技术的说法中,错误的是(B)。
A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B.要求同类数据的内容相似度尽可能小
C.要求不同类数据的内容相似度尽可能小
D.与分类挖掘技术相似的是,都是要对数据进行分类处理
26.大数据的最显著特征是(A)。
A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高
27.下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是(AB)。
A.传统营销模式比基于大数据的营销模式投入更小
B.传统营销模式比基于大数据的营销模式针对性更强
C.传统营销模式比基于大数据的营销模式转化率低
D.基于大数据的营销模式比传统营销模式实时性更强
E.基于大数据的营销模式比传统营销模式精准性更强
28.对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。
(F)(判断题)
是否
29.2015年,阿里平台完成农产品销售达到6000多亿元。
1分
正确错误1
30.大数据处理流程可以概括为以下哪几步?
abcd(多选题3
A.挖掘B.采集
C.统计和分析D.导入和预处理
31.对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户
最好集中处理。
(F)(判断题)
是
否
32.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。
正确√错误
33.数据化就是数字化,是相互等同的关系。
×分
正确
错误
34.以下对网络空间的看法,正确的是:
(B)
A.网络空间是虚拟空间,不需要法律
B.网络空间虽然与现实空间不同,但同样需要法律
C.网络空间是一个无国界的空间,不受一国法律约束
D.网络空间与现实空间分离,现实中的法律不适用于网络空间
35.世界上第一台电子计算机(ENIAC)是在哪一年宣告诞生的?
(单选题1分)
A.1946年√
B.1947年
C.1948年
D.1949年
36.阿兰·图灵在哪一年提出图灵测试的概念?
(B)(单选题1分)
A.1954年
B.1950年
C.1952年
D.1955年
37.大数据元年是指()。
(单选题1分)
A.2012年
B.2011年
C.2013年√
D.2010年
38.下列关于计算机木马的说法错误的是:
(A)
A.只要不访问互联网,就能避免受到木马侵害
B.Wrd文档也会感染木马
C.杀毒软件对防止木马病毒泛滥具有重要作用
D.尽量访问知名网站能减少感染木马的概率
39.下列关于数据重组的说法中,错误的是(A)。
A.数据重组是数据的重新生产和重新采集
B.数据重组能够使数据焕发新的光芒
C.数据重组实现的关键在于多源数据融合和数据集成
D.数据重组有利于实现新颖的数据模式创新
40.电脑或者办公的内网进行物理隔离之后,他人无法窃取到电脑中的信息。
×分
正确
错误
41.下面关于我们使用的网络是否安全的正确表述是.(A)
A.没有绝对安全的网络,使用者要时刻提高警惕,谨慎操作
B.安装了防火墙,网络是安全的
C.设置了复杂的密码,网络是安全的
D.安装了防火墙和杀毒软件,网络是安全的
42.下列关于数据交易市场的说法中,错误的是(C)。
A.数据交易市场是大数据产业发展到一定程度的产物
B.商业化的数据交易活动催生了多方参与的第三方数据交易市场
C.数据交易市场通过生产数据.研发和分析数据,为数据交易提供帮助
D.数据交易市场是大数据资源化的必然产物
43.传统数据密集型行业积极探索和布局大数据应用的表现是(BCE)。
A.投资入股互联网电商行业B.打通多源跨域数据
C.提高分析挖掘能力D.自行开发数据产品
E.实现科学决策与运营
44.万维网之父是(C)。
A.彼得·德鲁克B.舍恩伯格C.蒂姆·伯纳斯-李D.斯科特·布朗
45.国务院《关于印发促进大数据发展行动纲要的通知》指出.要建立()的新的管理机制。
(多选题3分)
分
A.用数据管理√
B.用数据创新√
C.用数据决策√
D.用数据说话√
46.2009年,甲型H1N1流感在全球爆发,谷歌(5000万条历史记录,做了4.5亿个不同的数学模型)测算出的数据与官方最后的数据相关性非常接近,达到了()。
(单选题1分)
A.77%
B.97%√
C.67%
D.87%
47.大数据的核心是洞察,洞察有以下哪些特色?
(多选题3分)
分
A.洞察工作重点√
B.洞察调度奥妙√
C.洞察管理规律√
D.洞察未来趋势√
48.郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?
abcd(多选题3
A.农作物病虫害监测
B.农业精准生产控制
C.农田环境监测
D.农作物长势苗情监测
49.2012年,我国农村居民家庭每百户拥有移动电话197.8部。
分.1分
正确1错误
50.请谈一谈你对HDFS的认识?
HDFS采用的是Maser/Slave模型,一个HDFScluster包含一个NameNde和一些列的DataNde,其中NameNde充当的是Maser的角色,主要负责管理HDFS文件系统。
里面存储着描述信息,处理来自客户端的请求;DataNde主要是用来存储数据文件,HDFS将一个文件分割成多个Blck,这些Blck可能存储在一个DataNde上或者是多个DataNde上。
HDFS支持传统文件系统的目录结构,应用程序能够创建目录directry,在这些目录中存储文件,创建文件,移动文件和删除文件,重命名文件,但是不支持硬链接和软连接。
系统需要进行分布式管理,这样可以通过高性能的Map-Reduce对系统的数据进行高效地管理和处理,使数据分散地存储到每个节点上,也令每个任务在节点上并行执行,减少系统的开销。
由于HDFS系统存储的数据量非常大,为了保证数据的完整性和数据在破坏或者丢失后能够充分地恢复,所以需要加入冗余和容错技术。
冗余是指备份数据和信息。
容错是指通过备份的数据和信息,使系统自动恢复到事故发生之前的状态。
HDFS将一个发文件分割成Blck,然后将这些Blck存储到不同的DataNde中,那么如何保证如果一个DataNde死掉,保证数据的完整性,通常的技术就是进行数据的备份,HDFS同样使用的是这一策略。