ImageVerifierCode 换一换
格式:DOCX , 页数:16 ,大小:2.17MB ,
资源ID:6048646      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-6048646.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(高校大大数据实验室建设解决方案设计Word文档格式.docx)为本站会员(b****1)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

高校大大数据实验室建设解决方案设计Word文档格式.docx

1、提供行业数据与案例解剖用于根底研究,提供数据分析方案与流程,提供数据更新接口,可以对行业数据进展分析统计,按需求生成数据报表,为科研工作提供数据支撑。例如某地区经济数据分析、股市数据分析、全国地震数据分析、食品价格行业数据分析等。三、建设规模按照60台大数据实验机容量进展同时在线使用进展建设为根底,整体系统提供快速扩容升级服务。四、硬件配置采用十六台高性能品牌服务器作为大数据节点进展建设,采用企业级全千兆三层交换机进展网络数据交换。每台节点的配置如下:处理器每节点支持2个英特尔 至强 处理器 E5-2650 CPU高速缓存15MBQPI总线速率内存提供12个内存插槽,标配192G内存,支持高级

2、内存纠错,内存镜像,内存热备等高级功能磁盘标配4块3TB SATA硬盘标配2块120G SSD 硬盘300G 10000转SAS系统盘网络控制器集成1个高性能千兆以太网控制器双口,支持虚拟化加速,网络加速,负载均衡,冗余等高级功能电源标配大功率高效白金级电源,1+1冗余虚拟化技术支持VMware vSphere、Docker、OpenStack等五、软件平台介绍1、大数据教学管理系统1.1专业管理 提供对专业信息的增加、删除、修改、查询功能。1.2班级管理 提供对专业下属班级的增加、删除、修改、查询功能。1.3学生管理 提供对班级内学生的管理,学生内容包含某某、学号、所属班级、所属专业、联系手

3、机、登录次数等内容。1.4交流日志查阅 对实验机分享交流的内容进展查询,包含交流IP、相关学员、相关教师、实验机编号、交流内容等内容。1.5成绩管理 对于学习中心在线学习的学习考核成绩进展管理,包含查询与删除等功能。1.6学习记录 提供每个学生在学习中心平台内学习课程的学习记录,包含日期、计划、课程、章节、学习IP等。1.7学习行为报表 对所有学生的课程学习记录进展统计,包含个体统计、班级统计、全体统计等。1.8课程管理 对学习课程进展查询、修改、删除等操作。1.9开通课程计划 对于学习开课计划的字段内容包含计划名称、授课讲师、授课时间段、开通状态、允许申请周期,允许申请人数等,功能提供绑定课

4、程计划相关实训平台课程、授课助教、云实验机绑定、实验任务绑定等功能。1.10课程测验习题管理 提供对课程相关的习题管理,题型包含单项选择、多项选择、判断题等类型,对习题进展增、册、改、查操作。1.11分级权限功能 系统分为总管理员、助教等二级管理角色,总管理员进展管理所有的功能点,助教可以进展班级管理、学生管理、开课计划制作、实验机远程协助等。1.12学生实训系统 提供学生根据某某、学号、密码登录系统进展实训操作,学生只需安装浏览即可进展实验任务操作;提供实训课程在线学习功能、实验机在线操作、实验报告提交、实验机界面截图、记录课程学习时长等。1.13实验机桌面分享 提供实验机桌面分享功能,如学

5、生在学习、操作云实验机的过程中,有问题可以向教师发起协助请求,助教在收到请求时,可以远程访问学生的实验机,并指导如何操作。2、云实验机与实验任务22.1云实验机 提供基于Web浏览器的实验机可视化操作,操作终端无需安装其它开发软件即可进展实验操作;云实验机可以根据学生编号、实验任务和环境要求自动创建,无需管理人员参与实验机创建操作过程。管理平台对云实验机可以进展停止、销毁操作。2.2云实验机集群管理功能 提供云实验机集群管理,对实验机所属服务器进展新增、删除等操作。2.3云实验机类型包含Hadoop实验机、Hive实验机、HBase实验机、R语言实验机、Scala实验机、Spark实验机、Ka

6、fka实验机、Sqoop实验机、Flume实验机、数据可视化实验机等。2.4实验机运行监控系统 系统提供对实验集群运行的所有实验机进展监控,可以查询编号、所属服务器、创建时间、运行状态、开放端口等内容。2.5实验任务管理 提供对实验任务内容的管理,包含任务课程、绑定实验机、设定任务成绩总分,排序值等,提供多种实验任务内容,例如Hadoop实验任务、Hive实验任务、HBase实验任务、Flume与kafka实验任务等。2.6实验报告审阅功能 在实验任务过程中学生上交的任务报告进展审阅评分,提供按照学生、实验任务等字段进展检索功能。2.7云实验机桌面分享系统 提供实验机桌面基于浏览器的分享功能,

7、允许学生与学生、学生与教师同步操作实验机桌面系统,提供基于浏览器的交流功能。3、大数据实战平台系统33.1大数据集群管理系统 基于分布式集群管理系统,提供大数据集群管理系统,功能包含Hadoop、Hive、HBase、Sqoop、Flume、Spark等节点部属与管理,提供实时监控集群的CPU、内存、硬盘等使用率与相关信息,可以对管理节点、计算节点进展启动、停止等操作管理。3.2大数据作业工作流系统 提供大数据相关作业的上传、部属、流程管理等功能,基于 Web 的任务调度、兼容Hadoop、Spark主流版本、失败任务的、运行状态监控等。六、大数据课程与行业案例实验平台提供100个课时的Had

8、oop、Spark等大数据主流课程,课程与大数据实验机完美结合,学员在教学管理系统学习课程,随时进展实训操作,包含项目设计、数据采集、清洗、建模、技术实现等,快速提升实操技能,最终掌握大数据开发、数据分析与数据挖掘等大数据能力。局部案例图片:【电商大数据分析案例】【电商大数据分析架构】【房产大数据分析架构】【房产大数据分析可视化】【搜索大数据分析架构】【日志大数据分析架构】课程实验内容包含:课程名称课时课程内容介绍Hadoop根底10讲解Hadoop生态系统,包括操作与开发;详细讲解HDFS和Map-Reduce的功能与作用;了解MapReduce原理、运行流程、压缩数据处理、作业调度、计算器

9、等环节。HDFS程序开发6讲解Hadoop文件系统HDFS JAVA API的使用。掌握如何使用HDFS Java API,读写文件、读写目录、以与对文件进展压缩处理等。MapReduce开发本课程针对Hadoop MapReduce开发进展讲解。课程以案例为根底,重点介绍MapReduce程序结构,以与如何使用MapReduce进展数据统计,去重,排序,Map端Join,Reduce端Join等关联操作,掌握MapReduce处理过程。Hive数据仓库24Hive是基于Hadoop构建的数据仓库分析系统,通过学习掌握Hive的函数、Hive数据的加载、Hive的DDL操作、自定义函数UDF等

10、内容,达到使用Hive进展查询、汇总、分析数据的能力。分布式数据库HBaseHBase是Hadoop生态系统中的重要一员,主要用于海量结构化数据存储;通过学习对HBase表设计、表操作、数据操作、Java API等内容,掌握对HBase系统的开发与使用。数据迁移工具 Sqoop4Sqoop是关系型数据库和Hadoop生态系统之间进展数据转换的主要工具;通过学习将mysql中的数据导入到hdfs中、将数据导入到HBase中、定义导入导出任务等,掌握对数据迁移的能力。分布式日志框架FlumeFlume对海量日志进展采集、聚合和传输的主流大数据工具;课程内容包含Flume应用场景、FlumeNG、F

11、lumeOG、Flume的核心组件、Flume的架构、Flume的source、sink配置说明等。Kafka流式数据采集Kafka是分布式的消息队列,广泛应用于实时数据处理。学习内容包含Kafka的体系结构、安装模式与安装部署、Topic、Producer、Consumer、发布订阅消息以与Kafka JAVA开发等。SparkSpark是一款高性能的分布式计算框架,比MapReduce计算快百倍;本课程内容全面涵盖了Spark生态系统、Spark与Hadoop比照、开发环境搭建、RDD、编程模型、Web监控等内容。Spark Streaming Spark Streaming是用户结合流式

12、、批处理和交互式查询应用的实时计算框架;本课程内容详细讲解原理与特点、适用场景、Dstream操作、容错、性能优化和内存优化等。Spark SQLSpark SQL的出现,使得SQL-on-Hadoop的性能相对于Hive有了显著的提高。达到Spark兼容Hive的功能。本课程详细讲解特点、运行架构、数据源、数据缓存、DataFrame等。实战案例搜索引擎日志数据统计分析讲解Hadoop系统架构设计以与项目分析流程;通过对用户搜索记录数据的清洗,分析指标内容,得出关键词排行榜、用户停留时间最高页面等。电子商务平台大数据分析讲解Spark系统架构设计以与项目分析流程;本课程主要讲解搭建电商的数据

13、处理平台、数据统计、分析与可视化技术的应用开发流程。七、行业数据与案例 提供大数据实战案例以与行业数据,提供包含海量日志分析案例、租房与二手房大数据分析案例、电商商品交易大数据挖掘、搜索引擎关键词分析算法案例、汽车销售数据分析案例等案例讲解与实战作业工作流内容。数据名称数据描述更新地区房产数据包含二手房在售数据、出租房屋数据、经纪人评价数据等。每周全国汽车数据包含国内不同种类汽车详细配置信息、汽车使用评论数据、汽车销售数据以与二手车数据等。可用于汽车行业市场行情分析。每月法律咨询数据包含国内所有法律咨询服务机构数据、机构评论数据、有关法律咨询话题的数据。可用于法律咨询行业市场行情分析,社会治安

14、情况分析。疾病问答数据包含国内不同种类疾病问题数据、医生回复数据、有关疾病常识等话题的数据。股票基金交易数据包含国内、港股、美股等国内外股票行情与交易数据、按照时间段提供详细数据;也包含证券投资基金、保险基金、信托投资基金等行情数据。每日天气、气象数据包含全国各个地区气象数据气温、降水量、风、气压等、气象观测产品数据。可用于气象业务、天气预报、气候预测以与气象服务。人脸图像数据包含国内多种年龄段的人脸图像数据。用于脸部特征分析、人脸识别、人脸检测等,每个人提供多个角度的图片。电商评价数据包含上百万条国内知名电商平台产品评价数据。可用于用户购置产品意愿分析、个性化推荐和精准营销,进展商业舆情监控和产品的市场行情分析。生鲜食品价格数据包含历年市蔬菜、水果、肉禽蛋、水产等生鲜食品的最低价、最高价以与平均价以与最新价格。利用大数据可进展生鲜食品行业分析。搜索引擎访问日志数据包含用户搜索记录数据。通过对用户搜索记录的分析,可以分析用户行为特征,构建广告点击模型。海量访问日志数据包含海量用户访问的日志数据。通过对日志的分析,我们可以知道获取每类页面的PV值PageView,页面访问量、独立IP数,哪个网页最有价值等。八、安装配置2、大数据实战集群与案例

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2