计算机类专业大数据技术与应用人才培养方案word.docx
《计算机类专业大数据技术与应用人才培养方案word.docx》由会员分享,可在线阅读,更多相关《计算机类专业大数据技术与应用人才培养方案word.docx(22页珍藏版)》请在冰点文库上搜索。
计算机类专业大数据技术与应用人才培养方案word
计算机类专业(大数据技术与应用)人才培养方案
一、招生对象及学习年限
(一)招生对象:
全日制普通中学高中毕业生,招生方式为普通高考招生。
(二)学习年限:
基本学制三年,实行弹性学制,学生在校时间原则上不能少于两年,总在校时间(含休学)不得超过六年。
二、培养目标
本专业培养面向中国特色社会主义建设,对接广州及珠三角地区战略性主导产业和战略性新兴产业中大数据或数据挖掘的工程重点领域的人才需求,具有良好的职业道德和职业精神,能从事计算机软硬件产品及大数据或数据挖掘的工程性开发与实现、在计算机与互联网企业中从事系统集成或售后服务、数据处理与分析、在政府部门或企事业单位从事信息系统的建设、管理、运行、维护的技术工作,具备“一技之长+综合素质”的德、智、体、美等方面全面发展的高素质的技术应用性人才。
三、就业岗位与就业范围
就业岗位
就业范围
主要业务工作
大数据研发工程师
互联网、金融、IT、制造业、零售企业
大数据产品建设与开发、大数据项目需求分析、设计、业务建模。
大数据产品工程师
互联网、金融、IT、制造业、零售企业
大数据产品建设与开发、大数据项目需求分析、设计、业务建模。
大数据售前工程师
互联网、金融、IT、制造业、零售企业
数据集成工作的开发、测试与调优、大数据产品测试,测试报告编写。
大数据运维工程师
互联网、金融、IT、制造业、零售企业
大数据平台搭建,维护,调优,管理,监控。
数据挖掘工程师
互联网、金融、IT、制造业、零售企业
常规数据报告的制定与信息挖掘、根据公司战略需要进行数据建模。
数据分析师
互联网、金融、IT、制造业、零售企业
数据采集及数据处理工作、对数
据进行整理规划,编写数据说明文档、明确客户方的业务体系。
四、人才培养规格
(一)综合素质
1.思想政治素质:
掌握马克思主义科学的世界观、人生观和价值观。
有坚定跟着共产党走中国特色社会主义道路的信心和决心,有热爱祖国、服务人民的理想信念。
具有社会责任感,能积极践行社会主义核心价值观,拥有能够支撑职业和人生发展的思想政治素质。
2.职业素质:
具有良好的职业态度和职业道德修养,具有正确的择业观和创业观。
坚持职业操守,爱岗敬业、诚实守信、办事公道、服务群众、奉献社会;具备从事职业活动所必需的基本能
力和管理素质;脚踏实地、严谨求实、勇于创新。
3.人文素养与科学素质:
具有融合传统文化精华、当代中西文化潮流的宽阔视野;文理交融的
科学思维能力和科学精神;具有健康、高雅、勤勉的生活工作情趣;具有适应社会核心价值体系的审美立场和方法能力;奠定个性鲜明、善于合作的个人成长成才的素质基础。
4.身心素质:
具有一定的体育运动和生理卫生知识,养成良好的锻炼身体、讲究卫生的习惯,掌握一定的运动技能,达到国家规定的体育健康标准;具有坚韧不拔的毅力、积极乐观的态度、良好的人际关系、健全的人格品质。
(二)职业能力
本专业主要学习常用数据挖掘编程语言(R语言和Python)、数据库应用技术、Java程序设计、Linux操作系统、Hadoop大数据存储与运算、Hadoop大数据存储与运算、大数据查询与处理、Spark大数据快速运算、Oozie大数据工作流,具备大数据开发与数据挖掘的实际工作能力,具有创新意识及进一步发展专业技能的良好基础。
本专业毕业生应获得以下几方面的知识和技能:
1.具有比较扎实的计算机基本理论与技术、数据挖掘的常用算法;
2.掌握当前使用最广泛的数据挖掘编程语言python;
3.熟悉SQL的计算与存储过程调优,并具有严密的逻辑分析能力;
4.具备数据的处理、抽取、清洗、转换等能力;
5.掌握主流的Hadoop处理技术,包括MapReduce、Hive、Hbase等;6.逻辑思维能力强,具备较强的文档编写和良好的沟通表达能力。
(三)职业拓展能力1.对大数据基础架构和平台有深刻理解;
2.熟悉Hadoop集群构建,能进行相应的部署及配置;
3.熟悉主流应用服务器的架构体系以及各种中间件技术。
五、毕业标准
学生按专业人才培养方案要求修完规定的课程,考核合格,达到毕业最低总学分和《国家学生体质健康标准》相关要求,获得本专业要求的证书,准予毕业,颁发毕业证书。
(一)学分要求本专业按学年学分制安排课程,学生最低要求修满总学分124学分。
必修课要求修满94学分,占总学分的75.81%。
其中:
基本素质课要求修满21学分,占总学分的16.94%;
职业能力课要求修满73学分,占总学分的58.87%。
选修课要求修满30学分,占总学分的24.19%。
其中:
基本素质课要求修满20学分,占总学分的16.13%;
职业能力课要求修满10学分,占总学分的8.06%。
(二)证书要求
1.获得以下英语证书之一
(1)广东省英语教学指导委员会颁发的高级职业英语证书;
(2)全国大学英语四、六级考试委员会颁发的全国大学生英语四级或六级考试证书;2.获得以下专业或职业资格认证证书之一
(1)广东省嵌入式软件公共技术中心组织的嵌入式Linux软件开发工程师职业资格认证证书;
(2)国家劳动和社会保障部职业技能鉴定中心和广东省LINUX公共服务技术支持中心的“全国计算机高新技术Linux系统管理模块管理员级”职业资格认证证书;
(3)通过国家人事部“计算机技术与软件专业技术资格(水平)考试”中计算机程序员初级资格考试,获取相应的“程序员”技术资格证书;
六、职业能力核心课程
1.Python编程与数据挖掘基础课程能力目标:
了解数据挖掘技术、Python编程及数据可视化。
课程主要内容:
数据挖掘、建模工具以及Python开发环境的搭建;Python的基础知识,包括操作符、流程控制、数据结构、文件读写等内容;Python面向对象的特性进行介绍,包括函数、类与对象等基本概念;数据分析与挖掘,以及其中具体的方法及对应的功能;Python可视化模块:
Matplotlib和Bokeh。
2.Hadoop大数据存储与运算
课程能力目标:
了解Hadoop的架构、原理、Hadoop集群配置及安装(JDK、SSH),熟悉HadoopIDE开发环境配置(Eclipse配置)和HadoopJavaAPI编程实例、具备Hadoop编程开发能力。
课程主要内容:
Hadoop简介、架构、原理、Hadoop集群配置及安装(JDK、SSH)、HadoopIDE开发环境配置(Eclipse配置)、HadoopJavaAPI编程实例、HadoopJavaAPI编程实例、Hadoop命令(hadoopfs,hadoopjob,Hadoopjar)、Hadoop基础编程(Mapper、Reducer、Driver)、Hadoop高级编程(FileInputFormat、Combiner、Partitioner、FileOutputFormat)、Hadoop案例
—基于KNN的鸢尾花类别预测(算法实现及Hadoop编程)、Hadoop实例—基于KMeans的客户价值分析(算法实现及Hadoop编程)。
3.Hbase大数据快速读写
课程能力目标:
熟悉HBase集群安装配置、掌握HBase架构与数据模型、实现基于HBase的冠字号查询系统。
课程主要内容:
HBase简介、HBase集群安装配置(Zookeeper简介、Zookeeper安装配置、配置文件解读)、HBase架构与数据模型(组件原理功能、Rowkey设计、Schema设计)、HBas命令行
(hbaseshell)、HBase开发环境配置、JavaAPI操作HBase删/建表、HBase增删改查、HBase与HadoopMapreduce交互(HBasetoHDFS,HDFStoHBase,HBasetoHBase)、基于HBase的冠字号查询系统(案例背景、架构、数据处理、案例实现)。
4.大数据查询与处理
课程能力目标:
熟悉Pig架构与原理、PigLatin运行环境、Pig数据类型,Hive与Pig区别,
掌握Pig安装、配置,熟悉PigLatin数据加载/输出、数据转换、数据存储。
课程主要内容:
Pig简介、架构与原理、PigLatin运行环境,Pig数据类型、Hive与Pig区
别、Pig安装、配置、Pig运行模式、Pig基本指令,PigLatin数据加载/输出、数据转换、数据存储,Pig内置函数、自定义函数(UDF),使用Hcatalog、Hive与Pig交互,Pig案例---SOGO案例。
5.Spark大数据快速运算
课程能力目标:
掌握Spark安装配置,了解其原理与架构,掌握Spark常用编程技术,实现基于SparkALS的电影推荐系统。
课程主要内容:
Spark简介(Spark简介、应用场景)、Spark安装配置(如何兼容Hadoop、HBase集群)、Spark原理与架构(组件功能、RDD原理)、Spark编程(Scala及编程简介、SparkTransformation/Action编程)、SparkIntellijIDEA开发环境配置、基于SparkALS电影推荐系统(案例背景、系统架构、SparkShell实现、系统业务逻辑实现)。
6.Oozie大数据工作流
课程能力目标:
了解Oozie工作原理,熟悉Oozie环境配置及页面监控、OozieWorkflow配置。
课程主要内容:
Oozie工作原理、Oozie环境配置及页面监控、OozieWorkflow配置(HadoopMR工作流、Hive工作流、Pig工作流、Spark工作流)、定时任务配置。
7.顶岗实习课程能力目标:
经过顶岗实习,进一步巩固学生所学的数据库应用技术、数据挖掘编程语言、
Hadoop大数据存储与运算、Hbase大数据快速读写、大数据查询与处理、Spark大数据快速运算、Oozie大数据工作流等学科知识,提高学生的实际工作能力和技能,为今后的工作打下基础。
课程主要内容:
结合所学的数据库应用技术、数据挖掘编程语言、Hadoop大数据存储与运算、Hbase大数据快速读写、大数据查询与处理、Spark大数据快速运算、Oozie大数据工作流等学科知识进行顶岗实习,实习课程的主要内容包括:
常用数据挖掘算法的实际应用,数据平台的运营管理和安全维护,保障数据的存档、保密工作;搭建基于Hadoop/Spark/Shark的大数据平台,大数据采集、清洗、整合等。
七、实践教学条件
(一)校内实训室大数据工程实训教学平台(H8),是将云存储资源、服务器资源和网络资源整合,然后通过Vmware
等虚拟化搭建私有云平台,在私有云平台上搭建统一的数据挖掘平台和基于Hadoop的大数据分析平台。
大数据工程教学实训平台的建设能让学生既掌握必要的理论基础,又能将大数据分析理论和方
法用于解决实际问题。
该大数据教学平台也能解决教学过程中实验环节非常薄弱,造成学生缺少数据挖掘实践经验、缺乏实践应用能力等问题。
基于Hadoop实战项目,在大数据实战环境中,通过动手实操,让学员在短时间内掌握使用平台开发Hadoop程序,以完成高效的大数据存储、清洗和分析。
大数据工程教学实训平台的建设采用四层架构,其整体架构如下图所示。
大数据挖掘建模平台
(TipDM-HB,无编程经验)
大数据开发实训平台
(TipDM-HD,需编程基础)
虚拟化层(VMWare、Hyper-v或KVM等)
大数据工程教学实训平台底层数据处理平台采用云计算技术实现,基于云计算的基础设施层能充分保障资源的有效利用率和资源的动态伸缩性,云基础设施层上搭建了基于VMware、Hyper-v或KVM等的虚拟化层,该虚拟化层能充分保证业务的连续性和平台运行的可靠性。
建立在虚拟化层上的统一数据挖掘平台TipDM-HB能满足有大数据挖掘需求的师生利用图形化的界面进行大数据分析,而基于Hadoop的大数据开发平台(TipDM-HD)能为大数据算法分析和大数据处理提供基础平台。
位于架构最上层的大数据工程教学实训平台为培养大数据时代的数据科学家提供实训平台。
H8主要可包含以下8个组件:
核心组件:
⏹大数据挖掘建模平台(云数据挖掘引擎;云数据挖掘算法库;主机监控系统;云平台监控系统);
⏹大数据开发实训平台(基于VMware、Hyper-v或KVM等虚拟化的Hadoop开发实训平台)。
可选组件:
⏹大数据分析教学实训教程:
由校企联合打造的以解决企业大数据挖掘应用为目标的案例教程,主要包括:
《Python与数据挖掘》、《Python数据分析与挖掘实战》、《Hadoop与大数据挖掘》、《Hadoop大数据分析与挖掘实战》;
⏹大数据分析教学案例库及配套资源:
所有案例均来自企业在大数据挖掘领域的典型应用;
⏹大数据教学演练沙盘:
模拟各种大数据应用案例场景的演练沙盘,如智能交通仿真沙盘、管网漏损智慧水务沙盘、窃漏电用户自动识别沙盘、菜品智能推荐沙盘等。
;
⏹大数据整合平台:
包括数据管理、运维视图、接口管理、调度管理、系统管理等功能;
⏹课程规划及师资培训:
协助完成课程设置及教学规划,并为大数据挖掘课程教学提供师资培训;
⏹学生实习实训:
提供大数据挖掘实践项目,组织学生参与公司的项目实习及集中实训。
1)大数据教学演练沙盘(TipDM-SP)
TipDM-SP是专门针对高校大数据课程教学实践环节薄弱,学员实际应用能力差这一教学弱点设计开发的一系列教学组件。
“沙盘模拟”实验课程改变传统的教学模式,将理论与实践融为一体的设计思路,使学生在参与、体验中完成了从知识到技能的转化。
沙盘模拟过程中,学生经历了一次从理论到实践再到理论的上升过程,实现从感性到理性的飞跃。
2)大数据开发实训平台(TipDM-HD)
TipDM-HD是一套建立在虚拟化层上的大数据开发平台,提供了一个开放、稳定和高度可扩展的框架,集成有ApacheHadoop的数据流业务与现有的数据架构。
基于此平台,学员能在极短的时间内快速掌握各种ApacheHadoop项目以及Hadoop分布式文件系统(HDFS)、MapReduce、Pig、Hive、HBase、Zookeeper和其他各种组件的使用方法,并真正完成基于Hadoop框架的大数据应用开发。
Hadoop增强模块
Hadoop各个子模块环境,如分布式文件系统HDFS、分布式计算框架MapReduce、集群资源管理YARN、基础平台Common等。
基于Hadoop的Hive增强模块
基于Hadoop的大数据仓库Hive模块环境,可直接执行相关HiveQL脚本、进行数据导入导出等。
基于Hadoop的HBase增强模块
基于Hadoop的大数据库HBase模块环境,可直接执行相关HBaseShell交互式终端命令、进行数据导入导出、使用MapReduce与HDFS进行交互等。
基于Hadoop的Pig增强模块
基于Hadoop的大数据快速数据处理Pig模块环境,可直接执行相关PigLatin脚本、进行大数据分布式文件系统HDFS上的各种数据处理等。
基于Hadoop的Spark增强模块
基于Hadoop的大数据快速计算Spark模块环境,如SparkCore、SparkSQL、SparkMllib等,可直接启动Spark-shell进行操作,也可以和YARN进行整合,可直接操作HDFS等。
TipDM-HD使用虚拟机进行大数据开发教学,每个学员一个小集群(一般配置为虚拟机),每个集群大概3~5台机器,其中虚拟机中预先配置好大数据开发环境及工程案例:
大数据工作流Oozie模块
包含Hadoop、Hive、HBase、Pig、Spark等集成环境,使用Oozie引擎触发各种大数据任务,可直接定义相关任务配置XML文件进行集群任务调度。
大数据案例模块
包含Hadoop、Hive、HBase、Pig、Spark、Oozie等集成环境,针对不同案例使用不同的软件环境及相关数据、工程,如进行数据传输时,需要Flume环境,则也是提前配置好的。
(二)校外实训基地
1.广州泰迪智能科技有限公司规模:
30-80名学生
功能:
顶岗实习、项目合作、咨询服务、师资培训
八、课程设置与教学安排(附表1)九、各类课程学时学分比例表(附表2)十、部分专业课程教材推荐
大数据工程和数据挖掘作为新兴产业,如何实现教学与企业需求相吻合具有重要意义,广州泰迪智能科技有限公司作为深耕大数据及数据挖掘行业多年的企业,在大数据及数据挖掘方面拥有丰富的实际项目经验和独到的行业见解。
同时,经过与各高校多年的深入合作,广州泰迪也更清楚高校育人与企业用人如何有效对接,故对相关专业课程的教材进行推荐,教材的绝大部分内容也是源于企业实际项目,更具有实践意义。
推荐的每本教材皆有配套的PPT、源代码及原始数据,教师教学能更加轻松顺畅,学生也更能体会到实际企业项目的过程,提升教学质量。
部分专业课程教材推荐表
课程编号
课程名称
学时数
推荐教材
章节
01050056Z
Python语言基础
72
Python与数据挖掘/张良均等著.-北京:
机械工业出版社
第1章~第6章
01050056Z
数据挖掘基础算法(Python语言)
54
Python与数据挖掘/张良均等著.-北京:
机械工业出版社
第7章~第11章
01050056Z
智能推荐系统实践(Python语言)
54
Python数据分析与挖掘实战/张良均等著.-北京:
机械工业出版社
第12章
01050383Z
Hadoop大数据存储与
运算
54
Hadoop与大数据挖掘/张良均等著.-
北京:
机械工业出版社
第1章~第2章
01050383Z
Hbase大数据快速读写
54
Hadoop与大数据挖掘/张良均等著.-
北京:
机械工业出版社
第3章
01050385Z
大数据查询与处理
54
Hadoop与大数据挖掘/张良均等著.-
第4章~第5章
北京:
机械工业出版社
01050386Z
Spark大数据快速运算
54
Hadoop与大数据挖掘/张良均等著.-
北京:
机械工业出版社
第6章
01050387Z
Oozie大数据工作流
54
Hadoop与大数据挖掘/张良均等著.-
北京:
机械工业出版社
第7章~第8章
附表1
计算机类专业(大数据技术与应用)课程设置与教学安排表
课程类别
课程性质
序号
课程代码
课程名称
核心课程
课程类型
学分
计划学时
教学周学时/教学周数
考核评价方式
主要教学场所
备注
总学时
理论
实践
一
二
三
四
五
六
16
周
18
周
18
周
18
周
18
周
16
周
基本素质课
必修课
1
01100001G
思想道德修养与法律基础
⊙
理论+实践
3
54
48
6
2/13
2/14
考试
多媒体教室
2
01100005G
毛泽东思想和中国特色社会主义理论体系概论
⊙
理论+实践
4
72
64
8
2/16
2/16
考试
多媒体教室
实践
/网络课时在课外安排
3
01100003G
形势与政策
理论+实践
1
64
16
48
2/2
2/2
2/2
2/2
考查
多媒体教室
4
01100004G
廉洁修身
理论+实践
1
18
8
10
2/4
考查
多媒体教室
5
03060005G
大学生心理健康教育
纯理论
2
32
32
0
4/8
考试
多媒体教室
6
03060004G
公益劳动
纯实践
1
16
0
16
考查
其他
7
03060002G
职业规划与就业指导
理论+实践
2
38
16
22
11
11
2/4
2/4
考查
多媒体教室
8
03060003G
军训(含军事理论)
纯实践
2
56
0
56
2W
考查
其他
9
01070003G
高职英语
理论+
5
90
45
45
4/12
4/11
多媒体教
实践
室
11
01090001G
应用文写作
纯理论
2
36
36
0
3/12
考试
多媒体教室
小计
23
476
265
211
选修课
1
01090012G
体育
纯实践
4
60
0
60
限选
2
综合素质课外训练项目必选8学分
8
0
0
0
创新创业、技能竞赛、社会实践、国际交流、社团活动、科技活动、文化艺术及其他素质拓展活动
3
综合素质选修课程要求必选8学分
8
120
120
0
1.一类模块2、3课程2学分;2.三类团队协作与执行能力课程
2学分;3.四类模块2课程2学分;4.四类模块5课程2学分
小计
20
180
120
60
职业能力课
必修课
平台课程
1
01050371Z
计算机数学基础
纯理论
4
72
72
0
6/12
考试
多媒体教室
2
01050346Z
计算机应用软件
理论+实践
4
72
36
36
6/12
考试
一体化教室
3