大数据分析培训机构学习路线文档格式.docx

上传人:b****1 文档编号:6080833 上传时间:2023-05-06 格式:DOCX 页数:29 大小:240.48KB
下载 相关 举报
大数据分析培训机构学习路线文档格式.docx_第1页
第1页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第2页
第2页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第3页
第3页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第4页
第4页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第5页
第5页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第6页
第6页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第7页
第7页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第8页
第8页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第9页
第9页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第10页
第10页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第11页
第11页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第12页
第12页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第13页
第13页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第14页
第14页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第15页
第15页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第16页
第16页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第17页
第17页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第18页
第18页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第19页
第19页 / 共29页
大数据分析培训机构学习路线文档格式.docx_第20页
第20页 / 共29页
亲,该文档总共29页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

大数据分析培训机构学习路线文档格式.docx

《大数据分析培训机构学习路线文档格式.docx》由会员分享,可在线阅读,更多相关《大数据分析培训机构学习路线文档格式.docx(29页珍藏版)》请在冰点文库上搜索。

大数据分析培训机构学习路线文档格式.docx

掌握Struts2在项目开发时用到的各种知识点,能够应用

该框架熟练的开发

Hibernate

ORM的概念、CRUD的完成、Hibernate常用的配置、API详细的分析、对象的三种状态、关联关系、检索、优化、缓存机制

熟练掌握利用Hibernate框架完成项目的开发,深入理解ORMapping的概念,深入理解缓存机制

Spring

IOC、DI、动态代理模式、AOP、基于Spring的数据库编程、Spring的声明式事务处理,Struts2与Hibernate与Spring的整合

深入理解SpringIOC、DI在软件架构中的作用,深入理解SpringAOP的实现机制和应用场景,Struts2的高级特性(对象工厂、静态注入、插件机制、ThreadLocal针对ActionContext的封装、Struts2的核心流程、结果集架构)、深入理解SSH整合的原理

JQuery

JQuery常见选择器的应用

利用JQuery控制Web界面

JS高级

JS面向对象的特征

对象、原型、闭包、JQuery内部结构解析等

Maven

Maven的概念、使用、原理、

Module的概念、仓库

能用Maven搭建项目环境

熟练使用Maven的依赖和继承机制

SSH项目:

国际物流

项目背景、系统USECASE图、系统功能结构图、系统框架图、国际物流核心业务货运管理、购销合同业务、购销合同下货物、出口报运单、装箱单、委托书、发票、财务统计、海量数据导出、出口报运、装箱业务、Shiro高级安全框架、工作流Activiti5

掌握画USECASE图、系统结构图、系统框架图。

面试能顺畅讲述国际物流核心业务,包括:

购销合同、出口报运、装箱、委托、发票、财务。

了解大型数据库设计思路,及数据库在设计上如何优化。

熟练实现合同、货物、附件两级主从结构。

熟练POI制式表单应用。

熟练应用Shiro高级安全框架。

熟练应用工作流Activiti5实现货运管理流程控制。

实训项目三:

易买电商项目

第四阶段(SpringMVC,Mybaties,SSM项目贯穿)

SpringMVC

模拟SpringMVC的核心部件写一个例子、核心分发器、处理器映射、适配器、控制器、注解开发实例、标签机制、拦截器机制、AJAX与JSON调用

熟练掌握SpringMVC的各个组件,理解SpringMVC的架构原理,利用SpringMVC开发项目

MyBaties

CRUD操作、SqlSessionFactory对象、SqlSession对象、集合参数、动态SQL语句、代码优化、Mapper的接口、关联关系、缓存机制、拦截器、MyEclipse插件的使用

SSM项目(易买电商)

项目需求讲解、环境的搭建、后台系统实现、前台系统搭建、内容管理实现、Redis缓存解决前台访问性能问题、单点登录、异步订单系统处理、Lucene与Solor实现文件的检索、ActivityMQ实现消息的异步通信、MySQL的数据库的读写分离、分布式环境的部署和实施

了解电商项目的需求分析,掌握用pom.xml文件构建项目,实现电商项目的前台的内容管理、菜单管理、购物等。

掌握Redis缓存如何提供性能、利用Solor做全文检索、利用ActivityMQ的异步机制把缓存中的改动同步到各个环节、掌握MySQL的主从复制和读写分离。

利用lvs,keepalived,nginx,tomcat搭建高并发的web环境

实训项目四:

电信项目

第五阶段(分布式、高并发、集群、电信项目贯穿)

网络编程

Socket、Io、Nio、Mina、RPC技术、多线程、线程池

把电信项目的部分环节利用mina、RPC技术实现

数据仓库

数据仓库基础知识

ETL

MySQL的导入工具、分表,分区、读写分离、存储过程级多维分析

掌握数据仓库的知识内容,这是大数据分析的基础

分布式缓存

学习MemoryCache与Redis两种缓存

掌握两种缓存的原理、以及操作

Zookeeper

Zookeeper的选举、数据的同步、Zookeeper的部署、Follow与Leader

了解Zookeeper的选举算法、同步机制、掌握Zookeeper的集群的搭建

集群

Keepalived的Loadblancing机制、Nginex反向代理服务器、Tomcat集群、Lvs

利用Lvs、Keepalived、Nginx、Tomcat搭建高并发、分布式的Web服务器

SOA

Rest风格的服务架构、基于Rest风格的WebService的使用、dubbo服务框架的使用

利用服务性框架使得系统的耦合性更弱,扩展性更强

云计算

云计算的概念、Iaas、Paas、Saas的理解、虚拟化的概念

理解云计算

把上面所学的知识点全部结合起来做电信行业的日志分析系统

通过项目掌握MySQL的集群、读写分离、优化、掌握Mina框架的通信机制、掌握Zookeeper的高可用机制、利用MySql掌握数据仓库的概念、利用分布式缓存提高系统的性能

实训项目五:

第六阶段(Hadoop,Spark,电信项目贯穿)

Hadoop的分布式文件系统HDFS

HDFS的概念、HDFS的API的应用、NameNode与SecondaryNameNode与DataNode的原理与通信机制、数据块Block的概念、NameNode的文档目录树、NameNode与DataNode的关联

Hadoop伪分布式的搭建、利用HDFS的API对分布式文件系统进行操作、掌握NameNode与SecondaryNameNode的通信原理、掌握NameNode与DataNode的通信原理

Hadoop的计算框架MapReduce

利用MapReducer的计算框架实现电信日志的分析、深入理解Shuffle机制、FileOutPutFormat、FileInPutFormat

熟练Map、Reducer、Sort、Partition的编程、深入理解Shuffle机制、深入理解OutPutFormat与InputFormat、基于Hadoop的对象序列化机制

Hadoop的资源管理与资源调度

Yarn框架

深入理解MapReducer的通信机制:

利用Yarn的资源管理和资源调度机制。

理解进程ResourceManager,NodeManager,ApplicationMaster等进程的作用

深入理解Yarn的资源管理与资源调度机制。

掌握整个MapReducer的计算流程和资源调度流程

HBase

搭建NOSQL数据库HBase的集群、利用Zookeeper做HBase的HA机制

掌握HBase的集群的的搭建

HIVE

数据仓库基础知识、Hive定义、Hive体系结构简介、Hive集群、客户端简介、HiveQL定义、HiveQL与SQL的比较、数据类型、外部表和分区表、表的操作与CLI客户端演示、数据导入与CLI客户端演示、查询数据与CLI客户端演示、数据的连接与CLI客户端演示、用户自定义函数(UDF)的开发与演示

利用HIVE做日志分析的查询

Spark

Spark介绍:

Spark应用场景、Scala编程语言、Scala高级编程、Spark集群部署等

利用Spark流式编程做日志的分析

把第四阶段的电信项目用Hadoop与Spark实现

熟练应用Hadoop的MapReducer,Hive与Spark

走心课程全面覆盖实力熬炼技术骨干

8大授课阶段全力培养未来高端大数据人才

课程详情

∙第一阶段

Java语言基础

∙第二阶段

HTML、CSS与JavaScript

∙第三阶段

JavaWeb和数据库

∙第四阶段

Linux基础

∙第五阶段

Hadoop生态体系

∙第六阶段

Spark生态体系

∙第七阶段

Storm实时开发

∙第八阶段

项目案例

01

第一阶段Java语言基础

∙01Java开发介绍

-Java的发展历史

-Java的应用领域

-Java语言的特性

-Java面向对象

-Java性能分类

-搭建Java环境

-Java工作原理

∙02熟悉Eclipse开发工具

-Eclipse简介与下载

-安装Eclipse的中文语言包

-Eclipse的配置与启动

-Eclipse工作台与视图

-“包资源管理器”视图

-使用Eclipse

-使用编辑器编写程序代码

∙03Java语言基础

-Java主类结构

-基本数据类型

-变量与常量

-Java运算符

-数据类型转换

-代码注释与编码规范

-Java帮助文档

∙04Java流程控制

-复合语句

-条件语句

-if条件语句

-switch多分支语句

-while循环语句

-do…while循环语句

-for循环语句

∙05Java字符串

-String类

-连接字符串

-获取字符串信息

-字符串操作

-格式化字符串

-使用正则表达式

-字符串生成器

∙06Java数组与类和对象

-数组概述

-一维数组的创建及使用

-二维数组的创建及使用

-数组的基本操作

-数组排序算法

-Java的类和构造方法

-Java的对象、属性和行为

∙07数字处理类与核心技术

-数字格式化与运算

-随机数与大数据运算

-类的继承与Object类

-对象类型的转换

-使用instanceof操作符判断对象类型

-方法的重载与多态

-抽象类与接口

∙08I/O与反射、多线程

-流概述与File类

-文件输入/输出流

-缓存输入/输出流

-Class类与Java反射

-Annotation功能类型信息

-枚举类型与泛型

-创建、操作线程与线程安全

∙09Swing程序与集合类

-常用窗体

-标签组件与图标

-常用布局管理器与面板

-按钮组件与列表组件

-常用事件监听器

-集合类概述

-Set集合与Map集合及接口

02

第二阶段HTML、CSS与JavaScript

∙01PC端网站布局

-HTML基础,CSS基础,CSS核心属性

-CSS样式层叠,继承,盒模型

-容器,溢出及元素类型

-浏览器兼容与宽高自适应

-定位,锚点与透明

-图片整合

-表格,CSS属性与滤镜

-CSS优化

∙02HTML5+CSS3基础

-HTML5新增的元素与属性

-CSS3选择器

-文字字体相关样式

-CSS3位移与变形处理

-CSS32D、3D转换与动画

-弹性盒模型

-媒体查询

-响应式设计

∙03WebApp页面布局

-移动端页面设计规范

-移动端切图

-文字流式/控件弹性/图片等比例/特殊设计的布局

-等比缩放布局

-viewport/meta

-rem/vw的使用

-flexbox详解

-移动web特别样式处理

∙04原生JavaScript交互功能开发

-什么是JavaScript

-JavaScript使用及运作原理

-JavaScript基本语法

-JavaScript内置对象

-事件,事件原理

-JavaScript基本特效制作

-cookie存储

-正则表达式

∙05Ajax异步交互

-Ajax概述与特征

-Ajax工作原理

-XMLHttpRequest对象

-同步与异步

-Ajax异步交互

-Ajax跨域问题

-Ajax数据的处理

-基于WebSocket和推送的实时交互

∙06JQuery应用

-各选择器使用,及应用优化

-Dom节点的各种操作

-事件处理、封装、应用

-jQuery中的各类动画使用

-可用性表单的开发

-jQueryAjax、函数、缓存;

-jQuery编写插件、扩展、应用

-理解模块式开发及应用

03

第三阶段JavaWeb和数据库

∙01数据库

-Mysql数据库

-JDBC开发

-连接池和DBUtils

-Oracle介绍

-MongoDB数据库介绍

-apache服务器/Nginx服务器

-Memcached内存对象缓存系统

∙02JavaWeb开发核心

-XML

-HTTP及Tomcat

-Servlet工作原理解析

-深入理解Session与Cookie

-Tomcat的系统架构与设计模式

-JSP语法与内置对象

-JDBC技术

-大浏览量系统的静态化架构设计

∙03JavaWeb开发内幕

-深入理解Web请求过程

-JavaI/O的工作机制

-JavaWeb中文编码

-Javac编译原理

-class文件结构

-ClassLoader工作机制

-JVM体系结构与工作方式

-JVM内存管理

04

第四阶段Linux基础

∙01Linux安装与配置

-Linux常见版本及VMware

-安装Linux至硬盘及虚拟机安装Linux系统

-虚拟机网络配置(IP地址、主机名、防火墙)

-超级用户root

-关于硬件驱动程序

-进阶:

配置Grub

-CSS预处理器LESS框架使用

-CSS组件框架编写

∙02系统管理与目录管理

-Shell基本命令

-使用命令行补全和通配符

-find命令、locate命令

-查找特定程序:

whereis

-Linux文件系统的架构

-移动、复制和删除

-文件和目录的权限

-文件类型与输入输出

∙03用户与用户组管理

-软件包管理

-磁盘基本管理命令(df、du、fdisk、mount)

-高级硬盘管理RAID和LVM

备份你的工作和系统

-用户与用户组管理

-内存使用监控命令(top、free等)

-软件安装方式(rpm、tar、yum)

-进程管理

∙04Shell编程

-Shell脚本编程概述

-字符集和单词、字符类

-Shell脚本编程

-脚本执行命令和控制语句

-Shell定制

-个性化设置:

修改.bashrc文件

-Shell脚本调试

∙05服务器配置

-系统引导

-管理守护进程

-通过xinetd启动SSH服务

-配置inetd

-Apache基础

-设置Apache服务器

-PHP基础

-配置DHCP服务器

∙06Vi编辑器与Emacs编辑器

-vi中的常用命令

-vi中的字符与文件操作

-vi中的窗口操作

-emacs概述

-emacs文本编辑

-emacs缓冲区和窗口

-emacs的扩展工具

05

第五阶段Hadoop生态体系

∙01Hadoop起源与安装

-大数据概论

-Google与Hadoop模块

-Hadoop生态系统

-Hadoop常用项目介绍

-Hadoop环境安装配置

-Hadoop安装模式

-Hadoop配置文件

∙02MapReduce快速入门

-WordCount准备开发环境

-MapReduce编程接口体系结构

-MapReduce通信协议

-导入Hadoop的JAR文件

-MapReduce代码的实现

-打包、部署和运行

-打包成JAR文件

∙03Hadoop分布式文件系统

-认识HDFS及其HDFS架构

-Hadoop的RPC机制

-HDFS的HA机制

-HDFS的Federation机制

-Hadoop文件系统的访问

-JavaAPI接口与维护HDFS

-HDFS权限管理

∙04Hadoop文件I/O详解

-Hadoop文件的数据结构

-HDFS数据完整性

-文件序列化

-Hadoop的Writable类型

-Hadoop支持的压缩格式

-Hadoop中编码器和解码器

-gzip、LZO和Snappy比较

∙05MapReduce工作原理

-MapReduce函数式编程概念

-MapReduce框架结构

-MapReduce运行原理

-Shuffle阶段和Sort阶段

-任务的执行与作业调度器

-自定义Hadoop调度器

-YARN架构及其工作流程

∙06MapReduce编程开发

-WordCount案例分析

-输入格式与输出格式

-压缩格式与MapReduce优化

-辅助类与Streaming接口

-MapReduce二次排序

-MapReduce中的Join算法

-从MySQL读写数据

-Hadoop系统调优

∙07Hive数据仓库工具

-Hive工作原理、类型及特点

-Hive操作及Hive复合类型

-Hive的JOIN详解

-Hive优化策略

-Hive内置操作符与函数

-Hive用户自定义函数接口

-Hive的权限控制

∙08开源数据库HBase

-HBase的特点

-HBase访问接口

-HBase存储结构与格式

-HBase设计

-关键算法和流程

-HBase的Shell操作

-HBase客户端

∙09Sqoop与Oozie

-安装部署Sqoop

-Sqoop数据迁移

-Sqoop使用案例

-Oozie简介

-Oozie与Hive

-Azkaban工作流

06

第六阶段Spark生态体系

∙01Spark简介

-什么是Spark

-Spark大数据处理框架

-Spark的特点与应用场景

-SparkSQL原理和实践

-SparkStreaming原理和实践

-GraphXSparkR入门

-Spark的监控和调优

∙02Spark部署和运行

-部署准备与下载

-Spark生态和安装部署

-LocalYARN模式部署

-Local模式运行

-SparkStandaloneHA安装

-YARN模式运行Spark

-Spark应用程序部署工具spark-submit

∙03Spark程序开发

-启动SparkShell

-加载text文件

-RDD操作及其应用

-RDD缓存

-构建Eclipse开发环境

-构建IntelliJIDEA开发环境

-创建SparkContext对象

-编写编译并提交应用程序

∙04Spark编程模型

-RDD特征与依赖

-集合(数组)创建RDD

-存储创建RDD

-RDD转换执行控制操作

-广播变量

-累加器

∙05作业执行解析

-Spark组件

-RDD视图与DAG图

-基于Standalone模式的Spark架构

-基于YARN模式的Spark架构

-作业事件流和调度分析

-构建应用程序运行时环境

-应用程序转换成DAG

∙06SparkSQL与DataFrame

-SparkSQL架构特性

-DataFrame和RDD的区别

-创建操作DataFrame

-RDD转化为DataFrame

-加载保存操作与Hive表

-Parquet文件JSON数据集

-分布式的SQLEngine

-性能调优数据类型

∙07深入SparkStreaming

-SparkStreaming工作原理

-DStream编程模型

-InputDStream

-DStream转换状态输出

-优化运行时间及内存使用

-文件输入源

-基于Receiver的输入源

-输出操作

∙08SparkMLlib与机器学习

-机器学习分类级算法

-SparkMLlib库

-MLlib数据类型

-MLlib的算法库与实例

-ML库主要概念

-算法库与实例

∙09GraphX与SparkR

-SparkGraphX架构

-GraphX编程与常用图算法

-GraphX应用场景

-SparkR的工作原理

-R语言与其他语言的通信

-SparkR的运行与应用

-R的DataFrame操作方法

-SparkR的DataFrame

∙10spark项目实战

-大数据分析系统

-系统资源分析平台

-在Spark上训练LR模型

-获取二级邻居关系图

∙11scala编程

-scala编程介绍

-Scala基本语法

-Scala开发环境搭建

-Scala开发Spark应用程序

∙12Python编程

-Python编程介绍

-Python的基本语法

-Python开发环境搭建

-Pyhton开发Spark应用程序

07

第七阶段Storm实时开发

∙01storm简介与基本知识

-storm的诞生诞生与成长

-storm的优势与应用

-storm基本知识概念和配置

-序列化与容错机制

-可靠性机制—保证消息处理

-storm开发环境与生产环境

-storm拓扑的并行度

-sto

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 党团工作 > 入党转正申请

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2