大数据介绍PPT课件PPT文档格式.pptx

上传人:wj 文档编号:1075069 上传时间:2023-04-30 格式:PPTX 页数:38 大小:3.37MB
下载 相关 举报
大数据介绍PPT课件PPT文档格式.pptx_第1页
第1页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第2页
第2页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第3页
第3页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第4页
第4页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第5页
第5页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第6页
第6页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第7页
第7页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第8页
第8页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第9页
第9页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第10页
第10页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第11页
第11页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第12页
第12页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第13页
第13页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第14页
第14页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第15页
第15页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第16页
第16页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第17页
第17页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第18页
第18页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第19页
第19页 / 共38页
大数据介绍PPT课件PPT文档格式.pptx_第20页
第20页 / 共38页
亲,该文档总共38页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

大数据介绍PPT课件PPT文档格式.pptx

《大数据介绍PPT课件PPT文档格式.pptx》由会员分享,可在线阅读,更多相关《大数据介绍PPT课件PPT文档格式.pptx(38页珍藏版)》请在冰点文库上搜索。

大数据介绍PPT课件PPT文档格式.pptx

,而有市场研究机构预测:

到2020年,整个世界的数据总量将会增长44倍,达到35.2ZB(1ZB=10亿TB),说明,互联网(社交、搜索、电商)、移动互联网(微博)、物联网(传感器,智慧地球)、车联网、GPS、医学影像、安全监控、金融(银行、股市、保险)、电信(通话、短信)都在疯狂产生着数据。

1GB(Gigabyte)=1024MB1TB(Terabyte)=1024GB1PB(Petabyte)=1024TB1EB(Exabyte)=1024PB1ZB(Zettabyte)=1024EB,大数据时代,变化,数据,在web2.0的时代,人们从信息的被动接受者变成了主动创造者,全球每秒钟发送2.9百万封电子邮件,每天会有2.88万个小时的视频上传到Youtube,推特上每天发布5千万条消息,量级,每月网民在Facebook上要花费7千亿分钟,发送和接收的数据高达1.3EBGoogle上每天需要处理24PB的数据,数结,多样性,大数据的定义.,大数据(bigdata),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

想驾驭这庞大的数据,我们必须了解大数据的特征。

2,大数据的4V特性.,体量Volume多样性Variety价值密度Value速度Velocity,数据结构,海量,存储能力,读写速度,实时.,大数据,分析,hadoop,hbase,spark,strom,大数据典型特性存储能力变化,数据量不断增加,存储能力也随之不断增强,存储能力,大数据典型特性读写速度提升,与云计算相结合的大数据存储速度显著提升,数据体量,读写速度,读写速度,大数据典型特性多样性发展,数据结构更加复杂,呈多样性发展,数据结构,多样性,体量Volume,多样性Variety,价值密度Value,速度Velocity,4V特性,从非结构化数据的超大规模和增长,比结构化数据增长快10倍到50倍,是传统数据仓库的10倍到50倍,总数据量的8090%,大数据的异构和多样性,多种形式(文本、图像、视频、机器数据),无模式或者模式不明显,不连贯的语法或句义,大量的不相关信息对未来趋势与模式的可预测分析,深度复杂分析,机器学习、人工智能Vs传统商务智能(咨询、报告等),实时分析而非批量式分析,数据输入、处理与丢弃,立竿见影而非事后见效,3,相关领域应用.,军事,建设公共基础设施应该如何选址?

怎样有效提高公众生活安全水平?

人口土地、资源利用如何优化?

自然灾害、雾霾情况怎样最大化去改善?

城市交通拥堵情况怎么去解决?

合理规划很重要,食品安全,消费行业,金融服务,电子商务,气象,交通环保,医疗卫生,军事,食品安全,消费行业,金融服务,电子商务,气象,交通环保,医疗卫生,VS,优化城市,实时交通信息:

利用社交网络和天气数据来优化最新的交通情况智能城市系统:

自动通知消防、公安、医院等,迅速到达现场处理自然灾害预测:

实时监测、对潜在危机做出快速响应,通过卫星和遥感技术,远程获取灾区情况,制定合理救援计划智慧城市建设:

宏观调控人口、环境、土地资源利用等,做高效的城市规划建设,正确方式,VS,改善生活,穿戴的装备:

根据睡眠模式、热量消耗、心率等时刻监控健康状况提高医疗和研发:

迅速解码DNA,结合海量病例迅速制定最优治疗方案改善安全和执法:

国家实时监控恐怖主义,企业防御网络攻击,警察利用社交、公共资源数据来匹配犯罪人员信息,捕捉罪犯,正确方式,用户行为数据,用户消费数据,用户社交等UGC数据,培亚马逊、SMG、淘宝,信用卡中心、蚂蚁金服,谷歌地图、大众点评、美团等APP的自动定位系统,互联网金融数据,支付宝、陆金所,用户地理位置数据,互联网大数据,简单罗列几个行业,fackbook、新浪,合理使用大数据,大数据之提高经济策略,金融服务,电子商务,消费行业,根据用户的喜好、交易记录并制定权重匹配商品,提供准确的推送,根据不同地域、不同年龄段的人群的消费情况及生活习惯,制定提供最优服务的计划,结合热点、题材、政策和历史数据及趋势分析,制定良好的方向,4,相关技术.,云计算列数据库实时分析hadoop生态集群,数据库,数据灵活,低价格,高性能,数据灵活,非关系型(列),性能对比,优点,缺点,优点,缺点,易理解使用方便支持sql易于维护,价格昂贵不能自动切片固定表结构读写性能差高并发读写需求,读写性能高基于键值对无耦合数据存储格式丰富价格低大多免费,不提供sql支持学习成本高BI支持弱,关系型数据库,非关系型数据库NoSql,场景不同效果也不同,目前NoSql是最为合适大数据发展的,关系型数据库:

Mysql、Oracle、SQserver等,非关系型数据库:

Hbase、MongoDB、Redis等,云计算,我们已经进入一个无处不网、无时不网的时代!

云计算(cloudcomputing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。

云是网络、互联网的一种比喻说法,用户通过电脑、笔记本、手机等方式接入数据中心,按自己的需求进行运算。

大数据与云计算,云计算与大数据的关系是静与动的关系,前者强调的是计算、存储能力;

大数据需要处理大数据的能力(数据获取、清洗、转换、存储、分析、统计等能力),其实就是强大的计算能力和数据存储能力。

大数据必须采用云端分布式架构对海量数据进行分布式存储、分布式处理。

云计算为大数据资源、大数据挖掘提供技术设施大数据挖掘为云计算建设和运作提供决策,相互关联性,大数据之实时分析,是指对规模巨大的数据进行分析,利用大数据技术高效的快速完成分析,达到近似实时的效果,更及时的反映数据的价值和意义。

近实时的数据分析,是传统架构的50-1000倍,高效的响应速度在当今互联网显得极为重要,实时大数据分析,spark实时分析框架,共性:

开源的分布式系统,具有低延迟、可扩展和容错性诸多优点,流式实时分析框架storm,Hadoop集群.,什么是hadoop?

集群又是什么?

是编程语言吗?

作用?

设计理念?

跟大数据有什么关系?

Hadoop是开源平台,本身不是数据库,但可处理非结构化数据这点关系数据库很难做到java、android等程序是用来做交互的,而hadoop是用来做计算的,哪些公司在使用Hadoop,为什么使用Hadoop,集群思路引入.,一户人家,家里有很多的田,他需要牛来耕地,他要怎么来决策耕田的问题呢?

一只普通的牛体力有限,很快就不行了,换一只昂贵的身材健硕的牛呢?

还是体力有限,很快就又不行了,最后他想到一个办法:

如果找一群普通的牛,事实不会又便宜又高效呢?

集群的概念就是这么得来的,特性,HDFS:

HadoopDistributedFileSystem分布式文件系统,MapReduce:

分布式运算框架,YARN:

YetAnotherResourceNegotiator资源管理调度系统,生态圈,问题:

怎样存储海量数据?

HDFS分布式文件系统,两个思想十分重要,1.切分,2.分装,MapReduce介绍,MapReduce=Map(拆分)+Reduce(合并、排序),大数据时代来临.,一切真相将会展现在我们面前,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2