统计学——Python实现教学课件cha2.pptx

上传人:wj 文档编号:377120 上传时间:2023-04-29 格式:PPTX 页数:29 大小:3.06MB
下载 相关 举报
统计学——Python实现教学课件cha2.pptx_第1页
第1页 / 共29页
统计学——Python实现教学课件cha2.pptx_第2页
第2页 / 共29页
统计学——Python实现教学课件cha2.pptx_第3页
第3页 / 共29页
统计学——Python实现教学课件cha2.pptx_第4页
第4页 / 共29页
统计学——Python实现教学课件cha2.pptx_第5页
第5页 / 共29页
统计学——Python实现教学课件cha2.pptx_第6页
第6页 / 共29页
统计学——Python实现教学课件cha2.pptx_第7页
第7页 / 共29页
统计学——Python实现教学课件cha2.pptx_第8页
第8页 / 共29页
统计学——Python实现教学课件cha2.pptx_第9页
第9页 / 共29页
统计学——Python实现教学课件cha2.pptx_第10页
第10页 / 共29页
统计学——Python实现教学课件cha2.pptx_第11页
第11页 / 共29页
统计学——Python实现教学课件cha2.pptx_第12页
第12页 / 共29页
统计学——Python实现教学课件cha2.pptx_第13页
第13页 / 共29页
统计学——Python实现教学课件cha2.pptx_第14页
第14页 / 共29页
统计学——Python实现教学课件cha2.pptx_第15页
第15页 / 共29页
统计学——Python实现教学课件cha2.pptx_第16页
第16页 / 共29页
统计学——Python实现教学课件cha2.pptx_第17页
第17页 / 共29页
统计学——Python实现教学课件cha2.pptx_第18页
第18页 / 共29页
统计学——Python实现教学课件cha2.pptx_第19页
第19页 / 共29页
统计学——Python实现教学课件cha2.pptx_第20页
第20页 / 共29页
亲,该文档总共29页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

统计学——Python实现教学课件cha2.pptx

《统计学——Python实现教学课件cha2.pptx》由会员分享,可在线阅读,更多相关《统计学——Python实现教学课件cha2.pptx(29页珍藏版)》请在冰点文库上搜索。

统计学——Python实现教学课件cha2.pptx

第1章,统计学Python实现,贾俊平2022-03-13,人生苦短,我要PythonStatisticswithPython,1-,统计学Python实现贾俊平,2022-03-13,第2章,贾俊平,2022-03-13,类别数据可视化数据分布可视化3.3变量间关系可视化样本相似性可视化时间序列可视化可视化的注意事项,2-,统计学Python实现贾俊平,2022-03-13,第2章数据可视化,第2章,2.1,2-,统计学Python实现贾俊平,2022-03-13,类别数据可视化,条形图,第2章,2.1类别数据可视化,条形图简单条形图例题分析【例2-1】(数据:

example1_1.csv)沿用第1章的例1-1。

绘制不同性别、态度和社区被调查者人数的简单条形图,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.1类别数据可视化,条形图及其变种复试条形图和脊形图例题分析,制两个类别变量的条形图时,可以使用原始数据绘图,也可以先生成二维列联表再绘图根据绘制方式不同有并列条形图(juxtaposedbarplot)和堆叠条形图(stackedbarplot)等在并列条形图中,一个类别变量作为坐标轴,另一个类别变量各类别频数的条形并列摆放在堆叠条形图中,一个类别变量作为坐标轴,另一个类别变量各类别的频数按比例堆叠在同一个条中,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.1类别数据可视化,饼图和环形图饼图例题分析,饼图(piechart)是用圆形及圆内扇形的角度来表示数值大小的图形。

它主要用于表示一个样本(或总体)中各类别的频数占全部频数的百分比,对于研究结构性问题十分有用,【例2-2】(数据:

example2_2.csv)表2-1是2019年北京、天津、上海和重庆的人均各项消费支出数据。

绘制饼图,分析人均各项消费支出的构成,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.1类别数据可视化,饼图和环形图饼图例题分析【例2-2】(数据:

example2_2.csv)表2-1是2019年北京、天津、上海和重庆的人均各项消费支出数据。

绘制饼图,分析人均各项消费支出的构成,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.1,类别数据可视化,饼图环形图例题分析,环形图(donutchart)是将饼图的中间挖掉后剩下的环形,也称为甜甜圈图环形图可以看做饼图的变种,它是用环形的各段表示各类别频数的百分比当有两个及两个以上类别变量时,可以绘制出每个变量各类别百分比的环形,并将各个环嵌套在一起。

环形图可以用于两个或两个以上类别变量的结构比较,【例2-2】(数据:

example2_2.csv)表2-1是2019年北京、天津、上海和重庆的人均各项消费支出数据。

绘制饼图,分析人均各项消费支出的构成,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.2数据分布可视化,直方图与核密度图直方图例题分析,将数据分组后,在x轴上用矩形的宽度表示每个组的组距,在y轴上用矩形的高度表示每个组的频数或密度,多个矩形并列在一起就是直方图利用直方图的形状可以观察数据分布的特征,【例2-2】(数据:

example2_2.csv)2020年1月1日12月31日几个主要城市的AQI数据。

绘制,出6个城市AQI的直方图分析其分布的特征,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.2数据分布可视化,直方图与核密度图核密度图例题分析,核密度图(kerneldensityplot)是用于描述估计核密度估计的一种图形,它使用一定的核函数和带宽为数据的分布提供了一种平滑曲线,从中可以看出数据分布的大致形状核密度图可以替代直方图来观察数据的分布核密度曲线的平滑程度取决于带宽(bandwidth,bw)。

bw的值越大,曲线越平滑利用直方图的形状可以观察数据分布的特征,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.2数据分布可视化,直方图与核密度图核密度图例题分析6个城市AQI的核密度图,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.2数据分布可视化,箱线图和小提琴图箱线图示意图,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.2数据分布可视化,箱线图和小提琴图箱线图示意图,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.2数据分布可视化,箱线图和小提琴图箱线图不同箱线图对应的分布,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.2数据分布可视化,箱线图和小提琴图箱线图例题分析6个城市AQI的箱线图,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.2数据分布可视化,箱线图和小提琴图小提琴图例题分析,小提琴图(violinplot)是箱线图的一变种将分布的核密度估计曲线与箱线图结合在一起,它在箱线图上以镜像方式叠加一条核密度估计曲线,易于观察数据分布的大致形状6个城市AQI的小提琴图,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.2,数据分布可视化,点图例题分析,各数据用点绘制在图中点图有多种形式,其中最常见的是克利夫兰(Cleveland)点图点图是检测数据离群点的有效工具当数据量较少时,也可以替代直方图和箱线图来观察数据的分布,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.3,变量间关系可视化,散点图随机模拟,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.3,变量间关系可视化,散点图例题分析【例2-3】(数据:

example2_3.csv)为分析上市公司的总股本与各项财务指标间的关系,随机抽取200家上市公司,得到的有关财务数据如表2-2所示。

绘制散点图分析总股本与每股收益之间的关系,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.3变量间关系可视化,散点图边际图例题分析【例2-3】(数据:

example2_3.csv)绘制散点图分析总股本与每股收益之间的关系,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.3,变量间关系可视化,散点图矩阵,2-,统计学Python实现贾俊平,2022-03-13,如果要同时分析多个变量两两之间的关系,可以将多幅散点图绘制成矩阵的形式,称为散点图矩阵(matrixscatter)矩阵散点图散点图矩阵中,对角线上下两部分是对称的图形,也可以将对角线的下方(或上方)绘制出一种形式的散点图(或相关系数),对角线上方(或下方)绘制出另一种形式的散点图(或相关系数),第2章,2.3,变量间关系可视化,散点图矩阵例题分析,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.3变量间关系可视化,气泡图例题分析气泡图也可以用于展示3个变量之间的关系,用变量x和y画出散点图,第3个变量数值的大小用圆的大小表示,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.4样本相似性可视化,样本相似性可视化轮廓图例题分析轮廓图(outlineplot)也称平行坐标图或多线图,它用x轴表示各样本,用y轴表示每个样本的多个变量的数值(x轴和y轴可以互换),将同一样本在不同变量上的观测值用折线连接起来。

观察轮廓图中各折线的形状及其排列方式,可以比较各样本在多个变量上取值的相似性及差异,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.4样本相似性可视化,样本相似性可视化雷达图例题分析从一个点出发,每个变量用一条射线表示,P个变量形成P条射线(P个坐标轴),每个样本在P个变量上的取值连接成线,即围成一个区域,多个样本围成多个区域,就是雷达图(radarchart),也称为蜘蛛图(spiderchart)。

利用雷达图也可以研究多个样本之间的相似程度,例题分析,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.5,时间序列可视化,折线图例题分析,折线图是描述时间序列最基本的图形,它主要用于观察和分析时间序列随时间变化的形态和模式。

折线图的x轴是时间,y轴是变量的观测值面积图是在折线图的基础上绘制的,它将折线与x轴之间的区域用颜色填充,填充的区域即为面积,【例2-6】(数据:

example2_6.csv)2000年2019年我国城镇居民和农村居民的消费水平数据如表2-3所示。

绘制折线图分析居民消费水平的变化特征,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.5,时间序列可视化,折线图例题分析【例2-6】(数据:

example2_6.csv)2000年2019年我国城镇居民和农村居民的消费水平数据如表2-3所示。

绘制折线图分析居民消费水平的变化特征,2-,统计学Python实现贾俊平,2022-03-13,第2章,2.6,可视化的注意事项,可视化的注意事项,2-,统计学Python实现贾俊平,2022-03-13,一幅完整的图形大体上包括图形主体、标题、坐标轴注释等要素。

图形主体用于表达数据信息标题用于注释图形的内容,一般包括数据所属的时间(when)、地点(where)和内容(what),此外,还应包括必要的图形编号。

标题可以放在图的上方,也可放在图的下方坐标轴注释需要标示出坐标轴代表的变量名称,以便于阅读和理解图形的比例也十分重要,一般图形大致为4:

3的一个矩形,过长或过高的图形都有可能歪曲数据,给人留下错误的印象,THEEND,THANKS2022-03-13,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2