ImageVerifierCode 换一换
格式:PPTX , 页数:29 ,大小:3.06MB ,
资源ID:377120      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-377120.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(统计学——Python实现教学课件cha2.pptx)为本站会员(wj)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

统计学——Python实现教学课件cha2.pptx

1、第 1 章,统计学Python 实现,贾俊平2022-03-13,人生苦短,我要P y t h o nStatistics with Python,1-,统计学Python实现贾俊平,2022-03-13,第 2 章,贾俊平,2022-03-13,类别数据可视化数据分布可视化3.3变量间关系可视化样本相似性可视化时间序列可视化可视化的注意事项,2-,统计学Python实现贾俊平,2022-03-13,第 2 章数据可视化,第 2 章,2.1,2-,统计学Python实现贾俊平,2022-03-13,类别数据可视化,条形图,第 2 章,2.1类别数据可视化,条形图简单条形图例题分析【例2-1】(

2、数据:example1_1.csv)沿用第1章的例1-1。绘制不同性别、态度和社区被调查者人数的简单条形图,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.1类别数据可视化,条形图及其变种复试条形图和脊形图例题分析,制两个类别变量的条形图时,可以使用原始数据绘图,也可以先生成二维列联表再绘图根据绘制方式不同有并列条形图(juxtaposed bar plot)和堆叠条形图(stacked bar plot)等在并列条形图中,一个类别变量作为坐标轴,另一个类别变量各类别频数的条形并列摆放在堆叠条形图中,一个类别变量作为坐标轴,另一个类别变量各类别的频数按比例堆叠在同一个

3、条中,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.1类别数据可视化,饼图和环形图饼图例题分析,饼图(pie chart)是用圆形及圆内扇形的角度来表示数值大小的图形。它主要用于表示一个样本(或总体)中各类别的频数占全部频数的百分比,对于研究结构性问题十分有用,【例2-2】(数据:example2_2.csv)表2-1是2019年北京、天津、上海和重庆的人均各项消费支出数据。绘制饼图,分析人均各项消费支出的构成,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.1类别数据可视化,饼图和环形图饼图例题分析【例2-2】(数据:example2_2

4、.c sv)表2-1是 2019年北京、天津、上海和 重庆的人均各 项消费支出数 据。绘制饼图,分析人均各项 消费支出的构 成,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.1,类别数据可视化,饼图环形图例题分析,环形图(donut chart)是将饼图的中间挖掉后剩下的环形,也称为甜甜圈图环形图可以看做饼图的变种,它是用环形的各段表示各类 别频数的百分比当有两个及两个以上类别变量时,可以绘制出每个变量各类别百分比的环形,并将各个环嵌套在一起。环形图可以用于两个或两个以上类别变量的结构比较,【例2-2】(数据:example2_2.csv)表2-1是2019年北京、

5、天津、上海和重庆的人均各项消费支出数据。绘制饼图,分析人均各项消费支出的构成,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.2数据分布可视化,直方图与核密度图直方图例题分析,将数据分组后,在x轴上用矩形的宽度表示每个组的组距,在y轴上用矩形的高度表示每个组的频数或密度,多个矩形并列在一起就是直方图利用直方图的形状可以观察数据分布的特征,【例2-2】(数据:example2_2.csv)2020年1月1日12月31日几个主要城市的AQI数据。绘制,出6个城市AQI的直方图分析其分布的特征,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.2数据

6、分布可视化,直方图与核密度图核密度图例题分析,核密度图(kernel density plot)是用于描述估计核密度估计的一种图形,它使用一定的核函数和带宽为数据的分布提供了一种平滑曲线,从中可以看出数据分布的大致形状核密度图可以替代直方图来观察数据的分布核密度曲线的平滑程度取决于带宽(bandwidth,bw)。bw的值越大,曲线越平滑利用直方图的形状可以观察数据分布的特征,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.2数据分布可视化,直方图与核密度图核密度图例题分析6个城市AQI的核密度图,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,

7、2.2数据分布可视化,箱线图和小提琴图箱线图示意图,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.2数据分布可视化,箱线图和小提琴图箱线图示意图,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.2数据分布可视化,箱线图和小提琴图箱线图不同箱线图对应的分布,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.2数据分布可视化,箱线图和小提琴图箱线图例题分析6个城市AQI的箱线图,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.2数据分布可视化,箱线图和小提琴图小提琴图例题分析,小提琴图(viol

8、in plot)是箱线图的一变种将分布的核密度估计曲线与箱线图结合在一起,它在箱线图上以镜像方式叠加一条核密度估计曲线,易于观察数据分布的大致形状6个城市AQI的小提琴图,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.2,数据分布可视化,点图例题分析,各数据用点绘制在图中点图有多种形式,其中最常见的是克 利夫兰(Cleveland)点图点图是检测数据离群点的有效工具当数据量较少时,也可以替代直方图和箱线图来观察数据的分布,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.3,变量间关系可视化,散点图随机模拟,2-,统计学Python实现贾俊平

9、,2022-03-13,第 2 章,2.3,变量间关系可视化,散点图例题分析【例2-3】(数据:example2_3.csv)为分析上市公司的总股本与各项财务指标间的关系,随机抽取200家上市公司,得到的有关财务数据如表2-2所示。绘制散点图分析总股本与每股收益之间的关系,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.3变量间关系可视化,散点图边际图例题分析【例2-3】(数据:example2_3.csv)绘制散点图分析总股本与每股收益之间的关系,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.3,变量间关系可视化,散点图矩阵,2-,统计学

10、Python实现贾俊平,2022-03-13,如果要同时分析多个变量两两之间的关系,可以将多幅散点图绘制成矩阵的形式,称为散点图矩阵(matrix scatter)矩阵散点图散点图矩阵中,对角线上下两部分是对称的图形,也可以将对角线的下方(或上方)绘制出一种形式的散点图(或相关系数),对角线上方(或下方)绘制出另一种形式的散点图(或相关系数),第 2 章,2.3,变量间关系可视化,散点图矩阵例题分析,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.3变量间关系可视化,气泡图例题分析气泡图也可以用于展示3个变量之间的关系,用变量x和y画出散点图,第3个变量数值的大小用圆

11、的大小表示,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.4样本相似性可视化,样本相似性可视化轮廓图例题分析轮廓图(outline plot)也称平行坐标图或多线图,它用x轴表示各样本,用y轴表示每个样本的多个变量的数值(x轴和y轴可以互换),将同一样本在不同变量上的观测值用折线连接起来。观察轮廓图中各折线的形 状及其排列方式,可以比 较各样本在多个变量上取 值的相似性及差异,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.4样本相似性可视化,样本相似性可视化雷达图例题分析从一个点出发,每个变 量用一条射线表示,P个变量形成P条射线(P个坐

12、标轴),每个样本在P个变量上的取值连接成 线,即围成一个区域,多个样本围成多个区域,就是雷达图(radar chart),也称为蜘蛛图(spider chart)。利用雷达图也可以研究多个样本之间的相似程度,例题分析,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.5,时间序列可视化,折线图例题分析,折线图是描述时间序列最基本的图形,它主要用于观察和分析时间序列随时间变化的形态和模式。折线图的x轴是时间,y轴是变量的观测值面积图是在折线图的基础上绘制的,它将折线与x轴之间的区域用颜色填充,填充的区域即为面积,【例2-6】(数 据:example2_6.csv)2000

13、年2019年我国城镇居民和农村居民的消费水平数据如表2-3所示。绘制折线图分析居民消费水平的变化特征,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.5,时间序列可视化,折线图例题分析【例2-6】(数据:example2_6.csv)2000年2019年我国城镇居民和农村居民的消费水平数据如表 2-3所示。绘制折线图分析居民消费水平的变化特征,2-,统计学Python实现贾俊平,2022-03-13,第 2 章,2.6,可视化的注意事项,可视化的注意事项,2-,统计学Python实现贾俊平,2022-03-13,一幅完整的图形大体上包括图形主体、标题、坐标轴注释等要素。图形主体用于表达数据信息标题用于注释图形的内容,一般包括数据所属的时间(when)、地点(where)和内容(what),此外,还应包括必要的图形编号。标题可以放在图的上方,也可放在图的下方坐标轴注释需要标示出坐标轴代表的变量名称,以便于阅读和理解图形的比例也十分重要,一般图形大致为4:3的一个矩形,过长或过高的图形都有可能歪曲数据,给人留下错误的印象,THE END,T H A N K S2022-03-13,

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2