数据分析与R语言_001.pdf

上传人:wj 文档编号:3431184 上传时间:2023-05-05 格式:PDF 页数:53 大小:1.58MB
下载 相关 举报
数据分析与R语言_001.pdf_第1页
第1页 / 共53页
数据分析与R语言_001.pdf_第2页
第2页 / 共53页
数据分析与R语言_001.pdf_第3页
第3页 / 共53页
数据分析与R语言_001.pdf_第4页
第4页 / 共53页
数据分析与R语言_001.pdf_第5页
第5页 / 共53页
数据分析与R语言_001.pdf_第6页
第6页 / 共53页
数据分析与R语言_001.pdf_第7页
第7页 / 共53页
数据分析与R语言_001.pdf_第8页
第8页 / 共53页
数据分析与R语言_001.pdf_第9页
第9页 / 共53页
数据分析与R语言_001.pdf_第10页
第10页 / 共53页
数据分析与R语言_001.pdf_第11页
第11页 / 共53页
数据分析与R语言_001.pdf_第12页
第12页 / 共53页
数据分析与R语言_001.pdf_第13页
第13页 / 共53页
数据分析与R语言_001.pdf_第14页
第14页 / 共53页
数据分析与R语言_001.pdf_第15页
第15页 / 共53页
数据分析与R语言_001.pdf_第16页
第16页 / 共53页
数据分析与R语言_001.pdf_第17页
第17页 / 共53页
数据分析与R语言_001.pdf_第18页
第18页 / 共53页
数据分析与R语言_001.pdf_第19页
第19页 / 共53页
数据分析与R语言_001.pdf_第20页
第20页 / 共53页
亲,该文档总共53页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

数据分析与R语言_001.pdf

《数据分析与R语言_001.pdf》由会员分享,可在线阅读,更多相关《数据分析与R语言_001.pdf(53页珍藏版)》请在冰点文库上搜索。

数据分析与R语言_001.pdf

DATAGURU专业数据分析网站2012.5.10数据分析与R语言第2周DATAGURU专业数据分析网站2012.5.10数据可视化的重要性2DATAGURU专业数据分析网站2012.5.10综合性例子模拟产生统计专业同学的名单(学号区分),记录数学分析,线性代数,概率统计三科成绩,然后进行一些统计分析3DATAGURU专业数据分析网站2012.5.10模拟成绩用runif和rnorm4DATAGURU专业数据分析网站2012.5.10模拟成绩5DATAGURU专业数据分析网站2012.5.10合成数据框并保存到硬盘data.frame()write.table6DATAGURU专业数据分析网站2012.5.10计算各科平均分函数mean(),colMeans(),apply()7DATAGURU专业数据分析网站2012.5.10求各科最高最低分函数max(),min(),apply()8DATAGURU专业数据分析网站2012.5.10求出每人总分9DATAGURU专业数据分析网站2012.5.10总分最高的同学10DATAGURU专业数据分析网站2012.5.10对x1进行直方图分析绘制直方图函数hist()11DATAGURU专业数据分析网站2012.5.10探索各科成绩的关联关系散点图绘制函数plot()12DATAGURU专业数据分析网站2012.5.10列联表分析列联函数table(),柱状图绘制函数barplot()13DATAGURU专业数据分析网站2012.5.10饼图饼图绘制函数pie()14DATAGURU专业数据分析网站2012.5.10箱尾图箱子的上下横线为样本的25%和75%分位数箱子中间的横线为样本的中位数上下延伸的直线称为尾线,尾线的尽头为最高值和最低值异常值15DATAGURU专业数据分析网站2012.5.10箱线图boxplot(x2:

4,col=c(red,green,blue),notch=T)16DATAGURU专业数据分析网站2012.5.10箱尾图水平放置的箱尾图17DATAGURU专业数据分析网站2012.5.10星相图每个观测单位的数值表示为一个图形每个图的每个角表示一个变量,字符串类型会标注在图的下方角线的长度表达值的大小18DATAGURU专业数据分析网站2012.5.10星相图19DATAGURU专业数据分析网站2012.5.10脸谱图安装aplpack包20DATAGURU专业数据分析网站2012.5.10脸谱图用五官的宽度和高度来描绘数值人对脸谱高度敏感和强记忆适合较少样本的情况21DATAGURU专业数据分析网站2012.5.10其它脸谱图安装TeachingDemos包22DATAGURU专业数据分析网站2012.5.10茎叶图23DATAGURU专业数据分析网站2012.5.10QQ图可用于判断是否正态分布直线的斜率是标准差,截距是均值点的散布越接近直线,则越接近正态分布24DATAGURU专业数据分析网站2012.5.10散点图散点图的进一步设置plot(x$x1,x$x2,main=数学分析与线性代数成绩的关系,xlab=数学分析,ylab=线性代数,xlim=c(0,100),ylim=c(0,100),xaxs=i,#Setxaxisstyleasinternalyaxs=i,#Setyaxisstyleasinternalcol=red,#Setthecolorofplottingsymboltoredpch=19)#Settheplottingsymboltofilleddots25DATAGURU专业数据分析网站2012.5.10散点图连线图a=c(2,3,4,5,6)b=c(4,7,8,9,12)plot(a,b,type=l)26DATAGURU专业数据分析网站2012.5.10散点图多条曲线的效果plot(rain$Tokyo,type=l,col=red,ylim=c(0,300),main=MonthlyRainfallinmajorcities,xlab=MonthofYear,ylab=Rainfall(mm),lwd=2)lines(rain$NewYork,type=l,col=blue,lwd=2)lines(rain$London,type=l,col=green,lwd=2)lines(rain$Berlin,type=l,col=orange,lwd=2)27DATAGURU专业数据分析网站2012.5.10密度图函数density()plot(density(rnorm(1000)28DATAGURU专业数据分析网站2012.5.10R内置数据集函数data()列出内置数据29DATAGURU专业数据分析网站2012.5.10热力图利用内置的mtcars数据集绘制heatmap(as.matrix(mtcars),Rowv=NA,Colv=NA,col=heat.colors(256),scale=column,margins=c(2,8),main=CarcharacteristicsbyModel)30DATAGURU专业数据分析网站2012.5.10Iris(鸢尾花)数据集Sepal花萼Petal花瓣Species种属31DATAGURU专业数据分析网站2012.5.10向日葵散点图用来克服散点图中数据点重叠问题在有重叠的地方用一朵“向日葵花”的花瓣数目来表示重叠数据的个数sunflowerplot(iris,3:

4,col=gold,seg.col=gold)32DATAGURU专业数据分析网站2012.5.10散点图集遍历样本中全部的变量配对画出二元图直观地了解所有变量之间的关系pairs(iris,1:

4)33DATAGURU专业数据分析网站2012.5.10散点图集用plot也可以实现同样的效果plot(iris,1:

4,main=Relationshipsbetweencharacteristicsofirisflowers,pch=19,col=blue,cex=0.9)34DATAGURU专业数据分析网站2012.5.10散点图集利用par()在同一个device输出多个散点图Par命令博大精深,用于设置绘图参数,help(par)par(mfrow=c(3,1)plot(x1,x2);plot(x2,x3);plot(x3,x1)35DATAGURU专业数据分析网站2012.5.10关于绘图参数help(par)有哪些颜色?

colors()36DATAGURU专业数据分析网站2012.5.10关于绘图参数绘图设备37DATAGURU专业数据分析网站2012.5.10关于绘图参数位置控制参数mai参数:

Anumericalvectoroftheformc(bottom,left,top,right)whichgivesthemarginsizespecifiedininches.oma参数:

Avectoroftheformc(bottom,left,top,right)givingthesizeoftheoutermarginsinlinesoftext.38DATAGURU专业数据分析网站2012.5.10三维散点图安装scatterplot3d包scatterplot3d(x2:

4)39DATAGURU专业数据分析网站2012.5.10三维作图x-y-seq(-2*pi,2*pi,pi/15)f-function(x,y)sin(x)*sin(y)z-outer(x,y,f)contour(x,y,z,col=blue)persp(x,y,z,theta=30,phi=30,expand=0.7,col=lightblue)40DATAGURU专业数据分析网站2012.5.10调和曲线图41DATAGURU专业数据分析网站2012.5.10调和曲线图unison.r的代码自定义函数调和曲线用于聚类判断非常方便42DATAGURU专业数据分析网站2012.5.10地图安装maps包map(state,interior=FALSE)map(state,boundary=FALSE,col=red,add=TRUE)map(world,fill=TRUE,col=heat.colors(10)43DATAGURU专业数据分析网站2012.5.10R实验:

社交数据可视化先下载安装maps包和geosphere包并加载library(maps)library(geosphere)画出美国地图map(state)44DATAGURU专业数据分析网站2012.5.10R实验:

社交数据可视化画世界地图map(world)45DATAGURU专业数据分析网站2012.5.10R实验:

社交数据可视化通过设置坐标范围使焦点集中在美国周边,并且设置一些有关颜色xlim-c(-171.738281,-56.601563)ylim-c(12.039321,71.856229)map(world,col=#f2f2f2,fill=TRUE,bg=white,lwd=0.05,xlim=xlim,ylim=ylim)46DATAGURU专业数据分析网站2012.5.10R实验:

社交数据可视化画一条弧线连线,表示社交关系lat_ca-39.164141lon_ca-121.640625lat_me-45.213004lon_me-68.906250inter-gcIntermediate(c(lon_ca,lat_ca),c(lon_me,lat_me),n=50,addStartEnd=TRUE)lines(inter)47DATAGURU专业数据分析网站2012.5.10R实验:

社交数据可视化继续画弧线lat_tx-29.954935lon_tx-98.701172inter2-gcIntermediate(c(lon_ca,lat_ca),c(lon_tx,lat_tx),n=50,addStartEnd=TRUE)lines(inter2,col=red)48DATAGURU专业数据分析网站2012.5.10R实验:

社交数据可视化装载数据airports-read.csv(http:

/DATAGURU专业数据分析网站2012.5.10R实验:

社交数据可视化画出多重联系map(world,col=#f2f2f2,fill=TRUE,bg=white,lwd=0.05,xlim=xlim,ylim=ylim)fsub-flightsflights$airline=AA,for(jin1:

length(fsub$airline)air1-airportsairports$iata=fsubj,$airport1,air2-airportsairports$iata=fsubj,$airport2,inter-gcIntermediate(c(air11,$long,air11,$lat),c(air21,$long,air21,$lat),n=100,addStartEnd=TRUE)lines(inter,col=black,lwd=0.8)50DATAGURU专业数据分析网站2012.5.10R实验:

社交数据可视化51DATAGURU专业数据分析网站2012.5.10R实验:

社交数据可视化52http:

/FAQ时间53

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2