统计学R语言实验.docx

上传人:b****2 文档编号:1867537 上传时间:2023-05-02 格式:DOCX 页数:16 大小:155.85KB
下载 相关 举报
统计学R语言实验.docx_第1页
第1页 / 共16页
统计学R语言实验.docx_第2页
第2页 / 共16页
统计学R语言实验.docx_第3页
第3页 / 共16页
统计学R语言实验.docx_第4页
第4页 / 共16页
统计学R语言实验.docx_第5页
第5页 / 共16页
统计学R语言实验.docx_第6页
第6页 / 共16页
统计学R语言实验.docx_第7页
第7页 / 共16页
统计学R语言实验.docx_第8页
第8页 / 共16页
统计学R语言实验.docx_第9页
第9页 / 共16页
统计学R语言实验.docx_第10页
第10页 / 共16页
统计学R语言实验.docx_第11页
第11页 / 共16页
统计学R语言实验.docx_第12页
第12页 / 共16页
统计学R语言实验.docx_第13页
第13页 / 共16页
统计学R语言实验.docx_第14页
第14页 / 共16页
统计学R语言实验.docx_第15页
第15页 / 共16页
统计学R语言实验.docx_第16页
第16页 / 共16页
亲,该文档总共16页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

统计学R语言实验.docx

《统计学R语言实验.docx》由会员分享,可在线阅读,更多相关《统计学R语言实验.docx(16页珍藏版)》请在冰点文库上搜索。

统计学R语言实验.docx

统计学R语言实验

实验5R绘图

(二)

一、实验目的:

1.熟练掌握描述性统计分析中常用的统计量;

2.掌握R语言的高水平作图命令;

3.掌握R语言的低水平作图命令;

4.掌握多元数据的三个数据特征:

均值向量、协方差矩阵、相关系数矩阵。

二、实验容:

练习:

要求:

①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。

④修改本文档名为“本人完整学号1”,其中1表示第1次实验,以后更改为2,3,...。

如文件名为“1305543109立1”,表示学号为1305543109的立同学的第1次实验,注意文件名中没有空格及任何其它字符。

最后连同数据文件、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。

截图方法:

法1:

调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕”或“PrScrn”等字符),即完成截图。

再粘贴到word文档的相应位置即可。

法2:

利用QQ输入法的截屏工具。

点击QQ输入法工具条最右边的“扳手”图标

,选择其中的“截屏”工具。

1.自行完成教材P130页开始的3.3-3.4节中的例题。

2.(习题3.5)小白鼠在接种了3种不同菌型的伤寒杆菌后的存活天数如下表所示,试绘出数据的箱线图(采用两种方法,一种是plot语句,另一种是boxplot语句)来判断小白鼠被注射3种菌型后的平均存活天数有无显著性差异?

白鼠试验数据

菌型

存活天数

1

2

4

3

2

4

7

7

2

2

5

4

2

5

6

8

5

10

7

12

12

6

6

3

7

11

6

6

7

9

5

5

10

6

3

10

注:

平均存活天数其实应该是均值,但当不知道总体的分布时,通常是比较中位数。

因此,这里考虑用箱线图中的中位数来进行比较。

解:

源代码:

y<-c(2,4,3,2,4,7,7,2,2,5,4,

5,6,8,5,10,7,12,12,6,6,

7,11,6,6,7,9,5,5,10,6,3,10)

f<-factor(c(rep(1,11),rep(2,10),rep(3,12)))

plot(f,y)

A<-c(2,4,3,2,4,7,7,2,2,5,4)

B<-c(5,6,8,5,10,7,12,12,6,6)

C<-c(7,11,6,6,7,9,5,5,10,6,3,10)

boxplot(A,B,C)

运行截图:

结论:

从箱线图中可以看到,菌型2和3的平均存活天数无显著差异,但是与菌型1的有显著差异

 

3.(习题3.6)绘出习题3.16关于3项指标的离散图,从图中分析例3.16的结论的合理性。

序号

硬度X1

变形X2

弹性X3

1

65

45

27.6

2

70

45

30.7

3

70

48

31.8

4

69

46

32.6

5

66

50

31.0

6

67

46

31.3

7

68

47

37.0

8

72

43

33.6

9

66

47

33.1

10

68

48

34.2

注:

1.绘出的图形类似教材P133页的图3.8。

2.把上述表格分复制到记事本中即可实现表格转化为文本,再用read.table()函数存入到数据框中即可,避免输入麻烦。

解:

源代码:

>df<-read.table("例3.6_data",header=T)

>df

>pairs(df)

运行截图:

结论:

具有相关关系的两个变量的散点图要么是从左下角到右上角(即正相关关系),要么是从左上角到右下角(即负相关关系)。

但从上图可知所有的图中都没有这样的趋势,故均不相关。

 

4.(习题3.7)某校测得19名学生的四项指标,性别、年龄、身高(cm)和体重(lb),具体数据如下表所示。

(1)试绘出体重对于身高的散点图;

(2)绘出不同性别情况下,体重与身高的散点图;(coplot(a~b|c))

(3)绘出不同年龄段的体重与身高的散点图;

(4)绘出不同性别和不同年龄段的体重与身高的散点图。

(coplot(a~b|c+d))

学号

性别

年龄

身高

体重

01

Alice

F

13

56.5

84.0

02

Becka

F

13

65.3

98.0

03

Gail

F

14

64.3

90.0

04

Karen

F

12

56.3

77.0

05

Kathy

F

12

59.8

84.5

06

Mary

F

15

66.5

112.0

07

Sandy

F

11

51.3

50.5

08

Sharon

F

15

62.5

112.5

09

Tammy

F

14

62.8

102.5

10

Alfred

M

14

69.0

112.5

11

Duke

M

14

63.5

102.5

12

Guido

M

15

67.0

133.0

13

James

M

12

57.3

83.0

14

Jeffrey

M

13

62.5

84.0

15

John

M

12

59.0

99.5

16

Philip

M

16

72.0

150.0

17

Robert

M

12

64.8

128.0

18

Thomas

M

11

57.5

85.0

19

William

M

15

66.5

112.0

解:

源代码:

>ef<-read.table(file.choose(),header=T);ef

>attach(ef)

>plot(体重~身高)

>coplot(体重~身高|性别)

>coplot(体重~身高|年龄)

>coplot(体重~身高|年龄+性别)

 

运行截图:

5.(习题3.8)画出函数z=x4−2x2y+x2−2xy+2y2+9x/2−4y+4在区域−2≤x≤3,−1≤y≤7上的三维网格曲面和二维等值线,其中x与y各点之间的间隔为0.05,等值线的值分别为0,1,2,3,4,5,10,15,20,30,40,50,60,80,100,共15条。

(注:

在三维图形中选择合适的角度)

解:

源代码:

x<-seq(-2,3,0.05)

y<-seq(-1,7,0.05)

f<-function(x,y)x^4-2*x^2*y+x^2-2*x*y+2*y^2+9*x/2-4*y+4

z<-outer(x,y,f)

contour(x,y,z,levels=c(0,1,2,3,4,5,10,15,20,30,40,50,60,80,100),col="black")

>persp(x,y,z,theta=30,phi=30,expand=0.7,col="lightblue")

运行截图:

6.(习题3.9)用Pearson相关检验法检验习题3.7中的身高与体重是否相关。

解:

源代码:

cor.test(身高,体重)

运行截图:

结论:

其P值为7.887e-07<0.05,拒绝原假设,认为变量身高与体重相关。

7.(习题3.10)绘出例3.17中48号求职者数据的星图。

(数据见文档最后)

(1)以15项自变量FL,APP,…,SUIT为星图的轴;

(2)以G1,G2,…,G5为星图的轴。

(提示:

先)

通过这些星图,能否说明应选哪6名应聘者。

为使星图能够充分反映应聘者的情况,在作图中可适当调整各种参数。

提示:

(2)小题,先利用教材P153页的公式,计算出48个求职者这5个变量的值,公式如下:

G1<-(SC+LC+SMS+DRV+AMB+GSP+POT)/7

G2<-(FL+EXP+SUIT)/3

G3<-(LA+HON+KJ)/3

G4<-AA

G5<-APP

再将G1,…,G5这5个列向量(即48行5列数据)赋值一个新的数据框,再按第

(1)小题的方法绘出星图。

解:

源代码:

>X<-read.csv("applicant.csv")

>stars(X)

>attach(X)

>X$G1<-(SC+LC+SMS+DRV+AMB+GSP+POT)/7

>X$G2<-(FL+EXP+SUIT)/3

>X$G3<-(LA+HON+KJ)/3

>X$G4<-AA

>X$G5<-APP

>rt<-scale(X[,17:

21])

>stars(rt)

运行截图:

 

思考:

1.R语言的高水平作图函数与低水平作图函数的主要区别是什么?

所谓高水平函数是与低水平作图函数相对应的,即所有的绘图函数均可产生图形,可以有坐标轴,以及图和坐标轴的说明文字。

2.plot()函数除了能画出散点图外,还能画什么图?

能画出曲线图吗?

曲线图,箱线图;能

3.多元数据主要有哪三个数据特征指标?

均值向量、协方差矩阵、相关系数矩阵

4.相关检验的原假设是什么?

总体X,Y不相关

5.多元数据的图形表示方法主要有哪几种图?

轮廓图,星图,调和曲线图

三、实验小结(必写,但字数不限)

本次实验,主要是在星图方面有些阻碍,用不同的函数读取的结果会不一样,有时还读不出来,最终还是把数据存入excel中,才能成功。

要学会描述性统计分析中常用的统计量,高水平作图函数与低水平图函数的区别。

 

附:

48名应聘者的得分情况

ID

FL

APP

AA

LA

SC

LC

HON

SMS

EXP

DRV

AMB

GSP

POT

KJ

SUIT

1

6

7

2

5

8

7

8

8

3

8

9

7

5

7

10

2

9

10

5

8

10

9

9

10

5

9

9

8

8

8

10

3

7

8

3

6

9

8

9

7

4

9

9

8

6

8

10

4

5

6

8

5

6

5

9

2

8

4

5

8

7

6

5

5

6

8

8

8

4

4

9

5

8

5

5

8

8

7

7

6

7

7

7

6

8

7

10

5

9

6

5

8

6

6

6

7

9

9

8

8

8

8

8

8

10

8

10

8

9

8

10

8

9

9

9

8

9

9

8

8

10

9

10

9

9

9

10

9

9

9

7

8

8

8

8

5

9

8

9

8

8

8

10

10

4

7

10

2

10

10

7

10

3

10

10

10

9

3

10

11

4

7

10

0

10

8

3

9

5

9

10

8

10

2

5

12

4

7

10

4

10

10

7

8

2

8

8

10

10

3

7

13

6

9

8

10

5

4

9

4

4

4

5

4

7

6

8

14

8

9

8

9

6

3

8

2

5

2

6

6

7

5

6

15

4

8

8

7

5

4

10

2

7

5

3

6

6

4

6

16

6

9

6

7

8

9

8

9

8

8

7

6

8

6

10

17

8

7

7

7

9

5

8

6

6

7

8

6

6

7

8

18

6

8

8

4

8

8

6

4

3

3

6

7

2

6

4

19

6

7

8

4

7

8

5

4

4

2

6

8

3

5

4

20

4

8

7

8

8

9

10

5

2

6

7

9

8

8

9

21

3

8

6

8

8

8

10

5

3

6

7

8

8

5

8

22

9

8

7

8

9

10

10

10

3

10

8

10

8

10

8

23

7

10

7

9

9

9

10

10

3

9

9

10

9

10

8

24

9

8

7

10

8

10

10

10

2

9

7

9

9

10

8

25

6

9

7

7

4

5

9

3

2

4

4

4

4

5

4

26

7

8

7

8

5

4

8

2

3

4

5

6

5

5

6

27

2

10

7

9

8

9

10

5

3

5

6

7

6

4

5

28

6

3

5

3

5

3

5

0

0

3

3

0

0

5

0

29

4

3

4

3

3

0

0

0

0

4

4

0

0

5

0

30

4

6

5

6

9

4

10

3

1

3

3

2

2

7

3

31

5

5

4

7

8

4

10

3

2

5

5

3

4

8

3

32

3

3

5

7

7

9

10

3

2

5

3

7

5

5

2

33

2

3

5

7

7

9

10

3

2

2

3

6

4

5

2

34

3

4

6

4

3

3

8

1

1

3

3

3

2

5

2

35

6

7

4

3

3

0

9

0

1

0

2

3

1

5

3

36

9

8

5

5

6

6

8

2

2

2

4

5

6

6

3

37

4

9

6

4

10

8

8

9

1

3

9

7

5

3

2

38

4

9

6

6

9

9

7

9

1

2

10

8

5

5

2

39

10

6

9

10

9

10

10

10

10

10

8

10

10

10

10

40

10

6

9

10

9

10

10

10

10

10

10

10

10

10

10

41

10

7

8

0

2

1

2

0

10

2

0

3

0

0

10

42

10

3

8

0

1

1

0

0

10

0

0

0

0

0

10

43

3

4

9

8

2

4

5

3

6

2

1

3

3

3

8

44

7

7

7

6

9

8

8

6

8

8

10

8

8

6

5

45

9

6

10

9

7

7

10

2

1

5

5

7

8

4

5

46

9

8

10

10

7

9

10

3

1

5

7

9

9

4

4

47

0

7

10

3

5

0

10

0

0

2

2

0

0

0

0

48

0

6

10

1

5

0

10

0

0

2

2

0

0

0

0

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2