实验三数据的简单统计分析和推断.docx

上传人:b****6 文档编号:15733381 上传时间:2023-07-07 格式:DOCX 页数:15 大小:209.30KB
下载 相关 举报
实验三数据的简单统计分析和推断.docx_第1页
第1页 / 共15页
实验三数据的简单统计分析和推断.docx_第2页
第2页 / 共15页
实验三数据的简单统计分析和推断.docx_第3页
第3页 / 共15页
实验三数据的简单统计分析和推断.docx_第4页
第4页 / 共15页
实验三数据的简单统计分析和推断.docx_第5页
第5页 / 共15页
实验三数据的简单统计分析和推断.docx_第6页
第6页 / 共15页
实验三数据的简单统计分析和推断.docx_第7页
第7页 / 共15页
实验三数据的简单统计分析和推断.docx_第8页
第8页 / 共15页
实验三数据的简单统计分析和推断.docx_第9页
第9页 / 共15页
实验三数据的简单统计分析和推断.docx_第10页
第10页 / 共15页
实验三数据的简单统计分析和推断.docx_第11页
第11页 / 共15页
实验三数据的简单统计分析和推断.docx_第12页
第12页 / 共15页
实验三数据的简单统计分析和推断.docx_第13页
第13页 / 共15页
实验三数据的简单统计分析和推断.docx_第14页
第14页 / 共15页
实验三数据的简单统计分析和推断.docx_第15页
第15页 / 共15页
亲,该文档总共15页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

实验三数据的简单统计分析和推断.docx

《实验三数据的简单统计分析和推断.docx》由会员分享,可在线阅读,更多相关《实验三数据的简单统计分析和推断.docx(15页珍藏版)》请在冰点文库上搜索。

实验三数据的简单统计分析和推断.docx

实验三数据的简单统计分析和推断

实验三数据的简单统计分析与推断

一、实验目的:

对采集数据利用数理统计的知识,辅以matlab进行估计、分析和推断,即从一定总体中随机抽出一部分样本简单估计、分析和推断,以此对所研究的总体进行推测性的判断。

1.掌握参数估计和假设检验的基本理论模型与分类;

2.了解方差分析和线性回归模型的matlab解决方案;

3.根据问题的要求建立模型;

4.针对已经建立的模型,确定参数,通过Matlab求解;

二、预备知识:

1.参数估计:

利用样本统计量对总体(服从正态分布)参数进行估计:

点估计、区间估计;

2.假设检验:

总体均值的假设检验、总体方差的假设检验和两总体的检验;

3.方差分析:

背景:

事件的发生往往与多个因素有关,但各个因素对事件发生的影响可能是不一样的,而且同一因素的不同水平对事件发生的影响也是不同的。

通过方差分析,可以研究不同因素以及因素的不同水平对事件发生的影响程度。

根据自变量个数的不同,方差分析可以分为单因子方差分析和多因子方差分析。

数学原理:

一个实验有多个影响因素,如果只有一个在发生变化,则称为单因子分析。

假设某一实验有

个不同条件,则在每个条件(或称水平)下进行实验,可以得到

个总体,分别记为

,个总体的平均数表示为

,各总体的方差表示为

现在,在这

个总体服从正态分布且方差相等的情况下检查各总体的平均数是否相等,若相等则认为因素对实验结果之间没有显著影响。

双因子方差分析,因素水平的改变所造成的实验结果的改变,称为主效应。

当某一因素的效应随另一因素的水平不同而不同,则称这两个因素之间存在交互作用。

由于交互作用引起的实验结果的改变称为交互效应。

4.线性回归:

背景:

实际生活中,某个现象的发生或某种结果的出现往往与其他的某个或某些因素有关,但这种关系又是不确定的,只是从数据上可以看出有关的趋势。

回归分析就是用来研究具有这种特征的变量之间的相关关系的。

线性回归假设因变量与自变量之间为线性关系,用一定的线性回归模型来拟合变量,确定模型中的未知参数。

5.参数估计、假设检验、方差分析和回归分析的matlab实现;

6.用matlab进行基本统计分析:

[1]基本统计量:

均值:

mean(x):

平均值或数学期望;

中位数:

median(x):

将数据由小到大排序后中间位置的数据;

标准差:

std(x):

各个数据与均值偏离程度的度量;

方差:

var(x):

标准差的平方;

偏度:

skewness(x):

反映分布的对称性,大于零:

此时数据位于均值右边的比位于左边的多;等于零,对称分布;小于零,偏向均值的左侧。

峰度:

kurtosis(x):

用于衡量偏离正态分布尺度的统计量之一。

正态分布的峰度为3,若2ν比3大得多,

表示分布有沉重的尾巴,说明样本中含有较

多远离均值的数据,因而峰度可以用作衡量

偏离正态分布的尺度之一。

参数估计:

1、正态总体的参数估计

设总体服从正态分布,则其点估计和区间估计可以同时以下命令获得:

[muhat,sigmahat,muci,sigmaci]=normfit(DATA,alpha)

参数说明:

DATA为样本、alpha为显著性水平(缺省时默认为0.05)

muhat:

均值的点估计;sigmahat:

标准差的点估计

muci:

针对于均值的置信水平为1-alpha的区间估计;

sigmaci:

针对于标准差的置信水平为1-alpha的区间估计;

2、其他分布的参数估计

若无法保证总体服从正态分布,有两种处理方法:

一是取容量充分大的样本(n>50),按中心极限定理,它近似的服从正态分布,仍可以用上面的估计公式计算;二是使用matlab工具箱中具有特定总体分布的估计命令,常见命令:

[muhat,muci]=expfit(DATA,alpha):

在显著性水平alpha下,求指数分布的数据DATA的均值的点估计和取间估计

[lambdahat,lambdaci]=poissfit(DATA,alpha):

在显著性水平alpha下,求指数分布的数据DATA的参数

的均值的点估计和取间估计

[phat,pci]=mle(data,'distribution',value,'alpha',value):

通用参数估计命令,在显著性水平alpha下,求‘distr’分布的数据DATA的参数估计。

示例:

[phat,pci]=mle(data,'distribution','binomial','alpha',.05,')

phat=

0.7370

pci=

0.7171

0.7562

假设检验:

在总体服从正态分布的情况下,可以用以下命令进行检验。

1)、总体方差已知,总体均值的检验(z-检验)

[h,sig,ci]=ztest(x,m,sigma,alpha,tail)

检验数据x的关于均值的某一假设是否成立,其中sigma为已知方差,alpha为显著性水平

tail=0

;tail=1

;tail=-1

h=0:

接受假设;h=1:

拒绝假设(h:

bull);

sig:

假设成立的概率;

ci:

均值的1-alpha置信区间;

2)、总体方差未知,总体均值的假设检验(t-检验)

[h,p,ci]=ttest(x,m,alpha,tail)

检验数据x的关于均值的某一假设是否成立,其它参数说明同上述z-检验的参数说明相一致。

3)、两总体均值的假设检验(t-检验)

[h,p,ci]=ttest2(x,y,alpha,tail)

检验数据x,y的关于均值的某一假设是否成立,其它参数说明同上述z-检验的参数说明相一致。

4)、非参数检验,总体分布的检验

[1]h=normplot(x)

此命令显示数据矩阵的正态概率图。

如果数据来自于正态分布,则图形显示出直线性形态,而其他概率分布函数显示出曲线形态。

方差分析:

1)、用anoval函数进行单因子方差分析:

p=anova1(X)

比较样本

的矩阵X中多列数据的均值,返回所有样本取自同一群体的零假设成立的概率。

该命令将生成两个图形,第一个为标准方差分析表,第二个显示X每一列的箱型图,箱型图中心线上较大的差异对应较大的F值和较小的p值。

一般当p值小于0.05时认为结果是显著的。

方差分析一般用的显著性水平是:

,拒绝

,称因素A的影响(或A各水平的差异)非常显著;取

,不拒绝

,但取

,拒绝

,称因素A的影响显著;取

,不拒绝

,称因素A无显著影响。

2)、用anova2函数进行双因子方差分析:

P=anova2(X,reps)进行平衡双因子方差分析,以比较样本X中两列或两列以上和两行或两行以上数据的均值。

不同列中的数据代表一个因子A的变化,不同行中的数据代表因子B的变化。

其中reps代表每一个单元格中观测值的个数,当reps=1返回两个p值,当reps>1时返回3个p值。

线性回归:

1)、用regress进行线性回归

[b,bint,r,rint]=regress(y,X,alpha)

2)、用rcoplot会残差图

Reoplot(r,rint)

 

示例:

1、综合示例:

一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障.故障是完全随机的,并假定生产任一零件时出现故障机会均相同.工作人员是通过检查零件来确定工序是否出现故障的.现积累有100次故障纪录,故障出现时该刀具完成的零件数如下:

459362624542509584433748815505

612452434982640742565706593680

9266531644877346084281153593844

527552513781474388824538862659

77585975549697515628954771609

402960885610292837473677358638

699634555570844166061062484120

447654564339280246687539790581

621724531512577496468499544645

764558378765666763217715310851

试观察该刀具出现故障时完成的零件数属于哪种分布.

%数据录入

x1=[459362624542509584433748815505];

x2=[612452434982640742565706593680];

x3=[9266531644877346084281153593844];

x4=[527552513781474388824538862659];

x5=[77585975549697515628954771609];

x6=[402960885610292837473677358638];

x7=[699634555570844166061062484120];

x8=[447654564339280246687539790581];

x9=[621724531512577496468499544645];

x10=[764558378765666763217715310851];

x=[x1x2x3x4x5x6x7x8x9x10];

%绘制频率直方图

figure

(1)

hist(x,10)

%分布的正态性检验

figure

(2)

normplot(x)

%参数估计

[muhat,sugmuhat,muci,sigmuci]=normfit(x,0.05)

%假设检验

[h,sig,ci]=ttest(x,594)

运行结果:

muhat=

594

sugmuhat=

204.1301

 

muci=

553.4962

634.5038

sigmuci=

179.2276

237.1329

h=

0

sig=

1

ci=

553.4962634.5038

2、一位教师想要检查3种不同教学方法的效果,为此随机的选取了水平相等的15位学生。

把他们分为3组,每组5人,每一组用一种教学方法,一段时间以后,这位教师给这15位学生进行统考,统考成绩如下表。

要求检验这3种教学方法的效果有没有显著差异。

方法

成绩

75

62

71

58

73

81

85

68

92

90

73

79

60

75

81

score=[758173;628579;716860;589275;739081];

p=anova1(score)

p=

0.0401

 

3、设火箭的射程在其他条件基本相同时与燃料种类和推进器型号有关。

现在考虑四中不同的燃料及3种不同的推进器,对于每种搭配各发射了火箭两次,测得数据如表,要求检验各自变量和自变量的交互效应是否对火箭的射程有显著影响。

推进器1

推进器2

推进器3

燃料1

58.2

56.2

65.3

52.6

41.2

60.8

燃料2

49.1

54.1

51.6

42.8

50.5

48.4

燃料3

60.1

70.9

39.2

58.3

73.2

40.7

燃料4

75.8

58.2

48.7

71.5

51.0

41.4

disp2=[58.252.649.142.860.158.375.871.5;

56.241.254.150.570.973.258.251;

65.360.851.648.439.240.748.741.4]';

p=anova2(disp2,2)

p=

0.00350.02600.0001

4、

X=[ones(10,1)(1:

10)'];

y=X*[10;1]+normrnd(0,0.1,10,1);

[b,bint,r,rint]=regress(y,X,0.05)

rcoplot(r,rint)

b=

10.0337

0.9943

 

bint=

9.836910.2304

0.96261.0260

 

r=

0.0014

-0.1560

0.0547

0.1513

-0.0745

0.0861

0.1314

-0.1477

-0.1268

0.0801

 

rint=

-0.24760.2505

-0.38560.0737

-0.22070.3302

-0.10420.4069

-0.35880.2097

-0.19570.3679

-0.13250.3952

-0.39580.1003

-0.36970.1161

-0.15900.3192

三、实验内容与要求:

1、从一批火箭推力装置中抽取10个进行试验,测得燃烧时间如下:

50.754.954.344.842.269.853.466.148.134.5

设燃烧时间服从正态分布,求燃烧时间的均值和方差,其中置信水平为

90%。

2、某种元件,要求其使用寿命不得低于1000小时,现在随机的从这批元件中抽取25件测得其寿命分别为:

906.7783.4962.5978.8835.41068.9946.2982.7967.5

931.3102.3891.21168.3936.4961.41056.7955.9940.4866.8979.4816.41021.41112.4880.8

已知这种元件的寿命服从标准差为100的正态分布,试在

的显著性水平下确定这批元件是否合格。

3、某校60名学生的一次考试成绩如下:

937583939185848277767795948991

888683968179977875676968848381

756685709484838280787473767086

769089716686738094797877635355

1)计算均值、标准差、极差、偏度、峰度,画出直方图;

2)检验分布的正态性;

3)若检验符合正态分布,估计正态分布的参数并检验参数。

4、某种水泥在凝固时放出热量Y与水泥中四种化学成分占比有关,现测得13组数据。

要求建立热量与水泥成分之间的经验回归关系式。

编号

X1

X2

X3

X4

y

1

7

26

6

60

78.5

2

1

29

15

52

74.3

3

11

56

8

20

104.3

4

11

31

8

47

87.6

5

7

52

6

33

95.9

6

11

55

9

22

109.2

7

3

71

17

6

102.7

8

1

31

22

44

72.5

9

2

54

18

22

93.1

10

21

47

4

26

115.9

11

1

40

23

34

83.8

12

11

66

9

12

113.3

13

10

68

8

12

109.4

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2