概率统计实验指导书23文档格式.docx

上传人:b****2 文档编号:1092057 上传时间:2023-04-30 格式:DOCX 页数:40 大小:205.75KB
下载 相关 举报
概率统计实验指导书23文档格式.docx_第1页
第1页 / 共40页
概率统计实验指导书23文档格式.docx_第2页
第2页 / 共40页
概率统计实验指导书23文档格式.docx_第3页
第3页 / 共40页
概率统计实验指导书23文档格式.docx_第4页
第4页 / 共40页
概率统计实验指导书23文档格式.docx_第5页
第5页 / 共40页
概率统计实验指导书23文档格式.docx_第6页
第6页 / 共40页
概率统计实验指导书23文档格式.docx_第7页
第7页 / 共40页
概率统计实验指导书23文档格式.docx_第8页
第8页 / 共40页
概率统计实验指导书23文档格式.docx_第9页
第9页 / 共40页
概率统计实验指导书23文档格式.docx_第10页
第10页 / 共40页
概率统计实验指导书23文档格式.docx_第11页
第11页 / 共40页
概率统计实验指导书23文档格式.docx_第12页
第12页 / 共40页
概率统计实验指导书23文档格式.docx_第13页
第13页 / 共40页
概率统计实验指导书23文档格式.docx_第14页
第14页 / 共40页
概率统计实验指导书23文档格式.docx_第15页
第15页 / 共40页
概率统计实验指导书23文档格式.docx_第16页
第16页 / 共40页
概率统计实验指导书23文档格式.docx_第17页
第17页 / 共40页
概率统计实验指导书23文档格式.docx_第18页
第18页 / 共40页
概率统计实验指导书23文档格式.docx_第19页
第19页 / 共40页
概率统计实验指导书23文档格式.docx_第20页
第20页 / 共40页
亲,该文档总共40页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

概率统计实验指导书23文档格式.docx

《概率统计实验指导书23文档格式.docx》由会员分享,可在线阅读,更多相关《概率统计实验指导书23文档格式.docx(40页珍藏版)》请在冰点文库上搜索。

概率统计实验指导书23文档格式.docx

此外,命令corrcoef计算相关系数矩阵,格式为R=corrcoef(X),X为输入矩阵,它的行元素为观测值,列元素为变量,返回相关系数矩阵R,矩阵R的元素为R(i,j);

命令cov计算协方差矩阵,格式为C=cov(X),X若为单个向量,cov(X)返回包含方差的标量;

X若为矩阵,X的每一列表示一个变量而行元素为观测值。

cov(X)计算结果为协方差矩阵C,矩阵C的元素为C(i,j),它与R(i,j)的关系如下:

注方差命令var(X)与diag(cov(X))所返回的结果相同;

标准差命令std(X)等价于sqrt(diag(cov(X)));

cov(x,y)(其中x,y为等长度的列向量)与cov([x,y])的计算结果相同。

例1有一大批糖果,现从中随机地取8袋,称得重量X(单位:

g)如下:

505.0507.0489.0502.0504.0511.0488.0528.0

求这组数据的均值、方差、标准差等。

解输入下列语句:

data1=[505,507,489,502,504,511,488,528]

mean(data1)%求data1的均值

运行得结果

ans=504.2500

再运行

std(data1)%求data1的标准差S

得结果

ans=12.6463

hist(data1)%画出data1的直方图

例2随机地抽查某班10名学生的数学、政治、外语三门课程的考试成绩如表1所示,试求各科的平均分数、标准差、协方差及相关系数矩阵。

表1学生成绩表

序号

科目

1

22

3

4

5

6

7

8

9

10

数学

政治

外语

78

82

67

91

85

76

81

72

57

63

52

80

65

69

83

68

93

88

75

解在MATLAB中,首先建立数据的M文件,从File菜单中选择M-File,即可打开一个编辑器,输入如下语句并以data.m命名。

functiondata=x

data=[788267;

918576;

678172;

576352;

808065;

637276;

698368;

829388;

758278;

858875];

在MATLAB命令窗口中输入

mean(data)%求数据的平均值

得到结果

ans=74.700080.900071.7000

第一列为数学的平均分74.7,第二列为政治的平均分80.9,第三列为外语的平均分71.7.

输入

std(data)%求数据的标准差

ans=10.57308.30609.5574

第一列为数学的标准差10.5730,第二列为政治的标准差8.3060,第三列为外语的标准差9.5574

下面求数据的相关系数矩阵,输入

corrcoef(data)

得到

ans=1.00000.80430.5400

0.80431.00000.7736

0.54000.77361.0000

cov(data)%求协方差矩阵

ans=111.788970.633354.5667

70.633368.988961.4111

56.566761.411191.3444

2.参数估计

MATLAB统计工具箱中,有专门计算总体均值、标准差的点估计和区间估计的程序。

将概率函数中的后三个字母由“pdf”变为“fit”即为相应总体的估计函数。

如,对于正态总体,命令是

[mu,sigma,mucisigmaci]=normfit[X,alpha]

其中,X是样本(数组),alpha是显著性水平

(alpha默认时设定为0.05),输出mu和sigma是总体均值

和标准差

的点估计,muci和sigmaci是总体均值

的区间估计。

当X是矩阵(列为变量)时输出行向量。

一般情况下,如果确定总体为正态总体,则使用上面的normfit函数,如果无法保证这个假设成立,有两种处理办法:

一是取容量充分大的样本,仍可按照上面给出的估计公式计算,因为根据概率论的中心极限定理,只要样本足够大(实用中取

),均值就近似地服从正态分布;

二是采用其他分布的估计函数,下面列出常见分布的估计函数格式,至于其他估计函数的用法可参见MATLAB的帮助系统。

(1)[muhat,muci]=expfit(X,alpha)

%在显著性水平

下,求指数分布的数据X的均值的点估计及其区间估计

(2)[lambdahat,lambdaci]=poissfit(X,alpha)

下,求泊松分布的数据X的参数

的点估计及其区间估计

例3用

分布产生

个随机样本,估计其均值和标准差(

)。

解输入语句

r=normrnd(10,2,100,1);

[musigmamucisigmaci]=normfit(r)

运行结果如下:

mu=9.8437

sigma=1.9138

muci=9.463910.2234

sigmaci=1.68032.2232

结果表明,该随机样本的均值的点估计为9.8437,区间估计为[9.4639,102234],标准差的点估计为1.9138,区间估计为[1.6803,2.2232].

3、假设检验

在总体服从正态分布的情况下,可用命令进行假设检验。

(1)总体方差

已知时,总体均值的检验使用Z-检验,语句格式为

[h,sig,ci,z]=ztest(x,m,sigma,alpha,tail)

检验数据x的关于均值的某一假设是否成立,其中sigma为已知方差

,alpha为显著性水平

,究竟检验什么假设取决于tail的取值:

tail=0,检验假设“x的均值等于m”;

tail=1,检验假设“x的均值大于m”;

tail=-1,检验假设“x的均值小于m”;

tail的默认值为0,alpha的默认值为0.05。

返回值h为一个布尔值,h=1表示可以拒绝假设,h=0表示不可以拒绝假设;

z为统计量

的值,其中n为样本中数据的个数;

sig为Z统计量在假设成立下的概率,ci为均值的

置信区间。

注ztest命令输出参数中的最后一个参数z,若不需要显示,通常被省略。

(2)总体方差

未知时,总体均值的检验使用t-检验,语句格式为

[h,sig,ci]=ttest(x,m,alpha,tail)

检验数据x的关于均值的某一假设是否成立,其中参数的取值和意义以及返回值的含义类同于上面的ztest函数,只是此函数的统计量为t统计量,

(3)两总体均值的假设检验使用t-检验,语句格式为

[h,sig,ci]=ttest2(x,y,alpha,tail)

检验数据x,y的关于均值的某一假设是否成立,其中参数的取值和意义以及返回值的含义也类同于上面的ztest函数,只是此函数的统计量为t统计量,

,其中m,n分别为样本x,y中数据的个数。

例4用

个随机样本,分别在总体方差已知(

)和未知的情况下检验总体均值

解假设检验分别为

总体方差已知时用Z-检验,未知时用t-检验,程序如下:

x=normrnd(5,1,100,1);

%产生

随机数100个

m=mean(x)%计算样本均值

[h0,sig0,ci0,z0]=ztest(x,5,1)%Z检验

[h1,sig1,ci1,z1]=ztest(x,5.25,1)

[ht0,sigt0,ci,t0]=ttest(x,5,1)%t检验

[ht1,sigt1,ci,t1]=ttest(x,5.25)

m=4.9901

h0=0;

sig0=0.9213;

ci0=4.79415.1861;

z0=-0.0987

h1=1;

sig1=0.0094;

ci1=4.79145.1861;

z1=-2.5987

ht0=0;

sigt0=0.9214;

cit0=4.79225.1881;

ht1=1;

sigt1=0.0106;

cit1=4.79225.1881

从以上结果可知,样本均值

,同时

(1)对Z-检验和t-检验都接受了

的假设,拒绝了

的假设。

(2)对Z-检验,在

下样本统计量z0=-0.0987

下的概率为sig0=0.9213(2*normcdf(z0)),样本对总体均值

的区间估计为[4.7941,5.1861];

(3)对Z-检验,在

下样本统计量z1=-2.5987

下的概率为sig1=0.0094(2=*normcdf(z1)),样本对总体均值

的区间估计同样为[4.7941,5.1861];

(4)对t-检验,在

下的概率为sigt0=0.9214(=2*tcdf(t0,n-1)),其中,t0可由公式

计算得到,对总体均值

的区间估计为[4.7922,5.1881];

(5)对t-检验,在

下的概率为sigt1=0.0094,

特别指出,ztest中的输出sig是

下的概率

,其中

偏离

越大,

越大,sig=

越大,所以可以认为sig给出了接受

(此时sig>

a)或拒绝

(此时sig<

a)的定量指标。

ttest和ttest2中的输出sig有类似的含义,只需换成t分布和t统计量。

例5分别用

两个分布随机产生n=100个样本,检验两个总体均值

解依题意,需作假设检验

,输入下列语句:

x=normrnd(5,1,100,1);

y=normrnd(5.2,0.8,100,1);

[pt,sigt]=ttest2(x,y);

运行得到

pt=0

sigt=0.5322

可见,虽然产生样本的两个总体的均值不同(5和5.2),但是仍然接受了

的假设检验。

类似ttest2.m,我们还可以编写ztest2.m函数文件,该文件所含语句如下(tail的用法与ztest相同,所有输入参数不可省略):

function[h,sig]=ztest2(x,y,sigma1,sigma2,alpha,tail)

n1=length(x);

n2=length(y);

xbar=mean(x);

ybar=mean(y);

z=(xbar-ybar)/sqrt(sigma1^2/n1+sigma2^2/n2);

iftail==0

u=norminv(1-alpha/2);

sig=2*(1-normcdf(abs(z)));

ifabs(z)<

=u

h=0;

else

h=1;

end

end

iftail==1

u=norminv(1-alpha);

sig=1-normcdf(z);

ifz<

iftail==-1

u=norminv(alpha);

sig=normcdf(z);

ifz>

然后再命令窗口运行

[p,sig]=ztest2(x,y,1,0.8,0.05,0)

p=0

sig=0.3877

4习题

1、某车间用包装机包装白糖,额定标准每袋重0.5kg。

根据长期经验知该包装机称得的糖重服从正态分布

,现从该包装机所包装的糖中随机地抽取9袋,称得净重(单位:

kg)为

0.4970.5060.5780.5240.4880.5110.5100.5120.515

能否认为该包装机包装的白糖是正常的?

2、表2给出了某些地区农民家庭生活消费的支出情况,试计算各种消费的均值、方差、协方差矩阵及相关系数矩阵。

表2某些地区农民家庭生活消费支出情况表单位:

食品

衣着

燃料

住房

生活及其他

文化、服务

2

11

12

193.330

135.200

95.000

104.780

128.410

145.680

159.370

115.840

140.540

153.110

221.110

144.980

43.770

36.400

22.830

25.110

27.630

32.380

33.380

30.760

21.590

23.090

38.640

29.120

9.730

10.470

9.300

6.460

8.940

18.370

12.200

17.640

15.620

12.530

11.670

60.540

44.160

22.440

9.890

12.580

11.810

53.619

19.190

23.540

116.650

42.600

49.010

36.490

22.810

18.170

23.990

25.290

33.770

15.970

18.180

50.280

27.300

9.040

3.940

2.800

3.250

3.270

5.220

3.850

4.940

6.390

5.890

5.740

3、设某产品的生产工艺发生了改变,在改变前后分别测得了若干产品的技术指标,其结果如下:

改变前21.622.822.121.220.521.921.4

改变后24.123.824.724.023.724.324.523.9

假设该产品的技术指标服从正态分布,方差未知且在工艺改变前后不变。

试估计工艺改变后,该技术指标的置信水平为95%的平均值的变化范围。

4、随机地从A批导线中抽取4根,又从B批导线中抽取5根,测得电阻(单位:

Ω)如下:

A批导线0.1430.1420.1430.137

B批导线0.1400.01420.1360.1380.140

设测定数据分别来自分布

且两样本相互独立,又

均未知,问

的值在什么范围内(

)?

5、从某电工器材厂生产的一批保险丝中抽取10根,测试其融化时间,得到数据如下:

42657578715957685554

设这批保险丝的融化时间服从正态分布,检验总体方差是否等于

6、甲、乙两台机床生产同一型号的滚珠,从这两台机床生产的滚珠中分别抽取若干个样品,测得滚珠的直径(单位:

mm)如下:

甲机床15.014.715.215.414.815.115.215.0

乙机床15.215.014.815.215.015.014.815.114.9

设两台机床生产的滚珠的直径都服从正态分布,检验它们是否服从相同的正态分布(

实验三随机模拟

1、引

1.问题:

有一个粒子放在平面上某一点,试作图显示粒子移动的轨迹,假设:

(1)粒子在平面上不受任何外力作用。

(2)粒子的运动轨迹在一平面上。

(3)粒子在平面上的运动时随机的。

(4)不考虑粒子质量。

(5)粒子在每单位时间随机移动一步,此步在横轴两个方向上分解得到的值都在-1与1之间。

2.分析:

粒子在平面上每一步移动都是随机的,每一步的移动可简化为平面上一个点(该步移动的起点)在横坐标与纵坐标上分别产生一个-1到1之间的随机增量得到一个新的点(该步移动的终点),两点之间的线段即为粒子在该步移动的轨迹。

选取初始点为坐标原点,通过随机数产生出一系列点,画出点与点之间的线段,即可得到粒子移动的轨迹图。

3、问题的解决:

由上面的分析,要想画出粒子的移动轨迹图,首先必须得到粒子由一点随机移动到另一点的坐标,而该坐标涉及两个随机数。

本节重点进行与随机数的产生和随机模拟有关的实验。

2、实验目的

1.模拟各种分布。

2.学习用MATLAB绘制样本分布的频数直方图。

3.解决“引”中的实际问题。

3、实验内容

1、服从各种常用分布的随机数的产生

实际工作过程中常常需要产生各种随机数,而MATLAB在这一方面为人们提供了很大的方便,事实上只需将MATLAB提供的各种分布函数的后缀改为“rnd”即是产生相应分布随机数的函数。

例1生成一组10个服从

的随机数。

解在命令窗口中输入

normrnd(0,1,1,10)

在命令行下方立刻会显示出

Columns1through8

-2.4280-1.16580.18790.09611.41780.42021.0377

Columns8through10

0.3636-1.5947-0.071

normrnd函数中的第1,2个参数分别表示均值及均方差,第3、4个参数表示的是随机数的排列形式,本例是生成1行10列的随机向量。

仿此,请练习生成服从其他分布的随机数,如生成

的服从

提示使用语句trnd(4,3,10).

2、绘制样本分布频数的直方图

使用hist函数,其基本格式为

hist(y,m),

其功能为将y的数值组成的区间平均分成m份,统计出y中的数在各个区间中的个数,并以区间为横坐标,个数为纵坐标作出柱状图。

如果将其赋值,如T=hist(y,m),则将各个区间中y中数的个数形成向量赋值给T,此时不难画出柱状图。

例2输入语句

x=[10102.33.51.39.86.7];

T=hist(x,5)

T=32012,

没有柱状图。

如果将后一语句的“T=”去掉,即变为

hist(x,5)

则显示柱状图,如图1

例3画出正态分布和均匀分布的柱状图,并观察比较。

x=randn(20,1);

y=rand(20,1);

%生成正态分布和均匀分布的实验样本,各20个

subplot(1,2,1),hist(x,7)%分成两个窗口作图,第一个窗口作出20个正态分布数据的柱状图,分为7个区间

subplot(1,2,2),hist(y,7)%第二个窗口作出20个均匀分布数据的柱状图,也分为7个区间

逐渐增加样本点的个数,如50,100,1000重新作图,仔细观察,图2是样本点为1000个时的图形,还可继续。

还有一个绘制柱状图的语句histfit,关于它的使用,请自己查阅帮助,练习使用。

3.小实验蒲丰投针问题

在一个平面上,用尺子画两条相距为d的平行线;

一根长度为

的针,扔到画了线的平面上;

针与线相交的概率为

原因如下:

用x表示针的中点与最近一条平行线的距离,用a表示针与此线间的夹角,显然

,而针与平行线相交的充要条件是

,化简为

,见图3.

由图4可知,针与平行线相交的概率为正弦曲线与横轴及

所围成的图形的面积同矩形面积的比,经计算得

如果大量的进行投针实验,根据大数定律,随着试验次数的增加,针与平行线相交的频率依概率收敛到概率,因此可以用频率代替相应的概率,由此可得到圆周率

的近似值。

下面用MATLAB语言编写的用计算机模拟投针实验来计算

的近似值的程序:

clear%清空工作区

d=1;

%两平行线间的宽度

l=0.6;

%针长

counter=1;

%计数器用来统计针与线相交的次数

N=1000000;

%投针次数

x=unifrnd(0,d/2,1,N);

%投出的针的中点到线的距离,在此设其服从区间[0,a/2]上的均匀分布

fi=unifrnd(0,pi/2,1,N);

%投出的针与平行线的夹角,在此设其服从区间[0,

/2]上的均匀分布

forI=1:

N

ifx(I)<

l*sin(fi(I))/2%满足此条件表示投出的针与平行线相交

counter=counter+1;

fren=counter/N;

%计算投出的针与平行线相交的频率

pihat=2*l/(d*fren)%计算

的近似值

运行上面的程序,可得到结果

pihat=3.1478

通过增加实验次数可以得到更精确的近似值,为什么?

4、习题

1、写出“引”中的实际问题,写出完整的实验报告。

提示:

可通过以下几步完成。

(1)选择粒子的起始位置为坐标原点。

(2)生成两个-1与1之间的随机数,作为新点产生的横坐标和纵坐标的增量,从而得到新点的坐标,画出连接两点的线段,即得到第一步移动的轨迹。

(3)以新点为始点,重新进行第二步,直到你认为选出的点足够为止。

注:

编写程序时也可以事先指定移动的次数,通过循环语句实现。

2、思考在什么情况下可能用到绘制直方图函数(即绘制直方图对解决哪些问题有所帮助)?

3、小李给她的N个朋友写信,写

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 学科竞赛

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2