统计学课后题答案Word文档下载推荐.docx
《统计学课后题答案Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《统计学课后题答案Word文档下载推荐.docx(20页珍藏版)》请在冰点文库上搜索。
1)假定总体标准差为15元,求样本均值的抽样标准误差
2)在95%勺置信水平下,求估计误差。
3)如果样本均值为120元,求总体均值卩的95%勺置信区间
解:
1)已知(T=15,n二49
)已知
z2
估计误差E=X15-V49〜
3)已知x=120
T置信区间为X士E二其置信区间二120士
3.从一个总体中随机抽取n=100的随机样本,得到=104560,假定总体标准差(T=85414,试构建总体均值卩的95%勺置信区间。
已知n=100,却04560,=85414,1-=95%,“11
由于是正态总体,且总体标准差已知。
总体均值在1-置信
水平下的置信区间为
25
xz$—105.361.96
=104560士
4.
s=12。
置信
从总体中抽取一个n=100的简单随机样本,得到x=81,
要求:
1)构建口的90%勺置信区间。
2)构建卩的95%勺置信区间。
3)构建卩的99%勺置信区间。
由于是正态总体,但总体标准差未知。
总体均值在1-
水平下的置信区间公式为
无土需'
-
一"
五81士%x12-V100=81士%x
1)1-=90%
其置信区间为
81
士
2)
1-=95%,
7
=^CjO25=L96
3)
1-=99%
-1•
5.利用下面的信息,构建总体均值的置信区间。
1)x=25,。
二,n=60,置信水平为95%
2)X=119,s=,n=75,置信水平为98%
3)X=,s=,n=32,置信水平为90%
x
zF或x
二锻=细ms
未知)
1-
=95%,
=196
其置信区间为:
25±
X^V60
=25士
2)1-=98%,贝卩=,/2=,1-/2=,查标准正态分布
表,可知:
「
119士75
=119士
3)1-=90%£
胡二.
士X—V32
=士
6.利用下面的信息,构建总体均值
卩的置信区间:
1)总体服从止态分布,且已知(T=
500,n二15x,
=8900,置
信水平为95%
N=15,为小样本正态分布,但
(T已知。
贝S
1-=95%
一"
-1---。
其置信区间公式为x
z辺一105.36xn
10
1.96
二置信区间为:
8900士X500宁V15=
()105.36
3.92
101.44,109.28
2)总体不服从正态分布,且已知(T=500,n二35X=8900,
置信水平为95%
为大样本总体非正态分布,但
(T已知。
贝S1-=95%
其置信区间公式为
z\n
105.361.96
3)总体不服从正态分布未知,n二35,=8900,s=500,
置信水平为90%
为大样本总体非正态分布,且(T未知,1-=90%%=。
片土H诃2-7^=
、8900士X500-V35=(87619039)
4)总体不服从正态分布未知,n二35,=8900,s=500,置信水平为99%
为大样本总体非正态分布,且(T未知,1-=99%忑翻=。
*土工~产-
"
宀8900士X500-V35=()
7.某大学为了解学生每天上网的时间,在全校7500名学生中采
取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:
小时)(略)。
求该校大学生平均上网时间的置信区间,置信水平分别为90%
疋二一
先求样本均值:
■'
再求样本标准差:
置信区间公式:
无土玄¥
8从一个正态总体中随机抽取样本量为8的样本,各样本值分别
为:
10,8,12,15,6,13,5,11。
求总体均值卩的95%置信区间解:
本题为一个小样本正态分布未知。
X二—
灣=80—8=10
E(爼-无^
壬一1已
1—1=V84/7=
于是,一的置信水平为1-工的置信区间是
已知^,n二8,贝卩-=二二a/2=,查自由度为n-1=
f«
z—
7的上分布表得临界值'
'
所以,置信区间为:
10±
x^V7
9.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离分别是:
10,3,14,8,
6,9,12,11,7,5,10,15,9,16,13,2。
假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
小样本正态分布,。
未知。
已知,n二16,•丄,则
:
-,a/2=,查自由度为n-1=15的兰分布表得临界值
比=—
样本均值-=150/16二
空(血-刃"
再求样本标准差:
丨旳-1=V15〜
于是,-的置信水平为L的置信区间是
士X"
16
10.从一批零件是随机抽取36个,测得其平均长度是,标准差是。
1)求确定该种零件平均长度的95%勺置信区间。
2)在上面估计中,你使用了统计中的哪一个重要定理请解释。
1)这是一个大样本分布。
已知N=36x=,S=,1-a=,
忑辭==196
o
龙±
2—=
'
・士x—V36
2)中心极限定理论证:
如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量11的增加,样本均
值的分布便趋近正态分布。
在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布则是普遍存在的。
样本均值也是一种随机变量和的分布,因此在样本容量卞充分
大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论基础。
11.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为
100克,现从某天生产的一批产品中按重复抽样随机抽取50包进行
检查,测得每包重量如下:
(略)
已知食品包重服从正态分布,要求:
1)确定该种食品平均重量的95%勺置信区间。
2)如果规定食品重量低于100克属于不合格,确定该批食品合格率的95%勺置信区间。
1)本题为一个大样本正态分布,(T未知。
已知N=5Q卩=100,1-a二,「'
o
1每组组中值分别为97、99、101、103、105,即此50包样本平均值才=(97+99+101+103+105/5=101
2样本标准差为:
=V{(97-101)2X2+(99-101)2X3+
(101-101)
2X34+(103-101)2X7+(105-101)2X4}-(50-1)~
3其置信区间为:
一「101士X"
50
2)v不合格包数(V100克)为2+3=5包,5/50=10%(不合格率),即P=90%。
该批食品合格率的95%置信区间为:
p±
Z
±
xVx^50=±
12.假设总体服从正态分布,利用下面的数据构建总体均值□的
99%勺置信区间。
样本均值
样本标准差:
1-
尽管总体服从正态分布,但是样本n=25是小样本,且总体标
准差未知,应该用T统计量估计。
1-a二,贝Sa=,a/2=,查自由度
为n-1=24的匕分布表得临界值'
■
尸的置信水平为1讥的置信区间是
13.一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工,得到他们每周加班的时间数据如下(单位:
小时):
假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%勺置信区间。
①N二18V30,为小样本正态分布未知
③1-a=90%a二,a/2=,则查自由度为
n-1=17的:
分
布表得临界值亠
④丄』的置信水平为
1壮的置信区间是
14.利用下面的样本数据构建总体比例丌的置信区间
1)n=44,p=,置信水平为99%
2)n=300,p=,置信水平为95%
查标准正态分布
n=1150,p=,置信水平为90%解:
1)1-a=99%,a=,a/2=,1-a/2=,表,则;
2)1-=95%芒谥二细血=1%
3)1-=90%-;
兀v丹分别代入
15.在一项家电市场调查中,随机抽取了200个居民户,调查他们
是否拥有某一品牌的电视机,其中拥有该品牌电视机的家庭占23%
求总体比例的置信区间,置信水平分别为90%和95%
1)置信水平90%1-=90%忑谄N=200,P=23%。
2)置信水平95%1-=95%J^=^=196,N=200,P=
23%代入显Y挖
16.—位银行的管理人员想估计每位顾客在该银行的月平均存款
额。
他假设所有顾客月存款额的标准差为1000元,要求的估计误差
在200元以内,置信水平为99%应选取多大的样本
已知1-a=99%,贝y'
。
E=200=1000元。
贝卩N=(厂卄2X。
2)-E2=(2X10002)-2002〜167
(得数应该是,不管小数后是多少,都向上进位取整,因此至少是
167人)
17.要估计总体比例丌,计算下列条件下所需的样本量。
1)E二,丌二,置信水平96%
2)E二,丌未知,置信水平95%
3)E二,丌二,置信水平90%
1)已知1-a=96%,a/2=,贝y
N={◎2XX(1-丌)—E2=2XX-2疋2547
2)已知1-a=95%,a12=,贝y、
丌未知,则取使丌(1-丌)最大时的。
N=严皿2XX(1-丌)}—E2=2xx-2〜601
3)置信水平90%1-=90%%=,
N=严岬2XK(1-丌)-E2=2XX-2〜270
18.某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取了50户,其中有32户赞同,18户反对。
1)求总体中赞成该项改革的户数比例的置信区间(a=)
2)如果小区管理者预计赞成的比例能达到80%估计误差不超过10%应抽取多少户进行调查(a=)
1)
已知N=5Qp=32/50=,a=,a/2=,贝『厂一
置信区间:
P士P(1-P)/N}=±
Vx50
=士X=士
2)已知丌=,E=,a=,a/2=,贝『匚
N=2丌(1-丌)/E2=2XX-2〜62
19.根据下面的样本结果,计算总体标准差(T的90%的置信区间:
1)=21,S=2,N=50
2)=,S=,N=15
3):
=167,S=31,N=22
1)大样本,。
未知,置信水平90%1-=90%
…厂21士X2750
2
)小样本,。
未知,置信水平90%1-—90%则查自由度
为n-1
=14的二分布表得临界值
入g,'
■=±
X—V15
3)大样本,。
未知,置信水平90%1-=90%-
+玄S二
—7-丁167士X31-V22
20.题目(略)
1)构建第一种排队方式等待时间标准差的95%勺置信区间
2)构建第二种排队方式等待时间标准差的95%勺置信区间
3)根据1)和2)的结果,你认为哪种排队方式更好解:
本题为小样本正态分布,。
未知,应用公式
置信水平95%1-=95%则查自由度为n-1=9的:
分布表
得临界值-
1)■■=,
J3
I岸-1=V0/9=0
其置信区间为士0
4)第二种排队方式更好.
(19题是对总体方差的估计,应该用卡方统计量进行估计,20题是对两个总体参数的估计,这二种类型老师未讲,不是本次考试的内容,不能用Z统计量像估计总体均值和比例那样去估计,具体内容见书上P18P194)
第八章假设检验
1.假设检验和参数估计有什么相同点和不同点解:
参数估计与假设检验是统计推断的两个组成部分。
相同点:
它们都是利用样本对总体进行某种推断。
不同点:
推断的角度不同。
参数估计讨论的是用样本统计量估计总体参数的方法,总体参数□在估计前是未知的。
而在假设检验中,则是先对口的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
2.什么是假设检验中的显著性水平统计显著是什么意思
显著性水平用a表示,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率。
它是由人们根据检验的要求确定的。
(我理解的统计学意义,统计显著是统计上专用的判定标准,指在一定的概率原则下,可以承认一种趋势或者合理性达到的程度,达到为统计上水平显著,达不到为统计上水平不显著)3.什么是假设检验中的两类错误
弃真错误(a错误):
当原假设为真时拒绝原假设,所犯的错误成为第I类错误,又称为弃真错误。
犯第I类错误的概率常记作a。
取伪错误(B错误):
当原假设为假时没有拒绝原假设,所犯的错误称为第II类错误,又称取伪错误。
犯第II类错误概率常记作B。
发生第I类错误的概率也常被用于检验结论的可靠性度量。
假设检验中犯第I类错误的概率被称为显著性水平,记作a。
4.两类错误之间存在什么样的数量关系
在样本容量n—定的情况下,假设检验不能同时做到犯a和B两类错误的概率都很小。
若减小a错误,就会增大犯B错误的机会;
若减小B错误,也会增大犯a错误的机会。
要使a和B同时变小只有增大样本容量。
但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。
因此假设检验需要慎重考虑对两类错误进行控制的问题。
5.解释假设检验中的P值。
如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。
也称为观察到的显著性水平。
P值是反映实际观测到的数据与原假设H之间不一致程度的一个概率值。
P值越小,说明实际观测到的数据与H之间不一致程度就越大。
6.显著性水平与P值有何区别
a(显著性水平)是一个判断的标准(当原假设为真,却被拒绝的概率),而P是实际统计量对应分位点的概率值(当原假设为真时,所得到的样本观察结果或更极端结果出现的概率)。
可以通过a计算置信区间,然后与统计量进行比较判断,也可
以通过统计量计算对应的p值,然后与a值比较判断。
7.假设检验依据的基本原理是什么
假设检验利用的是小概率原理,小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。
根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由
怀疑和拒绝原假设;
否则不能拒绝原假设。
8你认为在单侧检验中原假设和备择假设的方向应该如何确定
假设问题有两种情况,一种是所考察的数值越大越好(左单侧检验或下限检验),临界值和拒绝域均在左侧;
另一种是数值越小越好(右单侧检验或上限检验),临界值和拒绝域均在右侧。
1.已知某炼铁厂的含碳量服从正态分布N(,2),现在测定了9炉铁水,其平均含碳量为。
如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为(a=)
已知卩o=,c2=2,N=9,-=,
这里采用双侧检验,小样本已知,使用Z统计。
假定现在生产的铁水平均含碳量与以前无显著差异。
贝几
a二,a/2=,查表得临界值为'
计算检验统计量:
决策:
•••Z值落入接受域,二在二的显著性水平上接受H
结论:
有证据表明现在生产的铁水平均含碳量与以前没有显著
差异,可以认为现在生产的铁水平均含碳量为
2.—种元件,要求其使用寿命不得低于700小时。
现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。
已知该元件寿命服从正态分布=60小时,试在显著性水平下确定这批元件是否合格。
已知N=36(T=60,匚=680,卩0=700
这里是大样本已知,左侧检验,采用Z统计量计算。
提出假设:
假定使用寿命平均不低于700小时
H):
^>
700
H:
卩<
=,左检验临界值为负,查得临界值:
二计算检验统计量:
=@80-700)/(60/V36)
Z=-2/n
•••Z值落入拒绝域,二在二的显著性水平上拒绝H,接
受H
有证据表明这批灯泡的使用寿命低于700小时,为不合
格产品。
3.某地区小麦的一般生产水平为亩产250公斤,其标准差是30公斤。
现用一种化肥进行试验,从25个小区抽样,平均产量为270公斤。
这种化肥是否使小麦明显增产(a=)
已知卩0=250,c=30,N=25-=270
这里是小样本分布,。
已知,用Z统计量。
右侧检验,a
提出假设:
假定这种化肥没使小麦明显增产
即H):
^<
250
卩〉250
计算统计量:
Z=(匚-卩0)/(°
/VN)=(270-250)/(30/V25)=
Z统计量落入拒绝域,在a=的显著性水平上,拒绝H0,接受H。
有证据表明,这种化肥可以使小麦明显增产。
4.糖厂用自动打包机打包,每包标准重量是100千克。
每天开工后需要检验一次打包机工作是否正常。
某日开工后测得9包重量(单位:
千克)如下:
已知包重服从正态分布,试检验该日打包机工作是否正常。
(a
=)
已知N=9这里是小样本正态分布,0未知,双侧检验,采用t统计量,自由度为N-仁8。
a=,则Ta/2=
."
=
垃二\
提出假设,假设打包机工作正常:
即H):
a=100
Hi:
卩工100
t
结论:
ao
t值落入接受域,
()/(V9)-
•••在二的显著性水平上接受H
计算统计量:
有证据表明这天的打包机工作正常
5.某种大量生产的袋装食品,按规定不得少于250克。
今从一批该食品中任意抽取50袋,发现有6袋低于250克。
若规定不符合标准的比例超过5嘛不得出厂,问该批食品能否出厂(=)
已知N=5QP=6/50=,为大样本,右侧检验,用Z统计量计算。
二,即Z=
H:
丌W5%
Hi:
丌〉5%
zPP0〜N(0,1)
P0(iP0)/
Y=n—/Vx—50)—
(因为没有找到丌表示的公式,这里用P0表示丌0)
因为Z值落入拒绝域,所以在二的显著性水平上,拒绝
H,而接受H。
有证据表明该批食品合格率不符合标准,不能出厂。
6.某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下超
过目前的平均水平25000公里。
对一个由15个轮胎组成的随机样本
做了试验,得到样本均值和标准差分别为27000公里和5000公里
假定轮胎寿命服从正态分布,问该厂家的广告是否真实(=)
N=15,-=27000,s=5000,小样本正态分布未知,用t统
计量计算。
这里是右侧检验,二,自由度N-仁14,即t=
f:
a0<
25000
Hi:
a>
(27000-25000)/(5000-V15)〜
因为t值落入接受域,所以接受H,拒绝Hi
有证据表明,该厂家生产的轮胎在正常行驶条件下使用寿命与目前平均水平25000公里无显著性差异,该厂家广告不真实
7.某种电子元件的寿命x(单位:
小时)服从正态分布。
现测得16只元件的寿命如下:
(略)。
问是否有理由认为元件的平均寿命显著地大于225小时(=)
…二,
由于