ImageVerifierCode 换一换
格式:DOC , 页数:26 ,大小:1.49MB ,
资源ID:13763389      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-13763389.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(抽样技术课后习题-参考答案-金勇进.doc)为本站会员(wj)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

抽样技术课后习题-参考答案-金勇进.doc

1、第二章习题2.1判断下列抽样方法是否是等概的:(1) 总体编号164,在099中产生随机数r,若r=0或r64则舍弃重抽。(2) 总体编号164,在099中产生随机数r,r处以64的余数作为抽中的数,若余数为0则抽中64.(3) 总体2000021000,从11000中产生随机数r。然后用r+19999作为被抽选的数。解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有164是可能被抽中的,故不是等概的。(2)不是等概

2、的【原因】(3)是等概的。2.2抽样理论和数理统计中关于样本均值的定义和性质有哪些不同?解析:抽样理论和数理统计中关于样本均值的定义和性质的不同抽样理论概率统计定义性质1. 期望2. 方差1. 期望2. 方差2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值9.5(千瓦时),206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300, 该市居民用电量的95%置信区间为=4750001.96*41308.19即为(394035.95,555964

3、.05)由相对误差公式10%可得即n862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。解析:由已知得: 又有: 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:代入数据计算得:该区间为0.2843,0.41572.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号文化支出编号 文化支出120011150215

4、0121603170131804150141305160151006130161807140171008100181809110191701024020120估计该小区平均的文化支出,并给出置信水平95%的置信区间。解析:由已知得: 根据表中数据计算得: 该小区平均文化支出的95%置信区间为:即是:132.544 ,156.456故估计该小区平均的文化支出=144.5,置信水平95%的置信区间为132.544 ,156.456。2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到=1120(吨),据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。解析

5、:由题意知:=1120 置信水平95%的置信区间为: 代入数据得:置信水平95%的置信区间为:1079.872,1160.872*3502.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差,是确定简单随机抽样所需的样本量。若预计有效回答率为70%,则样本量最终为多少?解析:简单随机抽样所需的样本量 由题意知: 代入并计算得: 故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为872.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今

6、年的产量,得到,这些企业去年的平均产量为。试估计今年该地区化肥总产量。解析:由题可知,,则,该地区化肥产量均值的比率估计量为 该地区化肥产量总值Y的比率估计量为 所以,今年该地区化肥总产量的估计值为2426吨。2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表:单位:元编号文化支出总支出编号文化支出总支出12002300111501600215017001216017003170200013180200041501500141301400516017001515016006130140016100120071401500171801900810012001810011009

7、1101200191701800101401500201201300全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平95%的置信区间,并比较比估计和简单估计的效率。解析:由题可知 又 故平均文化支出的95%的置信区间为代入数据得(146.3291.96*1.892) 即为142.621,150.0372.10某养牛场购进了120头肉牛,购进时平均体重100千克。现从中抽取10头,记录重量,3个月后再次测量,结果如下:单位:千克编号原重量现重量1951502971553871404120180511017561151857103165810216099215010

8、105170用回归估计法计算120头牛现在的平均重量,计算其方差的估计,并和简单估计的结果进行比较。解:由题可知, 故有 所以总体均值的回归估计量为 其方差估计为: =1.097而 = =19.454显然所以,回归估计的结果要优于简单估第三单元习题答案(仅供参考)1解:(1)不合适(2)不合适(3)合适(4)不合适2将800名同学平均分成8组,在每一组中抽取一名“幸运星”。3根据表中调查数据,经计算,可得下表:h1102560.30330.039111.22867.294.42104200.49760.023825.510710302.53101680.19910.0595203360355.

9、6总计30844116937.2=20.1V()=- =9.7681-0.2962 =9.4719=3.0777(2)置信区间为95%相对误差为10%,则有按比例分配的总量:n=185.4407185=n=56,=92,=37按内曼分配:n=175=33,=99,=434根据调查数据可知:h10.180.920.210.93330.140.940.080.86750.160.93360.220.967=0.924根据各层层权及抽样比的结果,可得()=0.000396981=1.99%估计量的标准差为1.99%,比例为9.24%按比例分配:n=2663=479,=559,=373,=240,=4

10、26,=586内曼分配:n=2565=536,=520,=417,=304,=396,=3925解:由题意,有=75.79购买冷冻食品的平均支出为75.79元又由V()=+又n=V()=53.8086=7.335495%的置信区间为60.63,90.95。7解:(1)对(2)错(3)错(4)错(5)对8解:(1)差错率的估计值=70%+30%=0.027估计的方差v()=3.1967标准差为S()=0.0179。(2)用事后分层的公式计算差错率为=0.03估计的方差为;v()=-=2.57269解:(1)所有可能的样本为:第一层第二层3,50,38,156,93,100,68,256,155,

11、103,615,259,15(2)用分别比估计,有=0.4,=0.65,所以用分别比估计可计算得=6.4。用联合比估计,有=0.5,=0.625,所以用联合比估计可计算得=6.5。第四章习题4.1 邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群10户,现随机抽取4个群,取得资料如下表所示:群各户订报数11,2,1,3,3,2,1,4,1,11921,3,2,2,3,1,4,1,1,22032,1,1,1,1,3,2,1,3,11641,1,3,2,1,5,1,2,3,120试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。解:由题意得到,故(份)(份)

12、(份)于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。4.2 某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:单位总人数赞成人数1514226253349404734551016364831765388493097354106145115851125229136546144937155542(1) 估计该系统同意这一改革人数的比例,并计算估计标准误差。(2) 在调查的基础上对方案作了修改,

13、拟再一次征求意见,要求估计比例的允许误差不超过8%,则应抽取多少个单位做样本?解:题目已知,1)由已知估计同意改革的比例此估计量的标准差为4.3 某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。财务人员欲估计办公费用支出的数额,随机抽取了其中的10个抽屉,经过清点,整理出办公费用的票据,得到下表资料:抽屉编号票据数费用额(,百元)1428322762338454631125729661258724758145893267104180要求以95%的置信度估计该集团办公费用总支出额度置信区间(=0.05)。解:已知N=48, n=10, f=, 由题意得,则办公费用的总支出的估计为(元)

14、群总和均值(元)= 182.43590.4= 72765.44=269.7507则的置信度为95%的置信区间为3532.81.96269.7507,即3004.089,4061.511.4.4 为了便于管理,将某林区划分为386个小区域。现采用简单随机抽样方法,从中抽出20个小区域,测量树的高度,得到如下资料:区域编号数目株数平均高度(尺)区域编号数目株数平均高度(尺)1426.211606.32515.812526.73496.713615.94554.914496.15475.215576.0 6586.916634.97434.317455.38595.218466.79485.7196

15、26.110416.120587.0 估计整个林区树的平均高度及95%的置信区间。解:由已知得,整体的平均高度方差估计值标准方差在置信度95%下,该林区的树木的平均高度的置信区间为4.5 某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女生宿舍200间,每间6人。学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进行访问,两个阶段的抽样都是简单随机抽样,调查结果如下表:样本宿舍拍照人数样本宿舍拍照人数126120703181429151100试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。解:题目已知,在置信度9

16、5%下,p的置信区间为=4.6 上题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的调查,宿舍间的标准差为=326元,宿舍内同学之间的标准差为=188元。以一位同学进行调查来计算,调查每个宿舍的时间为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间为是4小时,如果总时间控制在8小时以内,则最优的样本宿舍和样本学生是多少?解:由已知条件得到以下信息:(元)(元)(分钟)(分钟)(分钟)由此得到,因而取最优的,进一步计算由于总时间的限制,由关系式得到计算方程得到,因而取则最优的样本宿舍数为20间,最优样本学生数为2。4.7 某居委会欲了解居民健身活动情况,如果一直该居

17、委会有500名居民,居住在10个单元中。现先抽取4个单元,然后再样本单元中分别抽出若干居民,两个阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身锻炼的时间结果如下(以10分钟为1个单位):单元居民人数样本量健身锻炼时间13244,2,3,624552,2,4,3,633643,2,5,845464,3,6,2,4,6试估计居民平均每天用于锻炼的时间,并给出估计的标准差。(1) 简单估计量(2) 比率估计量(3) 对两种估计方法及结果进行评价。解:(1)简单估计 = =1650,则, 又,所以分别计算所以,所以标准差(2) 比率估计其中(3)简单估计标准差,比率估计标准差比率估计更好第五章

18、不等概抽样习题答案5.1解: 分析题目可知“代码法”与“拉希里法”都是PPS抽样(放回的与规模大小成比例的不等概抽样)的实施方法,而此题需要用此两种方法进行不放回抽样,故需进一步进行改进:即采用重抽法抽取,如果抽到重复单元,则放弃此样本单元,重新抽取,直到抽到规定的样本量且所有样本党员不重复:(1) 代码法:由=可假设=1000000,则M=M列成数据表为:PSUM累计M代码111011011102185561866611118666362999816651866781665478216159881816661598815752452351261599822351266739833091092

19、351273091097765803856893091103856898389814246703856904246709407724654424246714654421022876488318465443488318113721492039488319492039122497151701049204051701013406545576645170115576641414804572468557665572468155577578045572469578045167078464882957804664882917696357184646488307184641834650753114718465

20、75311419694928226067531158226062036590859296822607859296213385389304985929789304922169599100088930509100082390669190749100099190742421795940869919075940869255918510000549408701000054我们看到抽取的范围比较大,所以我们利用计算机中的随机数表来抽取,第一个随机数为444703, 615432, 791937, 921813 , 738207, 176266, 405706 935470, 916904, 57891按照

21、范围我们可以知道抽取的PSU9, PSU16, PSU19, PSU24, PSU18, PSU2, PSU8 PSU24 PSU23 PSU2,我们看到第2组和24组重复抽取了,故进行重新抽取,抽到4组和6组;综上所述,抽取的样本为2,4,6,8,9,16,18,19,23,24组(2)拉希里法:M=78216,N=25,在1, 25和1, 78216中分别产生(n,m): (13,38678),M=4065438678,入样; (8, 57764),M=3898157764,舍弃,重抽; (23,13365),M=906613365,舍弃,重抽; (19,38734),M=69492387

22、34,入样;以此类推,当得到重复入样情况时,同上重新抽取,得到抽取结果为:2,3,5,6,7,12 ,13,16, 19,24组5.2解:由数据可得:t=20, t,t=38, t=24, t=21; 结合t值数据,我们可以推得Z的值Z=,Z=0.16,Z=0.32,Z=0.2,Z=0.12,由公式样本1,20.2737691,30.2174051,40.2830791,50.2438262,30.1662512,40.2131422,50.2438263,40.6039033,50.535464,50.2438265.3 解:设:=1,则有:,得到下表:i累计代码10.10410410411

23、0420.19219229610529630.13813843429743440.0626249643549650.0525254849754860.14714769554969570.0898978469678480.0383882278582290.05757879823879100.1211211000880100011000先在1,1000中产生第一个随机数为731,再在1,1000里面产生第二个随机数为103,最后在1,1000中产生第三个随机数为982,则它们所对应的第7、1、10号单元被抽中。5.4 解: 利用汉森-赫维茨估计量对总体总值进行估计: =20318.85.5解:由题

24、可知=2+9+3+2+1+6=23 由得下表:i指标值包含概率120.17390.087290.78260.3913330.26090.1304420.17390.087510.0870.0435660.52170.2609由上表显然有1/2,于是我们可以采用布鲁尔方法:经计算可得下表:样本1,20.00681,30.01531,40.00971,50.00461,60.03972,30.16072,40.10462,50.05122,60.36133,40.01533,50.00743,60.0624,50.00464,60.03975,60.0191附注:(2)样本1,20.03401.2

25、6131,30.01330.21741,40.00760.1741,50.00380.13051,60.02270.34792,30.0510.52172,40.0340.47832,50.0170.43482,60.10210.65223,40.01130.21743,50.00570.17393,60.0340.39134,50.00380.13054,60.02270.34795,60.01130.3044验证:另外:代入数据,经计算得到:5.6 解:i11071.432951.83531.6742125422平均63.61.78由题可计算出:(1)i11050101.43294591.8352551.67421022542042 =11.5所以有:=10.0625(2)由定义有:所以得到下表:i15.14825.741.4326.4

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2