1、二、多选题1.分层抽样又被称为( BC )A. 整群抽样 B. 类型抽样 C. 分类抽样 D. 系统抽样 E. 逆抽样2.在分层随机抽样中,当存在可利用的辅助变量时,为了提高估计精度,可以采用( BCD )A. 分层比估计 B. 联合比估计 C. 分别回归估计 D.联合回归估计 E. 分别简单估计为高房租和低房租的两层。高房租这一层每家拥有的财产被看作是低房租层每家所拥有财产的倍,与第层的均值的平方根成正比。高房租层有4000个住户,低房租层有2000个住户。请问:(1)包含1000个住户的样本应该如何在这两层中分配?(2) 若调查的目的是估计这两层平均每个住户拥有财产的差额,样本应如何分配(
2、假定各层的单位调查费用相等)?2. 一个县内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)的英亩数列在下表中。农场规模(英亩)农场数平均每一农场的玉米面积标准差0404180811201211601612002012403944613913341691131485.416.324.334.542.150.163.88.313.315.119.824.526.035.2总和或均值201026.3-现要抽出一个包含100个农场的样本,目的是估计该县平均每个农场的玉米面积,请问:(1)按比例分配时,各层的样本量为多少?(2)按最优分配时,各层的样本量为多少?(假定各层的单位调查费用相等)(
3、3)分别将比例分配、最优分配的精度与简单随机抽样的精确度比较。3. 设费用函数具有形式,其中及均为已知数,请证明当总费用固定时,为了使达到最小值,必与成比例。并求出下述条件中,一个含量为1000的样本所对应的。层1230.40.34564. 在一个商行内,62%的雇员是熟练的或不熟练的男性,31%是办事的女性,7%是管理人员。从商行内抽取由400人组成的一个样本,目的是估计使用某些娱乐设备的人所占的比例。按照粗略的猜测,这些设备40%到50%是由男性使用的,20%到30%是由女性使用的,5%到10%是由管理人员使用的。 (1)你如何把样本单位分配在这三组人之间? (2)若真正使用者占的比例分别
4、是48%,21%和4%,则估计比例的标准误是多少? (3)n=400的简单随机样本算得的p的标准误是多少?5. 为调查某个高血压发病地区青少年与成年人高血压患病率,对14岁以上的人分四个年龄组进行分层随机抽样,调查结果见下表。求总体高血压患病率P的估计及其标准差的估计。高血压患病率调查数据年龄组层权层样本量1425岁2640岁4160岁61岁以上0.2810.3220.2130.8144006506003500.0830.1740.3100.4640.9170.8260.6900.5366. 设计某一类商店销售额的调查,n=550,三层中的两层有以前调查的资料可用来得到的较好的估计值。第三层是
5、一些新开设的商店和以前调查中没有销售额的商店,因此,的值只好加以猜测。若的实际值是10,当被猜作(a)5, (b) 20时,请分别计算一下由奈曼分配所得的估计量的并请证明在这两种情况下,与真正的最优值相比,方差中按比例的增量稍大于2%。真值估计的(1)(2)0.60.13020107. 调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层抽取10个村作为样本单元,经过调查获得下列数据:村总数样本村养牛头数78914114384984412413470550147628715817010456160255822826211023213917863220149971
6、73425361531 请估计该地区养牛总头数Y及其估计量的相对标准差8. 一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,故采用分层随机抽样。已知下列资料:工人技术人员行政管理人员=132=36=92=25=27=9 若总样本量n=30,试用奈曼分配确定各层的样本量。9. 上题中若实际调查了18个工人、10个技术人员、2个行政人员,其损失的工时数如下:8,24,0,0,16,32,6,0,16,7,4,4,9,5,8,18,2,04,5,0,24,8,12,3,2,1,81,8 试估计总的工时损失数并给出它的置信度为95%的置信区间。10. 某县欲
7、调查某种农作物的产量,由于平原和山区的产量有差别,故拟划分为平原和山区两层采用分层抽样。同时当年产量和去年产量之间有相关关系,故还计划采用比估计方法。已知平原共有120个村,去年总产量为24500(百斤),山区共有180个村,去年总产出为21200(百斤)。现从平原用简单随机抽样抽取6个村,从山区抽取9个村,两年的产量资料列在下表中。试用分别比估计与联合比估计分别估计当年的总产量,给出估计量的标准误,并对上面的两种结果进行比较和分析。平原样本去年产量(百斤)当年产量(百斤)2042101438275256280275300198190山区1371501892001191256010310710
8、01591809011. 一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。N1=132 N2=92N3=27S12=36 S22=25S32=9若样本量n=30,试用你乃曼分配确定各层的样本量。12. 上题中若实际调查了18个工人,10个技术人员,2个行政人员,其中损失的工时数如下:8,24,0,0,16,32,6,0,16,7,4,4,9,5,8,18,2,0试估计总的工时损失数并给出它的置信度为95%的置信区间。13. 在估计比例问题时:(1) 假设P=0.5,W1=W2=0.5,则P1和P2为何值时可以使按比例分配的分层抽样精
9、度可以得益20%(即=0.8)(2) 若P=4%,其中W1=0.05,P1=45%;W2=0.2,P2=5%; W3=0.75, P3=1%.则采用按比例分配的分层抽样比简单随机抽样精度得益有多大?14. 调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层取10个村作为样本单元,经过调查获得下列数据1 2 3 4 5 6 7 8 9 10 43 84 98 0 10 44 0 124 13 050 147 62 87 84 158 170 104 56 160228 262 110 232 139 178 334 0 63 22017 34 25 34 36
10、0 25 7 15 31要求:(1) 估计该地区养牛总头数Y及其估计量的相对标准误差(2) 讨论分层抽样与不分层抽样比较效率有否提高。(3) 若样本量不变采用乃曼分配可以减少方差多少?15. 用下面的工厂分组资料按工人人数分组工厂数目每工厂产值(万元)14950991002492509991000人以上18260431522331057567250500176022508019002500(1) 若欲抽取3000个工厂作样本来估计产值,试比较下列各种分配的效率:(2) 按工厂数多少分配样本;按最优(奈曼)分配。16. 一个样本为1000的简单随机样本,其结果可分为三层,相应的=10.2,12.6,17.1,=10.82(各层相同),=17.66,估计的层权是=0.5,0.3,0.2,已知这些权数有误差,但误差在5%以内,最不好的情况是=0.525,0.285,0.190或=0.475,0.315,0.210,你认为是否需要分层?17. 设费用函数具有形式,其中,(h=1,L)均为已知数。试证明当总的费用固定时,为了使达到最小,18. 假设总体包含大小相等的L个层,且N相对于L和n来说很大。表示简单随机样本均值的方差,表示按比例分配的分层随机抽样时的相应方差。试证明下列两式近似成立: (2) 其中 表示层内的平均方差,即
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2