春社会统计学期末复习训练1资料.docx

上传人:b****4 文档编号:5880316 上传时间:2023-05-09 格式:DOCX 页数:43 大小:136.57KB
下载 相关 举报
春社会统计学期末复习训练1资料.docx_第1页
第1页 / 共43页
春社会统计学期末复习训练1资料.docx_第2页
第2页 / 共43页
春社会统计学期末复习训练1资料.docx_第3页
第3页 / 共43页
春社会统计学期末复习训练1资料.docx_第4页
第4页 / 共43页
春社会统计学期末复习训练1资料.docx_第5页
第5页 / 共43页
春社会统计学期末复习训练1资料.docx_第6页
第6页 / 共43页
春社会统计学期末复习训练1资料.docx_第7页
第7页 / 共43页
春社会统计学期末复习训练1资料.docx_第8页
第8页 / 共43页
春社会统计学期末复习训练1资料.docx_第9页
第9页 / 共43页
春社会统计学期末复习训练1资料.docx_第10页
第10页 / 共43页
春社会统计学期末复习训练1资料.docx_第11页
第11页 / 共43页
春社会统计学期末复习训练1资料.docx_第12页
第12页 / 共43页
春社会统计学期末复习训练1资料.docx_第13页
第13页 / 共43页
春社会统计学期末复习训练1资料.docx_第14页
第14页 / 共43页
春社会统计学期末复习训练1资料.docx_第15页
第15页 / 共43页
春社会统计学期末复习训练1资料.docx_第16页
第16页 / 共43页
春社会统计学期末复习训练1资料.docx_第17页
第17页 / 共43页
春社会统计学期末复习训练1资料.docx_第18页
第18页 / 共43页
春社会统计学期末复习训练1资料.docx_第19页
第19页 / 共43页
春社会统计学期末复习训练1资料.docx_第20页
第20页 / 共43页
亲,该文档总共43页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

春社会统计学期末复习训练1资料.docx

《春社会统计学期末复习训练1资料.docx》由会员分享,可在线阅读,更多相关《春社会统计学期末复习训练1资料.docx(43页珍藏版)》请在冰点文库上搜索。

春社会统计学期末复习训练1资料.docx

春社会统计学期末复习训练1资料

2012春社会统计学期末复习训练

一、单项选择题(20=2×10)

1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。

此处800人是(A)

A.样本B.总体C.统计量D.变量

2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为(C)

A.频率B.累积频数C.累积频率D.比率

3.离散系数的主要目的是(D)

A.反映一组数据的平均水平B.比较多组数据的平均水平

C.反映一组数据的离散程度D.比较多组数据的离散程度

4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有(B)

A.50%的数据B.68%的数据C.95%的数据D.99%的数据

5.在某市随机抽取10家企业,7月份利润额(单位:

万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为(A)

A.39.19B.28.90C.19.54D.27.95

6.用样本统计量的值直接作为总体参数的估计值,这种方法称为(A)

A.点估计B.区间估计C.有效估计D.无偏估计

7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(

)偏高。

如果要检验该说法是否正确,则假设形式应该为(A)

A.

≥0.1;

<0.1B.

≤0.1;

>0.1

C.

=0.1;

≠0.1D.

>0.1;

≤0.1

8.下面哪一项不是方差分析中的假定(D)

A.每个总体都服从正态分布B.观察值是相互独立的

C.各总体的方差相等D.各总体的方差等于0

9.判断下列哪一个不可能是相关系数(D)

A.-0.9B.0C.0.5D.1.2

10.用于说明回归方程中拟合优度的统计量主要是(D)

A.相关系数B.离散系数C.回归系数D.判定系数

11.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。

这项研究的总体是(A)

A.332.1万户家庭B.3000户家庭

C.332.1户家庭的年均收入D.3000户家庭的年均收入

12.下列变量属于数值型变量的是(A)

A.工资收入B.产品等级C.学生对考试改革的态度D.企业的类型

13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形(A)

A.环形图B.饼图C.直方图D.条形图

14.在频数分布表中,频率是指(C)

A.各组频数与上一组频数之比B.各组频数与下一组频数之比

C.各组频数与总频数之比D.各组频数与最大一组频数之比

15.两个定类变量之间的相关分析可以使用(A)

A.

系数B.

系数C.

系数D.Gamma系数

16.根据一个样本均值求出的90%的置信区间表明(C)

A.总体均值一定落入该区间内

B.总体均值有90%的概率不会落入该区间内

C.总体均值有90%的概率会落入该区间内

D.总体均值有10%的概率会落入该区间内

17.已知某单位职工平均每月工资为3000元,标准差为500元。

如果职工的月收入是正态分布,可以判断月收入在2500元—3500元之间的职工人数大约占总体的(B)

A.95%B.68%C.89%D.90%

18.方差分析的目的是(D)

A.比较不同总体的方差是否相等

B.判断总体是否存在方差

C.分析各样本数据之间是否存在显著差异

D.研究各分类自变量对数值型因变量的影响是否显著

19.对于线性回归,在因变量的总离差平方和中,如果回归平方和所占比例越大,那么两个变量之间(A)

A.相关程度越大B.相关程度越小C.完全相关D.完全不相关

20.正态分布中,

值越小,则(A)

A.离散趋势越小B.离散趋势越大C.曲线越低平D.变量值越分散

21.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为(A)

A.简单随机抽样B.系统抽样C.整群抽样D.分层抽样

22.某地区2001-2010年人口总量(单位:

万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据(D)

A.茎叶图B.环形图C.饼图D.线图

23.如果一组数据中某一个数值的标准分值为-1.5,这表明该数值(D)

A.是平均数的-1.5倍B.比平均数少1.5

C.等于-1.5倍标准差D.比平均数低1.5个标准差

24.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是(A)

A.89B.72C.88D.95

25.某班级学生期末英语考试平均成绩为75分,标准差为10分。

如果已知这个班学生的考试分数服从正态分布,可以判断成绩在65-85之间的学生大约占全班学生的(A)

A.68%B.89%C.90%D.95%

26.已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入的标准差为(A)

A.700B.0.2C.3500D.175000

27.在假设检验中,不拒绝虚无假设意味着(D)

A.虚无假设是肯定正确的B.虚无假设肯定是错误的

C.没有证据证明虚无假设是正确的D.没有证据证明虚无假设是错误的

28.在因变量的总离差平方和中,如果回归平方和所占的比例越大,则两变量之间(A)

A.相关程度越高B.相关程度越低C.完全相关D.没有任何关系

29.从两个总体中各选取了6个观察值,得到组间平方和为234,组内平方和为484,则组间方差和组内方差分别为(C)

A.234,121B.117,121C.234,48.4D.117,81

30.在回归方程中,若回归系数等于0,这表明(B)

A.因变量y对自变量x的影响是不显著的

B.自变量x对因变量y的影响是不显著的

C.因变量y对自变量x的影响是显著的

D.自变量x对因变量y的影响是显著的

31.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。

这种调查方法属于(C)

A.简单随机抽样B.整群抽样C.分层抽样D.系统抽样

32.某企业职工的月收入水平分为以下五组:

1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值近似为(D)

A.3000元

B.3500元

C.2500元

D.3250元

33.对于右偏分布,平均数、中位数和众数之间的关系是(A)

A.平均数>中位数>众数

B.中位数>平均数>众数

C.众数>中位数>平均数

D.众数>平均数>中位数

34.两组数据的平均数不相等,但是标准差相等。

那么(C)

A.平均数小的,离散程度小

B.平均数大的,离散程度大

C.平均数大的,离散程度小

D.两组数据离散程度相同

35.在假设检验中,如果所计算出的P值越小,那么检验的结果(A)

A.越显著

B.越不显著

C.越真实

D.越不真实

36.如果物价与销售量之间的线性相关系数为-0.87,而且二者之间具有统计显著性,那么二者之间存在着(A)

A.高度相关

B.中度相关

C.低度相关

D.极弱相关

37.回归平方和(SSR)反映了y的总变差中(A)

A.由于x与y之间的线性关系引起的y的变化部分

B.除了x对y的现有影响之外的其他因素对y变差的影响

C.由于x与y之间的非线性关系引起的y的变化部分

D.由于x与y之间的函数关系引起的y的变化部分

38.根据一个具体的样本求出的总体均值90%的置信区间(A)

A.以90%的概率包含总体均值

B.绝对包含总体均值

C.10%的可能性包含总体均值

D.绝对不包含总体均值

39.在假设检验中,虚无假设和备择假设(C)

A.都有可能成立

B.都不可能成立

C.有且只有一个成立

D.备择假设一定成立,虚无假设不一定成立

40.在方差分析中,某一水平下样本数据之间的误差称为(A)

A.组内误差

B.组间误差

C.组内平方

D.组间平方

41.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。

这项研究的总体是(A)

A.22000名学生

B.2200名学生

C.22000名学生的每月生活费用

D.2200名学生的每月生活费用

42.从变量分类看,下列变量属于定序变量的是(C)

A.专业

B.性别

C.产品等级

D.收入

43.在频数分布表中,比率是指(D)

A.各组频数与上一组频数之比

B.各组频数与下一组频数之比

C.各组频数与总频数之比

D.不同小组的频数之比

44.某地区2001-2010年人口总量(单位:

万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据(D)

A.茎叶图

B.环形图

C.饼图

D.线图

45.根据一个样本均值求出的90%的置信区间表明(C)

A.总体均值一定落入该区间内

B.总体均值有90%的概率不会落入该区间内

C.总体均值有90%的概率会落入该区间内

D.总体均值有10%的概率会落入该区间内

46.判断下列哪一个不可能是相关系数(C)

A.-0.89

B.0.34

C.1.32

D.0

47.期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。

如果学生的成绩是正太分布,可以判断成绩在72分-88分之间的学生大约占总体的(A)

A.95%

B.68%

C.89%

D.90%

48.正态分布中,

值越小,则(A)

A.离散趋势越小

B.离散趋势越大

C.曲线越低平

D.变量值越分散

49.下面哪一项不是方差分析中的假定(D)

A.每个总体都服从正态分布

B.观察值是相互独立的

C.各总体的方差相等

D.各总体的方差等于0

50.对消费的回归分析中,学历、年龄、户口、性别、收入都是因变量,其中收入的回归系数为0.8,这表明(A)

A.收入每增加1元,消费增加0.8元

B.消费每增加1元,收入增加0.8元

C.收入与消费的相关系数为0.8

D.收入对消费影响的显著性为0.8

51.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为(D)

A.简单随机抽样

B.系统抽样

C.整群抽样

D.分层抽样

52.在频数分布表中,某一小组中数据个数占总数据个数的比例称为(A)

A.频率

B.频数

C.频次

D.频谱

53.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是(D)

A.86

B.77

C.90

D.88

54.经验法则表明,当一组数据正太分布时,在平均数加减2个标准差的范围之内大约有(C)

A.50%的数据

B.68%的数据

C.95%的数据

D.99%的数据

55.残差平方和(SSE)反映了y的总变差中(B)

A.由于x与y之间的线性关系引起的y的变化部分

B.除了x对y的现有影响之外的其他因素对y变差的影响

C.由于x与y之间的非线性关系引起的y的变化部分

D.由于x与y之间的函数关系引起的y的变化部分

56.某项研究中欲分析受教育年限每增长一年,收入如何变化,下列哪种方法最合适(A)

A.回归分析

B.方差分析

C.卡方检验

D.列联表分析

57.用样本统计量的值构造一个置信区间,作为总体参数的估计,这种方法称为(B)

A.点估计

B.区间估计

C.有效估计

D.无偏估计

58.在假设检验中,虚无假设和备择假设(C)

A.都有可能成立

B.都不可能成立

C.有且只有一个成立

D.备择假设一定成立,虚无假设不一定成立

59.方差分析的目的是(D)

A.比较不同总体的方差是否相等

B.判断总体是否存在方差

C.分析各样本数据之间是否存在显著差异

D.研究各分类自变量对数值型因变量的影响是否显著

60.用于说明回归方程中拟合优度的统计量主要是(D)

A.相关系数

B.离散系数

C.回归系数

D.判定系数

61.为了解某地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。

此处5000户是(C)

A.变量

B.总体

C.样本

D.统计量

62.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形(A)

A.环形图

B.饼图

C.直方图

D.条形图

63.如果一组数据中某一个数值的标准分值为1.8,这表明该数值(D)

A.是平均数的1.8倍

B.比平均数多1.8

C.等于标准差的1.8倍

D.比平均数高出1.8个标准差

64.离散系数的主要目的是(D)

A.反映一组数据的平均水平

B.比较多组数据的平均水平

C.反映一组数据的离散程度

D.比较多组数据的离散程度

65.某班级学生期末统计学考试平均成绩为82分,标准差为5分。

如果已知这个班学生的考试分数服从正态分布,可以判断成绩在77-87之间的学生大约占全班学生的(A)

A.68%

B.89%

C.90%

D.95%

66.已知某单位平均月收入标准差为700元,离散系数为0.2,那么他们月收入的均值为(C)

A.700

B.0.2

C.3500

D.140

67.根据一个具体的样本求出的总体均值95%的置信区间(A)

A.以95%的概率包含总体均值

B.5%的可能性包含总体均值

C.绝对包含总体均值

D.绝对不包含总体均值

68.在因变量的总离差平方和中,如果回归平方和所占的比例越小,则自变量和因变量之间(B)

A.相关程度越高

B.相关程度越低

C.完全相关

D.没有任何关系

69.从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,则组间均方和组内均方分别为(A)

A.432,71

B.216,71

C.432,426

D.216,426

70.对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间(B)

A.相关程度越大

B.相关程度越小

C.完全相关

D.完全不相关

71.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。

这种调查方法属于(D)

A.简单随机抽样

B.整群抽样

C.分层抽样

D.系统抽样

72.某班级学生平均每天上网时间可以分为以下六组:

1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为(C)

A.5小时

B.6小时

C.5.5小时

D.6.5小时

73.对于左偏分布,平均数、中位数和众数之间的关系是(C)

A.平均数>中位数>众数

B.中位数>平均数>众数

C.众数>中位数>平均数

D.众数>平均数>中位数

74.一班学生的平均体重均为55千克,二班学生的平均体重为52千克,两个班级学生体重的标准差均为5千克。

那么(B)

A.一班学生体重的离散程度大

B.二班学生体重的离散程度大

C.两个班学生体重的离散程度相同

D.无法判断

75.在假设检验中,如果所计算出的P值越大,那么检验的结果(A)

A.越不显著

B.越显著

C.越不真实

D.越真实

76.如果收入与支出之间的线性相关系数为0.92,而且二者之间具有统计显著性,那么二者之间存在着(A)

A.高度相关

B.中度相关

C.低度相关

D.极弱相关

77.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:

万元)分别为65、23、54、45、39,那么这5家企业12月份利润额均值为(B)

A.39

B.45.2

C.23.5

D.65

78.在假设检验中,不拒绝虚无假设意味着(D)

A.虚无假设是肯定正确的

B.虚无假设肯定是错误的

C.没有证据证明虚无假设是正确的

D.没有证据证明虚无假设是错误的

79.某单位对该厂第一加工车间残品率估计高达13%,而该车间主任认为该比例(

)偏高。

如果要检验该说法是否正确,则假设形式应该为(A)

A.

≥0.13;

<0.13

B.

≤0.13;

>0.13

C.

=0.13;

≠0.13

D.

>0.13;

≤0.13

80.下列哪种情况不适合用方差分析(C)

A.性别对收入的影响

B.专业对收入的影响

C.年龄对收入的影响

D.行业对收入的影响

二、名词解释

1.抽样单位与抽样框P11

答:

一次直接的抽样所使用的基本单位;指一次直接抽样时样本中所有抽样单位的名单。

2.普查与抽样调查P12

答:

普查:

是一种专门的调查,它是为了某种特定的目的而对总体中所有的个体进行的一次全面调查。

抽样调查:

是从总体中选取部分个体组成样本进行调查的一种方式,其目的在于根据样本的调查结果推断总体特征。

3.参数与统计量P127-128

答:

参数:

是研究者想要了解的总体的某种特征值

统计量:

是根据样本数据计算出来的一个量。

4.方差与标准差P95

答:

方差:

是各数值与均值离平方的平均数。

标准差:

是方差的平方根

5.独立样本与配对样本P203;P207

答:

配对样本:

是指一个样本中的数据与另一个样本中的数据相对应的两个样本

独立样本:

是指我们得到的样本总体之间是相互独立的

6.总体与样本P11

总体:

是构成它的所有个体的集合;

样本:

就是从总体中按照一定方式抽取的一部分个体的集合

7.抽样分布P129

答:

是指样本统计量的概率分布,它是在重复选取容量为N的样本时,由每个样本计算出来统计量数值的相对频数分布

8.二维表P152

答:

就是交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。

9.相关系数P170

答:

就是对变量之间相关关系程度和方向的度量。

10.组内均方P218

答:

组成平方和除以自由度就是组内均方

11.普查P12

答:

它是为了某种特定的目的而对总体中所有的个体进行的一次全面调查

12.误差减少比例P158

答:

我们将在预测变量Y的值时,知道变量的X值时所减小的误差(E1-E2)与总误差E1的比值

13.散点图P165

答:

是在坐标系中,用横轴表示自变量X,用纵轴表示因变量Y,而变量组(X,Y)则用坐标系中的点表示,不同的变量组在坐标系中形成不同的散点,由坐标系及坐标系中的散点形成的二维图就是散点图

14.正态分布P103

答:

连续性随机变量中重要的分布是钟形概率分布,就是正态分布。

15.最小二乘法P180

答:

对于变量X和Y的观察值,我们可以用很多直线去描述,但我们需要选用距离各观察值最近的一条直线,用它来描述X和Y之间的关系与实际的误差最小,根据这一思想来确定回归方程中参数的方法。

16.概率抽样P13

答:

就是按照随即原则进行的抽样,总体中每个个体都有一定的,非零的概率入选样本,并且入选样本的概率都是已知的或可以计算的

17.中位数P73

答:

是对中心趋势的一种测量,是将一组数据排序后,处于中间位置的变量值,用Me表示。

18.相关系数P170(同9)

19.区间估计P134

答:

在估计总体参数时给出的不是一个数值,而是一个区间,是根据统计量的抽样分布的特点来进行估计,同时给出总体参数落入这一区间的可能性大小

20.中心极限定理P130

答:

无论总体分布是否服从正态分布,从均值为U,方差为a的平方的总体中抽取变量为n的随机样本,当n充分大时(n>=30),样本均值的抽样分布近似服从均值u,方差为a的平方/n

21.假设检验P140

答:

首先先对总体参数建立一个假设,然后根据样本信息去检验这一假设是否正确。

22.均值P78

答:

是集中趋势最主要的测量值,它是将全部数据进行加总然后除以数据总个数。

23.虚无假设与替换假设P140

答:

我们将需要通过样本信息来推断其正确与否的命题称为虚无假设。

如果虚无假设不成立,我们就拒绝虚无假设,需要在另一个假设中进行选择,这就是替换假设

24.置信水平P135

答:

就是将构造置信区间的步骤重复多次,置信区间包含总体参数真值的次数所占的比例。

25.离散系数P100

答:

是一组数据的标准差与该组数据均值之比,称为变量系数。

26.离散变量与连续变量P10

答:

如果一个变量的变量值是间断的,可以一一列举的,这种变量称为离散变量。

如果一个变量的变量值是连续不断的,可以取无线多个数值的,这种变量称为连续变量。

27.众数P68

答:

是一组数据中出现频数最多的数值,用Mo表示

三、简答题

1.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。

(1)网络供应商的姓名

(2)每月的网络服务费

(3)每月上网时间

(4)上网的主要目的

(5)上周收到的电子邮件数量

(6)每月用于网上购物的金额

(7)上月网上购物的次数

(8)使用的电脑的品牌

(9)上网是否玩游戏

(10)电脑是否带有光盘刻录机

2.调查方法主要包括哪几种?

简要说明各种方法的优缺点。

3.什么是简单一元线性回归分析?

其作用是什么?

4.举例简要说明社会研究过程。

5.按测度水平,变量可分为哪几类?

并举例说明。

6.简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。

7.等距分组和不等距分组有什么区别?

请举例说明。

8.举例说明什么是自变量和因变量,二者之间是什么关系?

9.简要说明卡方的拟合优度检验和独立性检验的含义。

10.条形图和直方图有什么区别?

11

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2