社会统计分析及SAS应用教程真题精选.docx
《社会统计分析及SAS应用教程真题精选.docx》由会员分享,可在线阅读,更多相关《社会统计分析及SAS应用教程真题精选.docx(16页珍藏版)》请在冰点文库上搜索。
社会统计分析及SAS应用教程真题精选
[填空题]1致敬信的内容主要是什么?
参考答案:
致敬信的内容是给被访者看的一封求助信,其内容亲切诚恳与否,直接影响到被访者填表的态度认真与否,因此务必要语气亲切、求贤若渴,让人一看便能责无旁贷地、认真地填答。
因此致敬信应是一封简短亲切的求助信。
[填空题]2问卷设计有何原则?
参考答案:
(1)要便于回答。
(2)要消除被访者的顾虑。
(3)要按定量分析或定性分析分别设计问卷。
(4)根据计算机处理或手工处理分别设计问卷。
(5)根据自填式或他填式分别设计问卷。
[填空题]3问卷中问题的答案有几大类?
参考答案:
问卷中的问题有两大类:
封闭式问题和开放式的问题。
封闭式问题的答案可以由调查单位规定具体的答案。
开放式的问题往往有五花八门的答案,一般难于硬性规定其答案(收入、身高、体重等区间(定距)以上变量除外)。
[填空题]4为什么说区间(定距)以上变量的答案不宜分组?
参考答案:
对区间(定距)以上的变量值分组貌似有理,但是统计分析时就会犯难了。
因为不能真正统计出本批问卷中人均月收入为多少。
错误之处是很明显的:
收入被分组后,原来的区间(定距)以上的数据就成了次序(定序)型数据,而次序型的数据只能计算它们的中位数,计算其平均收入则失去了原有的意义。
[填空题]5什么是观察值OBS?
什么是变量及变量值?
参考答案:
一份问卷或一个被访对象就是一个观察值。
一份问卷中的每一个问题都是变量。
每一个变量所对应的数据(如sex=1或sex=2)就叫做变量值VALUE。
[填空题]6变量值的栏目位置(栏位)有哪几种?
参考答案:
自由格式和固定格式两种。
[填空题]7问卷的基本结构有哪几大部分?
参考答案:
在一般情况下,问卷的基本结构有以下三部分:
(1)封面致敬信
(2)正文问答题
(3)封底指导语或
(1)封面致敬信
(2)扉页指导语
(3)正文问答题上述两种结构形式,可任选其一。
[填空题]8SAS如何进行数据重新编码?
参考答案:
举个年龄的例子,年龄可分为:
①20岁以下,②20~40岁,③40~60岁,④60岁以上等年龄组,重新编码的命令如下:
PROCFORMAT;
VALUEageFLOW-20=’1’20-40=’2’40-60=’3’60-High=’4’;
FORMATage
ageF.;
[填空题]9什么是正态分布?
它有什么特征?
参考答案:
统计学上,一般都是假设被统计的样本是来自正态分布(Normaldistribution)的总体。
正态分布是关于总体的一种理论分布,是有严格的数学定义的。
从正态分布的总体中抽取的样本一般是服从正态分布的。
正态分布的重要特征有:
(1)均值:
均值是观察值的平均值(Meanvalue)。
定距(Interval)以上的变量值的均值才有意义。
(2)众数:
众数是最经常发生的频数。
众数是对定类变量(Nominal)而言的。
比如某班有男生25名、女生15名,那么,该班男生的人数是众数。
(3)中位数:
中位数是对次序(Ordinal)变量值而言的。
中位数是比取值的一半大、同时又比取值的一半小的值。
或者说,中位数的一半落在均值之上,同时,另一半则落在均值之下。
中位数的取值方法有两种:
·单数情况下的观察值的中位数;
·双数情况下的观察值的中位数。
(4)正态分布的均值、众数、中位数重叠:
将正态分布的图形沿着中心位置对半折叠时,均值、众数、中位数三者重叠在一起。
[填空题]10什么是实际的显著性水平?
参考答案:
实际的显著性水平是统计分析时得到的概率P值,SAS
6.12以前版本输出标志为Prob,SAS
8.0以后版本输出标志为Pr。
如果Pr的值<α值
0.05则拒绝原假设,表明在显著性水平
0.05下,检验的结果是显著的。
[填空题]11SAS至少有哪几条命令语句可以书写汉字标签(汉化)?
参考答案:
至少有5条命令可以书写汉字标签:
TITLE、LABEL、VALUE、TABLE、KEYLABEL。
如:
P.ROCFORMAT;VALUESEXF1=’男’2=’女’;
F.ORMATSEXSEXF.;
K.EYLABELN=‘频率’ALL=‘累计’;
[填空题]12试用TABLE命令进行双变量的交叉汇总分析。
参考答案:
设命令为TABLEid1*sex*edc;将产生两个sex*edc的交叉汇总子表。
这是因为id1=11,12两个水平值。
一种水平数值产生一个子表。
[填空题]13独立样本T检验的假设检验是什么?
参考答案:
独立组样本T检验要求数据符合以下3个条件:
(1)观察值之间是独立的。
(2)每组观察值是来自正态分布的总体(此点决定了数据必须来自定距以上的变量)。
(3)两个独立组的方差相等。
H.0:
两个子总体的方差相等。
H.0’:
μ1=μ2(两个子总体的均值相等)
[填空题]14变量有哪4种类型?
参考答案:
(1)标称变量(NominalVariable):
国内称之为“定类”变量或“名义”变量。
(2)次序变量(OrdinalVariable):
国内称之为“定序”变量。
(3)区间变量(InternalVariable):
国内称之为“定距”变量。
(4)比例变量(RatioVariable):
国内称之为“定比”变量,其变量值既具有次序变量和区间变量的性质,还存在一个有意义的“零点”。
比如甲高2米,乙高1米,甲则是乙的两倍高度。
[填空题]15试写出计算身高(height)与体重(Weight)的Spearman相关系数。
参考答案:
PROCCORRSpearman;
VARHeightWeight;
(此句Weight指体重变量)
[填空题]16Factor(因素分析)过程与PRINCOM(主成分分析)过程有何异同之处?
参考答案:
主成分分析是从多变量的样本中提炼出少数几个综合变量(指标)来解释原来较多的变量(指标)。
Factor(因素分析)正是采用主成分分析的这个原理。
但是Factor(因素分析)又比主成分分析要求更高。
Factor(因素分析)不仅要求变量个数最小化,而且要求Factor个数也最小化。
[填空题]17主要的判别分析法有哪几种?
参考答案:
主要的判别分析法有如下3种:
(1)一般判别分析法(PROCDISCRIM):
不对变量进行筛选。
它细分为两种:
①Normal(参数法),②NPAR(非参数法)。
(2)典型判别法(Candisc)。
(3)回归判别分析法(RegressionforDiscriminant):
对变量进行回归筛选。
它细分为3种:
①Forward法:
变量前进法;②Backward法:
变量退出法;③Stepwise法:
逐步回归判别法,是①②两种的先后结合。
[填空题]18判别分析的原理是什么?
参考答案:
判别分析是在获得分组规则的基础上,再把各个观察值(OBS)按此规则分配到对应的组里。
例如给文科组和理科组的学生施以英语、政治和体育课教学,然后根据这3门功课的分数就可求出差别规则,以后对新生分组时,均按这种规则,把学生分配到适当的组里。
但聚类分析中,事先并不知道组群和组数。
[填空题]19方差分析的假设是什么?
参考答案:
方差分析的假设检验旨在排除随机误差的干扰,它和一切假设检验一样,首先假设总体均值没有显著差异,若有差异,则有理由拒绝原假设—认为总体中至少有一对(两个)均值不相等。
因此:
H.0(原假设):
μ1=μ2=…=μp
H.1(备择假设):
至少有一对(两个)均值不等。
当F的显著性水平<α理论值
0.05时,则有理由拒绝原假设。
[填空题]20GLM过程有哪些功能?
参考答案:
G.LM过程不仅可处理连续形变量的数据,而且可分析非连续形的数据,比如:
(1)简单回归(SimpleRegression);
(2)多元(自变量)回归(MultipleRegression);
(3)方差分析(ANOVA):
尤其适用于非均衡、非对称的数据的方差分析(UnbalancedDATA);
(4)加权回归(WeightedRegression);
(5)偏相关(PartialCorrelation);
(6)复方差分析(MANOVA);
(7)多项式回归(PolynomialRegression),或称高次回归;
(8)协方差分析。
[填空题]21哪一个相关系数的值要乘以30倍?
参考答案:
计算出的Hoeffding的D统计量应乘以30倍。
其D值范围为:
-
0.5<D<1。
当D值为较大的正值时,才表明变量间存在相关。
更多内容请访问《睦霖题库》微信公众号
[填空题]22什么是配对差值的Wilcoxon秩和检验?
参考答案:
应用PROCUnivariate过程可以同时进行配对差值T检验以及配对差值的Wilcoxon秩和检验。
PROCUnivariate过程见表
A.2所示的主要语句。
表
A.2命令语句[填空题]23配对样本T检验的假设检验是什么?
参考答案:
它只有以下两种假定。
(1)每对观察值与其他对观察值互为独立。
(2)配对差值来自正态总体。
[填空题]24试分析图
A.1中的卡方分布。
H0:
sex(性别)与edc(文化程度)互为独立。
图
A.1卡方检验
参考答案:
∵皮尔逊卡方(Chi-Square)为
9.2684,自由度(DF)为4,其概率值(Prob)为
0.0547。
又∵
0.0547≥α理论值
0.05。
∴没有理由拒绝原假设,从总体说sex(性别)与edc(文化程度)互为独立。
[填空题]25试说命令TABLEid1*sex*edc中3个变量的作用。
参考答案:
这3个变量的作用分别是“控制变量*行变量*列变量”。
[填空题]26什么是SAS的数据集?
如何复制数据集?
参考答案:
S.AS的数据集是SAS源程序运行之后所生成的目标数据,即SAS系统内部能识别的数据集,它相当于SPSS的*.sav数据。
可用SET命令复制SAS数据集。
比如:
D.ATAone;
I.NPUTabc;
C.ards;数据行
D.ATAtwo;/*预先为one的复制品起名为two*/
S.etone;/*‘数据集two’是从‘数据集one’中复制的。
*/
[填空题]27什么是“第二类错误(TypeⅡerror)”?
参考答案:
本该拒绝原假设H0但未能拒绝。
统计学上称之为“第二类错误(TypeⅡerror)”。
也称“纳伪的错误“。
若能控制好样本量,则能避免第二类错误(TypeⅡerror)。
[填空题]28什么是“第一类错误(TypeⅠerror)”?
参考答案:
当备择假设不正确却认为正确,这就称为“错误”。
统计学上称之为“第一类错误(TypeⅠerror)”,有人称之为“弃真的错误”。
[填空题]29理论的显著性水平(α值)是什么?
有几种水平选择?
参考答案:
理论的显著性水平α值是检验零假设(H0)的参考概率。
α值一般有3种取值:
0.10、0.05和
0.01,分别表示“中等显著”、“显著”、“高度显著”。
对于α=
0.10来说,意味着参考概率为
0.10。
如果拒绝原假设的后果不是十分严重,建议取α=
0.10。
如果原假设是关系到前人所发现的一种理论,拒绝后其后果十分严重,建议取α=
0.01(或α=
0.001)。
一般情况下取α=
0.05。
[填空题]30经验规则有哪些?
参考答案:
如果数据来自服从正态分布的总体,可用下面的经验规则很快地概括出我们的数据。
经验规则有:
·68%的观察值是落在离均值一个标准偏差(1σ)的范围内。
·95%的观察值是落在离均值两个标准偏差(2σ)的范围内。
·99%的观察值是落在离均值三个标准偏差(3σ)的范围内。
[填空题]31在SAS统计分析软件中,均值、标准偏差、方差这三种测量值是什么含义?
参考答案:
(1)均值:
用以描述数据(变量值)分布的中心位置。
定距以上的数据计算均值才有意义。
比如,对于一个总体(某省)的人口,其平均值称为总体均值(populationgmean),记为μ。
对于某样本(某县)的人口,其平均人口则称为样本均值(sampleaverage),记为。
总体均值和样本均值的计算公式是相同的。
但是其他测量值不一定相同。
此外,还有方差、标准偏差等概念。
(2)标准偏差:
也称为标准差。
表示某人的身高或收入等测量值偏离均值多少。
比如甲班语文成绩的标准偏差为20,乙班语文成绩的标准偏差为30,那么,乙班语文成绩比甲班的语文成绩变化(波动)大。
(3)方差:
标准偏差的平方则是方差。
方差表示数据内部的变异性。
[填空题]32SAS如何创造新变量?
参考答案:
创建一个新变量,它等于老变量(在INPUT中已定义的变量)之间的数学运算。
可使用的数学运算符及其书写方法见表
A.1。
例:
Z=X+Y;
[填空题]33SAS用什么命令定义变量标签?
变量标签处于程序的第几行?
参考答案:
用LABEL命令定义变量标签。
变量标签必须处于程序的DATA行后面。
比如:
DATAolder;
LABELID1=’地区名称’CASEID=’观察值编号’EDC=’老年人的文化程度’ocu1=’退休前的职业’;
INFILE’
older.DAT’;
[填空题]34SAS用什么命令调用外部数据文件?
参考答案:
用INFILE命令调用外部数据文件。
比如:
INFILE’
Older.Dat’;
(调用当前目录中的
Older.Dat数据文件)
[填空题]35如何定义“一行多个观察值数据的挖掘方法?
参考答案:
用@符号定义。
比如:
INPUTEDCocu1sal1@@;
[填空题]36有哪几种变量类型?
参考答案:
有2种变量类型。
变量值是用阿拉伯数字表示时,该变量被称为“数值型”变量(或数字型变量)。
变量值若用字母(或字母与数字的混合型)表示时,该变量则称作“字符串型”变量;此时,该变量名的后面必须附加一个美元符号“$”。
同一个变量必须赋于同一类型的数据(变量值)。
[填空题]37什么是利克特的量表法?
参考答案:
利克特是美国的一位社会心理学家,在20世纪30年代,他和一些科学家对上述量表中的“是”与“否”
(或“赞成”与“不赞成”)两种答案进行了改进,分别增加了“头”、“尾”和“中间”三种答案,例如:
“非常不赞成→不赞成→无所谓→赞成→非常赞成”;根据这5种回答,然后依次记为:
1分→2分→3分→4分→5分。
某人如果赞成什么事则记为4分,不赞成则记为2分,依此类推。
从中可以计算出每人的得分以及群体总分是多少,以此可以判断某人对某事所持的态度。
因此,利克特量表也被称为“累加量表”。
[填空题]38在社会调查和市场调查时为什么要采用量表法?
参考答案:
此类调查需要了解消费者对某种商品的认可程度、购物意向,以及对某种商品价格的看法等深层次的问题。
如果只是简单地采用“是”与“否”或“好”与“坏”的问法,甚至分为几个阶段,这样做固然可以,但是统计时往往无法预测出内在的结果;而且,遇到政策性较强或带有某种政治色彩的问题时,如果简单而直接地采用“是”与“否”或“好”与“坏”的问法,被访者因出于各种考虑而往往难于道出内心深处的真实看法。
因此有必要采用量表法。
[填空题]39什么是区间(定距)以上的变量?
宜用什么样的答案?
参考答案:
所谓区间变量,国内俗称定距变量。
它的变量值可以测量出一个区间的距离,比如:
个人月收入、家庭的人均收入、年龄、身高、体重、分数,以及购买电视机有多少年等。
区间(定距)以上的变量宜用开放性的答案。
[填空题]40封闭式答案必须注意哪些问题?
参考答案:
封闭式问题的
答案:
设计时必须注意到“互斥性”、“穷尽性”。
[填空题]41问卷中的问题有哪几类?
参考答案:
(1)填答式:
在问题的后面划出一道横线,答案要填在横线上。
(2)是非题:
在问题的后面列出两种判断(是与否、好与坏、对与错)。
(3)多项选一:
在一个问题的后面列举出两个以上的答案,供被访者选答其中最符合自己实际情况的一个答案。
(4)矩阵式:
把问题排成行,而把各种答案排成列。
(5)表格式:
是上述矩阵式的特殊形式。
[填空题]42写指导语要注意什么?
参考答案:
指导语主要用来告诉填答者如何填好问卷中的答案,比如:
(1)问卷中画横线“_____”处,请您填入符合自己情况的数字和答案。
(2)问卷中的多项选择题,请在符合您自己情况的该项前面的序号上,画一个“○”;如:
性别:
①-男2-女
(3)如果某些问题比较复杂,则应该逐一在题后用括号加以说明。
比如:
“(此题有5个答案,请选择最重要的1个)”,“(此题填法与上面相同)”,“(居住面积不包括阳台)”等。
总之,问卷中模糊不清的地方一定要加以详细说明。
[填空题]43致敬信的正文应如何写?
参考答案:
①正文的内容要中心突出,简明扼要。
②正文内容要突出保密性。
③一定要向被访者指明填答的方法。
[填空题]44社会调查的方法主要有哪些?
参考答案:
社会调查的方法有多种,但最主要的有以下几种方法:
问卷调查法、文献追踪法、内部资料调研法、访谈调查法、亲自实践法等。