社会统计分析及SAS应用教程真题精选.docx

上传人:w**** 文档编号:8894470 上传时间:2023-05-15 格式:DOCX 页数:16 大小:15.35KB
下载 相关 举报
社会统计分析及SAS应用教程真题精选.docx_第1页
第1页 / 共16页
社会统计分析及SAS应用教程真题精选.docx_第2页
第2页 / 共16页
社会统计分析及SAS应用教程真题精选.docx_第3页
第3页 / 共16页
社会统计分析及SAS应用教程真题精选.docx_第4页
第4页 / 共16页
社会统计分析及SAS应用教程真题精选.docx_第5页
第5页 / 共16页
亲,该文档总共16页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

社会统计分析及SAS应用教程真题精选.docx

《社会统计分析及SAS应用教程真题精选.docx》由会员分享,可在线阅读,更多相关《社会统计分析及SAS应用教程真题精选.docx(16页珍藏版)》请在冰点文库上搜索。

社会统计分析及SAS应用教程真题精选.docx

社会统计分析及SAS应用教程真题精选

  [填空题]1致敬信的内容主要是什么?

  参考答案:

致敬信的内容是给被访者看的一封求助信,其内容亲切诚恳与否,直接影响到被访者填表的态度认真与否,因此务必要语气亲切、求贤若渴,让人一看便能责无旁贷地、认真地填答。

因此致敬信应是一封简短亲切的求助信。

  [填空题]2问卷设计有何原则?

  参考答案:

  

(1)要便于回答。

  

(2)要消除被访者的顾虑。

  (3)要按定量分析或定性分析分别设计问卷。

  (4)根据计算机处理或手工处理分别设计问卷。

  (5)根据自填式或他填式分别设计问卷。

  [填空题]3问卷中问题的答案有几大类?

  参考答案:

问卷中的问题有两大类:

封闭式问题和开放式的问题。

封闭式问题的答案可以由调查单位规定具体的答案。

开放式的问题往往有五花八门的答案,一般难于硬性规定其答案(收入、身高、体重等区间(定距)以上变量除外)。

  [填空题]4为什么说区间(定距)以上变量的答案不宜分组?

  参考答案:

对区间(定距)以上的变量值分组貌似有理,但是统计分析时就会犯难了。

因为不能真正统计出本批问卷中人均月收入为多少。

错误之处是很明显的:

收入被分组后,原来的区间(定距)以上的数据就成了次序(定序)型数据,而次序型的数据只能计算它们的中位数,计算其平均收入则失去了原有的意义。

  [填空题]5什么是观察值OBS?

什么是变量及变量值?

  参考答案:

一份问卷或一个被访对象就是一个观察值。

一份问卷中的每一个问题都是变量。

每一个变量所对应的数据(如sex=1或sex=2)就叫做变量值VALUE。

  [填空题]6变量值的栏目位置(栏位)有哪几种?

  参考答案:

自由格式和固定格式两种。

  [填空题]7问卷的基本结构有哪几大部分?

  参考答案:

在一般情况下,问卷的基本结构有以下三部分:

  

(1)封面致敬信

  

(2)正文问答题

  (3)封底指导语或

  

(1)封面致敬信

  

(2)扉页指导语

  (3)正文问答题上述两种结构形式,可任选其一。

  [填空题]8SAS如何进行数据重新编码?

  参考答案:

举个年龄的例子,年龄可分为:

①20岁以下,②20~40岁,③40~60岁,④60岁以上等年龄组,重新编码的命令如下:

  PROCFORMAT;

  VALUEageFLOW-20=’1’20-40=’2’40-60=’3’60-High=’4’;

  FORMATage

  ageF.;

  [填空题]9什么是正态分布?

它有什么特征?

  参考答案:

统计学上,一般都是假设被统计的样本是来自正态分布(Normaldistribution)的总体。

正态分布是关于总体的一种理论分布,是有严格的数学定义的。

  从正态分布的总体中抽取的样本一般是服从正态分布的。

  正态分布的重要特征有:

  

(1)均值:

均值是观察值的平均值(Meanvalue)。

定距(Interval)以上的变量值的均值才有意义。

  

(2)众数:

众数是最经常发生的频数。

众数是对定类变量(Nominal)而言的。

比如某班有男生25名、女生15名,那么,该班男生的人数是众数。

  (3)中位数:

中位数是对次序(Ordinal)变量值而言的。

中位数是比取值的一半大、同时又比取值的一半小的值。

或者说,中位数的一半落在均值之上,同时,另一半则落在均值之下。

中位数的取值方法有两种:

  ·单数情况下的观察值的中位数;

  ·双数情况下的观察值的中位数。

  (4)正态分布的均值、众数、中位数重叠:

将正态分布的图形沿着中心位置对半折叠时,均值、众数、中位数三者重叠在一起。

  [填空题]10什么是实际的显著性水平?

  参考答案:

实际的显著性水平是统计分析时得到的概率P值,SAS

  6.12以前版本输出标志为Prob,SAS

  8.0以后版本输出标志为Pr。

如果Pr的值<α值

  0.05则拒绝原假设,表明在显著性水平

  0.05下,检验的结果是显著的。

  [填空题]11SAS至少有哪几条命令语句可以书写汉字标签(汉化)?

  参考答案:

至少有5条命令可以书写汉字标签:

TITLE、LABEL、VALUE、TABLE、KEYLABEL。

  如:

  P.ROCFORMAT;VALUESEXF1=’男’2=’女’;

  F.ORMATSEXSEXF.;

  K.EYLABELN=‘频率’ALL=‘累计’;

  [填空题]12试用TABLE命令进行双变量的交叉汇总分析。

  参考答案:

设命令为TABLEid1*sex*edc;将产生两个sex*edc的交叉汇总子表。

这是因为id1=11,12两个水平值。

一种水平数值产生一个子表。

  [填空题]13独立样本T检验的假设检验是什么?

  参考答案:

独立组样本T检验要求数据符合以下3个条件:

  

(1)观察值之间是独立的。

  

(2)每组观察值是来自正态分布的总体(此点决定了数据必须来自定距以上的变量)。

  (3)两个独立组的方差相等。

  H.0:

两个子总体的方差相等。

  H.0’:

μ1=μ2(两个子总体的均值相等)

  [填空题]14变量有哪4种类型?

  参考答案:

  

(1)标称变量(NominalVariable):

国内称之为“定类”变量或“名义”变量。

  

(2)次序变量(OrdinalVariable):

国内称之为“定序”变量。

  (3)区间变量(InternalVariable):

国内称之为“定距”变量。

  (4)比例变量(RatioVariable):

国内称之为“定比”变量,其变量值既具有次序变量和区间变量的性质,还存在一个有意义的“零点”。

比如甲高2米,乙高1米,甲则是乙的两倍高度。

  [填空题]15试写出计算身高(height)与体重(Weight)的Spearman相关系数。

  参考答案:

  PROCCORRSpearman;

  VARHeightWeight;

  (此句Weight指体重变量)

  [填空题]16Factor(因素分析)过程与PRINCOM(主成分分析)过程有何异同之处?

  参考答案:

主成分分析是从多变量的样本中提炼出少数几个综合变量(指标)来解释原来较多的变量(指标)。

Factor(因素分析)正是采用主成分分析的这个原理。

但是Factor(因素分析)又比主成分分析要求更高。

Factor(因素分析)不仅要求变量个数最小化,而且要求Factor个数也最小化。

  [填空题]17主要的判别分析法有哪几种?

  参考答案:

主要的判别分析法有如下3种:

  

(1)一般判别分析法(PROCDISCRIM):

不对变量进行筛选。

它细分为两种:

①Normal(参数法),②NPAR(非参数法)。

  

(2)典型判别法(Candisc)。

  (3)回归判别分析法(RegressionforDiscriminant):

对变量进行回归筛选。

它细分为3种:

①Forward法:

变量前进法;②Backward法:

变量退出法;③Stepwise法:

逐步回归判别法,是①②两种的先后结合。

  [填空题]18判别分析的原理是什么?

  参考答案:

判别分析是在获得分组规则的基础上,再把各个观察值(OBS)按此规则分配到对应的组里。

例如给文科组和理科组的学生施以英语、政治和体育课教学,然后根据这3门功课的分数就可求出差别规则,以后对新生分组时,均按这种规则,把学生分配到适当的组里。

但聚类分析中,事先并不知道组群和组数。

  [填空题]19方差分析的假设是什么?

  参考答案:

方差分析的假设检验旨在排除随机误差的干扰,它和一切假设检验一样,首先假设总体均值没有显著差异,若有差异,则有理由拒绝原假设—认为总体中至少有一对(两个)均值不相等。

因此:

  H.0(原假设):

μ1=μ2=…=μp

  H.1(备择假设):

至少有一对(两个)均值不等。

  当F的显著性水平<α理论值

  0.05时,则有理由拒绝原假设。

  [填空题]20GLM过程有哪些功能?

  参考答案:

  G.LM过程不仅可处理连续形变量的数据,而且可分析非连续形的数据,比如:

  

(1)简单回归(SimpleRegression);

  

(2)多元(自变量)回归(MultipleRegression);

  (3)方差分析(ANOVA):

尤其适用于非均衡、非对称的数据的方差分析(UnbalancedDATA);

  (4)加权回归(WeightedRegression);

  (5)偏相关(PartialCorrelation);

  (6)复方差分析(MANOVA);

  (7)多项式回归(PolynomialRegression),或称高次回归;

  (8)协方差分析。

  [填空题]21哪一个相关系数的值要乘以30倍?

  参考答案:

计算出的Hoeffding的D统计量应乘以30倍。

其D值范围为:

  0.5<D<1。

当D值为较大的正值时,才表明变量间存在相关。

  更多内容请访问《睦霖题库》微信公众号

  [填空题]22什么是配对差值的Wilcoxon秩和检验?

  参考答案:

应用PROCUnivariate过程可以同时进行配对差值T检验以及配对差值的Wilcoxon秩和检验。

PROCUnivariate过程见表

  A.2所示的主要语句。

  表

  A.2命令语句[填空题]23配对样本T检验的假设检验是什么?

  参考答案:

它只有以下两种假定。

  

(1)每对观察值与其他对观察值互为独立。

  

(2)配对差值来自正态总体。

  [填空题]24试分析图

  A.1中的卡方分布。

  H0:

sex(性别)与edc(文化程度)互为独立。

  图

  A.1卡方检验

  参考答案:

∵皮尔逊卡方(Chi-Square)为

  9.2684,自由度(DF)为4,其概率值(Prob)为

  0.0547。

  又∵

  0.0547≥α理论值

  0.05。

  ∴没有理由拒绝原假设,从总体说sex(性别)与edc(文化程度)互为独立。

  [填空题]25试说命令TABLEid1*sex*edc中3个变量的作用。

  参考答案:

这3个变量的作用分别是“控制变量*行变量*列变量”。

  [填空题]26什么是SAS的数据集?

如何复制数据集?

  参考答案:

  S.AS的数据集是SAS源程序运行之后所生成的目标数据,即SAS系统内部能识别的数据集,它相当于SPSS的*.sav数据。

可用SET命令复制SAS数据集。

比如:

  D.ATAone;

  I.NPUTabc;

  C.ards;数据行

  D.ATAtwo;/*预先为one的复制品起名为two*/

  S.etone;/*‘数据集two’是从‘数据集one’中复制的。

*/

  [填空题]27什么是“第二类错误(TypeⅡerror)”?

  参考答案:

本该拒绝原假设H0但未能拒绝。

统计学上称之为“第二类错误(TypeⅡerror)”。

也称“纳伪的错误“。

  若能控制好样本量,则能避免第二类错误(TypeⅡerror)。

  [填空题]28什么是“第一类错误(TypeⅠerror)”?

  参考答案:

当备择假设不正确却认为正确,这就称为“错误”。

统计学上称之为“第一类错误(TypeⅠerror)”,有人称之为“弃真的错误”。

  [填空题]29理论的显著性水平(α值)是什么?

有几种水平选择?

  参考答案:

理论的显著性水平α值是检验零假设(H0)的参考概率。

α值一般有3种取值:

0.10、0.05和

  0.01,分别表示“中等显著”、“显著”、“高度显著”。

对于α=

  0.10来说,意味着参考概率为

  0.10。

如果拒绝原假设的后果不是十分严重,建议取α=

  0.10。

如果原假设是关系到前人所发现的一种理论,拒绝后其后果十分严重,建议取α=

  0.01(或α=

  0.001)。

  一般情况下取α=

  0.05。

  [填空题]30经验规则有哪些?

  参考答案:

如果数据来自服从正态分布的总体,可用下面的经验规则很快地概括出我们的数据。

  经验规则有:

  ·68%的观察值是落在离均值一个标准偏差(1σ)的范围内。

  ·95%的观察值是落在离均值两个标准偏差(2σ)的范围内。

  ·99%的观察值是落在离均值三个标准偏差(3σ)的范围内。

  [填空题]31在SAS统计分析软件中,均值、标准偏差、方差这三种测量值是什么含义?

  参考答案:

  

(1)均值:

用以描述数据(变量值)分布的中心位置。

定距以上的数据计算均值才有意义。

  比如,对于一个总体(某省)的人口,其平均值称为总体均值(populationgmean),记为μ。

对于某样本(某县)的人口,其平均人口则称为样本均值(sampleaverage),记为。

  总体均值和样本均值的计算公式是相同的。

但是其他测量值不一定相同。

  此外,还有方差、标准偏差等概念。

  

(2)标准偏差:

也称为标准差。

表示某人的身高或收入等测量值偏离均值多少。

  比如甲班语文成绩的标准偏差为20,乙班语文成绩的标准偏差为30,那么,乙班语文成绩比甲班的语文成绩变化(波动)大。

  (3)方差:

标准偏差的平方则是方差。

方差表示数据内部的变异性。

  [填空题]32SAS如何创造新变量?

  参考答案:

创建一个新变量,它等于老变量(在INPUT中已定义的变量)之间的数学运算。

可使用的数学运算符及其书写方法见表

  A.1。

  例:

Z=X+Y;

  [填空题]33SAS用什么命令定义变量标签?

变量标签处于程序的第几行?

  参考答案:

用LABEL命令定义变量标签。

变量标签必须处于程序的DATA行后面。

比如:

  DATAolder;

  LABELID1=’地区名称’CASEID=’观察值编号’EDC=’老年人的文化程度’ocu1=’退休前的职业’;

  INFILE’

  older.DAT’;

  [填空题]34SAS用什么命令调用外部数据文件?

  参考答案:

用INFILE命令调用外部数据文件。

比如:

  INFILE’

  Older.Dat’;

  (调用当前目录中的

  Older.Dat数据文件)

  [填空题]35如何定义“一行多个观察值数据的挖掘方法?

  参考答案:

用@符号定义。

比如:

INPUTEDCocu1sal1@@;

  [填空题]36有哪几种变量类型?

  参考答案:

有2种变量类型。

变量值是用阿拉伯数字表示时,该变量被称为“数值型”变量(或数字型变量)。

变量值若用字母(或字母与数字的混合型)表示时,该变量则称作“字符串型”变量;此时,该变量名的后面必须附加一个美元符号“$”。

同一个变量必须赋于同一类型的数据(变量值)。

  [填空题]37什么是利克特的量表法?

  参考答案:

利克特是美国的一位社会心理学家,在20世纪30年代,他和一些科学家对上述量表中的“是”与“否”

  (或“赞成”与“不赞成”)两种答案进行了改进,分别增加了“头”、“尾”和“中间”三种答案,例如:

  “非常不赞成→不赞成→无所谓→赞成→非常赞成”;根据这5种回答,然后依次记为:

1分→2分→3分→4分→5分。

  某人如果赞成什么事则记为4分,不赞成则记为2分,依此类推。

从中可以计算出每人的得分以及群体总分是多少,以此可以判断某人对某事所持的态度。

  因此,利克特量表也被称为“累加量表”。

  [填空题]38在社会调查和市场调查时为什么要采用量表法?

  参考答案:

此类调查需要了解消费者对某种商品的认可程度、购物意向,以及对某种商品价格的看法等深层次的问题。

如果只是简单地采用“是”与“否”或“好”与“坏”的问法,甚至分为几个阶段,这样做固然可以,但是统计时往往无法预测出内在的结果;而且,遇到政策性较强或带有某种政治色彩的问题时,如果简单而直接地采用“是”与“否”或“好”与“坏”的问法,被访者因出于各种考虑而往往难于道出内心深处的真实看法。

因此有必要采用量表法。

  [填空题]39什么是区间(定距)以上的变量?

宜用什么样的答案?

  参考答案:

所谓区间变量,国内俗称定距变量。

它的变量值可以测量出一个区间的距离,比如:

个人月收入、家庭的人均收入、年龄、身高、体重、分数,以及购买电视机有多少年等。

区间(定距)以上的变量宜用开放性的答案。

  [填空题]40封闭式答案必须注意哪些问题?

  参考答案:

封闭式问题的

  答案:

设计时必须注意到“互斥性”、“穷尽性”。

  [填空题]41问卷中的问题有哪几类?

  参考答案:

  

(1)填答式:

在问题的后面划出一道横线,答案要填在横线上。

  

(2)是非题:

在问题的后面列出两种判断(是与否、好与坏、对与错)。

  (3)多项选一:

在一个问题的后面列举出两个以上的答案,供被访者选答其中最符合自己实际情况的一个答案。

  (4)矩阵式:

把问题排成行,而把各种答案排成列。

  (5)表格式:

是上述矩阵式的特殊形式。

  [填空题]42写指导语要注意什么?

  参考答案:

指导语主要用来告诉填答者如何填好问卷中的答案,比如:

  

(1)问卷中画横线“_____”处,请您填入符合自己情况的数字和答案。

  

(2)问卷中的多项选择题,请在符合您自己情况的该项前面的序号上,画一个“○”;如:

性别:

①-男2-女

  (3)如果某些问题比较复杂,则应该逐一在题后用括号加以说明。

比如:

  “(此题有5个答案,请选择最重要的1个)”,“(此题填法与上面相同)”,“(居住面积不包括阳台)”等。

  总之,问卷中模糊不清的地方一定要加以详细说明。

  [填空题]43致敬信的正文应如何写?

  参考答案:

①正文的内容要中心突出,简明扼要。

  ②正文内容要突出保密性。

  ③一定要向被访者指明填答的方法。

  [填空题]44社会调查的方法主要有哪些?

  参考答案:

社会调查的方法有多种,但最主要的有以下几种方法:

问卷调查法、文献追踪法、内部资料调研法、访谈调查法、亲自实践法等。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经管营销 > 销售营销

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2