社会统计分析及SAS应用教程真题精选Word文档下载推荐.docx

上传人:w**** 文档编号:8373105 上传时间:2023-05-11 格式:DOCX 页数:15 大小:15.39KB
下载 相关 举报
社会统计分析及SAS应用教程真题精选Word文档下载推荐.docx_第1页
第1页 / 共15页
社会统计分析及SAS应用教程真题精选Word文档下载推荐.docx_第2页
第2页 / 共15页
社会统计分析及SAS应用教程真题精选Word文档下载推荐.docx_第3页
第3页 / 共15页
社会统计分析及SAS应用教程真题精选Word文档下载推荐.docx_第4页
第4页 / 共15页
社会统计分析及SAS应用教程真题精选Word文档下载推荐.docx_第5页
第5页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

社会统计分析及SAS应用教程真题精选Word文档下载推荐.docx

《社会统计分析及SAS应用教程真题精选Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《社会统计分析及SAS应用教程真题精选Word文档下载推荐.docx(15页珍藏版)》请在冰点文库上搜索。

社会统计分析及SAS应用教程真题精选Word文档下载推荐.docx

在一般情况下,问卷的基本结构有以下三部分:

  

(1)封面致敬信

  

(2)正文问答题

  (3)封底指导语或

  

(2)扉页指导语

  (3)正文问答题上述两种结构形式,可任选其一。

  [填空题]8SAS如何进行数据重新编码?

举个年龄的例子,年龄可分为:

①20岁以下,②20~40岁,③40~60岁,④60岁以上等年龄组,重新编码的命令如下:

  PROCFORMAT;

  VALUEageFLOW-20=’1’20-40=’2’40-60=’3’60-High=’4’;

  FORMATage

  ageF.;

  [填空题]9什么是正态分布?

它有什么特征?

统计学上,一般都是假设被统计的样本是来自正态分布(Normaldistribution)的总体。

正态分布是关于总体的一种理论分布,是有严格的数学定义的。

  从正态分布的总体中抽取的样本一般是服从正态分布的。

  正态分布的重要特征有:

  

(1)均值:

均值是观察值的平均值(Meanvalue)。

定距(Interval)以上的变量值的均值才有意义。

  

(2)众数:

众数是最经常发生的频数。

众数是对定类变量(Nominal)而言的。

比如某班有男生25名、女生15名,那么,该班男生的人数是众数。

  (3)中位数:

中位数是对次序(Ordinal)变量值而言的。

中位数是比取值的一半大、同时又比取值的一半小的值。

或者说,中位数的一半落在均值之上,同时,另一半则落在均值之下。

  更多试卷请访问《睦霖题库》中位数的取值方法有两种:

  ·

单数情况下的观察值的中位数;

双数情况下的观察值的中位数。

  (4)正态分布的均值、众数、中位数重叠:

将正态分布的图形沿着中心位置对半折叠时,均值、众数、中位数三者重叠在一起。

  [填空题]10什么是实际的显著性水平?

实际的显著性水平是统计分析时得到的概率P值,SAS6.12以前版本输出标志为Prob,SAS8.0以后版本输出标志为Pr。

如果Pr的值<α值0.05则拒绝原假设,表明在显著性水平0.05下,检验的结果是显著的。

  [填空题]11SAS至少有哪几条命令语句可以书写汉字标签(汉化)?

至少有5条命令可以书写汉字标签:

TITLE、LABEL、VALUE、TABLE、KEYLABEL。

  如:

  P.ROCFORMAT;

VALUESEXF1=’男’2=’女’;

  F.ORMATSEXSEXF.;

  K.EYLABELN=‘频率’ALL=‘累计’;

  [填空题]12试用TABLE命令进行双变量的交叉汇总分析。

设命令为TABLEid1*sex*edc;

将产生两个sex*edc的交叉汇总子表。

这是因为id1=11,12两个水平值。

一种水平数值产生一个子表。

  [填空题]13独立样本T检验的假设检验是什么?

独立组样本T检验要求数据符合以下3个条件:

  

(1)观察值之间是独立的。

  

(2)每组观察值是来自正态分布的总体(此点决定了数据必须来自定距以上的变量)。

  (3)两个独立组的方差相等。

  H.0:

两个子总体的方差相等。

  H.0’:

μ1=μ2(两个子总体的均值相等)

  [填空题]14变量有哪4种类型?

  更多试卷请访问《睦霖题库》

  

(1)标称变量(NominalVariable):

国内称之为“定类”变量或“名义”变量。

  

(2)次序变量(OrdinalVariable):

国内称之为“定序”变量。

  (3)区间变量(InternalVariable):

国内称之为“定距”变量。

  (4)比例变量(RatioVariable):

国内称之为“定比”变量,其变量值既具有次序变量和区间变量的性质,还存在一个有意义的“零点”。

比如甲高2米,乙高1米,甲则是乙的两倍高度。

  [填空题]15试写出计算身高(height)与体重(Weight)的Spearman相关系数。

  PROCCORRSpearman;

  VARHeightWeight;

  (此句Weight指体重变量)

  [填空题]16Factor(因素分析)过程与PRINCOM(主成分分析)过程有何异同之处?

主成分分析是从多变量的样本中提炼出少数几个综合变量(指标)来解释原来较多的变量(指标)。

Factor(因素分析)正是采用主成分分析的这个原理。

但是Factor(因素分析)又比主成分分析要求更高。

Factor(因素分析)不仅要求变量个数最小化,而且要求Factor个数也最小化。

  [填空题]17主要的判别分析法有哪几种?

主要的判别分析法有如下3种:

  

(1)一般判别分析法(PROCDISCRIM):

不对变量进行筛选。

它细分为两种:

①Normal(参数法),②NPAR(非参数法)。

  

(2)典型判别法(Candisc)。

  (3)回归判别分析法(RegressionforDiscriminant):

对变量进行回归筛选。

它细分为3种:

①Forward法:

变量前进法;

②Backward法:

变量退出法;

③Stepwise法:

逐步回归判别法,是①②两种的先后结合。

  [填空题]18判别分析的原理是什么?

判别分析是在获得分组规则的基础上,再把各个观察值(OBS)按此规则分配到对应的组里。

例如给文科组和理科组的学生施以英语、政治和体育课教学,然后根据这3门功课的分数就可求出差别规则,以后对新生分组时,均按这种规则,把学生分配到适当的组里。

但聚类分析中,事先并不知道组群和组数。

  更多试卷请访问《睦霖题库》[填空题]19方差分析的假设是什么?

方差分析的假设检验旨在排除随机误差的干扰,它和一切假设检验一样,首先假设总体均值没有显著差异,若有差异,则有理由拒绝原假设—认为总体中至少有一对(两个)均值不相等。

因此:

  H.0(原假设):

μ1=μ2=…=μpH.1(备择假设):

至少有一对(两个)均值不等。

  当F的显著性水平<

α理论值0.05时,则有理由拒绝原假设。

  [填空题]20GLM过程有哪些功能?

  G.LM过程不仅可处理连续形变量的数据,而且可分析非连续形的数据,比如:

  

(1)简单回归(SimpleRegression);

  

(2)多元(自变量)回归(MultipleRegression);

  (3)方差分析(ANOVA):

尤其适用于非均衡、非对称的数据的方差分析(UnbalancedDATA);

  (4)加权回归(WeightedRegression);

  (5)偏相关(PartialCorrelation);

  (6)复方差分析(MANOVA);

  (7)多项式回归(PolynomialRegression),或称高次回归;

  (8)协方差分析。

  [填空题]21哪一个相关系数的值要乘以30倍?

计算出的Hoeffding的D统计量应乘以30倍。

其D值范围为:

-0.5<D<1。

当D值为较大的正值时,才表明变量间存在相关。

  更多内容请访问《睦霖题库》微信公众号

  [填空题]22什么是配对差值的Wilcoxon秩和检验?

应用PROCUnivariate过程可以同时进行配对差值T检验以及配对差值的Wilcoxon秩和检验。

PROCUnivariate过程见表A.2所示的主要语句。

  表A.2命令语句

  更多试卷请访问《睦霖题库》[填空题]23配对样本T检验的假设检验是什么?

它只有以下两种假定。

  

(1)每对观察值与其他对观察值互为独立。

  

(2)配对差值来自正态总体。

  [填空题]24试分析图A.1中的卡方分布。

  H0:

sex(性别)与edc(文化程度)互为独立。

  图A.1卡方检验

∵皮尔逊卡方(Chi-Square)为9.2684,自由度(DF)为4,其概率值(Prob)为0.0547。

  又∵0.0547≥α理论值0.05。

  ∴没有理由拒绝原假设,从总体说sex(性别)与edc(文化程度)互为独立。

  [填空题]25试说命令TABLEid1*sex*edc中3个变量的作用。

这3个变量的作用分别是“控制变量*行变量*列变量”。

  [填空题]26什么是SAS的数据集?

如何复制数据集?

  S.AS的数据集是SAS源程序运行之后所生成的目标数据,即SAS系统内部能识别的数据集,它相当于SPSS的*.sav数据。

可用SET命令复制SAS数据集。

比如:

  D.ATAone;

  I.NPUTabc;

  C.ards;

  更多试卷请访问《睦霖题库》数据行

  D.ATAtwo;

/*预先为one的复制品起名为two*/

  S.etone;

/*‘数据集two’是从‘数据集one’中复制的。

*/

  [填空题]27什么是“第二类错误(TypeⅡerror)”?

本该拒绝原假设H0但未能拒绝。

统计学上称之为“第二类错误(TypeⅡerror)”。

也称“纳伪的错误“。

  若能控制好样本量,则能避免第二类错误(TypeⅡerror)。

  [填空题]28什么是“第一类错误(TypeⅠerror)”?

当备择假设不正确却认为正确,这就称为“错误”。

统计学上称之为“第一类错误(TypeⅠerror)”,有人称之为“弃真的错误”。

  [填空题]29理论的显著性水平(α值)是什么?

有几种水平选择?

理论的显著性水平α值是检验零假设(H0)的参考概率。

α值一般有3种取值:

0.10、0.05和0.01,分别表示“中等显著”、“显著”、“高度显著”。

对于α=0.10来说,意味着参考概率为0.10。

如果拒绝原假设的后果不是十分严重,建议取α=0.10。

如果原假设是关系到前人所发现的一种理论,拒绝后其后果十分严重,建议取α=0.01(或α=0.001)。

  一般情况下取α=0.05。

  [填空题]30经验规则有哪些?

如果数据来自服从正态分布的总体,可用下面的经验规则很快地概括出我们的数据。

  经验规则有:

68%的观察值是落在离均值一个标准偏差(1σ)的范围内。

95%的观察值是落在离均值两个标准偏差(2σ)的范围内。

99%的观察值是落在离均值三个标准偏差(3σ)的范围内。

  [填空题]31在SAS统计分析软件中,均值、标准偏差、方差这三种测量值是什么含义?

用以描述数据(变量值)分布的中心位置。

定距以上的数据计算均值才有意义。

  比如,对于一个总体(某省)的人口,其平均值称为总体均值(populationgmean),记为μ。

对于某样本(某县)的人口,其平均人口则称为样本均值

  更多试卷请访问《睦霖题库》(sampleaverage),记为。

  总体均值和样本均值的计算公式是相同的。

但是其他测量值不一定相同。

  此外,还有方差、标准偏差等概念。

  

(2)标准偏差:

也称为标准差。

表示某人的身高或收入等测量值偏离均值多少。

  比如甲班语文成绩的标准偏差为20,乙班语文成绩的标准偏差为30,那么,乙班语文成绩比甲班的语文成绩变化(波动)大。

  (3)方差:

标准偏差的平方则是方差。

方差表示数据内部的变异性。

  [填空题]32SAS如何创造新变量?

创建一个新变量,它等于老变量(在INPUT中已定义的变量)之间的数学运算。

可使用的数学运算符及其书写方法见表A.1。

  例:

Z=X+Y;

  [填空题]33SAS用什么命令定义变量标签?

变量标签处于程序的第几行?

用LABEL命令定义变量标签。

变量标签必须处于程序的DATA行后面。

  DATAolder;

  LABELID1=’地区名称’CASEID=’观察值编号’EDC=’老年人的文化程度’ocu1=’退休前的职业’;

  INFILE’older.DAT’;

  [填空题]34SAS用什么命令调用外部数据文件?

用INFILE命令调用外部数据文件。

  INFILE’Older.Dat’;

  (调用当前目录中的

  Older.Dat数据文件)

  [填空题]35如何定义“一行多个观察值数据的挖掘方法?

用@符号定义。

INPUTEDCocu1sal1@@;

  更多试卷请访问《睦霖题库》[填空题]36有哪几种变量类型?

有2种变量类型。

变量值是用阿拉伯数字表示时,该变量被称为“数值型”变量(或数字型变量)。

变量值若用字母(或字母与数字的混合型)表示时,该变量则称作“字符串型”变量;

此时,该变量名的后面必须附加一个美元符号“$”。

同一个变量必须赋于同一类型的数据(变量值)。

  [填空题]37什么是利克特的量表法?

利克特是美国的一位社会心理学家,在20世纪30年代,他和一些科学家对上述量表中的“是”与“否”

  (或“赞成”与“不赞成”)两种答案进行了改进,分别增加了“头”、“尾”和“中间”三种答案,例如:

  “非常不赞成→不赞成→无所谓→赞成→非常赞成”;

根据这5种回答,然后依次记为:

1分→2分→3分→4分→5分。

  某人如果赞成什么事则记为4分,不赞成则记为2分,依此类推。

从中可以计算出每人的得分以及群体总分是多少,以此可以判断某人对某事所持的态度。

  因此,利克特量表也被称为“累加量表”。

  [填空题]38在社会调查和市场调查时为什么要采用量表法?

此类调查需要了解消费者对某种商品的认可程度、购物意向,以及对某种商品价格的看法等深层次的问题。

如果只是简单地采用“是”与“否”或“好”与“坏”的问法,甚至分为几个阶段,这样做固然可以,但是统计时往往无法预测出内在的结果;

而且,遇到政策性较强或带有某种政治色彩的问题时,如果简单而直接地采用“是”与“否”或“好”与“坏”的问法,被访者因出于各种考虑而往往难于道出内心深处的真实看法。

因此有必要采用量表法。

  [填空题]39什么是区间(定距)以上的变量?

宜用什么样的答案?

所谓区间变量,国内俗称定距变量。

它的变量值可以测量出一个区间的距离,比如:

个人月收入、家庭的人均收入、年龄、身高、体重、分数,以及购买电视机有多少年等。

区间(定距)以上的变量宜用开放性的答案。

  [填空题]40封闭式答案必须注意哪些问题?

封闭式问题的

  答案:

设计时必须注意到“互斥性”、“穷尽性”。

  更多试卷请访问《睦霖题库》[填空题]41问卷中的问题有哪几类?

  

(1)填答式:

在问题的后面划出一道横线,答案要填在横线上。

  

(2)是非题:

在问题的后面列出两种判断(是与否、好与坏、对与错)。

  (3)多项选一:

在一个问题的后面列举出两个以上的答案,供被访者选答其中最符合自己实际情况的一个答案。

  (4)矩阵式:

把问题排成行,而把各种答案排成列。

  (5)表格式:

是上述矩阵式的特殊形式。

  [填空题]42写指导语要注意什么?

指导语主要用来告诉填答者如何填好问卷中的答案,比如:

  

(1)问卷中画横线“_____”处,请您填入符合自己情况的数字和答案。

  

(2)问卷中的多项选择题,请在符合您自己情况的该项前面的序号上,画一个“○”;

如:

性别:

①-男2-女

  (3)如果某些问题比较复杂,则应该逐一在题后用括号加以说明。

  “(此题有5个答案,请选择最重要的1个)”,“(此题填法与上面相同)”,“(居住面积不包括阳台)”等。

  总之,问卷中模糊不清的地方一定要加以详细说明。

  [填空题]43致敬信的正文应如何写?

①正文的内容要中心突出,简明扼要。

  ②正文内容要突出保密性。

  ③一定要向被访者指明填答的方法。

  [填空题]44社会调查的方法主要有哪些?

社会调查的方法有多种,但最主要的有以下几种方法:

问卷调查法、文献追踪法、内部资料调研法、访谈调查法、亲自实践法等。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 成人教育 > 成考

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2