ImageVerifierCode 换一换
格式:DOCX , 页数:15 ,大小:15.39KB ,
资源ID:8373105      下载积分:8 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-8373105.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(社会统计分析及SAS应用教程真题精选Word文档下载推荐.docx)为本站会员(w****)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

社会统计分析及SAS应用教程真题精选Word文档下载推荐.docx

1、在一般情况下,问卷的基本结构有以下三部分:(1)封面致敬信(2)正文问答题(3)封底指导语或(2)扉页指导语(3)正文问答题上述两种结构形式,可任选其一。填空题 8SAS如何进行数据重新编码?举个年龄的例子,年龄可分为:20岁以下,2040岁,4060岁,60岁以上等年龄组, 重新编码的命令如下:PROC FORMAT;VALUE ageF LOW20=1 2040=2 4060=3 60High=4;FORMAT ageageF.;填空题 9什么是正态分布?它有什么特征?统计学上,一般都是假设被统计的样本是来自正态分布(Normal distribution)的总体。正态分布是关于总体的一种

2、理论分布,是有严格的数学定义的。从正态分布的总体中抽取的样本一般是服从正态分布的。正态分布的重要特征有:(1)均值:均值是观察值的平均值(Mean value)。定距(Interval)以上的变量值的均值才有意义。(2)众数:众数是最经常发生的频数。众数是对定类变量(Nominal)而言的。比如某班有男生25名、女生15名,那么,该班男生的人数是众数。(3)中位数:中位数是对次序(Ordinal)变量值而言的。中位数是比取值的一半大、同时又比取值的一半小的值。或者说,中位数的一半落在均值之上,同时,另一半则落在均值之下。更多试卷请访问睦霖题库中位数的取值方法有两种:单数情况下的观察值的中位数;

3、双数情况下的观察值的中位数。(4)正态分布的均值、众数、中位数重叠:将正态分布的图形沿着中心位置对半折叠时,均值、众数、中位数三者重叠在一起。填空题 10什么是实际的显著性水平?实际的显著性水平是统计分析时得到的概率P值,SAS 6.12以前版本输出标志为Prob,SAS 8.0以后版本输出标志为Pr。如果Pr的值值0.05则拒绝原假设,表明在显著性水平0.05下,检验的结果是显著的。填空题 11SAS至少有哪几条命令语句可以书写汉字标签(汉化)?至少有5条命令可以书写汉字标签:TITLE、LABEL、VALUE、TABLE、KEYLABEL。如:P.ROCFORMAT;VALUESEXF1=

4、男2=女;F.ORMATSEXSEXF.;K.EYLABELN=频率ALL=累计;填空题 12试用TABLE命令进行双变量的交叉汇总分析。设命令为TABLEid1*sex*edc;将产生两个sex*edc的交叉汇总子表。这是因为id1=11,12两个水平值。一种水平数值产生一个子表。填空题 13独立样本T检验的假设检验是什么?独立组样本T检验要求数据符合以下3个条件:(1)观察值之间是独立的。(2)每组观察值是来自正态分布的总体(此点决定了数据必须来自定距以上的变量)。(3)两个独立组的方差相等。H.0:两个子总体的方差相等。H.0:1=2(两个子总体的均值相等)填空题 14变量有哪4种类型?

5、更多试卷请访问睦霖题库(1)标称变量(Nomina lVariable):国内称之为“定类”变量或“名义”变量。(2)次序变量(Ordinal Variable):国内称之为“定序”变量。(3)区间变量(Internal Variable):国内称之为“定距”变量。(4)比例变量(Ratio Variable):国内称之为“定比”变量,其变量值既具有次序变量和区间变量的性质,还存在一个有意义的“零点”。比如甲高2米,乙高1米,甲则是乙的两倍高度。填空题 15试写出计算身高(height)与体重(Weight)的Spearman相关系数。PROC CORR Spearman;VAR Height

6、 Weight;(此句Weight指体重变量)填空题 16Factor(因素分析)过程与PRINCOM(主成分分析)过程有何异同之处?主成分分析是从多变量的样本中提炼出少数几个综合变量(指标)来解释原来较多的变量(指标)。Factor(因素分析)正是采用主成分分析的这个原理。但是Factor(因素分析)又比主成分分析要求更高。Factor(因素分析)不仅要求变量个数最小化,而且要求Factor个数也最小化。填空题 17主要的判别分析法有哪几种?主要的判别分析法有如下3种:(1)一般判别分析法(PROC DISCRIM):不对变量进行筛选。它细分为两种:Normal(参数法),NPAR(非参数法

7、)。(2)典型判别法(Candisc)。(3)回归判别分析法(Regression for Discriminant):对变量进行回归筛选。它细分为3种:Forward法:变量前进法;Backward法:变量退出法;Stepwise法:逐步回归判别法,是两种的先后结合。填空题 18判别分析的原理是什么?判别分析是在获得分组规则的基础上,再把各个观察值(OBS)按此规则分配到对应的组里。例如给文科组和理科组的学生施以英语、政治和体育课教学,然后根据这3门功课的分数就可求出差别规则,以后对新生分组时,均按这种规则,把学生分配到适当的组里。但聚类分析中,事先并不知道组群和组数。更多试卷请访问睦霖题库

8、填空题 19方差分析的假设是什么?方差分析的假设检验旨在排除随机误差的干扰,它和一切假设检验一样,首先假设总体均值没有显著差异,若有差异,则有理由拒绝原假设认为总体中至少有一对(两个)均值不相等。因此:H.0(原假设):1=2=p H.1(备择假设):至少有一对(两个)均值不等。当F的显著性水平理论值0.05时,则有理由拒绝原假设。填空题 20GLM过程有哪些功能?G.LM过程不仅可处理连续形变量的数据,而且可分析非连续形的数据,比如:(1)简单回归(Simple Regression);(2)多元(自变量)回归(MultipleR egression);(3)方差分析(ANOVA):尤其适用

9、于非均衡、非对称的数据的方差分析(Unbalanced DATA);(4)加权回归(Weighted Regression);(5)偏相关(Partial Correlation);(6)复方差分析(MANOVA);(7)多项式回归(Polynomial Regression),或称高次回归;(8)协方差分析。填空题 21哪一个相关系数的值要乘以30倍?计算出的Hoeffding的D统计量应乘以30倍。其D值范围为: 0.5 D 1。当D值为较大的正值时,才表明变量间存在相关。更多内容请访问睦霖题库微信公众号填空题 22什么是配对差值的Wilcoxon秩和检验?应用PROC Univariat

10、e过程可以同时进行配对差值T检验以及配对差值的Wilcoxon秩和检验。PROC Univariate过程见表A.2所示的主要语句。表A.2命令语句更多试卷请访问睦霖题库填空题 23配对样本T检验的假设检验是什么?它只有以下两种假定。(1)每对观察值与其他对观察值互为独立。(2)配对差值来自正态总体。填空题 24试分析图A.1中的卡方分布。H0:sex(性别)与edc(文化程度)互为独立。图A.1卡方检验皮尔逊卡方(Chi-Square)为9.2684,自由度(DF)为4,其概率值(Prob)为0.0547。又0.0547理论值0.05。没有理由拒绝原假设,从总体说sex(性别)与edc(文化

11、程度)互为独立。填空题 25试说命令TABLE id1*sex*edc中3个变量的作用。这3个变量的作用分别是“控制变量*行变量*列变量”。填空题 26什么是SAS的数据集?如何复制数据集?S.AS的数据集是SAS源程序运行之后所生成的目标数据,即SAS系统内部能识别的数据集,它相当于SPSS的*.sav数据。可用SET命令复制SAS数据集。比如:D.ATAone;I.NPUTabc;C.ards;更多试卷请访问睦霖题库数据行D.ATAtwo;/*预先为one的复制品起名为two*/S.etone;/*数据集two是从数据集one中复制的。*/填空题 27什么是“第二类错误(Type erro

12、r)”?本该拒绝原假设H0但未能拒绝。统计学上称之为“第二类错误(Typeerror)”。也称“纳伪的错误“。若能控制好样本量,则能避免第二类错误(Typeerror)。填空题 28什么是“第一类错误(Type error)”?当备择假设不正确却认为正确,这就称为“错误”。统计学上称之为“第一类错误(Type error)”,有人称之为“弃真的错误”。填空题 29理论的显著性水平(值)是什么?有几种水平选择?理论的显著性水平值是检验零假设(H0)的参考概率。值一般有3种取值:0.10、0.05和0.01,分别表示“中等显著”、“显著”、“高度显著”。对于=0.10来说,意味着参考概率为0.10

13、。如果拒绝原假设的后果不是十分严重,建议取=0.10。如果原假设是关系到前人所发现的一种理论,拒绝后其后果十分严重,建议取=0.01(或=0.001)。一般情况下取=0.05。填空题 30经验规则有哪些?如果数据来自服从正态分布的总体,可用下面的经验规则很快地概括出我们的数据。经验规则有:68%的观察值是落在离均值一个标准偏差(1)的范围内。95%的观察值是落在离均值两个标准偏差(2)的范围内。99%的观察值是落在离均值三个标准偏差(3)的范围内。填空题 31在SAS统计分析软件中,均值、标准偏差、方差这三种测量值是什么含义?用以描述数据(变量值)分布的中心位置。定距以上的数据计算均值才有意义

14、。比如,对于一个总体(某省)的人口,其平均值称为总体均值(populationg mean),记为。对于某样本(某县)的人口,其平均人口则称为样本均值更多试卷请访问睦霖题库(sample average),记为。总体均值和样本均值的计算公式是相同的。但是其他测量值不一定相同。此外,还有方差、标准偏差等概念。(2)标准偏差:也称为标准差。表示某人的身高或收入等测量值偏离均值多少。比如甲班语文成绩的标准偏差为20,乙班语文成绩的标准偏差为30,那么,乙班语文成绩比甲班的语文成绩变化(波动)大。(3)方差:标准偏差的平方则是方差。方差表示数据内部的变异性。填空题 32SAS如何创造新变量?创建一个新

15、变量,它等于老变量(在INPUT中已定义的变量)之间的数学运算。可使用的数学运算符及其书写方法见表A.1。例:Z=XY;填空题 33SAS用什么命令定义变量标签?变量标签处于程序的第几行?用LABEL命令定义变量标签。变量标签必须处于程序的DATA行后面。DATA older;LABEL ID1=地区名称 CASEID=观察值编号 EDC=老年人的文化程度 ocu1=退休前的职业;INFILE older.DAT;填空题 34SAS用什么命令调用外部数据文件?用INFILE命令调用外部数据文件。INFILE Older.Dat;(调用当前目录中的Older.Dat数据文件)填空题 35如何定义

16、“一行多个观察值数据的挖掘方法?用符号定义。INPUT EDC ocu1 sal1 ;更多试卷请访问睦霖题库填空题 36有哪几种变量类型?有2种变量类型。变量值是用阿拉伯数字表示时,该变量被称为“数值型”变量(或数字型变量)。变量值若用字母(或字母与数字的混合型)表示时,该变量则称作“字符串型”变量;此时,该变量名的后面必须附加一个美元符号“$”。同一个变量必须赋于同一类型的数据(变量值)。填空题 37什么是利克特的量表法?利克特是美国的一位社会心理学家,在20世纪30年代,他和一些科学家对上述量表中的“是”与“否”(或“赞成”与“不赞成”)两种答案进行了改进,分别增加了“头”、“尾”和“中间

17、”三种答案,例如:“非常不赞成不赞成无所谓赞成非常赞成”;根据这5种回答,然后依次记为:1分2分3分4分5分。某人如果赞成什么事则记为4分,不赞成则记为2分,依此类推。从中可以计算出每人的得分以及群体总分是多少,以此可以判断某人对某事所持的态度。因此,利克特量表也被称为“累加量表”。填空题 38在社会调查和市场调查时为什么要采用量表法?此类调查需要了解消费者对某种商品的认可程度、购物意向,以及对某种商品价格的看法等深层次的问题。如果只是简单地采用“是”与“否”或“好”与“坏”的问法,甚至分为几个阶段,这样做固然可以,但是统计时往往无法预测出内在的结果;而且,遇到政策性较强或带有某种政治色彩的问

18、题时,如果简单而直接地采用“是”与“否”或“好”与“坏”的问法,被访者因出于各种考虑而往往难于道出内心深处的真实看法。因此有必要采用量表法。填空题 39什么是区间(定距)以上的变量?宜用什么样的答案?所谓区间变量,国内俗称定距变量。它的变量值可以测量出一个区间的距离,比如:个人月收入、家庭的人均收入、年龄、身高、体重、分数,以及购买电视机有多少年等。区间(定距)以上的变量宜用开放性的答案。填空题 40封闭式答案必须注意哪些问题?封闭式问题的答案:设计时必须注意到“互斥性”、“穷尽性”。更多试卷请访问睦霖题库填空题 41问卷中的问题有哪几类?(1)填答式:在问题的后面划出一道横线,答案要填在横线

19、上。(2)是非题:在问题的后面列出两种判断(是与否、好与坏、对与错)。(3)多项选一:在一个问题的后面列举出两个以上的答案,供被访者选答其中最符合自己实际情况的一个答案。(4)矩阵式:把问题排成行,而把各种答案排成列。(5)表格式:是上述矩阵式的特殊形式。填空题 42写指导语要注意什么?指导语主要用来告诉填答者如何填好问卷中的答案,比如:(1)问卷中画横线“_”处,请您填入符合自己情况的数字和答案。(2)问卷中的多项选择题,请在符合您自己情况的该项前面的序号上,画一个“”;如:性别:-男2-女(3)如果某些问题比较复杂,则应该逐一在题后用括号加以说明。“(此题有5个答案,请选择最重要的1个)”,“(此题填法与上面相同)”,“(居住面积不包括阳台)”等。总之,问卷中模糊不清的地方一定要加以详细说明。填空题 43致敬信的正文应如何写?正文的内容要中心突出,简明扼要。正文内容要突出保密性。一定要向被访者指明填答的方法。填空题 44社会调查的方法主要有哪些?社会调查的方法有多种,但最主要的有以下几种方法:问卷调查法、文献追踪法、内部资料调研法、访谈调查法、亲自实践法等。

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2