ImageVerifierCode 换一换
格式:PPT , 页数:56 ,大小:479.50KB ,
资源ID:16487112      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-16487112.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(SPSS统计分析SPSS数据文件的建立和整理.ppt)为本站会员(wj)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

SPSS统计分析SPSS数据文件的建立和整理.ppt

1、2023/7/14,SPSS数据文件的建立步骤,2023/7/14,一、变量类型与测量尺度变量类型:数值型 和 字符型 数值型:如分数、收入、销售额等 字符型:如血型、性别等 Tips:SPSS默认的是数值型,2023/7/14,变量类型 vs 测量尺度例:“性别”变量:1男,2女“成绩等级”变量:1最高,2中等,3最低Question:“1”在不同变量中意义有何不同?,2023/7/14,测量尺度:数据的测量尺度表现为:定类尺度定序尺度定距尺度定比尺度 计量水平由低级到高级,2023/7/14,一般来说,数据的等级越高,应用范围越广泛,等级越低,应用范围越受限。不同测度级别的数据,应用范围不

2、同。等级高的数据,可以兼有等级低的数据的功能,而等级低的数据,不能兼有等级高的数据的功能。,2023/7/14,二、定义新变量(进入变量编辑窗口),名称:名称长度控制在8位以内,并尽量使用英文名称。类型:宽度:小数:标签:对变量进行解释值:可简化数据录入例:性别 1男 2女缺失:缺失值的处理方法,多用于严格的大型调查列:对齐:测量:变量的测量尺度,2023/7/14,二、定义新变量,练习题:ID城市 北京 广州 上海 深圳 武汉性别 男 女文化程度 大专及以下 大专 本科 硕士研究生 硕士研究生以上职位等级 一般员工 基层管理者 中层管理者 高层管理者企业规模 小型(50人以下)中型(50-2

3、00人)大型(200人以上)企业性质 国企 机关 事业单位 外资 合资年总收入月基本工资1月-12月份加班工资1月-12月奖金,虚拟100人,随机数据的产生(RAND),2023/7/14,Problems:名称:尽可能用英文变量类型:字符 or 数值型,宽度,小数点模拟数据的合理性数据检查无数据 vs 缺失值变量命名必须唯一,不能有两个相同的变量名,SPSS数据文件的建立,1、数据的输入2、数据的检查3、数据整理,SPSS数据文件的建立,1、数据的输入(进入数据编辑的数据窗口data view)在SPSS中直接输入从外部文件导入(1)Excel(.xls):菜单:file open data

4、选择.xls文件类型 直接从excel中copy,paste到spssTips:简单但不智能,如变量名空缺,字符型变量缺失(2)文本文档(.txt)菜单:fileRead text data,2023/7/14,Exercise,1、导入SPSS自带的demo.xls文件,导入时只要包含demo中的前三个变量2、导入SPSS自带的demo.txt文件Tips:C:Program Files SPSS tutorial sample_filesdemo(.xls/.txt),2023/7/14,Problems:名称:尽可能用英文变量类型:字符 or 数值型,宽度,小数点模拟数据的合理性数据检查

5、无数据 vs 缺失值,2023/7/14,三、数据的录入和修改,(进入数据编辑的数据窗口data view)1.在SPSS中直接录入Tips:使用键盘而非鼠标进行操作,2023/7/14,三、数据的录入和修改,2.从外部文件导入(1)Excel(.xls):菜单:file open data选择.xls文件类型直接从excel中copy,paste到spssTips:简单但不智能,如变量名空缺,字符型变量缺失(2)文本文档(.txt)菜单:fileRead text data,2023/7/14,第一步:“你的文本文件和预定义格式是否相一致”,2023/7/14,第二步:“变量如何排列”?“变

6、量名包括在文件最前面么?”,2023/7/14,第三步:“第一条记录从第几行开始”“你的记录是怎样存储在文件中的?”“你想导入多少条记录?”,2023/7/14,第四步:“变量间用的是哪种分隔符?”,2023/7/14,第五步:“定义在数据预览窗口中所选择的变量。”,2023/7/14,第六步:“你愿意保存这次的文件(读入)格式设置以备下次使用吗?”“你是否愿意将以上操作粘贴为SPSS语句?”,2023/7/14,Exercise,1、导入SPSS自带的demo.xls文件,导入时只要包含demo中的前三个变量2、导入SPSS自带的demo.txt文件Tips:C:Program Files

7、SPSS tutorial sample_filesdemo(.xls/.txt),2023/7/14,三、数据的录入和修改,数据必须输入正确才能保证正确的分析结果。但很难一次输入正确,所以就需要进行修改,一般包括数据的插入、删除、修改等。,2023/7/14,三、数据的录入和修改,找到单元格-重新输入数据查找办法:1、移动指针到指定序号的观测值Data Go to Case2、查找指定变量中的指定数据(定位到单元格)Edit+Find(或工具栏上的Find图标按钮),2023/7/14,三、数据的录入和修改,插入一个变量在现存变量的右边:直接在Variable View中定义在现存变量的中间

8、:Data View或Variable View 点击右键“insert variables”菜单:Data Insert VariableTips:所添加的变量都在现存变量前一个位置删除一个变量Data View选中一列数据,右键clearVariable View选中一变量名,右键clear,2023/7/14,三、数据的录入和修改,插入一个观测值在最后:直接输入在中间:Data Insert CasesTips:结果是直接插入一空白行删除一个观测值选中观测量序号,后按Del,或右键clear批量数据调整 选中一列数据,鼠标右键cut,copy,paste Exercise:数据的录入和修

9、改,2023/7/14,数据文件的管理 SPSS的一个重要功能,File,Data,Transform 三大菜单,2023/7/14,数据文件的管理 之File菜单详解,一、新建数据文件(略)二、导入外部数据(重点)三、保存数据文件 Save 保存为同一数据文件 Save as 保存为不同数据文件,或者只保存文件中的部分变量 Example in SPSS,2023/7/14,四、File 菜单中的其他条目Display Data Info系统会在结果窗口中显示所选数据文件的详细情况,包括建立时间、标签设置、变量设置等信息Give Example Cache Data 缓冲区加快处理速度,用于

10、处理远程数据 Print 和 Print view打印和打印预览,2023/7/14,数据文件的管理 之Utilities菜单详解,一、Utilities Variables 菜单项:该菜单项用于显示各个变量的基本信息 注:与FILE菜单中的Display Data Info 有所不同,前者单独显示各个变量的信息,后者显示整个文件的信息Give example二、Utilities File info菜单项:,Thinking:比较File菜单中的display data info与Utilities菜单中的variables以及Display data info 三者功能有何不同?,2023

11、/7/14,数据文件的管理 之Utilities菜单详解,三、UtilitiesDefine Sets:定义变量集用途:当数据文件中涉及到大量的变量,而我们所做的统计分析仅用到文件中的某几个变量时常常需要定义变量集,即将所要用到的变量定义成一个集合。Exercise:定义工资表中的变量集,2023/7/14,数据文件的管理 之Data菜单详解,【Sort Cases对话框】用途:将数据按照某一变量或某几个变量进行排序 Give Example,2023/7/14,数据文件的管理 之Data菜单详解,【Transpose对话框】对数据进行行列转置原文件中的一行数据变为新文件中的一列数据,反之亦然

12、可以在原数据文件中指定一个变量记录转置后的变量名 Give Example:性别为新变量名,将第一季度奖金进行转置,2023/7/14,数据文件的管理 之Data菜单详解,【Merge Files对话框】Add cases 从外部数据文件中增加记录(仅观测值)到当前数据文件中,称为纵向合并两文件需具有相同的变量 Give ExampleAdd variables 从外部数据文件增加变量到当前数据文 件,称为横向合并 Give Example,2023/7/14,Exercise Data,1:以文化程度(升)和职业等级(降)将工资表排序Tips:注意当两个变量的排序相反时,SPSS如何处理?2

13、:以城市类型为新变量名,将工人全年加班费(12个变量)进行行列转置 Tips:注意转换后文件的变量名,2023/7/14,Exercise Data,3:新建一个数据文件,其中含有“城市”和“地区”两个变量,每个变量有10个观测值(数值为随机数),然后将新文件的“城市”变量中所有观测值合并到“工资表”中4:新建一个数据文件,其中含有“id”和“area”两个变量。其中id变量的数值为100110,area变量的数值为随机数。然后以id为key variable将新数据文件中的“area”变量合并到“工资表”中Tips:注意有无key variable的结果差异,2023/7/14,数据文件的管

14、理 之Data菜单详解,【Aggregate对话框】用于对数据进行分类汇总即按指定的分类变量对观测值进行分组,对每组记录的各变量值求指定的描述统计量,结果可以存入新数据文件,也可以替换当前数据文件。,2023/7/14,Break Variables:用于选择分组变量;Aggregate Variables框:用于选择被汇总的变量;Name&Label钮:用于定义新产生的汇总变量的名称和标签Function钮:用于定义汇总函数Save Number of cases in break group as variable复选框:用于定义一个新变量以存储同组的记录数;Create new data

15、 file单选钮:定义一个新文件以存储汇总结果Replace working data file单选钮:用汇总的结果替换原来的数据,2023/7/14,Aggregate对话框提供的函数形式:Give Example:不同城市工人的平均年总收入,求数值概况求特殊值求观测值数求百分比求百分数,2023/7/14,数据文件的管理 之Data菜单详解,【Split File对话框】用于将数据文件分组为进一步处理做准备 Analyze all cases单选框:选中本框不拆分文件;Compare groups单选框:结果紧挨在一起便于相互比较;Organize output by groups单选框:

16、各组分析结果单独放置;Groups based on框:用于选择拆分数据文件的变量;Sort the file by grouping variables单选框:将数据按所用的拆分变量排序;File is already sorted单选框:数据保持原状,不按所用的拆分变量排序。Give Example:根据文化程度对工资表进行拆分,2023/7/14,数据文件的管理 之Data菜单详解,【Select Cases对话框】当不需要分析全部数据,而是按某种要求分析其中的一部分时使用例如:数据库中包括全省所有学生高考语文成绩。由于数据量太大,现在我们想只选取数据库中前5000个学生的成绩进行统计,

17、以得到一个粗略的估计。,2023/7/14,All cases:分析所有的记录;If condition is satisfied:只分析满足条件的记录;Random sample of cases:从原数据中按某种条件抽样;Based on time or case range:基于记录序号来选择记录;Use filter variable:使用筛选指示变量来选择记录,该变量取值为非0的记录将被选中Filtered:未被选中的记录只是被隔离Deleted:未被选中的记录将被删除,一般不要使用。,2023/7/14,Exercise Data,5:计算工资表中不同性别的一月份平均加班费和一月份

18、加班费总值6:只选取观测值中男性的数据,再计算不同性别的一月份加班费总值Tips:注意观察最后的结果与练习4最后的结果有何差异?,2023/7/14,数据文件的管理 之Transform菜单详解,Transform:主要针对数据中变量的变换,如根据已知变量产生一个新的变量Data:主要针对数据库的维护,如数据文件的合并、拆分、汇总等。,2023/7/14,Transform菜单,Compute:计算一个新变量Count:计数,比如60分以下有几人Recode:变量数值重新编码,比如考试分数转为及格或不及格Categorize:归类Rank case:对调查对象进行排序,如对考分进行排名Auto

19、matic recode:自动编码 Create time series:创造时间系列 Replace missing valuve:缺失数据替代(用某一个数字),2023/7/14,1、【Compute对话框】最常用,2023/7/14,Compute菜单中的函数介绍:,1、Arithmetic 函数数学函数Abs(?)返回变量的绝对值Arsin(?)返回变量的反三角函数值Rnd(?)返回数值表达式四舍五入后得到的整数值Trunc(?)返回数值表达式截尾以后得到的整数值,2023/7/14,Compute菜单中的函数介绍:,2、Random numbers随机变量函数 RV.Normal(m

20、ean,stddev)返回来自指定均值和标准离差的正态分布的随机数RV.EXP(shape)返回服从指定参数的指数分布随机数RV.Possion(mean)返回服从指定均值的泊松分布的随机数RV.Uniform(min,max)返回指定最小值和最大值的均匀分布的随机数Eg:如有100个case,想打乱它们的顺序,该如何解决?方法:首先产生一个均匀分布的随机数,然后按随机数进行排序后即可。,2023/7/14,Compute菜单中的函数介绍:,3、统计函数CFVAR(标准离差/均值)MAX/最大值MIN/最小值MEAN/均值SD/标准差SUM/求和VARIANCE/方差,2023/7/14,Co

21、mpute菜单中的函数介绍:,4、日期和时间函数 Eg:Date5、逻辑函数 Eg:ANY 6、字符串函数 Eg:String7、转换函数 converse 主要用于字符型变量与数值型变量的转换,2023/7/14,Demo:1、将“职位等级”由一般员工 基层管理者 中层管理者 高层管理者 这四个等级改变为一般员工 基层管理者 中高层管理者 三个等级2、计算所有工人的第一月总收入,命名为sum_Jan3、计算前五十名工人第一季度的月平均奖金,命名为mean_bon 4、将广州市工人的年总收入值增加10000,2023/7/14,计数用于标示某个值或某些值在某个变量的取值中是否出现。SPSS会自

22、动用数字1来标注满足所需条件的记录。例:如果想知道月基本工资在1000元以下的记录注意:千万注意,Count对话框有一个潜在的bug,当需要计算同时满足两个变量取值条件的记录数有多少时,直接用该对话框会得出完全错误的结果。,2、【Count对话框】,Eg:如果想知道月基本工资在1000元以下的北京工人有哪些记录?,2023/7/14,3、【Recode对话框】,对变量值重新编码可以将新值赋给原变量也可以生成一个新变量。例:将文化程度由原来的5个等级缩减为3个等级,其中大专和大专以下合并为一个,研究生及研究生以上合并为一个(1)由一个新的变量标识(2)直接修改原变量操作:Transform=Re

23、cord=Into Different Variables(Into Same Variables),2023/7/14,4【Categorize Variables】,用于将连续性变量自动按要求分成等间距的几类 非常简单例:将年总收入平均分为5个等级,2023/7/14,5、【Rank Cases对话框】,变量编秩按照某个变量的大小对记录进行排序在非参数统计中,经常要用到秩次选项:Rank Types Ties例:我们如果想知道这次考试中,男生数学成绩的排序和女生数学成绩的排序,就需要根据性别分组计算数学成绩的秩次,2023/7/14,6、【Automatic Recode】,该对话框用于按原变量值的大小生成新变量,变量值就是原值的大小次序功能和Rank Cases对话框重复,2023/7/14,Exercise Transform,计算文化程度在本科以上的北京高层管理者其每月的平均收入和第三季度的平均奖金,分别用变量名Mean_inc和Mean_bon来表示表示出职位等级在基层与中层之间的工人记录北京市工人的性别变量输入错误,原有的1事实上女性,而原有的2事实上是男性,所以需要进行替换计算上海和广州工人的上半年月平均工资,命名为Mean_ShG,并将月平均工资平均分为3个等级,

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2