课程实验指导.docx

上传人:b****3 文档编号:11186513 上传时间:2023-05-29 格式:DOCX 页数:97 大小:154.48KB
下载 相关 举报
课程实验指导.docx_第1页
第1页 / 共97页
课程实验指导.docx_第2页
第2页 / 共97页
课程实验指导.docx_第3页
第3页 / 共97页
课程实验指导.docx_第4页
第4页 / 共97页
课程实验指导.docx_第5页
第5页 / 共97页
课程实验指导.docx_第6页
第6页 / 共97页
课程实验指导.docx_第7页
第7页 / 共97页
课程实验指导.docx_第8页
第8页 / 共97页
课程实验指导.docx_第9页
第9页 / 共97页
课程实验指导.docx_第10页
第10页 / 共97页
课程实验指导.docx_第11页
第11页 / 共97页
课程实验指导.docx_第12页
第12页 / 共97页
课程实验指导.docx_第13页
第13页 / 共97页
课程实验指导.docx_第14页
第14页 / 共97页
课程实验指导.docx_第15页
第15页 / 共97页
课程实验指导.docx_第16页
第16页 / 共97页
课程实验指导.docx_第17页
第17页 / 共97页
课程实验指导.docx_第18页
第18页 / 共97页
课程实验指导.docx_第19页
第19页 / 共97页
课程实验指导.docx_第20页
第20页 / 共97页
亲,该文档总共97页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

课程实验指导.docx

《课程实验指导.docx》由会员分享,可在线阅读,更多相关《课程实验指导.docx(97页珍藏版)》请在冰点文库上搜索。

课程实验指导.docx

课程实验指导

《管理统计软件》

课程实验指导

编著人:

穆广杰

前言

《管理统计软件》是一门实验性很强的课程,通过上机实验使学生能更好地理解课堂所学理论知识,更好地掌握相关的基本理论与方法;同时,锻炼学生的动手能力,提高分析、解决具体问题的能力,从而对统计分析方法的理解和应用能力达到较高水平。

通过独立设计相关程序以及对程序执行结果的分析、整理,培养学生创新思维、处理一般应用问题的能力及实事求是的科学态度。

本实验使用目前国际上数据分析与处理领域的标准分析工具软件TheSASSystem系统。

通过实验,要求学生了解并熟练操作TheSASSystemforWindowsV8系统。

重点掌握SAS系统中各种统计分析方法的应用。

能够熟练的运用的统计分析方法和工具搜集、整理、分析统计数据,能够对分析结果做出正确的解释,并据此导出结论、做出决策

适用专业:

统计学专业及经济管理类其他专业(注“*”为统计学专业实验,其他专业选作)

实验教学的基本要求:

1.实验前按要求做好准备工作,认真学习相关理论内容,完成实验预习报告。

2.认真阅读实验指导书,按实验指导书要求和自己的实验预习报告独立进行实验。

3.上机时要遵守实验室的规章制度,爱护实验设备;

4.对实验分析结果进行认真分析,完成实验报告。

 

实验一数据文件的建立与整理

实验名称:

数据文件的建立与整理

实验目的:

熟练掌握SAS系统永久数据库,数据集的创建、外部数据的编程录入与其他格式数据文件的导入,完成数据文件的数据添加、修改、排序、输出等整理工作。

掌握SAS系统数据文件整理的编程设计与菜单操作。

实验类型:

验证型

实验学时:

4学时

实验原理(知识点):

变量、常量、表达式、DATA步语句、PROC步语句、SORT过程

实验内容与要求:

1用编程和菜单操作两种方法将系统内数据文件夹DST和EXEC,创建为永久数据库。

2创建永久数据库DATA,将数据资料ZL1—ZL6转成永久SAS数据集。

3在数据库DATA中以本班级资料分别建立三个数据集,数据集名分别为CLASS1、CLASS2、CLASS3。

要求数据集CLASS1中包括学号、姓名、籍贯三个变量,数据集CLASS2中包括学号、性别、身高三个变量,数据集CLASS3中包括3门课程的成绩以及3门课程的平均成绩,变量名自定(资料自定、每个数据集的观测数不少于20个),利用菜单操作对数据集CLASS1、CLASS2和CLASS3进行合并,要求每位学生的各种数据一一对应。

4利用编程和菜单操作对所建的三个数据集分别学号(升序)、身高(升序)和平均成绩(降序)进行排序,排序结果分别输出到数据集S_CLASS1、S_CLASSS2、S_CLASS3,并按班级在OUTPUT窗口中输出。

5对由ZL1中的Sheet1和Sheet2生成的永久数据集,编程完成如下工作:

①利用SET语句将两个数据集连接为数据集DATA.ALL01

②利用MERGE语句将两个数据集合并为数据集DATA.ALL02

6对由数据资料ZL5生成的数据集分别用分析员应用和交互式数据分析完成如下工作:

①对数据集中的变量加标签,分别为“SHID—社会福利编号”、“AGE—年龄”、“INCOME—年薪”、“TITLL—职称”。

②在数据集中增加10个观测、数值自定不能为缺失值。

③在数据集中增加1个新变量“TAX”,其取值为:

TAX=0.2×INCOME

④创建数据集DA1的变量子集DA11,其中只包含变量SHID和TAX。

⑤在数据集DA1的观测中选出“TAX>280”的观测输出到数据集DA12中。

相关内容的菜单操作:

一、建立永久库

操作过程为:

在系统主窗口→Explorer窗口→右击(Library)图标→选择“new…”命令。

或者在工具条中点

,在弹出的窗口中的name栏中输入逻辑库名,在Path栏中输入目录路径或点击右侧的“Browse”按钮选择磁盘中的文件夹,选中右侧的“Enableatstartup”使其永久有效,然后点“OK”完成新库名的定义。

二、将外部文件转为SAS数据集

SAS系统中提供了Import菜单界面工具,它可以在图形界面中直观地通过点击鼠标和健入简单信息.完成几种常用格式的数据文件转换为SAS数据集。

Import菜单界面工具包括以下两个工具:

·数据导入界面:

输入‘标准’格式的文件为SAS数据集;

·EFI:

输人用户规定格式的文本文件为5AS数据集。

这里‘标准’格式是指数据导入界面和系统平台接受的格式,包括

·dBase文件和Lotus1,3,4文件;

·MSExcel4,5,7及2000文件;

·MSAccess表格

·以逗号(*.csv),空格或TAB为字段分隔符的文本格式文件。

进入Import菜单,可在SAS主窗口中选:

•FILE→ImportData(I)…

①选中Standarddatasource(标准数据源)复选框;

②点击Standarddatasourcefromthelist下右侧的向下箭头,并在弹出的菜单下选MicrosoftExcel97or2000(*.xls)为源文件;

③点击Next进入下一个选择文件菜单;

④在选择文件菜单点击按钮Browse选择源文件impt001.xls所在的位置和名称或直接在Whereisthefile下的字段键入Excel文件所在的路径和全称;

⑤点击Options,在弹出的选项窗口,选中Columnnameinfirstrow(使第一行为列名),表示使用第一行为变量名;

⑥点击OK进入下一个选择库名和数据集名的菜单;

⑦在Library(库)和Member(成员)中分别键入数据库名和数据集名;

⑧点击Finish(完成)按钮,即完成转换的过程。

三、使用Analyst菜单加工SAS数据集

在菜单中选Solutions→Analysis→Analyst,菜单中选择File→OpenBySASName,然后在弹出的对话框中选择逻辑库、文件名和OK。

打开SAS数据集。

(一)数据的浏览与编辑

在分析员应用中打开数据集表进行操作,分为浏览或编辑方式,在分析员窗口数据表名后的括号中,指明当前打开的数据表的模式,要修改这一模式,其操作如下:

·在菜单中选Edit→Mode→Browse,对打开的数据集只能浏览不能编辑。

·在菜单中选Edit→Mode→ShareEdit,可对打开的数据集实行行封锁进行修改。

·在菜单中选Edit→Mode→Edit,可对打开的数据集实行表封锁进行修改。

许多数据集的加工修改的操作都需要在Edit模式下才可进行。

·对列的操作(变量操作)

在分析员窗口中打开的数据集表中,点击其某一的名称就表示选中了该列(变量)。

将光标置于某一列点击右键就显示可对这一列各种进行操作。

这些操作有:

·Move:

移动该列;

·Hide:

隐去该列;

·Hold:

将该列及其左侧各列在移动中固定;

·Insert在该列右侧插入新的空白的列;

·Sort:

按该列的值对数据集排序;

·Duplicate:

复制该列;

·Delete:

删除该列;

·Label:

切换列名/列标签的显示;

·Properties:

显示和修改该列的属性(可修改变量书,变量标签,输入格式和输出格式)。

·对行的操作(观测操作)

在分析员窗口中将光标置于打开的数据集表的某一行序号并点击右键,就表示选中了该行(观测)。

同时在弹出菜单中也显示了可对这一行进行的各种操作。

它们有:

·Add:

在数据表最后加入新的一行;

·Duplicate:

将该行复制到数据表的最后一行;

·Delete:

删除该行。

·对数据的加工

在分析员窗口菜单的Data栏目下包括了可以对整个数据集进行加工的项目。

其中:

·Filter:

是使用Where语句选取数据集的部分行;

·Sort:

对数据集的行按某一个变量的值进行排序;

·Transform:

由原来变量生成新变量;

·RandomVariates:

生成

新的一列具有特定分布的随机数。

其他是涉及到多个数据表的加工和分析需要的数据表加工。

·生成新的变量

假定在分析员窗口中已经在编辑模式下打开了SAS数据集DST.EX11。

需要建立一个新变量

为此在菜单中选:

1.Data→Transform→Computs

2.在弹出的Computs窗口的左侧的编辑框中键入新建变量的名称EX。

如果需要对新变量的属性进行设置可点击右侧的Attributes(属性)按钮。

3.键入新变量的表达式,先点击(,再在Variables(变量)框中双击VARA,(或点击变量名VARA和向上的箭头。

选择*并在表示框中输入0.8。

然后依次键入如下符号完成计算新变量的表达式:

+VARB*0.2)/VARC。

4.OK

·按变量值分组赋新的值

如果要按变量VARA规定一个新的变量BVARA如下:

则可使用菜单操作如下:

1.Data→Transform→RecodeRanges;

2.由于新的变量是依据变量VARA生成的,所以点击ColumntoRecode框右侧的箭头并选VARA;

3.在Newcolumnname:

后键入新建变量的名称:

BVARA;

4.新建变量是字符型的,故选中单选按钮Character;

5.由于原变量的值分为三组赋值,所以在Numberofgroupstobeformed后的框内键入3;

6.OK

在随后弹出的菜单中,可将分组范围和新变量的取值填入,在键入分组上下现时为了自动实现上一组的上限作为下一组的下限,从小到大输入较为方便。

点击OK即返回分析员主菜单,这时的数据表中又加入一列新的变量BVARA

·生成一列随机数

如果要在数据集中增加一列,在(-2,2)上随机分布的随机数列,则可按如下步骤使用菜单进行操作:

1.Data→RandomVariaties→Normal;

2.在Startingpoint:

后键入-2,在Endingpoint:

后键入2;

3.点击OK。

即返回主菜单,数据表中已生成了新的一列,就是在(-2,2)上随机分布的数列。

(二)数据集操作

·数据集的连接

在分析员菜单系统中,也提供了对数据集进行串接和匹配并接的功能。

例如要对数据集DST.DA和DST.DA2进行连接。

可在分析员的主窗口操作如下:

1.选Data→CombineTables→ConcatenatebyRows

2.在弹出的ConcatenatebyRows(连接)窗口的Tablestoconcatenate(要连接的表)框中,点击OpenSASData,按设定的SAS逻辑库和数据集选中要连接的第一个数据集(或者点击Browse…,从操作系统的目录中选中要连接的第一个数据集)。

类似地,用同样的方法选中要连接的第二个数据集。

若要删除已选入的数据集,可在选中要删除的数据集后点击Remove按键。

对已选入的数据集要改变次序,可选中其中的一个数据集后使用右侧的向上或向下箭头。

3.在concatenationmethods(连接方法)框中选中Append(补充)单选按钮。

4.点击按Variable(变量),在弹出的菜单中选择串接后的数据集要保留的变量。

右侧的框中列举所有保留的变量。

左侧的框列举所有侯选的变量,在左侧框选中的变量点击Keep可使它们移到右侧的框中。

点击Remove可使右侧选中的变量移至左侧的框。

5.OK→OK就显示连接的结果。

如果对数据集DST.DA和DST.DA2进行穿插连接,使连接的结果按SHPX排序,只需将上述操作的第三步改为:

在concatenationmethods(连接方法)框中选中Interleave(穿插)的单选按钮,然后在Interleavevariables(穿插变量)框中的CommonVariables(连接数据集中都存在的变量)下的列表中,选中要排序变量SHPX→InterleaveBY。

其他操作与上面相同。

·数据集的匹配合并

在分析员菜单中,如果要对数据集DST.DA和DST.DA2进行匹配并接。

可操作如下

可在分析员的主窗口操作如下:

1.选Data→CombineTables→MergebyColumns;

2.在弹出的MergeTablebyRows(按列匹配合并)的窗口的中,在Tables(表)1框中,点击箭头按设定的SAS逻辑库和数据集选中要连接的第一个数据集DST.DA1(或者点击Browse…,从操作系统的目录中选中要连接的第一个数据集)。

类似地,用同样的方法选中要连接的第二个数据集。

如果还有更多的表可以点击More…,还会弹出一个窗口继续选择另外的四个表。

3.在Combinedtablewillkeep框中选择匹配合并后的表中要保留那些记录;其中:

·Matchonly:

只保留被合并的每一个表都有的纪录(匹配变量的值);

·Matchestotable1:

只保留第一个表中有的纪录;

·Allrows:

保留匹配合并后的所有记录。

一般选择Allrows的单选按钮。

4.在Mergevariables框中设定合并时匹配的变量。

这一设定是必须的。

在Commonvariables框中已经列出被合并数据集中共有的变量。

可在这个列表中选择一个或多个匹配的变量后再按Mergeby选择的匹配变量就会移至右侧的框。

这个例子中只有SHPX为两个数据集共有的变量,故选SHPX→Mergeby。

5.选Variables,在弹出的菜单中选择在匹配合并后的数据集中要保留的变量。

右侧的框中列举所有保留的变址。

左侧的框列举所有侯选的变量。

对左侧框选中的变量点击Keep可使它们移到右侧的框,点击Remove可使右侧选中的变量移至左侧的框。

这个例子中保留所有的变量。

6.OK→OK就显示合并的结果。

 

实验报告

 

实验报告

实验二描述统计分析与图形操作

实验名称:

描述统计分析与图形操作

实验目的:

熟练掌握SAS系统中描述统计分析中的均值过程、单变量分析过程、准确理解分析结果、掌握系统生成散点图与条形图的编程与操作。

实验类型:

验证型

实验学时:

4学时

实验原理(知识点):

MEANS过程、UNIVARIATE过程GPLOT过程、GCHART过程、茎叶图、盒型图

实验内容与要求:

1已知两个班五门课程的成绩资料(ZL4):

(1)按班计算每位同学5门课的平均成绩。

(2)打印成绩单,对每个班分别按平均成绩从高到低排序输出。

(3)将各班平均成绩在80分以上的同学输出到另一个数据集中,并按班级在OUTPUT窗口中输出。

(4)用单变量过程分析比较两个班的平均成绩分布状态,并写出分析报告。

(5)用编程按班绘制茎叶图、盒型图和正态分布概率图。

2分别用交互式分析和分析员应用对数据集EXEC.COUNTIES的变量EDUC和BUDGET生成茎叶图、盒型图。

(1)是否有极端值,若有,它们表示哪些地区。

(2)在同一坐标系下生成变量BUDGET的三个盒型图,每个州一个。

(3)作变量BUDGET的分布指出其均值,中位数,和极差,分析其是否服从正态分布。

3创建数据集T_DATA资料如下:

ID

X

Y

K1

K2

A

A1

B1

5

10

A

A2

B2

6

12

B

B1

B1

7

14

B

B2

B2

8

16

利用编程和菜单操作两种方法对其按变量ID分组进行转置,要求全部变量均参与转置,并在转置后的数据集内保留全部变量。

4根据ZL5的资料,完成下列工作:

(1)计算各地区年国内生产总值的平均值、偏度、峰度、方差;

(2)对各地区国内生产总值进行统计检验,显示频数分布。

(3)用编程和菜单操作输出各年的发展指数。

(4)用编程和菜单操作分别输出国内生产总值高于全国平均水平省份。

5对练习一中的数据集da1和da2,按变量SHID进行匹配合并生成数据集DST.INCOMES,完成下列工作:

(1)以AGE为纵坐标,INCOME为横坐标作散点图,要求打印点变量为SEX。

(2)以AGE为纵坐标,INCOME为横坐标,以SEX分组作散点图,要求输出图形坐标刻度相同。

(3)以TITL为作图变量,SEX为分组变量作条形图。

(4)以TITL为作图变量,SEX为细分变量作条形图。

(5)以AGE为作图变量,调整各组中心值从30到60间距10。

6计算资料ZL6中各省市国内生产总值年平均数、各年平均增长速度。

对年平均增长速度降序排列,并对平均增长速度大于10%的省市输出。

相关内容的菜单操作:

一、InteractiveDataAnalysis(交互式数据分析)

InteractiveDataAnalysis(交互式数据分析)是SAS系统中一个常用的菜单分析过程,其输出界面美观、交互性强但能完成的分析过程较少。

1.在系统主界面中选择Solutions→Analysis→InteractiveDataAnalysis,进入交互式数据分析窗口SAS/INSIGHT;

2.在SAS/INSIGHT窗口中选择数据库及数据集,本例中选择永久数据库DST中的数据集BCLASS;

3.选择Analyze→Distribution(数据分布);

4.在Distribution(数据分布)窗口中选中分析变量HEIGHT

5.选择OUTPUT选择项,在弹出窗口中选择需要的分析内容及统计量;

6.选择OK。

Analyze的其他下拉菜单的操作与Distribution(数据分布)类似,各菜单的功能如下:

·Histogram/BarChart(Y)→绘制直方图及条形图;

·BoxPlot/MosaicPlot(Y)→绘制盒形图及马赛克图

·LinePlot(YX)→绘制折线图

·ScatterPlot(YX)→绘制散点图

·ContourPlot(ZYX)→绘制三维曲面图

·RotatingPlot(YX)→绘制三维旋转图

·Fit(YX)→拟和分析模型

·Multivariate(YX)→多元分析模型

二、Analyst(分析员应用)

Analyst(分析员应用)是SAS系统中一个重要的菜单分析过程,可以完成绝大部分数据分析过程,功能十分强大。

·Analyst(分析员应用)的均值过程

1.在系统主界面中选择Solutions→Analysis→Analyst,进入SAS/Analyst窗口;

2.选择File→OpenBySASName,打开已有的SAS数据集;

3.选择Statistics(统计)→Descriptive(描述)→SummaryStatistics(概括统计);

4.在弹出窗口中选择分析变量HEIGHT→Analysis栏;Class栏填入分类变量(本例没有选择);

5.选择Statistics键,在弹出窗口中选择需要输出的统计分析量;

6.选择Plot键,在弹出窗口中选择需要输出的分析图形(盒形图与直方图);

7.选择Variables键,在弹出窗口中选择分组变量(ByGroup)、权重变量(Weight)或权数变量(Freq),本例未作选择;

8.选择OK。

·Analyst(分析员应用)的单变量过程

1.在系统主界面中选择Solutions→Analysis→Analyst,进入SAS/Analyst窗口(分析员应用);

2.选择File→OpenBySASName,打开已有的SAS数据集;

3.选择Statistics(统计)→Descriptive(描述)→Distributions(数据分布)

4.在弹出窗口中选择分析变量HEIGHT→Analysis栏;Class栏填入分类变量;

5.选择Fit键,在弹出窗口中选择拟和分布的模型,;

6.选择Plot键,在弹出窗口中选择需要输出的分析图形(盒形图与直方图);

7.选择Variables键,在弹出窗口中选择分组变量(ByGroup)、权重变量(Weight)或权数变量(Freq);

8.选择OK,输出变量HEIGHT的分布分析统计量。

实验报告

实验报告

实验三矩阵计算与统计表制作

实验名称:

矩阵计算与统计表制作

实验目的:

熟练掌握SAS系统中IML语言的矩阵计算、解线性方程组及高次方程的过程、掌握各种制作统计表过程、FREQ语句完成列联表分析过程、编制数据秩。

实验类型:

验证型

实验学时:

4学时

实验原理(知识点):

IML语言、TABULATE语句及各种表格形式、FREQ语句过程、属性数据的关联性分析以及卡方检验、RANK过程

实验内容与要求:

1对资料ZL1的数据利用职称、性别和年龄变量制作:

①含ALL变量的二维表;

②计算年龄均值、最大值、最小值的二维表;

③计算各栏目频率的二维表以及行频率表和列频率表。

2计算矩阵

的行列式、逆阵、特征值及特征向量

3求线性方程

的解。

4求高次方程

的根。

5某大学招生资料:

专业

男生

女生

报考人数

录取百分比

报考人数

录取百分比

A

825

62%

108

82%

B

560

63%

25

68%

C

325

37%

593

34%

D

417

33%

375

35%

E

191

28%

393

24%

F

373

6%

341

7%

完成以下工作:

①创建数据集

②编程编制二维列联表

③分析录取考生与性别是否有显著关系。

④考生所报专业的录取与性别是否有显著关系。

6资料ZL3是一些国家和地区的健康指标(出生率、死亡率、婴儿死亡率、总死亡率、结婚率、以及0岁、1岁、65岁预期寿命等),这些国家的健康状况进行综合排名。

相关内容的菜单操作:

一、Analyst

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 小学教育 > 语文

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2