018404林江锋信计091.docx
《018404林江锋信计091.docx》由会员分享,可在线阅读,更多相关《018404林江锋信计091.docx(14页珍藏版)》请在冰点文库上搜索。
018404林江锋信计091
浙江万里学院
集中实践课程报告
课程名称:
SAS编程技术课程
系别:
信息与计算科学091
专业班级:
信计091
姓名:
林江锋学号:
2009018404
指导教师:
顾锋娟
起止日期:
2012年6月18日-2012年6月29日
目 录
实践日志1
1实践来源及背景2
2实践内容3
3实践总结与体会4
4作业一1
5作业二1
集中实践课程考核表2
实践日志
实践第一周
日期
星期
实践内容(讨论、学习或上机等内容)
签名
6.18
一
今天是SAS的第一节课,我们初步学习了SAS的意思,特点,作用以及它的一些功能。
初步了解了SAS界面的一些简单的窗口操作,比如新建、输出、保存、导入、导出等,又比如就是一些数据的简单筛选,像选取13岁女生等;还有就是SAS的一些注意事项。
如分号、run、还有一些与其它统计软件不同的符号等。
6.19
二
通过今早的一上午学习,我在昨天学习的基础上又学到了很多东西。
先是对昨天所学的加以温故,再跟我们讲述了如何SQL的查询、保存。
对数据取子集、创新新变量、移动变量;保存报表以及一系列对报表的操作;用insight
分析数据、图形的建立以及对回归分析里的数据的解释说明。
6.20
三
今天学习主要分两部分:
前一部分课中进行了实际的演习,对前些天所学的更加牢记,特别是对回归分析里的数值的了解。
另一部分初步讲述了一些编程的基础知识。
比如:
什么是有效的语句;SAS名的一些规定;SAS程序包括数据步和过程步;数据步指的就是数据的创建;过程步就是数据的处理求标准差、方差、均值等。
6.21
四
今天我们主要学了很多的基础程序编程知道了大致编程的过程;了解了很多编程里字母的意思以及字符个数的限制字母间搭配的运用和obs的运用;懂得了怎么画简单的二维图和还有一些其它细节方面。
比如:
书写的规则;变量列表的一些缩写方法等。
值得一提的事:
这节课我们重点在于对程序的理解以及实际的运用练习,加深了对SAS软件的理解和运用。
6.22
五
端午节放假
实践第二周
日期
星期
实践内容(讨论、学习或上机等内容)
签名
6.25
一
经过三天的假期,对上周学的知识有些淡忘了,在对之前学的进行简单温习后,我们开始学习新的东西。
我们学了怎样用程序输出观测值,计算均值和相关系数,新建变量,数值常数,字符常数,日期时间常数等等,经常忽略细节,容易出错,多练习希望会好些。
6.26
二
一开始,我们就对昨天做过的一道题进行了温习,按不同年龄段求体重平均值和标准差,由于昨天已经掌握了,今天做就不难。
在这之后,我们开始学习了新的知识,学了if…then语句,比较算符,运算符,逻辑算符,还学了纵向拼接和横向拼接。
总的来说,今天的知识不算太难,循序渐进地踏实练习,每个问题都能够迎刃而解。
在做第一次练习的过程中,有碰到一些问题,但基于都是些上课讲到的知识点,所以回忆一下还是可以解决。
6.27
三
前两天我们学的东西只是一般的用菜单栏操作,今天我们接触了一点点用程序的方式来做一些简单处理。
我们还学到了SAS名的规定,语句的格式,基本数据步和过程步,创建数据集等等。
但由于我们对程序的不熟悉,所以感觉会比前几天稍难,多加练习,应该就会熟练一点,总之课上好好听讲,课下多看些课外资料练习几次,这很重要。
6.28
四
今天我们主要学习了第五章的日期时间的运用,像星期的表达、日期的表达。
回顾了下对数收益率的表达、回顾的运用解释。
还学习了第八章的DO语句。
了解了if……then的不足以及DO……end的优点。
6.29
五
答辩
1实践来源及背景
SAS是用于数据分析与决策支持的大型集成信息系统,统计分析功能是它的重要组成部分和核心功能。
SAS课程的学习对于学生进行大型数据处理,统计分析具有重要的意义。
SAS软件的掌握包括三个层次,第一层次:
会使用SAS菜单以及一些菜单界面的SAS模块,了解初步的SASBASE语句,能用SAS系统作简单的数据加工处理和分析,具有一定的数理统计知识,掌握一定的SASSTAT过程。
第二层次:
精通SASBASE,能用SAS语言编写复杂的SAS程序,能用SASBASE进行大型的、复杂的数据加工整理和呈现,掌握SAS和外部数据文件的接口,会进行复杂的统计建模和分析等,初步掌握一种基于SAS的开发工具。
第三个层面:
在一、二层面基础上,进一步掌握SAS/AF,SAS/IML等,能开发基于SAS的数据管理和分析模块。
对于本科生来讲主要是第一层次的学习,以及第二层次的初步学习。
2实践内容
1、主要完成以下教学项目:
第一讲、SAS系统简介。
了解什么是SAS,SAS的操作界面,SAS的语言。
第二讲、SAS菜单操作。
逻辑库的建立,数据集的导入和导出,数据集编辑器的使用(列排序、列隐藏、数据编辑、改变列标题、数据的筛选)。
第三讲、菜单式SQL查询。
运行SQL窗口,单个数据集的筛选,多个数据集之间的筛选,where语句,创建新变量,HTML输出窗口设置。
第四讲、报表编辑器、分析家模块的使用、交互式模块的使用。
报表编辑器使用(报表分组、取子集),分析家模块的使用(描述性统计),交互式模块的使用(作图、回归)。
第五讲、SAS编程基础。
Data步和Proc步介绍,创建数据集,增加列,筛选。
第六讲、Data步编程。
数据类型的转变和应用,变量的计算,函数的使用。
第七讲、Proc步编程。
描述性统计,排序,相关系数,回归等。
第八讲、金融问题专题讲解。
2、课下完成以下内容:
●完成每一知识点所留习题
●完成教师规定课外作业
●完成实践日志和总结报告
3实践总结与体会
以前学的matlab可以解决我们遇到的一些简单问题了,这次学的sas是统计方面的软件,有些问题用EVIWS也可以解决,但sas强大的统计功能使得操作起来也方便多了。
虽然两个星期的时间我们学的只是一些简单的操作,但对于我们现在遇到的问题来说已经足够了。
这个软件用菜单栏操作起来其实跟office的软件还蛮类似的,所以上手并不怎么难,而且一些程序语句也是很基础的,所以在学习的过程中虽说偶尔是会碰到一些问题,但突然开窍了,解决起来也就轻松了,在这个学习的过程中,我收获了知识,也培养了对这个软件的兴趣。
我们拿到的书是一本很厚的教材,但两个星期的时间并不能学习多少知识。
所以结合老师给的ppt和教材,回去我们要学的还有很多。
尤其是对于今年暑假我还要参加数学建模,相信这个会很有用。
以前都是用matlab解决比较多,但这次学习了sas,又多了个软件可以解决问题,而且用着也比较方便,所以暑假回家,我还得好好学习一下,希望了解的不只是皮毛,能够处理一些稍微复杂的问题。
在网上得知sas系统全称为三他statisticsanalysissystem,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了sas软件研究所,正式推出了sas软件。
Sas是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,至今,统计分析功能也仍是它的重要组成部分和核心功能。
Sas现在的版本大小约1G。
经过多年的发展,sas已被全世界120多个国家和地区的近三万家机构所采用,直接用户则超过三百万人,遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域,在数据处理和统计分析领域,sas系统被誉为国际上的标准软件系统,并在96—97年度被评选为建立数据库的首选产品。
堪称统计软件界的巨无霸。
这么广的用途,以后一定能用的到,尤其是对我们专业的,这个软件会很有用。
Sas是由大型机系统发展而来,其核心操作方式就是程序驱动,经过多年的发展,现在已成为一套完整的计算机语言,其用户界面也充分体现了这一特点:
它采用MDI(多文档界面),用户在PGM视窗中输入程序,分析结果以文本的形式在OUTPUT视窗中输出。
使用程序方式,用户可以完成所有需要做的工作,包括统计分析、预测、建模和模拟抽样等。
但是,这使得初学者在使用sas时必须要学习sas语言,入门比较困难。
Sas的windows版本根据不同的用户群开发了几种图形操作界面,这些图形操作界面各有特点,使用时非常方便。
但是由于国内介绍他们的文献不多,并且也不是sas推广的重点,因此还不为绝大多数人所了解。
在以后的不断学习中,我希望能一步步揭开sas的神秘面纱,能够将sas的用处发挥的淋漓尽致。
4作业一
问题:
(1)新建逻辑库fdata,对应到课件下的文件夹fdata。
(2)对逻辑库fdata下面的数据集A600001进行排序,要求找到最大的交易额所对应的观测值的信息,找到最高收盘价所对应的观测值的信息。
(3)筛选出交易额最小的100天的数据,并将这些数据保存到fdata.A600001_1中,并计算这100天的平均交易额。
(4)筛选出交易额最大的100天的数据,并将这些数据保存到fdata.A600001_2中,并计算这100天的平均交易额。
(5)在数据集A600001增加两个变量,名字为spread,return。
其中spread由最高价减最低价得到,return由收盘价减开盘价得到,并将新的数据集命名为A600001_3。
(6)利用A600001_3中的spread,return,sums三个序列,建立两个回归方程。
其中一个是交易额sums对spread的回归,一个是交易额sums对return的回归。
并评价好坏,分析原因。
解答:
1、打开sas软件找到资源管理器
双击逻辑库
空白处右键新建
填入相对应的名称fdata
点击启动时应用
路径选择.....\SAS课件及数据库\fdata
点击确定。
2、找到编辑器窗口
输入
procsortdata=fdata.a000001out=b;
bydescendingsums;run;
再输入
procprintdata=b(obs=1)noobs;run;
3、procsortdata=fdata.a000001(obs=100)out=fdata.A000001_1;
bysums;run;
再输入
procmeansdata=fdata.A000001_1;
varsums;outputout=mmean=sums_m;run;
4、procsortdata=fdata.a000001(obs=100)out=fdata.A000001_2;
bydescendingsums;run;
procmeansdata=fdata.A000001_2;
varsums;outputout=mmean=sums_m;run;
5、dataA000001_3;
setfdata.a000001;
spread=hipr-lopr;
return=clpr-oppr;
run;
6、进入insight界面
选择work中的A000001_3进行回归
该表是交易额sums对return的回归。
表中的
说明两者基本无关,也就是说交易额跟最高价与最低价的差额多少基本不存在关系。
该表是交易额sums对spread的回归,其中
说明存在一定的相关性,也就是说交易额跟收盘价与开盘价的差额多少基本不存在关系。
5作业二
问题:
(1)将邯郸钢铁fdata.A600001与上证指数fdata.A1a0001进行合并,合并之后的数据集只包括日期、邯郸钢铁的收盘价、开盘价、最高价、最低价、成交金额,上证指数的收盘价、开盘价、最高价、最低价、成交金额;并且数聚集只包括邯郸钢铁和上证指数都有行情的日期。
(2)计算邯郸钢铁的日对数收益率;计算上证指数的日对数收益率;计算邯郸钢铁的日交易金额的变化率;计算上证指数的日交易金额的变化率
(3)画出邯郸钢铁日对数收益率与上证指数的日对数收益率之间的散点图。
(4)用邯郸钢铁日对数收益率与上证指数的日对数收益率数据,计算出邯郸钢铁的历年的贝塔值,并分析贝塔值的含义。
(5)用邯郸钢铁的日对数收益率对上证指数的日对数收益率和邯郸钢铁的超额交易额的变化率进行回归,并评价回归结果的好坏,并分析其经济含义。
解答:
1、dataa;
mergefdata.a600001(keep=dateclpropprhiprloprsumsrename=(clpr=clpr_pfoppr=oppr_pfhipr=hipr_pflopr=lopr_pfsums=sums_pf))
fdata.a1a0001(keep=dateclpropprhiprloprsumsrename=(clpr=clpr_shoppr=oppr_shhipr=hipr_shlopr=lopr_shsums=sums_sh));
bydate;
ifclpr_pf^=.;
ifclpr_sh^=.;
run;
2、datab;
seta;
r_pf=log(clpr_pf)-log(lag(clpr_pf));
r_sh=log(clpr_sh)-log(lag(clpr_sh));
chv_pf=log(sums_pf)-log(lag(sums_pf));
chv_sh=log(sums_sh)-log(lag(sums_sh));
run;
3、procgplotdata=b;
plotr_pf*r_sh=1;
symbol1v=stari=noner=1c=blue;
run;
quit;
4、datac;
setb;
yy=year(date);
run;
procsortdata=cout=d;
byyy;
run;
procregdata=d;
modelr_pf=r_sh/pcliclm;
byyy;
run;
5、datae;
setd;
overchv=chv_pf-shv_sh;
run;
procregdata=e;
modelr_pf=r_shoverchv/pcliclm;
byyy;
run;
集中实践课程考核表
评价种类(所占比例)
责任人
分数
责任人签名
1.平时成绩(包括到课率,课堂表现等)
教师
2.考核成绩(包括作业、实践日志、报告书写作质量及规范程度等)
教师
总成绩
教师