SAS上机练习题全部含参考答案Word文件下载.docx
《SAS上机练习题全部含参考答案Word文件下载.docx》由会员分享,可在线阅读,更多相关《SAS上机练习题全部含参考答案Word文件下载.docx(51页珍藏版)》请在冰点文库上搜索。
134-139、150、151、152、157、158、159、188
联通:
130、131、132、155、156
电信:
133、153、180、189
手机号码
1508320464X
1313654836X
1510291126X
1351425709X
1339644156X
1303612231X
1532464828X
1383824855X
1365721647X
1522322763X
1523105754X
1357851051X
1592624347X
1508311759X
1331237668X
1327313520X
1370048578X
1556443719X
1507244457X
1804346016X
1321246707X
1513441713X
1368464734X
1308279203X
1394913242X
1897876466X
inputy1-3x$4-7z$8-11;
if134<
=y<
=139oryin(150,151,152,157,158,159,188)thenygrp='
移动'
ifyin(130,131,132,155,156)thenygrp='
联通'
ifyin(133,153,180,189)thenygrp='
电信'
。
7、下表是某班学生几门功课的成绩,其中形势课是考查课,其它均为考试课。
请完成以下处理并且保存程序、结果和日志:
(注意函数在DATASTEP中使用的位置)
(1)用Mean()函数求出每位同学的平均分,将其保存在变量中;
(2)用sum()函数或者表达式求出每位同学的总分,将其保存在变量中;
(3)如果每门考试课权重是0.75,每门考查课权重为0.25,试求每位同学的加权平均分;
(4)将数据集保存为永久数据集,保存位置为“D:
\mydata\”;
(5)调用上面的永久数据集,并将男、女生的成绩分别保存在数据集Dmale和Dfemale中。
表3 某班同学几门功课的成绩
学号
性别
(0=女,1=男)
高数
生理
人解
数理统计
形势(考查)
0083
1
73
64
74
75
0414
90
79
71
85
78
0564
97
87
89
91
80
0774
40
60
61
65
0873
68
76
0874
56
0875
46
66
0876
0877
55
70
0878
0880
81
82
0881
84
0883
77
0884
0885
62
0886
83
0887
0888
67
0889
69
0890
0891
0892
0893
0894
0895
0896
51
42
44
0898
0899
72
0900
63
0901
libnamepb"
D:
\mydata\"
datapb.score;
inputid$xbgsslrjsltjxs;
mscore=mean(ofgsslrjsltjxs);
tscore=sum(ofgsslrjsltjxs);
wmscore=((gs+sl+rj+sltj)*0.75+xs*0.25)/(0.75*4+0.25);
008317373647475
041419079718578
056419787899180
077414060616575
087316865607675
087417468566075
087517346656687
087617979748987
087717568556070
087817660647180
088018173607582
088117681848978
088317760606675
088408587848590
088507875626680
088608079777383
088708582818480
088807775746780
088906771716990
089007570756980
089106976767990
089206671606078
089317084758085
089416265656981
089519178616678
089615160424478
089816773677385
089917972786880
090017668638490
090108170708279
datadmaledfemale;
setpb.score;
ifxb=1thenoutputdmale;
ifxb=0thenoutputdfemale;
8、下面是3个大类疾病的ICD-10编码及对应的疾病名。
请完成以下任务:
(1)建立数据集;
(2)提取每种疾病的大类编码;
(3)分别将3个大类的疾病存入3个数据集。
ICD10编码中小数点前面的三位表示大类;
length语句定义字符变量长度;
字符串取子串函数)
表4 4类疾病的ICD10编码及对应疾病名
ICD10
Disease
A01.001
伤寒
A01.002
伤寒杆菌性败血症
A01.003+
伤寒性脑膜炎
A01.101
甲型副伤寒
A01.201
乙型副伤寒
A01.301
丙型副伤寒
A01.401
副伤寒
A02.001
B群沙门氏菌肠炎
A02.002
C群沙门氏菌肠炎
A02.004
沙门氏菌性肠炎
A02.006
沙门氏菌胃肠炎
A02.007
鼠伤寒沙门氏菌性肠炎
A02.008
婴儿沙门氏菌肠炎
A02.101
沙门氏菌败血症
A02.201+
沙门氏菌性肺炎
A02.202+
沙门氏菌性关节炎
A02.203+
沙门氏菌性脑膜炎
A02.901
沙门氏菌感染
A02.902
鼠伤寒沙门氏菌感染
A02.903
沙门氏菌属食物中毒
A03.001
什密氏志贺菌痢疾
A03.101
弗氏志贺菌痢疾
A03.201
鲍氏志贺菌痢疾
A03.301
宋内氏志贺菌痢疾
A03.802
菌痢混合感染
A03.901
细菌性痢疾
A03.902
慢性细菌性痢疾急性发作
A03.903
慢性细菌性痢疾
A03.905
慢性迁延型细菌性痢疾
A03.906
中毒性痢疾
inputICD10$Disease:
$24.;
cat=substr(ICD10,1,3);
A01.001伤寒
A01.002伤寒杆菌性败血症
A01.003+伤寒性脑膜炎
A01.101甲型副伤寒
A01.201乙型副伤寒
A01.301丙型副伤寒
A01.401副伤寒
A02.001B群沙门氏菌肠炎
A02.002C群沙门氏菌肠炎
A02.004沙门氏菌性肠炎
A02.006沙门氏菌胃肠炎
A02.007鼠伤寒沙门氏菌性肠炎
A02.008婴儿沙门氏菌肠炎
A02.101沙门氏菌败血症
A02.201+沙门氏菌性肺炎
A02.202+沙门氏菌性关节炎
A02.203+沙门氏菌性脑膜炎
A02.901沙门氏菌感染
A02.902鼠伤寒沙门氏菌感染
A02.903沙门氏菌属食物中毒
A03.001什密氏志贺菌痢疾
A03.101弗氏志贺菌痢疾
A03.201鲍氏志贺菌痢疾
A03.301宋内氏志贺菌痢疾
A03.802菌痢混合感染
A03.901细菌性痢疾
A03.902慢性细菌性痢疾急性发作
A03.903慢性细菌性痢疾
A03.905慢性迁延型细菌性痢疾
A03.906中毒性痢疾
datacat01cat02cat03;
seta;
ifcat='
A01'
thenoutputcat01;
A02'
thenoutputcat02;
A03'
thenoutputcat03;
9、现有两个文件,内容如下:
A文件
学号统计体育年龄
01878323
02569622
03937519
04778424
05885518
B文件
学号性别班级
01男1
02女1
03男3
04男2
05女2
08女3
要求:
打印至少有一门功课不及格的同学的年龄、性别和班级。
datafileA;
inputno$tjtyage;
01878323
02569622
03937519
04778424
05885518
datafileB;
inputno$sex$bj;
procsortdata=fileA;
byno;
procsortdata=fileB;
datafileAB;
mergefileAfileB;
byno;
ifmin(tj,ty)<
60andmin(tj,ty)>
.;
10、显示100到200以内的素数。
素数即只能被1和本身整除的数,如2,3,5,7等等;
循环语句,条件语句,取余数函数mod(a,b))
doi=100to200;
flag=0;
doj=2toi-1;
ifmod(i,j)=0thenflag=1;
end;
ifflag=0thenoutput;
end;
keepi;
(彭斌,2010-3-23)
SAS上机练习题
(二)
1、某农村地区1999年14岁女孩的身高资料列于表1。
表1谋农村地区1999年14岁女孩身高资料(cm)
142.3148.8142.7144.4144.7145.1143.3154.2152.3142.7156.6
137.9143.9141.2139.3145.8142.2137.9141.2150.6142.7151.3
142.4141.5141.9147.9125.8139.9148.9154.9145.7140.8139.6
148.8147.8146.7132.7149.7154.0158.2138.2149.8151.1140.1
140.5143.4152.9147.5147.7162.6141.6143.6144.0150.6138.9
150.8147.9136.9146.5130.6142.5149.0145.4139.5148.9144.5
141.8148.1145.4134.6130.5145.2146.2146.4142.4137.1141.4
144.0129.4142.8132.1141.8143.3143.8134.7147.1140.9137.4
142.5146.6135.5146.8156.3150.0147.3142.9141.4134.7138.5
146.6134.5135.1141.9142.1138.1134.9146.7138.5139.6139.2
148.8150.3140.7143.5140.2143.6138.7138.9143.5139.9134.4
133.1145.9139.2137.4142.3160.9137.7142.9126.8
问题:
(1)计算均数、中位数;
计算均数的95%可信区间;
(2)计算四分位间距、标准差、变异系数;
计算标准误;
(3)请进行正态性检验;
(4)观察频数分布情况;
inputx@@;
procmeansdata=anmeanmedianclmqrangestdcvstderr;
varx;
procunivariatedata=anormal;
histogramx;
2、某研究员欲分析急性染毒对肝脏功能的影响,将40只小鼠分为两组,雄雌各半,试验组进行急性染毒试验,染毒后2小时测定血液中的ALT,整理的结果见下表。
(1)比较实验组与对照组的ALT有无差异;
ALT(丙氨酸转氨酶)
NO
male
controlTreaetment
Female
38.4
57.8
39.7
55.7
2
30.6
62.4
34.6
63.8
3
25.5
57.5
40.5
59.9
4
29.9
49.9
44.3
49.7
5
29.0
55.6
41.2
48.8
6
33.6
47.3
25.6
51.3
7
39.4
50.1
53.8
8
42.5
48.7
37.6
42.6
9
46.7
57.9
39.5
61.7
10
49.3
60.4
25.1
65.3
dataa2;
dosex='
M'
'
F'
dogrp='
C'
T'
inputalt@@;
output;
38.457.839.755.7
30.662.434.663.8
25.557.540.559.9
29.949.944.349.7
29.055.641.248.8
33.647.325.651.3
39.450.130.653.8
42.548.737.642.6
46.757.939.561.7
49.360.425.165.3
procanovadata=a2;
classsexgrp;
modelalt=sexgrp;
meansgrp;
quit;
3、24名志愿者随机分成两组,每组12人,接受降胆固醇试验,甲组为特殊饮食组,乙组为药物治疗组。
受试者试验前后各测量一次血清胆固醇(mmol/L),数据见下表:
甲组
乙组
受试者
试验前
试验后
6.11
6.00
6.90
6.93
6.81
6.83
6.40
6.35
6.48
4.49
6.41
7.59
7.28
7.00
7.10
6.42
6.30
6.53
6.94
6.64
6.70
6.68
9.17
8.42
9.10
9.05
7.33
7.31
6.58
6.96
6.91
7.67
7.22
6.73
11
8.15
6.57
8.16
7.65
12
6.60
6.17
6.98
6.52
(1)试建立能够满足以下统计分析的SAS数据集。
(2)试判断两组受试者试验前血清胆固醇水平是否相等?
(3)分别判断两种降胆固醇措施是否有效?
(4)试判断两种降胆固醇措施的效果是否相同?
参与程序:
dataa3;
dogrp='
甲组'
乙组'
inputidbeforeafter@@;
cha=before-after;
16.116.0016.906.93
26.816.8326.406.35
36.484.4936.486.41
47.597.2847.007.10
56