数据分析报告(线性回归、SAS).pptx
《数据分析报告(线性回归、SAS).pptx》由会员分享,可在线阅读,更多相关《数据分析报告(线性回归、SAS).pptx(25页珍藏版)》请在冰点文库上搜索。
数据分析方法,习题:
2.4(Page79),计算2班:
陈磊,报告目录,问题重述化妆品销售与人数、月收入关系,数据导入本题数据导入、数据导入的几种方法,执行过程procreg、model语句,执行结果方差分析、参数估计,多元线性回归设置,习题2.4题目,某公司管理人员为了解某化妆品在一个城市的月销量Y(单位:
箱)与该城市中适合使用该化妆品的人数1(单位:
千人)以及他们人均月收入2(单位:
元)之间的关系,在某个月中对15个城市作了调查,得到上述各量的观测值如表2.12所示。
表2.12化妆品销售数据(部分数据),-,城市销量(y)人数
(1)收入
(2),-,11622742450,21201803254,32233753802,41312052838,.,-,假设Y与1,2之间满足线性回归关系,=0+11+22+,=1,2,15,其中独立同分布于(0,2).,导入数据,title数据据分析方法_习题2.4_page79;/*标题*/datamylib.ch2_2_4;/*在逻辑库mylib中创建数据集ch2_2_4*/inputyx1x2;/*表示可连续输入*/cards;/*开始输入数据*/162274245012018032542233753802131205283867862347169265378281983008192330245011619521375553256025243040202323724427144236266010315720882123702605;/*遗漏数据用“.”表示,否则对应的这组数据会被自动删除*/run;/*run语句用于说明处理当前程序步中该语句之前的所有行*/,.:
SAS逻辑库名最多为8个字符,数据集的名称最多为32个字符。
?
:
若去掉,上边能导入哪些数据?
导入数据,若干方法,1、在编辑框中输入数据,cards,2、从文件读入数据,infileinfileF:
mylibch2_2_4.txt;,3、导入外部数据向导导入;import语句导入procimport,4、已经建立过数据集procregdata=mylib.ch2_2_4;,执行过程1,procreg;/*调reg过程用*/modely=x1x2;/*因变量为y,自变量为x1、x2*/run;,Model语句:
用于定义模型中因变量、自变量、模型选项及结果输出选项。
常用选项有Selection=,指定变量选择方法;NOINT,表示在模型中不包括常数项;STB,输出标准化的回归系数;CLI,输出单个预测值置信区间;R,进行残差分析,并输出分析结果。
格式:
MODEL因变量名=自变量名列/选项例:
modely=x1x2/selection=stepwise;/*逐步回归*/,执行结果1,参数估计表,最小二乘估计:
=(0,1,2)=(3.45261,0.49600,0.00920)回归方程:
Y=3.45261+0.496001+0.009202置信区间:
0.97512=2.17881(通过查t分布表得到)1=0.496+/-2.179*0.00605,得出(0.4828,0.5092)2=0.0092+/-2.179*0.00096811,得出(0.0071,0.0113),执行结果1,方差分析表,误差方差估计值:
2=MSE=4.74040复相关系数:
2=SSR/SST=53845/53902=0.9989显著性:
由复相关系数的值可以看出是高度显著的(Y与1,2),执行过程2,自变量X1,检验人数X1对销售量Y的影响是否显著修改程序,进行一元线性回归分析,自变量x1procregdata=mylib.ch2_2_4;/*直接引用数据集*/modely=x1;run;,执行结果2,自变量X1,复相关系数为:
0.9910,X1对Y影响显著,检验人数X1对销售量Y的影响是否显著修改程序,进行一元线性回归分析,自变量x2procregdata=mylib.ch2_2_4;modely=x2;run;,执行过程3,自变量X2,注:
可以同时指定多条Model语句。
执行结果3,自变量X2,复相关系数为:
0.4087,X2对Y的影响不显著,执行过程4,X1、X2交互作用,datamylib.ch2_2_4;inputyx1x2;z=x1*x2;/*新建自变量z*/cards;162274245012018032542233753802131205283867862347169265378281983008192330245011619521375553256025243040202323724427144236266010315720882123702605;run;procreg;modely=z;/*自变量为z*/run;,执行结果4,X1、X2交互作用,复相关系数为:
0.9030,X2对Y的影响显著,利用向导执行,解决方案-分析-分析家,one,文件-打开打开ch2_2_4.sas7bdat,即打开已新建的数据集,利用向导执行,TWO,统计-回归-线性设置变量,利用向导执行,THREE,变量列表,因变量,自变量,利用向导执行,FOUR,模型参数设置建立包含所有已选自变量的全模型,利用向导执行,FIVE,Tests选项设置,置信度a的值,利用向导执行,SIX,Plots选项设置,原始残差,自变量,判定残差是否服从正态分布的QQ图,利用向导执行,SEVEN,Predictions选项设置,对现有数据集中的数据进行预测,保存预测结果到一个数据集中,输出残差预测值,利用向导执行,EIGHT,Statistics选项设置,输出标准化的回归系数,所得结果,残差图,所得结果,Q-Q图,Somuchformyreport,VielenDank!
PERFECTIONIST.CL,