最新SAS数据分析完整笔记资料Word文档下载推荐.docx
《最新SAS数据分析完整笔记资料Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《最新SAS数据分析完整笔记资料Word文档下载推荐.docx(13页珍藏版)》请在冰点文库上搜索。
旋转图:
Analysis→RotationgPlot
曲面图:
Analysis→RotationgPlot
设置
FitSurface
等高线图:
Analysis→Countorplot
1.4
分布分析
包括:
直方图、盒形图、各阶矩、分位数表,直方图拟合密度曲线,对特定分布进行检验。
1.4.
1
Analysis→Distribution(Y)
第一部分为盒形图,第二部分为直方图,第三部分为各阶矩,第四部分为分位数表。
1.4.2
添加密度估计
A:
参数估计:
给出各种已知分布(正态,指数等),只需要对其中参数进行估计;
Curves→ParametricDensity
B:
核估计:
对密度函数没有做假设,曲线性状完全依赖于数据;
Curves→KernelDensity
1.4.3
分布检验
Curves→CDFconfidenceband
Curves→TestforDistribution
1.5
曲线拟合
Analysis→Fit(YX):
分析两个变量之间的关系
1.6
多变量回归
Analysis→Fit(YX)
1.7
方差分析
1.8
相关系数计算
Analysis→Multivariate
1.9
主成分分析
2.SASANALYST启动:
Solution→Analysis→Analyst
在命令栏内输入analyst
2.1
分类计算统计量:
Data→Summarizebygroup
2.2
随机抽样:
Data→RandomSample
2.3
生成报表:
Report→Tables
2.4
变量计算:
Date→Transform
2.5
绘制统计图
2.5.1
条形图:
Graph→BarChart→Horizontal
2.5.2
饼图:
Graph→PieChart
2.5.3
Graph→Histogram
2.5.4
概率图:
Graph→Probalityplot
2.5.5
Graph→Scatterplot
2.6
统计分析与计算
2.6.1
计算描述性统计量
Statistics
→Descriptive→SummartStatistics
只计算简单统计量
→Descriptive→Distribution
可计算一个变量的分布信息
→Descriptive→Correlations可计算变量之间的相关关系
→Descriptive→Frequencycounts
可计算频数
2.6.2
列联表分析
→TableAnalysis
2.7假设检验
2.7.1单样本均值Z检验:
检验单样本均值与某个给定的数值之间的关系
→Hypothesistests
→One-SampleZ-testforamean
2.7.2单样本均值t检验:
适用于不了解变量的方差情形
推断该样本来自的总体均数μ与已知的某一总体均属μ0是否相等
→
One-Samplet-testforamean
2.7.3单样本比例检验:
检验取离散值的变量取某个值的比例
→One-Sampletestforaproportion
2.7.4单样本方差检验:
检验样本方差是否等于给定的值。
零假设方差等于某个给定的。
→Hypothesistests→One-Sampletestforavariance
2.7.5两样本均值t检验:
独立的两个总体的均值是否相等或者是否相差给定的值
→Two-Samplet-testformeans
2.7.6成对样本均值t检验:
成对样本检验中总体是相关的。
→Two-Samplepairedt-testformeans
2.7.7两样本比例检验:
检验两个总体中某个比例的值是否相等。
→Two-Sampletestforproportions
2.7.8两样本方差检验
→Hypothesistests→TwoSampletestforvariance
2.8ANOVA过程
2.8.1单因素ANOVA过程
→ANOVA→One-WayAnova
2.8.2非参数的单因素方差分析:
适用于正态分布假定或方差相等假设不能满足的单因素问题
→ANOVA→nonparameterone-wayAnovatest
Wilcoxon法、Median法、VanderWaerden法、Savage法。
2.8.2因素方差分析:
实验结果是连续数值而分类变量是两个以上的离散型数值。
→ANOVA→FactorialAnova
2.8.3线性模型:
用最小二乘法拟合一般线性模型
→ANOVA→LinearModel
2.9回归分析:
→Regression
2.9.1simple回归:
简单一类回归分析,单一的自变量,单一的因变量,模型可以是一次、二次、三次。
→Regression→simple
2.9.2linear回归:
线性回归,回归模型可以有多个因变量,多个自变量,但是对因变量分别进行回归
→Regression→linear
2.9.3logistic回归:
用于解决因变量是一个二元变量
→Regression→logistic
3.报表以及图形输出
3.1print过程
Procprintdata=sasuser.score;
//数据库.数据集
Run;
VarnamemathChinese;
//变量
Procprintdata=sasuser.score
noobs;
//去掉第一列(观测序号)
VarnamemathChinese;
Proc
print
data=
sasuser.score;
Wheresexin(‘f’);
//通过where语句
Procprintdata=
sasuser.scorenoobslabel;
Title
‘女生成绩单’;
Labelname=‘姓名’
Sex=‘性别’
Math=
‘数学’
Chinese=
‘语文’
English=
‘英语’;
“thesassystem”;
//恢复系统标题
data=
Footnote=
‘分数列表’;
//加分数列表的脚注
Procsort
By
sex;
//使用by分组输出前用sort排序
Bysex;
Summath;
3.2tabulate过程
Proctabulatedata=数据集名称;
Class
分类变量;
Var
分析变量;
Table
页面说明行维说明列维说明/选项;
3.3sort过程
Procsortdata=
数据集名称;
//默认升序排列
变量名;
descending
//降序排列
3.4
means过程:
数量(N)、均值(Mean)、标准差(StdDev)、最大值(Maximum)、最小值(Minimum)
Procmeans
data=sasuser.stock;
price;
3.5univariate过程
Procunivariatedata=数据集;
结果:
Moments:
统计量的各阶矩,例如一阶矩就是均值,二阶矩就是方差等;
BasicStatisticalMeasures:
基本统计量;
Testsforlocation:
检验均值是否为零;
Quantiles:
分位数表;
ExtremeObservations:
极端观测值。
3.6freq过程:
离散变量的分布情况
Procfreqdata=数据集名;
Tables
变量取值、频数、百分比、累计频数、;
累计百分比
3.7corr过程:
相关系数
Proccorrdata=数据集;
变量名
简单统计量
相关系数及p值
3.8gplot过程:
绘制散点图和曲线图,绘制回归曲线。
Procgplot
Symbol
曲线类型;
Plot
竖轴变量*横轴变量;
Procgplotdata=sasuser.score;
SymbolI=none
v=star;
PlotEnglish*Chinese;
3.9
gchart过程:
绘制直方图、饼图、三维直方图等。
Procgchartdata=
Vbar/pie/block=变量;
3.10G3D过程绘制三维曲面
Procg3ddata=数据集;
变量x*变量y=变量z;
gcontour过程:
画出曲面的等高线
Procgcontourdata=数据集名;
Plotx*y=z;
4.基本统计分析
4.1正态性检验:
univariate过程
Procunivariatedata=sasuser.stocknormal;
eps;
Histogrameps;
//画出直方图
Probploteps;
//画出概率分布图
4.2单变量均值检验
4.2.1如果一个变量服从正态分布,那么可以用t检验来对变量进行均值检验
Procttestdata=数据集
ho=
均值;
检验变量;
4.2.2t检验还可以检验方差相同的两个独立样本均值是否相等
Procttestdata=数据集;
结果
第一部分简单统计量
第二部分t检验结果
第三部分两者方差是否相等检验
T检验要求两个独立样本都必须服从正态分布,如果不服从正态分布,则无法进行t检验。
这时可用非参数的方法,常用的非参数方法是NPAR1WAY过程,它是
noparameter1way缩写。
4.3成对总体均值检验
4.4回归分析:
reg(回归)过程、rsreg(二次响应面回归)过程、orthoreg(病态数据回归)过程、nlin(非线性回归)过程、transreg(变换回归)过程、calis(线性结果方程和路径分析)过程、glm(一般线性回归)过程、genmod(广义线性回归)过程
(二)创业弱势分析4.4.1REG过程
(二)对“碧芝”自制饰品店的分析Procregdata=
输入数据集选项;
(二)大学生对DIY手工艺品消费态度分析Var
变量列表;
(二)创业弱势分析Model
因变量
=
自变量列表;
Print
输出结果;
诊断图形;
4.4.2nlin过程
指明模型的表达式并给定系数初值
4.4.3glm过程:
使用最小二乘法回归线性模型,还可以进行回归,分差,协方差,多变量方差、偏相关系数分析
四、影响的宏观环境分析4.5方差分析
4.5.1单因素方差分析
手工艺制品是我国一种传统文化的象征,它品种多样,方式新颖,制作简单,深受广大学生朋友的喜欢。
当今大学生的消费行为表现在追求新颖,追求时尚。
追求个性,表现自我的消费趋向:
购买行为有较强的感情色彩,比起男生热衷于的网络游戏,极限运动,手工艺制品更得女生的喜欢。
Procanovadata=数据集名称;
(3)个性体现Class
因素;
大学生对手工艺制作兴趣的调研Model
实验结果
=因素;
中式饰品风格的饰品绝对不拒绝采用金属,而且珠子的种类也更加多样。
五光十色的水晶珠、仿古雅致的嵌丝珐琅珠、充满贵族气息的景泰蓝珠、粗糙前卫的金属字母珠片的材质也多种多样。
创业首先要有“风险意识”,要能承受住风险和失败。
还要有责任感,要对公司、员工、投资者负责。
务实精神也必不可少,必须踏实做事;
Model
Means
brand;
brand/t;
//t检验
brand/bon;
//bonferronit检验
控制第一类错误的概率,但是具有较大第二类错误概率
brand/regwq;
//regwq检验
控制第一类错误的概率
brand/tukey;
//tukey检验
控制第一类错误的概率,但是第二类错误概率通常高于regwq检验
4.5.2多因素方差分析
4.5.3列联表检验
Procfreqdata=
数据集;
因素a*因素b/chisq;
Weight
实验结果;
5相关知识
因变量—Depender
(Y)
自变量—Independent
(X1
X2…)