浅析统计软件STATA的操作和运用.docx

上传人:b****4 文档编号:5121290 上传时间:2023-05-08 格式:DOCX 页数:9 大小:64.82KB
下载 相关 举报
浅析统计软件STATA的操作和运用.docx_第1页
第1页 / 共9页
浅析统计软件STATA的操作和运用.docx_第2页
第2页 / 共9页
浅析统计软件STATA的操作和运用.docx_第3页
第3页 / 共9页
浅析统计软件STATA的操作和运用.docx_第4页
第4页 / 共9页
浅析统计软件STATA的操作和运用.docx_第5页
第5页 / 共9页
浅析统计软件STATA的操作和运用.docx_第6页
第6页 / 共9页
浅析统计软件STATA的操作和运用.docx_第7页
第7页 / 共9页
浅析统计软件STATA的操作和运用.docx_第8页
第8页 / 共9页
浅析统计软件STATA的操作和运用.docx_第9页
第9页 / 共9页
亲,该文档总共9页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

浅析统计软件STATA的操作和运用.docx

《浅析统计软件STATA的操作和运用.docx》由会员分享,可在线阅读,更多相关《浅析统计软件STATA的操作和运用.docx(9页珍藏版)》请在冰点文库上搜索。

浅析统计软件STATA的操作和运用.docx

浅析统计软件STATA的操作和运用

浅析统计软件STATA的操作和运用

 

 

一、Stata的数据管理能力

1.stata的数据管理空间受计算机的操作系统和计算机扩展内存的影响。

对640K内存的微机,3.1版本的Stata可以管理2400个记录×99个变量,并随计算机扩展内存的增加而增加;对4.0的WINDOWS版本,Stata可以管理4800个记录×99个变量;对WINDOWS95下的5.0版本,可根据计算机的配置情况设置变量数和记录数,如32M扩展内存的计算机,可处理2千万个数据。

变量数和记录数可以互相交易(trade),即减少记录数可以增加变量数,减少变量数可以增加记录数。

2.可以将分组变量转换成指示变量(哑变量),将字符串变量映射成数字代码。

3.可以对数据文件进行横向和纵向链接,可以将行数据转为列数据,或反之。

4.可以恢复、修改执行过的命令。

5.可以利用数值函数或字符串函数产生新变量。

6.可以从键盘或磁盘读入数据。

 

二、Stata的统计功能与矩阵运算功能

1.stata的统计功能

Stata的统计功能很强,除了传统的统计分析方法外,还收集了近20年发展起来的新方法,如Cox比例风险回归,指数与Weibull回归,多类结果与有序结果的logistic回归,Poisson回归、负二项回归及广义负二项回归,随机效应模型等。

具体说,Stata具有如下统计分析能力:

1.数值变量资料的一般分析:

参数估计,t检验,单因素和多因素的方差分析,协方差分析,交互效应模型,平衡和非平衡设计,嵌套设计,随机效应,多个均数的两两比较,缺项数据的处理,方差齐性检验,正态性检验,变量变换等。

2.分类资料的一般分析:

参数估计,列联表分析(2检验,列联系数,确切概率),流行病学表格分析等。

3.等级资料的一般分析:

秩变换,秩和检验,秩相关等。

4.相关与回归分析:

简单相关,偏相关,典型相关,以及多达数十种的回归分析方法,如多元线性回归,逐步回归,加权回归,稳键回归,二阶段回归,百分位数(中位数)回归,残差分析、强影响点分析,曲线拟合,随机效应的线性回归模型,等。

5.危险度分析:

条件和非条件的logistic回归,多类结果与有序结果的logistic回归,Probit回归,及其他广义线性模型,随机效应的logistic回归,随机效应的Poisson回归,等。

6.生存分析:

基线生存曲线的估计、相对危险度的估计,Kaplan-Meier生存曲线、寿命表分析,对数秩检验,Mantel-Haenszel检验,Wilcoxon-Gehan检验,Cox比例风险模型,正态截尾及Tobit回归,指数回归和Weibull回归,等。

7.其它方法:

质量控制,整群抽样的设计效率,诊断试验评价,kappa,等。

2.stata的矩阵运算功能

矩阵代数是多元统计分析的重要工具,Stata提供了多元统计分析中所需的矩阵基本运算,如矩阵的加、积、逆、Cholesky分解、Kronecker内积等;还提供了一些高级运算,如特征根、特征向量、奇异值分解等;在执行完某些统计分析命令后,还提供了一些系统矩阵,如估计系数向量、估计系数的协方差矩阵等。

尽管Stata的容量最大只容许400400的矩阵(默认为4040),用它来完成日常工作中的统计分析显然不现实,但用它来做一些练习,提高多元统计分析的教学效率,无疑是很有帮助。

详见第十八章。

 

三、Stata的数据输入与储存

Stata可以从键盘输入数据,也可以从文件读入数据。

WINDOWS下的Stata还可以用Stata的数据编辑器输入、修改和管理数据。

这里简单介绍如何从键盘输入数据。

进入Stata后,操作过程如下,其中划线部分为操作者输入部分。

1.从键盘输入数据

.inputxy

x   y

1.14

2.25.5

3.36.2

4.47.7

5.58.5

6.end

用list命令可以看到输入的数据。

.list

x   y

1. 1   4

2. 2  5.5

3. 3  6.2

4. 4  7.7

5. 5  8.5

2.保存数据

为了方便以后应用,输入Stata的数据应存盘。

如欲将上述数据存入d:

\mydata\子目录中,文件名为ex1.dta,命令为:

.saved:

\mydata\ex1

filed:

\temp\ex1replace.dtasaved

该指令在d:

盘的mydata子目录中建立了一个名为“ex1.dta”的Stata格式的数据文件。

后缀dta是Stata内定的数据格式文件。

该格式文件只能在Stata中用use命令打开:

.used:

\mydata\ex1

如目标盘及子目录中已有相同文件名的文件存在,则该命令将给出如下信息:

filed:

\mydata\ex1.dtaalreadyexists,告诉用户在该目标盘及子目录中已有相同的文件名存在。

如欲覆盖已有文件,则加选择项replace。

命令及结果如下:

.saved:

\mydata\ex1,replace

filed:

\temp\ex1.dtasaved

这样,Stata在d:

盘的mydata子目录中建立了一个名为“ex1.dta”的Stata格式数据文件,并替换了原有文件。

 

四、Stata的作图功能

tata的作图模块,主要提供如下八种基本图形的制作:

直方图(histogram),条形图(bar),百分条图(oneway),百分圆图(pie),散点图(twoway),散点图矩阵(matrix),星形图(star),分位数图。

这些图形的巧妙应用,可以满足绝大多数用户的统计作图要求。

在有些非绘图命令中,也提供了专门绘制某种图形的功能,如在生存分析中,提供了绘制生存曲线图,回归分析中提供了残差图等。

 

五、Stata的操作方式

Stata的操作方式有两种形式,一种是交互式操作,一种是非交互式操作。

1.交互式操作

在Stata状态直接键入指令,每输入一个指令,Stata执行一个,这种方式称为交互式操作。

例如命令:

useex1

Regyx

2.非交互式操作

若分析内容很多,有时甚至涉及到多个数据库,有几十个甚至成百个分析内容,若仍采取交互式操作,不仅要将许多时间花在等待运算结果上,而且容易漏掉一些主要的分析内容或做一些无益的重复劳动。

这时最好在EDIT,PE2,WORD等文字处理下将这些指令写入一个以“do”为扩展名的命令文件(文本格式,即ASCII码),并仔细核对分析内容、命令格式,直至组织数据文件的合理性等,修改好后再在Stata状态执行该命令文件。

例如:

第一步,在字处理软件下写入命令,并以文件名“ex1.do”存入磁盘d:

\mydata\子目录中。

第二步,在stata状态健入:

dod:

\mydata\ex1.do

stata将首先打开一个名为“ex1.log”的结果文件,然后打开数据文件“ex1.dta”,画散点图并将图形存入文件“ex1.gph”,进行相关分析、回归分析,最后关闭结果文件。

此时,Stata执行这些命令是自动的,不间断的。

六、Stata的数据输入,存盘和调用文件命令以及数据管理命令

输入数据命令:

1.input变量名1变量名2…变量名m(各变量数据之间用空格隔开,每行一个记录,最后以end表示结束)

2.infile变量名1变量名2…变量名musing文件名

(该文件为文本文件,各变量数据之间用空格隔开,每行一个记录)

存盘命令:

save[路径]文件名[,replace]

以STATA格式存盘,缺省扩展名为dta,replace表示覆盖同名同路径的文件;也可以在菜单File中选SAVEas或SAVE进行操作)

outfileusing[路径]文件名[,replace]

以文本格式存盘,缺省扩展名为raw,replace表示覆盖同名同路径的文件)

调用已存的STATA格式文件

use[路径]文件名[,clear]

也可以在菜单File中选open进行操作)

产生新变量

gen新变量名=表达式

修改变量值

replace变量名=表达式[in范围][if逻辑表达式](变量的缺省值(miningdata)表达)

在STATA软件中数据输入通常有三种方式:

键盘直接输入,从外部的文本文件(ASC码文件)读入数据和在DOS环境下应用Transfer软件直接把Fox或其他格式存盘的文件转换成Stata软件格式的文件。

例如:

当前计算机中正处于STATA状态下,并有二个配对变量x1和x2的数据,因此需要计算两个变量的差:

x1-x2,则:

genx=x1-x2

修改数据:

STATA命令:

replace变量名=表达式[if逻辑表达式][in范围]

如:

变量x中所有值为999的数据是缺省资料,现改为STATA缺省值的记号,所有大于100的数据将改为2;x小于或等于100且大于5的所有数据改为1;x小于或等于5的所有数据为0。

则:

replacex=.ifx==999

replacex=0ifx<=5

replacex=1ifx>5&x<=100

replacex=2ifx>100

 

七、Stata的相关分析

correlate变量名1变量名2…变量名m

spearman变量1变量2

线性关系的相关分析

若计量资料变量1,…,变量m服从正态分布,对于它们之间是否存在线性相关关系可以通过相关分析方法,相应的STATA命令为:

pwcorr变量名1变量名2…变量名m,sig

例:

上海医科大学儿科医院研究某种代乳粉的营养价值时,用大白鼠作试验,得大白鼠进食量(克)和增加体重(克)之间的关系的原始数据如下表,用x表示大白鼠进食量和用y表示大白鼠增加体重,试作相关分析(资料摘自医学统计分析)

进食量(克)820780720867690787934679639820

增加体重(克)165158130180134167186145120158

作关于x和y相关分析

pwcorrxy,sig

|xy

---------------+-----------------------------

x|1.0000

|

|

y|①0.93951.0000

|②0.0001

|

①为x和y的相关系数r。

②为相关系数显著性检验(Ho:

r=0)所对应的p值。

因此根据本例资料和上述结果可以认为大白鼠进食量与大白鼠体重增加呈线性正相关(若数据x和y服从正态分布)。

•秩和相关分析

由于以上的相关分析中,要求数据x和y均服从正态分布,但是对于那些不能满足正态分布的数据之间的相关分析应采用非参数相关分析,通常采用秩和相关分析,即:

Spearman相关分析方法。

STATA命令为:

spearman变量1变量2

以上例资料为例,作秩和相关分析:

spearmanxy

Numberofobs=10

Spearman'srho=0.8994①

TestofHo:

xandyindependent②

③Pr>|t|=0.0004

①为Spearman相关系数;②为无效假设Ho:

x与y独立;③无效假设的Spearman相关显著性检验所对应的p值。

由上述结果表明:

Spearman相关系数为0.8994,相应的p值为0.0004,因此由本例资料和检验结果可以认为大白鼠进食量与大白鼠体重增加呈正相关。

 

结论:

通过对统计软件Stata课程的学习,我认识了什么是统计软件Stata,知道了Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件,知道了它具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点,又在许多方面别具一格。

Stata融汇了上述程序的优点,克服了各自的缺点,使其功能更加强大,操作更加灵活、简单,易学易用,越来越受到人们的重视和欢迎。

在今后工作中也有比较重要的地位。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2