stata使用手册Word下载.doc-资源下载

stata使用手册Word下载.doc

1、三、输入数据（Entering data）在本小节中，我们将介绍如何把数据读进STATA。但是在正式介绍之前，我们必须先对几个一般性的指令（general command）有所了解，说明如下：cd：即change directory，简言之，告知STATA数据储存的地方。例如当数据储存在e槽的sample数据夹时，则必须先输入cd e:sample。dir/ls：用来显示目录的内容。set memory #m：设定内存的容量。例如：当有一笔庞大的数据要处理时，则可设定100mb的容量，此时可输入set memory 100m。（输入指令memory可以知道内存容量的大小以及使用情况。）set

2、matsize #：设定所需的变量个数。一般而言，不须对此部分进行设定，除非所欲处理的资料庞大或是当执行后出现matsize too small的讯息时再进行修改即可。内建为40。set more off/on：若欲执行结果以分页的型式呈现时，则输入set more on；若欲执行结果同时呈现时，则输入set more off。help：求助键。后面必须接的是指令。说明如何使用该指令，例如：help regress。search：后面可接任何文字。说明在何处可以找到该文字。search normal distribution。clear：清除键。用来删除所有数据。接下来，根据数据类型或指令的不

3、同，数据输入的方法可分成以下四种：1、输入EXCEL数据将EXCEL的数据输入STATA的方式还可细分成以下两种：将EXCEL的数据输入STATA之前，必须先将数据存成csv 文件，再利用指令insheet来读数据。Example：当csv档的第一列有变量名称时：cd e:sampledirmemoryset memory 10minsheet using sample1-1.csv当csv档的第一列没有变量名称时：insheet gender id race ses schtyp prgtype read write math science socst using sample1-2.cs

4、v直接复制EXCEL上的数据，再到STATA选取”Window”下的”Data Editor”，点选后会出现”Stata Editor”工作表，再到”Edit”下选取”Paste”即可贴上数据。2、输入ASCII 的数据型态依ASCII 的数据型态区分，将ASCII 的数据输入STATA的方式也有以下两种：数据型态一：见sample1-3.txtinfile gender id race ses schtyp str10 prgtype read write math science socst using sample1-3.txt记住文字的设定方式（str# variable name）。

5、数据型态二：见sample1-4.txt第二种的数据型态通常须要codebook。如下表所示。variable nameColumn numberid1-2eng3-4math5-6sex7micro8-9macro10-11infix id 1-2 eng 3-4 math 5-6 gender 7 micro 8-9 macro 10-11 using sample1-4.txt3、利用Do-file editor输入数据将数据或是指令写入Do-file editor，再执行即可。将下面数据复制并贴在Do-file editor（选取”Window”下的”Do-file editor”）上

6、，再选择”do currnet file”执行即可。input id female race ses str3 schtype prog read write math science socst147 1 1 3 pub 1 47 62 53 53 61108 0 1 2 pub 2 34 33 41 36 3618 0 3 2 pub 3 50 33 49 44 36153 0 1 2 pub 3 39 31 40 39 5150 0 2 2 pub 2 50 59 42 53 6151 1 2 1 pub 2 42 36 42 31 39102 0 1 1 pub 1 52 41 51

7、53 5657 1 1 2 pub 1 71 65 72 66 56160 1 1 2 pub 1 55 65 55 50 61136 0 1 2 pub 1 65 59 70 63 51end4、利用STATA的数据型态输入除了以上三种方法之外，还可以开启之前以STATA储存的资料。use sample1-6.dta此一指令亦可用在读取网络上的数据（use 网址）。最后，将数据输入的相关指令整理成下表。insheetread ASCII （text） data created by a spreadsheetinfileread unformatted ASCII （text） datain

8、fixread ASCII （text） data in fixed formatinputenter data from keyboarduse load a Stata-format dataset四、探索资料（Exploring data）为了更详细地呈现出在数据探索时所需使用的相关指令，我们利用sample4-1来说明指令的用法。首先，利用前节所提及的数据输入方法将sample4-1读进STATA。在正式分析数据之前，我们可以利用一个log档来储存之后所要执行的指令以及所得到的结果。指令的表示方法如下：log using result4-1, text（log檔的名稱為result4-

9、1）接下来，我们可以先利用下面的指令来检视sample4-1的数据：count：可得样本数。describe：描述数据来源以及数据大小。list：依序列出观察值的各个变量值。codebook：描述资料的详细内容。此外，我们就可以利用summarize、tabulate和tabstat等指令得到数据的叙述统计与基本特性。表示如下：summarize：列出资料的叙述统计。summarize write, detailsum write if read=60（sum是summarize的简写）sum write if prgtype=academic（接在if之后的句子中的”=”要放两个）sum w

10、rite in 1/40（只列出第1笔到第40笔资料）tabulate：列出变数的次数表。tabulate prgtype tabulate prgtype racetabulate prgtype, summarize（read）tabulate prgtype race, summarize（write）tabstat：列出变量的叙述统计。tabstat read write math, by（prgtype） stat（n mean sd） tabstat write, stat（n mean sd p25 p50 p75） by（prgtype）接下来，我们介绍一些用来划图的指令：茎叶

11、图：stem writestem write, lines（2）直方图：graph write, bin（10）graph write, hist normal bin（10）箱形图：graph write, boxsort prgtype（要先有这个指令才能执行下一个指令）graph write, box by（prgtype）此外，利用correlate或是pwcorr可以得到相关矩阵；亦可利用graph划出散布图。correlate write read sciencepwcorr write read science, obsgraph write read, twowaygra

12、ph write read, two jitter（2）（two是twoway的簡稱，jitter是用來區分重疊的觀察點）graph write read, two jitter（2） boxgraph read science write, matrix half现在我们可以将log文件结束了，指令输入如下：log close若欲检视log档中的结果，可以输入指令：type result4-1.log或是到所储存的目录下点选。最后，将数据探索的相关指令整理成下表。countShow the number of observations describeDescribe contents of

13、 data in memory or on disklistList values of variablescodebookDetailed contents of a datasetlogCreate a log filesummarizeDescriptive statisticstabulateOne- & two-way frequency tablestabstatTable of descriptive statisticsstemStem-and-leaf plotgraphHigh resolution graphssortSort observations in a data

14、sethistHistogram of a categorical variablecorrelateCorrelationspwcorrPairwise correlationstypeDisplay an ASCII file五、修饰资料（Modifying data）在本小节中，我们亦利用sample4-1的数据进行说明。首先，读进数据。读完数据后，可以为此数据取个名称，指令如下：label data High School and Beyond, 200 cases现在我们可以将变量的顺序作一排列。原先的变量顺序为gender、id和race，但是我们想把顺序改成id、gender和r

15、ace，则可以下面的指令来执行：order id gender在执行codebook时，我们会发现有些变量尚未加上卷标（label），为了更清楚地表达变量所代表的意义，我们可以执行以下的指令：label variable schtyp The type of school the student attended.现在，我们想要产生一个新变量total，此变量代表read、write和math的总和。指令如下：generate total = read + write + math此外，若是我们想加总的分数是read、write和socst，而非read、write和math，此时的指令输入如

16、下：replace total = read + write + socst另一方面，我们还可以将变量total表示成以等级（A、B、C、D and F）的形式。generate grade = totalrecode grade 0/80=0 80/110=1 110/140=2 140/170=3 170/300=4label define abcdf 0 F 1 D 2 C 3 B 4 Alabel values grade abcdf为了记忆变量的意义为何，我们还可以利用note的方式来记录变量。notes race: values of race coded as 5 were re

17、coded to be missingnotes（叫出note的指令）另外，介绍一些利用公式来产生变量的指令。egen zread = std（read）summarize zreadlist read zread in 1/10egen rmean = mean（read）, by（ses）list read ses rmean in 1/10egen mread = median（read）, by（prog）list read prog mread in 1/10最后，我们可以将以上的执行结果储存下来。save sample5-1（存成另一個檔）save sample4-1（取代原來的s

18、ample4-1）现在亦将数据修饰的相关指令整理成下表。label dataApply a label to a data setorderOrder the variables in a data setlabel variableApply a label to a variablegenerateCreates a new variablereplaceReplaces one value with another valuerecodeRecode the values of a variableLabel valuesApply value labels to a variablel

19、abel defineDefine a set of a labels for the levels of a categorical variablenotesApply notes to the data fileegenExtended generate - has special functions that can be used when creating a new variablesaveStore the dataset currently in memory on disk in Stata data format六、管理数据（Managing data）在本节中，我们将进

20、一步介绍如何将数据作一些特殊的处理，例如：保留所欲分析的数据、删除多余的数据或是将两份数据结合等等。假设我们只想针对部分的数据进行处理，而又想保留原始资料时，则有以下两种方法可进行：1、另存新檔：亦即将所欲分析的部分数据储存在另一个档案中。我们只针对read成绩大于或是等于60分的学生进行分析，则可利用下面的指令来筛选。keep if read = 60summarize save sample6-1当只要保留某些变量时，则利用指令keep。keep read write。2、直接处理：亦即在原始数据上进行分析。承上例，指令输入如下：preservedrop if read 60restore

21、若要删除某些变量时，则利用指令drop。drop read write。接下来，我们介绍如何将两笔数据结合在一起。数据的结合主要可以分为两种，水平合并和垂直合并。前者是指变量的增加；后者则是指样本数的增加。说明如下：1、水平合并use sampleh1append using sampleh22、垂直合并： use samplev1sort idsave samplev1, replaceuse samplev2, clearsave , replacemerge id using samplev2在垂直合并前要记得先sort。最后，我们将数据修饰的相关指令整理成下表。keep ifKeep

22、observations if condition is metdrop ifDrop observations if condition is metkeepKeep variables （dropping others）drop Drop variables （keeping others）append usingAppend a data file to current fileSort observationsmergeMerge a data file with current file七、资料分析透过前面几节的介绍，应该对于STATA的指令和使用方法有了基本的认识。现在，我们开始说

23、明如何利用STATA来处现统计上的问题以及计量方面的模型。1、检定：我们利用下面的例子来示范如何进行统计上的检定工作。sample4-1：ttest write =60ttest write, by （gender）ttest write, by （gender） unequalsample7-1：ttest before= after2、回归在执行回归分析时所使用的指令为regress。use sample7-2regress growth lnrlp84 lnemp oclnemp cr4 lnrd oc另外，当存在heterogeneity of variance的问题时，可在后面加上r

24、obust；另外，若是不想放入截距项时，可在后面加上noconstant。若欲得到残差值，可输入以下指令：predict e , residual3、二元选择模型在执行二元选择模型时所使用的程序写法与执行回归分析时相同，只是所使用的指令不同。在logit模型时为logit；在progit模型时为progit。clearuse sample7-3logit oc rlp emptot rlp2 emptot2 rlpemp lnrdlstatlogit oc rlp emptot rlp2 emptot2 rlpemp lnrd,orprobit oc rlp emptot rlp2 empto

25、t2 rlpemp lnrddprobit oc rlp emptot rlp2 emptot2 rlpemp lnrd4、Treatment effect model原则上，STATA在处理计量模型时，格式上大都一致，亦即指令被解释变量解释变量的输入型式。我们再举一个计量模型来说明，例如：在有关自我选择的问题时，为了考虑内生性的情形，计量学家提出了一个Treatment effect model，其指令的撰写如下：treatreg growth lnrlp84 lnemp oclnemp lnrd cr4,treat（oc= rlp84 emptot rlp842 emptot2 rlpemp cr4 lnrd）treatreg growth lnrlp84 lnemp oclnemp lnrd cr4,treat（oc= rlp84 emptot rlp842 emptot2 rlpemp cr4 lnrd）two由上述可知，STATA在使用上真的相当方便、容易，尤其对于初学者而言，更是一个相当值得推荐的软件包。最后，整理一些STATA的相关网站以供参考：http:/www.ats.ucla.edu/stat/stata/default.htm/www.princeton.edu/erp/stata/main.html13

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？