AntConc地详细使用说明书.docx
《AntConc地详细使用说明书.docx》由会员分享,可在线阅读,更多相关《AntConc地详细使用说明书.docx(17页珍藏版)》请在冰点文库上搜索。
![AntConc地详细使用说明书.docx](https://file1.bingdoc.com/fileroot1/2023-5/8/a45068d2-f07a-4553-af18-a153c54e11cc/a45068d2-f07a-4553-af18-a153c54e11cc1.gif)
AntConc地详细使用说明书
AntConc3.2.0的使用说明1
1.提取语境共现1.1设置检索项
(1)单项检索
a)点击file下拉菜单中的openfiles”,选择要打开的语料(如果想打开整个文件夹,
可以选择opendirectory);
b)在SearchTerm”一栏键入要检索的词项,女口go;
c)在SearchWindowSize”一栏设置每一共现行出现的词数;
d)点击恥“,开始检索。
检索结果如图1.1所示:
图1.1单项检索结果
(2)多项检索
设置多项检索
除了检索单个词项以外,AntCone还具有检索多个词项的功能,检索方法为在检索项间键入“”符号。
此说明书由华南师范大学外文学院2007研究生张杏娟编写,导师何安平订正和补充
其中限定范围的检索方法由香港城市大学D.Lee博士提供,仅此致谢。
例:
要检索动词go的各种时态形式,可在SearchTerm”中输入go|went|gone|goes
设置语境词检索
为了限制语境共现的检索,可以设定一个语境词在检索项周边一定的语境范围内出现。
例:
如要研究a…of这一类词组,可通过AntConc提取所有的词项,检索方法如下:
a)在SearchTerm”一栏键入a;
入of,点击二•
如要重新设置语境词,可先点击
清除原来语境词,后重
复以上操作。
另外,还需设定语境词距离检索项的位置,如本研究中,of在a的右二位
图1.2AdvaneedSearch界面ContextHoriizoo
置,所以ContentHorizon”确定为''''~,最后点击1—;
c)
回到语境共现的界面后
,点击恥",开始检索。
结果可提取alotof,abitof
词块
设置多字语检索
在研究中,如需检索多个词项,除了使用“丨以外,也可使用以下方法,尤其适合检索项数目较多的情况。
例:
研究感官动词watch,sound,feel,hear,smell
a)在TXT文本中键入所有要检索的词项,可多达250个词。
然后为该文本起名保存。
需注意:
键入的词项需以列的形式排列。
女口:
b)点击SearchTerm”旁的,进入AdvaneedSearch”界面,如图1.2所示。
点击Usecontextwordsandhorizons”,然后在ContextWords”一栏键
b)
feel
feels
felt
点击SearchTerm旁的
Advanced
选择Usesearchterm(s)fromlistbelow
”。
占
0八、、
LoadFile
在保存以上新建的文本的盘符路径点击文本名
c)回到语境共现的界面后,点击aartII,开始检索
(3)类别检索
使用通配符检索
符号
意义
检索项
检索结果
*
零个或多个字符
book*
提取所有以book打头
的词,如book、
books、booking、bookshop等
*book
提取所有以book结尾
的词,如book、
notebook等
*book*
可以同时提取包括以上
两类词
+
零个或一个字符
book+
提取所有以book打头的词,但之后有零个或一个字母,女口book、
books
?
任意一个字符
?
ough
提取所有以字母组合ough结尾的,但之前有一个字母的词,如
cough、rough等
@
零个或一个词
think@of
提取所有含有的词组,
如thinkof、think
highlyof等
#
任意一个词
look#
提取所有与look的搭
配,如lookafter、look
at等
附码检索
因研究需要,有些语料经过整理加工并附加上各种符号标记,称为附码语料库”。
如附有词性标注的LOBTAG和附有错误类型标记的CLEC等。
检索时只需键入某个标记符号便可提取带附有该标码的所有词。
例:
提取LOBTAG语料库中所有的名词,只需键入*_NN(NN为名词标码,关于其他词性的详细标记,请参阅何安平,2004,〈语料库语言学与英语教学》一书的附录113页。
(4)在指定范围内检索
a)在concordanee的检索界面上选择"Regex"(regularexpression),键入\[.*\]为检索项便可提取语料库中所有在起止符号『和厂之间的所有文字内容,其他符号照似类
b)在concordanee的检索界面上选择"Regex"(regularexpression),键入\[.*write.*\]
为检索项便可提取语料库中所有在起止符号『和之内的Write”的语境共现行,其他
词项照似类推。
键入的检索项计较大小写,但是可以用通配符*。
1.2分析检索结果
(1)观察频数、分布
频数即该检索项出现的次数,可在ConcordaneeHits”一栏中获得
ConcordancePlot
点击,查看检索项在语料文本中的分布状况。
(2)凸显周边语境词
OtherOptions
Treatinsort
*Sortbycharactersinsteadafwords
'HidesearchterminKWICdisplay
图1.4ToolPreferences下拉菜单界面
为了具体某个教学等目的,可通过凸显检索项周边的某些词汇。
方法是选择KwicSort”,R1和L1分别代表检索项右方和左方的第一个词,一次可设置三列凸现词,均按字母顺序排列。
检索结果如图1.3所示。
如想使凸显内容的颜色一致,可通过设置亠一■汕丄下拉菜单中的ColorSettings”改变颜色。
另外,若要凸显的部分不是一个词,而是单词中
的字母,可选择J*上1-=、下拉菜单中的Concordanee”选项中的Sortbycharactersinsteadofwords”,如图1.4所示。
■1.
■■
■■
■■
-“1
.Lri.
.Lrii
.1.
■■■
-1.
.1.
■UB
'-bl
i.
■i
■'
--•
■■-■■
.CK
.LK
■■
-1
■■
.1.
•■■
■
.1.
■'
・I
■
Lrii.UM.LK■EE
'•
■■1
.'1
LR
图1.3凸显周边语境词检索结果
(3)提取搭配词表
通过点击主界面中的可获得检索项的搭配词表,同时可以设置搭配词
的位置、出现的最少次数与词表的排列方式。
例:
观察look右一的搭配词
a)点击主界面中的
b)在SearchTerm”一栏键入look;
c)
设置搭配词的位置,如
Wimdow刊站ihSame
From...|1RTa,-,
|iRl
d)点击
Start
,开始检索,
检索结果如图
1.5所示。
e)点击SortbyFreq”可根据不同的需要设定搭配词表的排列方式
,如按频数排,按
拼写字母排等等
图1.5提取搭配词表检索结果
(4)提取搭配短语
Clusters
另外,也可以使用■这一
工具来提取搭配词块,且可设置检索项在词块中的位置。
例:
检索以ask开头的搭配词块
Clusters
a)点击主界面中的
【■去巾T饭电冃讥」怖盍山
b)在SearchTerm”一栏键入ask;c)设置检索项的位置,如选择Ontheleft”;
d)设置搭配词块的长度,女口Min.Size:
3,Max.Size:
3;
e)点击^rtI,开始检索,检索结果如图1.6所示,所有6的提取k被列在词块结果左边
(5)隐藏、分类和删除
隐藏”是指把检索结果中的检索项挖空,可用于教学或测试。
具体操作方法如下:
a)在SearchTerm”一栏键入要检索的词项,女口look;
b)点击’"",选择Concordanee”,再选择HidesearchterminKWIC
display”,最后点击口;
c)点击血",开始检索。
检索结果如下:
youalwaysdoyourownhomework?
Doyou*******forhelpwhenyouthinkitnecessary?
Doyouhelp
2.提取词频表2.1单字和N字语词频表
单字词频表是指目标语料库的单词表,且词频表的检索结果是以每个词的形式及
其频数排列。
方法如下:
a)选择要生成单字词频的目标语料库;
WordList
b)进入界面,设置词频表排列排序方式,如SortbyFreq”;也可以设置为
按词头的或者词尾的拼写字母顺序排列
c)点击帥rt,开始检索,检索结果如图2.1所示
图2.1单字词频表检索结果
N字语词频表是指目标语料库的多字语频数表。
例如,检索句子Thisisapen”的
2字语词频表结果为:
thisis”、is“a”、apen”。
N字语词频表的提取方法如下:
a)选择要生成单字词频的目标语料库;
b)进入CIUSterS界面,后点击N5恥;
c)
设置N字语词频表的长度,如
d)选择词表的排序方式,如SortbyFreq”;
e)点击上L_l,开始检索,检索结果如图2.2所示
图2.2N字语词频表检索结果
2.2词项重组---词簇化(lemmatizing)
词簇化是将同一词性的某个词的所有曲折变化形式作削尾处理,并归为一个词簇来
计算频数。
其好处是可以简约词频表并且引起对构词法的关注。
对词频表进行词簇化的方法如下:
WordLi^t
在界面生成词频表之后,拉下ToolPreferenee菜单,选择Lemmalistoptions,点击open和load,上传lemmal文档(可在本网站下载)点击Apply(如图2.3所示)。
词簇化的部分结果见图24
图2.3设置词簇化界面
ClH'^UHFlll:
!
il
■r)07hb丄一Q.t■上
Cwww!
d'Ww,?
QorHQBdWKVPW
thYwrw眸lUwtW事gkiTl陀
ffgidLIVl
Etpywrifri1ag|
fjtaaP^EKEHHI:
li
国illlllllll
EzthT古rmp加d£厂Casa厂聞和:
OrHW
PT^mI-MM*Mk-WH■■:
as?
EM;
AnLC«nTmJLT...
HMElIcAdNiirtei已'A>udT”.SEB1ddrwtei&Wmdra4w:
T-343D
FiWn*
L*rfvM
LfrftrfrtWtrdRSnHi)
L
加
店齐
Ji
1Z75
JL
A11.4ZKT,ill
1ZG7
aird.
£
$«£
aE
€
»3fl
la
阿
W
14
■»
4CZ
i
IO
445
ttUJE
uhM417-thuavIS-
11.
fax
12
<1£
M<1
L?
ill
ufWZ
14
absi
:
U
1£
344
图2.4词频表被词簇化后的结果(部分)图中1142例a和133例an被归为同一个词簇a共1275例
3.提取关键词表
关键词表是指两个语料库的词频表相比,其中一个明显地高频于另一个的那部分词项表。
前一个称目标语料库;后一个称参照语语料库,通常规模要大一些,以此来凸现目标语料库的一些特别高频词以浮现该语料库的主题或内容特色。
3.1凸显目标语料库中显著性高频于对照语料库的词项
具体操作方法如下:
a)点击file下拉菜单中的openfiles”,选择
要对比的目标语料的语料(如果对比整
个文件夹,可以选择opendirectory);
KeywordList
b)点击主界面中的
c)
点击
T□□!
Preferences
,选择KeywordList
如图3.1所示;
d)选择Shownegativekeywords”,可在检索结果中显示对照语料明显高于目标语料的词;
e)点击,选择对照语料,最后点击亘二
f)点击宝旨匸,开始检索,检索结果如图3.2所示。
图3.1ToolPreferences对话框
图3.2提取关键词表检索结果