AntConc的详细使用说明.docx
《AntConc的详细使用说明.docx》由会员分享,可在线阅读,更多相关《AntConc的详细使用说明.docx(17页珍藏版)》请在冰豆网上搜索。
AntConc的详细使用说明
AntConc的详细使用
说明
-CAL-FENGHAI.-(YICAI)-CompanyOne1
AntConc3・2・0的使用说明】
1.提取语境共现
设置检索项
(1)单项检索
a)点击file下拉菜单中的“openfiles",选择要打开的语料(如果想打开整个文件夹,可以选择opendirectory);
b)在“SearchTerm”一栏键入要检索的词项,如go;
c)在44SearchWindowSizeM一栏设置每一共现行出现的词数;
d)点击LW』,开始检索。
检索结果如图所示:
图单项检索结果
(2)多项检索
设置多项检索
除了检索单个词项以外,AntConc还具有检索多个词项的功能,检索方法为在检索项间键入“I”符号。
例:
要检索动词go的各种时态形式,可在uSearchTerm"中输入go|went|goneIgoes
设置语境词检索
为了限制语境共现的检索,可以设定一个语境词在检索项周边一定的语境范围内出现。
例:
如要研究a...of这一类词组,可通过AntConc提取所有的词项,检索方法如下:
a)在uSearchTermM一栏键入a;
b)点击"SearchTerm”旁的=―,进入uAdvancedSearchv界
面,如图所示。
点击aUsecontextwordsandhorizonsM,然后在"ContextWords"-栏键入of,点击[“如]o如要重新设置语境词,可
图AdvancedSearch界而
1此说明书由华南师范大学外文学院2007研尤生张杏娟编写,导师何安平订正和补充。
其中限定范困的检索方法由香港城市大学廨上提供.仅此致谢。
Clear
先点击清除原来语境词,后重复以上操作。
另外,还需设定语境词距离检索项
的位置,如本研究中,of在a的右二位置,所以“ContentHorizon”确定为
ContextHorizon
F5国月“两耳,最后点击页厂|:
C)回到语境共现的界面后,点击L沖』,开始检索。
结果可提取alotof,abitof
等词块。
设置多字语检索
在研究中,如需检索多个词项,除了使用“丨”以外,也可使用以下方法,尤其适合检索项数目较多的情况。
例:
研究感官动词watch,sound,feel,hear,smell
a)在TXT文本中键入所有要检索的词项,可多达250个词。
然后为该文本起名保存。
需注意:
键入的词项需以列的形式排列。
如:
feel
feels
felt
LoadFile
在保存以上新建的文本的盘符路径点击文本名,然后点击一即刖
C)回到语境共现的界面后,点击d兀IL开始检索。
(3)类别检索
使用通配符检索
符号
意义
检索项
检索结果
*
零个或多个字符
book*
提取所有以book打头的词,如book、books、booking、bookshop等
*book
提取所有以book结尾的词,如book、notebook等
*book*
可以同时提取包括以上两类词
+
零个或一个字符
book+
提取所有以book打头的词,但之后有零个或一个字母,如book^books
任意一个字符
ough
提取所有以字母组合ough结尾的,但之前有一个字母的词,如cough、rough等
@
零个或一个词
think@of
提取所有含有的词组,如thinkof>thinkhighlyof等
#
任意一个词
look#
提取所有与look的搭配,如lookafter、lookat等
附码检索
因研究需要,有些语料经过整理加工并附加上各种符号标记,称为“附码语料库”。
如附有词性标注的LOBTA6和附有错误类型标记的CLEC等。
检索时只需键入某个标记符号便可提取带附有该标码的所有词。
例:
提取LOBTAG语料库中所有的名词,只需键入JNN(NN为名词标码,关于其他词性的详细标记,请参阅何安平,2004,《语料库语言学与英语教学》一书的附录113页。
(4)在指定范围内检索
a)在concordance的检索界面上选择11Regex"(regularexpression),键入\『\]为检索项便可提取语料库中所有在起止符号和“r之间的所有文字内容,其他符号照似类推。
b)在concordance的检索界面上选择"Regex"(regularexpression),键入\『write.*\]为检索项便可提取语料库中所有在起止符号“[”和“]”之内的“write”的语境共现行,其他词项照似类推。
键入的检索项计较大小写,但是可以用通配符性
分析检索结果
(1)观察频数.分布
频数即该检索项出现的次数,可在“ConcordanceHits”一栏中获得。
ConcordancePlot
点丄查看检索项在语料文本中的分布状况。
(2)凸显周边语境词
为了具体某个教学等1_1的,可通过凸显检索项周边的某些词汇。
方法是选择"KwicSort",R1和L1分别代表检索项右方和左方的第一个词,一次可设置三列凸现词,均按字母顺序排列。
检索结果如图所示。
如想使凸显内容的颜色一致,可通
OtherOptions
厂Treatcaseinsort
17Sortbycharactersinsteadofwords:
HidesearchterminWACdisplay
过设置GlobalSettings下拉菜单中的«ColorSettings"改变颜色。
另
图ToolPreferences下拉菜单界面
外,若要凸显的部分不是一个词,而是单词中的字母,可选择TodTerences下拉菜单中的uConcordance选项中的uSortbycharactersinsteadofwordsn,如图所示。
[l琳“nr督
|M'»■
亠..一(MMMM
M4«te1
Gt«wiP~^Gum49|Z~3Gm«[Z~?
!
_一R
mmMmmm*
--iniiimi
图凸显周边语境词检索结果
(3)提取搭配词表
Collocatew
通过点击主界面中的L可获得检索项的搭配词表,同时可以设置搭配词
的位置、出现的最少次数与词表的排列方式。
例:
观察look右一的搭配词
Collocat令w
a)点击主界面中的―;
b)在“SearchTerm"—栏键入look;
WindowS|>an丨Same
C)设置搭配词的位置,如FgTo...师月;
d)点击I.IL开始检索,检索结果如图所示。
e)点击“SortbyFreq”可根据不同的需要设定搭配词表的排列方式,如按频数排,按拼写字母排等等。
Cw(wV
Cwkw-Um#j|UMLM
ToWH)agx*Tfcw22TcMUi・CJtc«toIW
3
‘5
J
»>
)
71
i
>
>
>
)
>
4
>
)
<
>
)
5
a
3
T
:
5
2
■
:
0
3
>
?
1
IB
i
n
1
iJ
I
j
1
Jt
L
>
1
JI
L
)
J
14
I
)
J
11
I
)
1
1<
2
1
A
I
0
1
It
I
1
1>
I
1
IB
I
1
Lj
L
)
1
卜
L
4
17w>
杭亠*~X2gprgt>f2~g
01久4MMX
Illlllll川
'・•
r*vi5m
S・2«^
n
图提取搭配词表检索结果
另外,
也可以使用
Cluster令
«・r—
工具来提取搭配词块,且可设置检索项在词块中的位置。
例:
检索以ask开头的搭配词块
a)点击主界面中的J;
b)在“SearchTerm”一栏键入ask;
c)设置检索项的位置,如选择“Ontheleft”;
d)设置搭配词块的长度,如:
3,:
3:
e)点击I.H,开始检索,检索结
三lllllll■
S«4(4aM・S»«*4dUi«
3冷Kidtfar/•“•?
TOM0CUMT^ca
二EH-H二iF%:
L:
rr壮霍税tMC豊
:
:
:
:
・*x■jHute二二工税
I«r»/•rtrCwt'»»?
r*r»>:
巨g]J5f?
-J如g(T-§
*g勿jMmCMtfa
<*«MkiF"3
图提取搭配短语检索结果
(4)提取搭配短语
果如图所示,所有的ask被列在词块的左边。
(5)隐藏.分类和删除
“隐藏”是指把检索结果中的检索项挖空,可用于教学或测试。
具体操作方法如下:
a)在“SearchTerm”一栏键入要检索的词项,如look;
b)占击ToolPreferences,选择uConcordance°,再选择uHidesearchterminKWICdisplay",最后点击|_即血_;
c)点击LU,开始检索。
检索结果如下:
youalwaysdoyourownhomeworkDoyou*******forhelpwhenyouthinkitnecessaryDoyouhelp
2.提取词频表
单字和N字语词频表
单字词频表是指口标语料库的单词表,且词频表的检索结果是以每个词的形式及其频数排列。
方法如下:
a)选择要生成单字词频的LI标语料库;
WordListI
b)进入JI界面,设置词频表排列排序方式,如"SortbyFreq":
也可以设置
为按词头的或者词尾的拼写字母顺序排列。
C)点击L沖」1,开始检索,检索结果如图所示。
图单字词频表检索结果
N字语词频表是指L1标语料库的多字语频数表。
例如,检索句子"Thisisapen"的2字语词频表结果为:
“thisis”、“isa”、“apen”。
N字语词频表的提取方法如下:
a)选择要生成单字词频的忖标语料库;
b)进入C,U8tW,I界面,后点击17;
d)选择词表的排序方式,如“SortbyFreq":
e)点击L开始检索,检索结果如图所示。
图N字语词频表检索结果
词项重组…词簇化(lemmatizing)
词簇化是将同一词性的某个词的所有曲折变化形式作削尾处理,并归为一个词簇来计算频数。
其好处是可以简约词频表并且引起对构词法的关注。
对词频表进行词簇化的方法如下:
WordLi&t
在界面生成词频表之后,拉下ToolPreference菜单,选择Lemmalistoptions,
点击open和load,上传lemmal文档(可在本网站下载)点击Apply(如图2.3所示)。
词簇化的部分结果见图.
图2.3设置词簇化界面
图词频表被词簇化后的结果(部分)。
图中1142例a和133例an被归为同一个词簇a共1275例。
3.提取关键词表
关键词表是指两个语料库的词频表相比,其中一个明显地高频于另一个的那部分词项表。
前一个称H标语料库;后一个称参照语语料库,通常规模要大一些,以此来凸现口标语料库的一些特别高频词以浮现该语料库的主题或内容特色。
凸显目标语料库中显着性高频于对照语料库的词项具体操作方法如下:
a)
b)
c)
d)
e)
点击file下拉菜单中的"openfiles",选择要对比的口标语料的语料(如果对比整
个文件夹,可以选择opendirectory);点击主界面中的血叫;
.I.ToolPreferences
选择uKeyword
List",如图所示;
选择uShownegativekeywords*',可在检索结果中显示对照语料明显高于口标语料的词;
点击
ChooseFiles
选择对照语料,
最后点击Apply
图ToolPreferences对话框
f>点击L^lJL开始检索,检索结果如图所示。
图提取关键词表检索结果