1、AntConc的详细使用说明AntConc的详细使用说明-CAL-FENGHAI.-(YICAI)-Company One 1AntConc320的使用说明】1.提取语境共现设置检索项(1)单项检索a) 点击file下拉菜单中的“open files,选择要打开的语料(如果想打开整个文件 夹,可以选择 open directory);b) 在“Search Term ”一栏键入要检索的词项,如go;c) 在44Search Window SizeM 一栏设置每一共现行出现的词数;d) 点击L W,开始检索。检索结果如图所示:图单项检索结果(2)多项检索设置多项检索除了检索单个词项以外,AntC
2、onc还具有检索多个词项的功能,检索方法为在检索 项间键入“I”符号。例:要检索动词go的各种时态形式,可在u Search Term中输入go | went | gone Igoes设置语境词检索为了限制语境共现的检索,可以设定一个语境词在检索项周边一定 的语境范围内出现。例:如要研究a . of这一类词组,可通过AntConc提取所有的词项,检 索方法如下:a) 在 uSearch Term M 一栏键入 a;b) 点击Search Term” 旁的 =,进入 uAdvanced Searchv 界面,如图所示。点击 a Use context words and horizons M ,
3、然后在 Context Words-栏键入of,点击“如o如要重新设置语境词,可图 Advanced Search 界而1此说明书由华南师范大学外文学院2007研尤生张杏娟编写,导师何安平订正和补充。 其中限定范困的检索方法由香港城市大学廨上提供.仅此致谢。Clear先点击 清除原来语境词,后重复以上操作。另外,还需设定语境词距离检索项的位置,如本研究中,of在a的右二位置,所以“Content Horizon ”确定为Context HorizonF5国月“两耳,最后点击页厂| :C) 回到语境共现的界面后,点击L沖,开始检索。结果可提取a lot of, a bit of等词块。设置多字语
4、检索在研究中,如需检索多个词项,除了使用“丨”以外,也可使用以下方法,尤其 适合检索项数目较多的情况。例:研究感官动词 watch, sound, feel, hear, smella)在TXT文本中键入所有要检索的词项,可多达250个词。然后为该文本起名保存。需注意:键入的词项需以列的形式排列。如:feelfeelsfeltLoad File在保存以上新建的文本的盘符路径点击文本名,然后点击一即刖C)回到语境共现的界面后,点击d兀IL开始检索。(3)类别检索使用通配符检索符号意义检索项检索结果*零个或多个字符book*提取所有以book打头 的词,如book、 books、booking、
5、bookshop 等*book提取所有以book结尾 的词,如book、 notebook 等*book*可以同时提取包括以上 两类词+零个或一个字符book+提取所有以book打头 的词,但之后有零个或 一个字母,如book books任意一个字符ough提取所有以字母组合 ough结尾的,但之前有 一个字母的词,如 cough、 rough 等零个或一个词thinkof提取所有含有的词组, 如 think of think highly of等#任意一个词look#提取所有与look的搭 配,如 look after、look at等附码检索因研究需要,有些语料经过整理加工并附加上各种符号
6、标记,称为“附码语料 库”。如附有词性标注的LOBTA6和附有错误类型标记的CLEC等。检索时只需键入某 个标记符号便可提取带附有该标码的所有词。例:提取LOBTAG语料库中所有的名词,只需键入JNN (NN为名词标码,关于其 他词性的详细标记,请参阅何安平,2004,语料库语言学与英语教学一书的附录 113 页。(4)在指定范围内检索a)在concordance的检索界面上选择11 Regex (regular expression),键入为检索项便 可提取语料库中所有在起止符号和“r之间的所有文字内容,其他符号照似类 推。b)在 concordance 的检索界面上选择Regex (reg
7、ular expression),键入write.*为检 索项便可提取语料库中所有在起止符号“”和“”之内的“write”的语境共现行,其 他词项照似类推。键入的检索项计较大小写,但是可以用通配符性分析检索结果(1)观察频数.分布频数即该检索项出现的次数,可在“Concordance Hits” 一栏中获得。Concordance Plot点 丄查看检索项在语料文本中的分布状况。(2)凸显周边语境词为了具体某个教学等1_1的,可通过凸显检索项周边的某些 词汇。方法是选择KwicSort , R1和L1分别代表检索项右 方和左方的第一个词,一次可设置三列凸现词,均按字母顺序 排列。检索结果如图所
8、示。如想使凸显内容的颜色一致,可通Other Options厂 Treat case in sort17 Sort by characters instead of words: Hide search term in WAC display过设置Global Settings下拉菜单中的 Color Settings改变颜色。另图Tool Preferences下拉菜单界面外,若要凸显的部分不是一个词,而是单词中的字母,可选择Tod Terences下拉菜单中 的 uConcordance选项中的 uSort by characters instead of wordsn ,如图所示。l 琳
9、 “ nr 督| M 亠.一 (M MMMM4te 1G twi PGum49|Z3GmZ? !_ 一 Rmm Mm mm*-iniiimi图凸显周边语境词检索结果(3)提取搭配词表Collocatew通过点击主界面中的 L可获得检索项的搭配词表,同时可以设置搭配词的位置、出现的最少次数与词表的排列方式。例:观察look右一的搭配词Collocat 令 wa) 点击主界面中的 ;b) 在 “Search Term 栏键入 look;Window S|an 丨 SameC)设置搭配词的位置,如Fg To.师月 ;d) 点击I. IL开始检索,检索结果如图所示。e) 点击“SortbyFreq”可
10、根据不同的需要设定搭配词表的排列方式,如按频数排, 按拼写字母排等等。Cw (wVCwkw-Um# j | UM LMToWH) agx* Tfcw 22 TcMUi CJtcto IW)71i)4)5a3T:52:03?1IBin1iJIj1JtL1JIL)J14I)J11I)11I1IBI1LjL)1卜L41 7w杭亠* X2 g prg t f2g01 久 4MMXI lllllll川 r *vi5mS2n图提取搭配词表检索结果另外,也可以使用Cluster 令r工具来提取搭配词块,且可设置检索 项在词块中的位置。例:检索以ask开头的搭配词块a) 点击主界面中的 J;b) 在 “Sea
11、rch Term ” 一栏键入 ask;c) 设置检索项的位置,如选择“On the left” ;d) 设置搭配词块的长度,如:3,:3:e) 点击I. H,开始检索,检索结三 lllllllS4(4aM S*4dUi3 冷Kidtfar/“ ? TOM0 CUM Tc a二EH-H 二 iF% :L:rr壮霍税tMC豊:* x jHute二二工税Ir /rtr Cwt ?r* r :巨g J 5 f?-J 如 g (T-* g 勿 j Mm CMtf a*Mk i F3图提取搭配短语检索结果(4)提取搭配短语果如图所示,所有的ask被列在词块的左边。(5)隐藏.分类和删除“隐藏”是指把检索
12、结果中的检索项挖空,可用于教学或测试。具体操作方法如 下:a) 在“Search Term” 一栏键入要检索的词项,如look;b) 占击 Tool Preferences ,选择 u Concordance ,再选择 u Hide search term in KWIC display,最后点击|_即血_ ;c) 点击LU,开始检索。检索结果如下:you always do your own homework Do you * for help when you think it necessary Do you help2.提取词频表单字和N字语词频表单字词频表是指口标语料库的单词表,且词
13、频表的检索结果是以每个词的形式及 其频数排列。方法如下:a) 选择要生成单字词频的LI标语料库;Word List Ib) 进入J I界面,设置词频表排列排序方式,如Sort by Freq:也可以设置为按词头的或者词尾的拼写字母顺序排列。C)点击L沖1,开始检索,检索结果如图所示。图单字词频表检索结果N字语词频表是指L1标语料库的多字语频数表。例如,检索句子This is a pen 的2字语词频表结果为:“thisis”、“isa”、“a pen”。N字语词频表的提取方法 如下:a) 选择要生成单字词频的忖标语料库;b) 进入C,U8tW,I界面,后点击17;d) 选择词表的排序方式,如“
14、Sort by Freq:e) 点击L 开始检索,检索结果如图所示。图N字语词频表检索结果词项重组词簇化(lemmatizing)词簇化是将同一词性的某个词的所有曲折变化形式作削尾处理,并归为一个词簇来 计算频数。其好处是可以简约词频表并且引起对构词法的关注。对词频表进行词簇化 的方法如下:Word Li&t在 界面生成词频表之后,拉下Tool Preference菜单,选择Lemma list options,点击open和load,上传lemmal文档(可在本网站下载)点击Apply (如图2.3所 示)。词簇化的部分结果见图.图2. 3设置词簇化界面图词频表被词簇化后的结果(部分)。图中
15、1142例a和133例an被归为同一个词簇a共1275例。3.提取关键词表关键词表是指两个语料库的词频表相比,其中一个明显地高频于另一个的那部分词 项表。前一个称H标语料库;后一个称参照语语料库,通常规模要大一些,以此来凸 现口标语料库的一些特别高频词以浮现该语料库的主题或内容特色。凸显目标语料库中显着性高频于对照语料库的词项 具体操作方法如下:a)b)c)d)e)点击file下拉菜单中的open files,选择要对比的口标语料的语料(如果对比整个文件夹,可以选择open directory); 点击主界面中的血叫;. I. Tool Preferences选择 u KeywordList,如图所示;选择 uShow negative keywords*,可在 检索结果中显示对照语料明显高于口标 语料的词;点击Choose Files选择对照语料,最后点击Apply图 Tool Preferences 对话框f点击LlJL开始检索,检索结果如图所示。图提取关键词表检索结果
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1