英语语料库及词频表介绍
1、COCA:权威词频库COCA,作为美国当代英语的基准,其权威性不言而喻。它提供Wordlist和genre frequency词汇表,按口语、等5大类别详细划分,分为3个层次,包含约480万个搭配,是深度学习者的理想选择。精简版词频库对于高效学习,50M COCA corpus精选了前2-3万常用词和200-300搭配,极具实用价值。
2、语料库是英语学习的宝库,它汇集了各类英文表述,包含古今词汇,如GBC(Google Books Corpus,拥有1550亿美国英语词汇)、BNC(British National Corpus,英国英语的权威资源)和COHA/COCA(美国当代英语语料库,分别记录历史和现代词汇)。
3、学习和背诵 COCA 语料库词频表是终极法门。COCA 是美国当代英语语料库的简称,具有大、全、新的特点。它包含了高达6亿个词汇,且持续扩充,确保实时性。基于这个庞大语料库,提取出了20000个高频词,覆盖了美国英语中使用频率最高的词汇。这份词表不仅适合准备英语考试,也适用于日常语言表达。
4、COCA词频表 COCA的全称是Corpus of Contemporary American English,即当代美国英语语料库。它研究的对象全部都是当代美国英语语料,基本不包括20世纪早期和19世纪的语料。目前收集了4亿词汇的文献资料。这4亿词汇的基础材料包括1990至年这几十年里阅读量最广泛的和杂志、电影、电视节目。
5、COCA,即美国当代英语语料库,是一个总结了英语最常用词汇的大数据。它包含从1990年至年间美国代表性报纸、杂志、、学术论文及口语(可能通过电视剧或脱口秀节目转录)的内容,每部分占比五分之一,生成了一个包含5亿单词的语料库。
6、COCA,何以成为英语学习的宠儿? COCA,即美国当代英语语料库,因其大、全、新的特性而备受瞩目。它囊括了6亿个词汇,每年还在以两千万的数量持续更新,确保了内容的实时性和实用性。从电影到学术文章,COCA捕捉了英语语言的最新动态。COCA词频表的诞生,源于对这海量数据的精心提炼。
有没有类似antconc的英语语料库检索使用的分享?
1、Wordsmith,由英国利物浦大学教授设计的分析。 AnConc,日本早稻田大学教授设计的语料分析。 ParaConc,用于平行语料库检索。 PowerGREP,语言特征提取的强大。 北京外国语大学开发的,包括PatCount和BFSU Collocator。导师推荐的两件是Lexical Tutor和CLAWS。
2、想要分析词频,语料库检索分析是不错的选择。两款个人推荐的有AntConc和YiCorpus。AntConc是Laurence Anthony开发的,功能丰富但不包含补丁,且没有停用词表,需自行导入。它的词频功能界面清晰直观。YiCorpus是Tmxmall旗下的多功能平台,集单语、平行和术语库于一体。
3、AntConc是由Laurence Anthony开发的语料库检索,提供丰富的功能,用户可以在使用。然而,在使用AntConc进行词频分析时,需注意其对未分词的检测词频准确度较低,会将短句误识别为词语。因此,在导入AntConc前,需要先使用分词进行预处理。