英語語料庫語言學(xué)在我國的發(fā)展
王 三
【摘 要】本文介紹了英語語料庫在我國的發(fā)展?fàn)顩r,對我國英語語料庫基礎(chǔ)上的研究進(jìn)行了概括介紹,并對其應(yīng)用進(jìn)行了探討,期望進(jìn)一步對展開英語語料庫研究有所幫助。
【關(guān)鍵詞】語料庫語言學(xué);英語語料庫
Abstract: This paper reviews the development of English Corpus Linguistics in China, and introduces the studies based on English corpora in China, which is helpful for future research。
Key words: Corpus Linguistics English corpus
一、引 言
在歐洲,語料庫語言學(xué)已經(jīng)成為語言學(xué)的主流分支。語料庫通常指為語言研究收集的、用電子形式保存的語言材料,由自然出現(xiàn)的書面語或口語的樣本匯集而成,用來代表特定的語言或語言變體。它是一個由大量的語言實(shí)際使用的信息組成的、專供語言研究、分析和描述的語言資料庫。語料庫語言學(xué)是在語料庫的基礎(chǔ)上對語言進(jìn)行分析和研究的科學(xué)。它是隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)發(fā)展應(yīng)運(yùn)而生的新的語言學(xué)研究領(lǐng)域和研究手段。經(jīng)過科學(xué)選材和標(biāo)注、具有適當(dāng)規(guī)模的語料庫能夠反映和記錄語言的實(shí)際使用情況。人們通過語料庫觀察和把握語言事實(shí),分析和研究語言系統(tǒng)的規(guī)律。
語料庫語言學(xué)為語言研究與教學(xué)提供了一種全新的方法和思路。它以真實(shí)的語言數(shù)據(jù)為研究對象,對大量的語言事實(shí)進(jìn)行系統(tǒng)分析。它研究的是語言行為(language performance),而不是語言能力(language competence),也就是說它通過考察語言的實(shí)際運(yùn)用來尋找語言使用的規(guī)律。
本文介紹了我國英語語料庫的發(fā)展?fàn)顩r,對我國英語語料庫基礎(chǔ)上的研究進(jìn)行了概括介紹,并探討了它在語言研究、詞典編纂和教學(xué)領(lǐng)域中的作用。期望對進(jìn)一步展開英語語料庫研究有所幫助。
二、英語語料庫在我國的發(fā)展
近年來,英語語料庫語言學(xué)在我國取得了巨大進(jìn)展,出現(xiàn)了眾多各種類型的英語語料庫,我國目前已有不少規(guī)模較大的語料庫。如:早在1982年,上海交通大學(xué)的黃人杰、楊惠中教授就主持建立了一百萬詞次的專門用途英語語料庫(JDEST)。2003年,桂詩春和楊惠中兩位教授主持完成了中國英語學(xué)習(xí)者語料庫(Chinese Learner English Corpus,簡稱CLEC),這是國際上第一部公開發(fā)布的學(xué)習(xí)者語料庫,它對研究中國學(xué)生的語言應(yīng)用和使用失誤等特征,以及它們與外語學(xué)習(xí)之間的關(guān)系等都具有十分重要的指導(dǎo)作用。除了書面語語料庫之外,研究者們也開始建立口語語料庫。如南京大學(xué)創(chuàng)建的中國學(xué)習(xí)者英語口語語料庫(Spoken English Corpus of Chinese Learners,簡稱SECCL)。上海交通大學(xué)也建立了大學(xué)英語學(xué)習(xí)者英語口語語料庫。與此同時,隨著個人電腦的普及,許多研究者個人也開始建立適合自己的小型語料庫,許多英語語料庫應(yīng)運(yùn)而生。這些英語語料庫大部分是中國英語學(xué)習(xí)者的中介語語料庫。
隨著英語語料庫數(shù)量的增多,我國語料庫基礎(chǔ)上的研究也越來越多。在計(jì)算機(jī)技術(shù)的支持下,語料庫方法被應(yīng)用于語言研究的許多領(lǐng)域,如:詞匯、語法、語義、語用、語體研究、社會語言學(xué)研究、口語研究、詞典編纂、語言教學(xué)以及自然語言處理、人工智能、機(jī)器翻譯、言語識別與合成等領(lǐng)域。
對中國學(xué)生英語的分析目前主要從兩方面進(jìn)行:一是對比其他以英語為母語的語料庫來分析學(xué)習(xí)者的語料特征;二是對失誤特征進(jìn)行分析。但是我國目前在語料庫基礎(chǔ)上的研究還處于起步階段,多使用語料的檢索和頻率統(tǒng)計(jì)結(jié)果。
三、英語語料庫在我國的應(yīng)用
隨著計(jì)算機(jī)技術(shù)空前迅速的發(fā)展,英語語料庫也在我國迅速發(fā)展。語料庫方法在詞典編纂、語言研究和語言教學(xué)等方面也得到了越來越多的應(yīng)用。語料庫是語言研究與教學(xué)的重要基礎(chǔ),是編寫詞典、語法書和教材的重要源泉。
語料庫和語料庫語言學(xué)在當(dāng)今語言研究由高度抽象轉(zhuǎn)向語言的實(shí)際使用這個過渡中起著十分重要的作用:一是提供真實(shí)語料;二是提供統(tǒng)計(jì)數(shù)據(jù);三是驗(yàn)證現(xiàn)行的理論;四是構(gòu)建新的理論。提供真實(shí)語料是詞典編纂的生命線。現(xiàn)在流行的英語詞典幾乎全部是基于大規(guī)模語料庫編纂而成的。基于大規(guī)模語料庫的英語語法書也已經(jīng)問世。在理論建設(shè)上,基于英國國家語料庫英語口語庫的研究表明,基于真實(shí)英語口語語料的英語口語語法跟基于書面語的語法有很大不同。
在應(yīng)用語言學(xué)領(lǐng)域,詞典編纂和語言教學(xué)同是語料庫的最大受益者。目前已有多部詞典在編纂或修訂過程中,不同程度地使用語料庫或電子文檔收集詞語數(shù)據(jù),用于收詞、釋義、例句、屬性標(biāo)注等。南京大學(xué)近年來開發(fā)了NULEXID語料庫暨雙語詞典編纂系統(tǒng),涉及英漢兩種語言,在《新時代英漢大詞典》的編纂過程中起了重要作用。
語料庫用于語言教學(xué)的一個例子是上海交通大學(xué)的JDEST英語語料庫,利用這個語料庫,通過語料比較、統(tǒng)計(jì)、篩選等方法為中國大學(xué)英語教學(xué)提供通用詞匯和技術(shù)詞匯的應(yīng)用信息,為確定大學(xué)英語教學(xué)大綱的詞表提供了可靠的量化依據(jù)。這個語料庫也在英語語言研究中發(fā)揮了作用,支持基于語料庫的英語語法的頻率特征、語料庫驅(qū)動的詞語搭配等項(xiàng)研究。
中國學(xué)習(xí)英語者(CLEC)涵蓋我國中學(xué)生、大學(xué)英語4級和6級、英語專業(yè)低年級和高年級的學(xué)習(xí)內(nèi)容,并對所有的語料作了語法標(biāo)注和言語失誤標(biāo)注。根據(jù)這個語料庫得到了詞頻排列表、拼寫失誤表、詞目表、詞頻分布表、語法標(biāo)注頻數(shù)表、言語失誤表等,還把這些數(shù)據(jù)與一些英語本族語語料庫(如BROWN,LOB,F(xiàn)ROWN,F(xiàn)LOB)進(jìn)行了某些比較。這個語料庫為詞典編纂、教材編寫和語言測試提供了必要的資源。
語料庫是一個龐大的語言素材的集合體,主要用于觀察、分析和研究目的語的各種特征。它能快速準(zhǔn)確地提供諸如構(gòu)詞、搭配、語境等多方面的語料及信息。詞匯教學(xué)是語料庫資源和研究手段用于外語教學(xué)時間最早和成果最多的一個領(lǐng)域。語料庫在外語學(xué)習(xí)中縮小課堂語言與真實(shí)語言的差距、培養(yǎng)學(xué)習(xí)者的語感和學(xué)習(xí)能力及研究能力等方面也正在發(fā)揮越來越大的作用。
利用語料庫對語言的特征以及學(xué)習(xí)者的語言使用特征等方面作出分析,其分析結(jié)果可應(yīng)用于指導(dǎo)語言教學(xué)的實(shí)踐,改進(jìn)課堂教學(xué)。比如,語言現(xiàn)象的分布和頻率等信息可以用來指導(dǎo)教師確定哪些是教學(xué)的重點(diǎn)和難點(diǎn)等;學(xué)習(xí)者語言應(yīng)用和使用失誤等信息可以幫助教師診斷學(xué)生在語言學(xué)習(xí)過程中可能存在的問題,并為學(xué)生進(jìn)行有針對性的訓(xùn)練。語料庫還可以應(yīng)用于教材編寫和教學(xué)大綱設(shè)計(jì)等。語料庫為確定教材或教學(xué)大綱中的詞匯表、語法結(jié)構(gòu)以及它們的編排順序等提供了科學(xué)的依據(jù)。應(yīng)用語料庫開展計(jì)算機(jī)輔助語言教學(xué)也開始引起廣泛的興趣。
在英語教學(xué)與研究方面,語料庫和語料庫語言學(xué)一直發(fā)揮著非常重要的作用,從理論、內(nèi)容和方法等方面對語言教學(xué)與研究都有重要影響,比如英語教學(xué)方面,經(jīng)典性的詞典和語法書等就是在英語語料庫的基礎(chǔ)上編寫而成的。語料庫的應(yīng)用將從傳統(tǒng)領(lǐng)域,如詞典編篡,擴(kuò)展到新興領(lǐng)域,如編寫教學(xué)大綱和教材、開展機(jī)助語言學(xué)習(xí)、機(jī)器翻譯等;以語料庫為基礎(chǔ)的研究方法將逐漸受到重視和廣泛應(yīng)用;英語語料庫及語料庫語言學(xué)將在今后的英語教學(xué)和研究領(lǐng)域發(fā)揮更大的作用。
對于詞匯學(xué)、語法學(xué)、語言理論、歷史語言學(xué)等研究來說,語料庫的作用目前大多還是通過語料檢索和頻率統(tǒng)計(jì),幫助人們觀察和把握語言事實(shí),分析和研究語言的規(guī)律。語料庫方法的發(fā)展會使這種僅起輔助作用的手段逐步變成必備的應(yīng)用資源和工具。利用語料庫,人們可以把指定的語法現(xiàn)象加以量化,并且檢測和驗(yàn)證語言理論、規(guī)則或假設(shè)。
結(jié)束語
我國目前已建成大量的英語語料庫,在規(guī)模、設(shè)計(jì)和研究目的等方面各具特色,已經(jīng)被證明是對英語語言進(jìn)行廣泛研究的最佳信息源,極大地促進(jìn)了對英語詞匯、句法和語篇等的研究和描述,同時也推動了對英語不同變體的比較研究和英語定量的探索研究。英語語料庫所蘊(yùn)含的巨大的研究潛力使得以語料庫為基礎(chǔ)的研究快速發(fā)展壯大起來,英語語料庫及語料庫語言學(xué)研究有著廣闊的發(fā)展前景。英語語料庫及語料庫語言學(xué)將在英語教學(xué)與研究方面發(fā)揮更大的作用。但是我國在語料庫的發(fā)展和應(yīng)用上還處于起步階段,需要更多的探索。
參考文獻(xiàn):
[1] Thomas, J. and Short, M. (eds) Using Corpora for Language Research, London: Longman, 1996.
[2] McEnery T&Wilson A. Corpus Linguistics Edinburgh University Press, 1996.
[3] Kennedy, Graeme. An Introduction to Corpus Linguistics. Addison Wesley Longman, 1998.
[4] 楊惠中. 語料庫語言學(xué)導(dǎo)論. 上海:上海外語教育出版社,2002
[5] 衛(wèi)乃興. 基于語料庫和語料庫驅(qū)動的詞語搭配研究. 當(dāng)代語言學(xué). 2002年第2期