馬爾可夫模型下英語口語表達的統(tǒng)計分析
姚艷梅
一、引言 從國內(nèi)英語口語研究方面的文獻來看,該研究已經(jīng)從定性研究逐漸集合多學科,借助于數(shù)據(jù)統(tǒng)計分析,轉(zhuǎn)向定量的研究。國內(nèi)近年的研究主要有:張文忠,吳旭東在文獻《第二語言口語流利性發(fā)展定量研究》一文中對第二語言口語流利性發(fā)展進行了實證性定量研究,首先確定了口語流利性的具體測定指標;然后從定量的角度對第二語言口語流利性的發(fā)展進行了描述。從測試的統(tǒng)計分析結(jié)果來看,受試者在經(jīng)過一段時間的基礎(chǔ)訓練后,英語口語的流利性得以提高,準確性并無改變,學習者在口語流利性的發(fā)展趨勢上呈現(xiàn)出個體差異,[1]此研究沒有對口語的準確性給出定量的分析,使得口語表達能力難以給出綜合評價;譚曉晨,董榮月在《任務類型和語言水平對英語專業(yè)大學生口語準確性和復雜性的影響》一文中,就使用語料庫的方法,探索不同的口語產(chǎn)出任務和語言水平對英語學習者口語表達準確性和復雜性的影響,[2]對口語表達的準確性問題進行了一些有益的探索,但主要是采用定性的分析方法,而且缺乏數(shù)據(jù)的支撐 ,使得研究結(jié)果缺乏深度和精確度。何蓮珍,王敏在《任務復雜度、任務難度及語言碎片對中國學生語言表達準確度的影響》一文中從語言學習的信息處理模式入手,采用試驗的方法具體分析了任務難度、任務復雜度及語言水平三個變量之間的相互關(guān)系,也指出了影響英語口語交流的流利性和準確性的具體因素。[3]該文獻雖然進行了數(shù)學建模,給出了定量的分析,但定量分析過于簡單粗糙,不能有效的說明問題。西方國家的研究最有影響的應屬口語能力訪談(Oral Proficiency Interview),從語法、語篇和語用三個方面衡量,并且制定了0至5的十個檔次標準,最高是達到本族受教育者的水平,最基本的準確是結(jié)構(gòu)正確(Brown,1994),[4]Stern(1983)在語言能力的評述中做了理論和實踐的解釋,著重提出中介語研究的特殊性,不能完全用目標語的標準判斷。從近三十年來國外的研究來看,學者們采用了許多指標對流利性的不同側(cè)面進行測定,這些指標可以歸納為兩類:與流暢程度有關(guān)的時間指標(temporal variables)和與語言表達有關(guān)的指標(performance variables)。 準確性和流利性是衡量英語口語能力的兩個重要指標,在交際過程中,這兩個因素會受到任務難度和復雜度的影響。口語能力的發(fā)展既受學習者目標語知識的制約,又受語言加工過程中操作因素的影響。(Foster & Skehan,1996)[5]在我國大學英語教學中語言產(chǎn)出的流利程度在理論研究和教學實踐中得到充分重視,但學生往往強調(diào)語言的流利性,語言表達的準確性降低。要提高語言表達的準確性,首先要找出影響語言準確性的原因,并作深入分析,找出解決方法。本研究針對英語口語表達的流利性和準確性問題,提出口語表達意群的狀態(tài)空間概念,即將意群單位作為狀態(tài)空間的一個元素,將一個口語表達完整過程按照意群劃分為若干狀態(tài)空間;基于意群狀態(tài)空間的概念,采用隨機統(tǒng)計分析的方法,將口語表達過程和背景音樂兩個相互影響的因素置入兩個相互嵌入的半馬爾科夫過程模型(是研究隨機事件變化趨勢的方法);[6]應用該模型進行口語測試的實驗,從而獲取提高英語口語流利性和準確性的有效訓練方法。 二、口語指標的統(tǒng)計建模 英語口語的表述,即從大腦中所記憶的英語詞語的數(shù)據(jù)庫里,在英語語法、慣用法等條件下的約束下,搜索合適的詞組單元,按照多層次邏輯進行排序,將作者的思想用語言文字表達出來。 即: 對于英語是外語,而并非第二語言的國家來說,要提高口語表達的準確性和流利性,必須先掌握好英語一些基本知識和表達技巧。英語學習者首先要掌握一定量的詞匯及慣用表達的技巧和方法,詞匯的獲取是通過閱讀英語文章,詞組句型練習,情景模仿等環(huán)節(jié)實現(xiàn)的。在課堂中,學生在聽取老師講解詞組、文章的過程中,為了獲取有益的內(nèi)容,必然要掌握理解這些新詞,通過比較、強記、聯(lián)想以及類比,逐漸掌握大量的詞匯,即在大腦形成類似于計算機硬盤的數(shù)據(jù)庫,該數(shù)據(jù)庫必須包含發(fā)音的一些元素。 為了應用統(tǒng)計學來研究英語口語,本研究將英語單詞組成的英語短語或者意群(meaning group)作為一個狀態(tài),這些意群(meaning group)集合構(gòu)成一個狀態(tài)空間。例如: 假設(shè)從大腦數(shù)據(jù)庫中搜索的最流利準確的口語句子為: Many years ago, I went into a bookstore in London in search of some books that I wanted. 這是一個完整的句子,按照上面的結(jié)論,將以上各句安意群劃分為幾個狀態(tài) 其中( )表示短語意群, 表示實意意群。口語表達是一個帶有發(fā)音和記憶的過程,各狀態(tài)之間的表現(xiàn)服從半馬爾科夫的隨機過程,與其中狀態(tài)轉(zhuǎn)移與記憶和停頓的回憶時間間隔有關(guān)。 為了研究該過程,本文對張文忠 吳旭東第二外語口語流利性發(fā)展定量研究中口語流利性和準確性的指標給出相應的統(tǒng)計模型如下:即 語速(SR):表示為一個言語樣本的音節(jié)總數(shù)和產(chǎn)生該言語樣本所需的(包括停頓在內(nèi))時間總(表示為秒)之比。通常的做法是將所得結(jié)果乘以60,表示為每分鐘發(fā)出的音節(jié)數(shù),該過程服從泊松分布。 發(fā)聲時間比(PTR):表示用于發(fā)音的時間總量與用于產(chǎn)生該言語樣本所需的時間總量之比,該比值服從負指數(shù)分布。 平均語流長度(MLR):指所有每兩次達到或超過0.3秒停頓之間的語流的平均長度,表示言語的音節(jié)總數(shù)與(除首尾外)所有達到或超過0.3秒停頓的總次數(shù)之比, 分布。
發(fā)音速度(AR):指用于發(fā)出所有音節(jié)的總時間內(nèi)平均每秒所發(fā)出的音節(jié)數(shù),表示為言語樣本的音節(jié)總數(shù)與用于發(fā)出這些音節(jié)所需的(除開停頓以外的)時間總量之比,該比值服從分布。 平均停頓長度(ALP):表示所有達到或超過0.3秒停頓的總量與(除首尾外的)停頓次數(shù)之比,該比值服從負指數(shù)分布。 基于以上的口語指標的統(tǒng)計模型,并考慮邏輯因素,該狀態(tài)空間中各元素構(gòu)成一個半馬爾科夫的狀態(tài)空間集合,作為口語表達過程,也就是將這些能記憶的單元按照邏輯和預設(shè)表達的意思重新組合的過程,因此該空間的各狀態(tài)是可達的。 這些狀態(tài)的實現(xiàn)是可能的,是因為口語表達者可以通過記憶聯(lián)想來完成整個句子和意思的表達。因為不是母語,所以表達過程中,會有記憶的時間間隔,當該狀態(tài)空間處于非周期、不可約的條件下,必須設(shè)置科學的測試環(huán)境和合理的準確的評價體系,使得學習者帶著輕松的心情通過反復練習,才能最終達到口語表達流利和準確的目的。 為了提高英語口語表達的流利性和準確性,指導老師可以插入背景音樂,讓合適的背景音樂旋律實時填充回憶時間間隔,建立背景音樂符號旋律與口語狀態(tài)空間各單元之間的聯(lián)系,從而增強口語表達的流利性和準確性。為了描述這兩個過程的統(tǒng)計特性,建立雙半馬爾科夫。