每每聽到「○○○語料庫『不好用』」的時候,「不好用」包含了許多可能性。它可能指的是語料庫的語料不夠多(數量),也可能指的是語料庫所涵蓋的文體或範圍(質量)並非使用者所期待。學了一些入門的語料庫檢索的方法之後,我想大部分人在說「○○○語料庫『不好用』」這句話的時候,想表達的應該是「○○○語料庫(界面)的查詢功能『不好用』」。 中央研究院的平衡語料庫自2007年開始未再更新,而檢索界面看起來最後設計是在2013年,它透過勾選、搜尋框和下拉選單等網頁工具給人一種「很好用」的印象。國家教育研究院的華語文語料庫(COCT)則自2013年開始蒐集語料,其語料數量已經超過平衡語料庫,同時透過國教院語料索引典系統的設置,在同一個系統內,可以檢索不同的語料庫(目前開放的為中研院平衡語料庫4.0、COCT 口語語料庫、華語中介語語料庫、COCT 書面語語料庫)的語料。索引典系統還「不太好用」,因為它還不能透過人類直觀的感覺去進行查詢,使用者必須學習電腦的語言(Simple Query或Corpus Query Processor, CQP),才能找到符合要求的語料。 在CQP的表示式中,[word=”把” & (pos=”Nf” | pos=”Na”)]的意思是查詢「把」這個詞中,屬於詞性是Nf和Na的語料。Nf和Na就是語料庫中,透過斷詞系統或人工檢查所標註的詞性,中研院詞類標記列表 有所標註的代號。 CQP包含下面萬用字: [word=”好高.遠”].代替一個字 [word=”哈*”]*前字重覆0~n次 [word=”副.+”]+前字重覆0~n次 [word=”[台臺]灣”] [AB..]任選一個字 [word=”一[^百千萬]二[^百千萬]”][^AB…]否定一組字 [word=”(台北|高雄)市”]“(X|Y)Z”任選一組字 根據上面的表示式和萬用字,我們可以就可以對電腦說很多話。假設我現在要查四字格裡頭,第一個字是「生」,第二個字是「死」的時候,我就可以用以下表示式:[word=”….”&char(word,0)=”生”&char(word,1)=”死”]同理,我可以請電腦幫我找,第一個字是「生」,第三個字是「死」[word=”….”&char(word,0)=”生”&char(word,2)=”死”]第一個字是「生」,第四個字是「死」[word=”….”&char(word,0)=”生”&char(word,3)=”死”]第二個字是「生」,第三個字是「死」[word=”….”&char(word,1)=”生”&char(word,2)=”死”]第二個字是「生」,第四個字是「死」[word=”….”&char(word,1)=”生”&char(word,3)=”死”]第三個字是「生」,第四個字是「死」[word=”….”&char(word,2)=”生”&char(word,3)=”死”] 接著我可以用|把上面這些條件取聯集,我就得到一個「四字格裡頭,包含『生』和『死』兩個字,而且『生』在前面,『死』在後面」的表示式[word=”….”&char(word,0)=”生”&char(word,1)=”死”]|[word=”….”&char(word,0)=”生”&char(word,2)=”死”]|[word=”….”&char(word,0)=”生”&char(word,3)=”死”]|[word=”….”&char(word,1)=”生”&char(word,2)=”死”]|[word=”….”&char(word,1)=”生”&char(word,3)=”死”]|[word=”….”&char(word,2)=”生”&char(word,3)=”死”] 跟日本人說話,我們要用日語;跟泰國人說話,我們要用泰語;跟語料庫說話,我們可以用第四代語料庫語言CQP。當然,有時候找個日語翻譯或泰語翻譯也是解決溝通上的方法,而和語料庫溝通的翻譯就是那些擁有資工專長的人們。 CQP的使用可以參考中國外語教育研究中心許家金的使用手冊。
Category: 華語教學
《對不起!我的中文不好》課前學習
載入中…
新加坡如何發展為雙語社會?
日前,新加坡國立大學文學暨社會科學院語言中心陳桂月教授演講《新加坡華語文教學:政策與實踐》,為我們介紹新加坡社會概況,這提供我們對於雙語社會理解的範例。在童年時期的雙語發展,有四種類型,簡述如下:一、父母各別使用一種語言;二、家庭和社會各別使用一種語言;三、父母親同時使用兩種語言;四、童年時期末期才接受第二語言。在父母各別使用一種語言的情況下,父母對孩子只說自己的語言,但父母之間仍講同一個語言;家庭和社會各使用一種語言時,孩子在家庭只有一種語言的輸入,而另一種語言則來自正式或非正式的環境;父母親同時使用兩種語言,則常有語碼轉換(codeswitch)的現象,但這只發生在面對雙語者時;童年時期末期才接受第二語言,則是父母刻意延遲孩子接受外在社會較為主流的語言,而將孩子隔離在只有家庭語言的環境,至到兩、三歲後才開始接受主流語言。 新加坡是廣為人知的雙語社會,那新加坡的孩子是在什麼樣的雙語發展歷程下成長的呢? 新加坡族群有華族、馬來族、印度族和其它族群(混血或峇峇娘惹都屬於一族群)。華族佔七成,馬來族和印度族各一成,其它族群則不到4個百分點。華族裡頭的語言,除了華語之外,包括粵語、客家話、福建話、海南話等都被部份華族人口使用;馬來族以馬來語為其代表語言,但也有部分人使用爪哇語或其它語言;印度族則以淡米爾語為其代表語言,但包括興都語和孟加拉語等其它語言使用者總合並不弱於淡米爾語,尤其淡米爾語又主要以勞工階層使用。從三個族群所代表的語言:華語、馬來語和淡米爾語來排列組合,新加坡可能出現的雙語組合為:華語和馬來語、華語和淡米爾語、馬來語和淡米爾語。對照大家印象中,新加坡的雙語,似乎有很大的落差。從人口的組成和新加坡的現況,我們可以知道新加坡之所以能夠成為雙語社會,並不是來自雙語發展的第一種類型,即父母各別使用一種語言。屬於混血的族群只有不到4個百分點,而且新加坡也不是以峇峇娘惹(華族和馬來族)族群的兩個語言作為主要的雙語實踐。 新加坡的雙語社會的可能,大概是來自第二種類型和第三種類型。新加坡因為族群問題自馬來西亞聯邦獨立,所以新加坡自然不會讓族群又成為問題。最能夠挑動族群敏感神經的,除了膚色外,就屬語言了。膚色是人們眼睛看得到的,語言則是人們耳朵聽得到的。膚色是沒法改變,但是語言是可以選擇的,李光耀自己在英國的經驗使他認為帶領新加坡走出去最好的方式就是以英語為主要工作語言,各自族群的母語就成為第二語言了。在李光耀的設計下,新加坡各個族群的家庭和社會各使用一種語言,使得新加坡成為一個以英語和另一個母語的雙語社會。 但是,這和我們印象所知道的新加坡似乎是不一樣的,我們印象中的新加坡是一個以英語和華語為雙語的社會。人口佔七成的華族顯著是造成這個結果的重要因素。早期以英語為主要工作語言的社會氛圍下,許多家長都能夠同時使用兩種語言(英語和華語、英語和馬來語、英語和淡米爾語)。但是三個族群對於孩子教養的方式不一定會一樣。馬來族的家庭在家裡向小孩都是講馬來語的,進了小學再學英語。因此,馬來族的家庭是屬於第四種類型的雙語發展,即童年時期末期才接受第二語言。印度族的淡米爾語,僅僅是在人數稍多的情況下,成為代表印度族的語言,事實上並沒有大多數的印度族以淡米爾語為第二語言,甚至有許多印度族的小孩以華語為第二語。馬來族、印度族和其它族群加起來不到整個社會的三成,而佔超過七成的華人的家庭教養方式為何?以下純屬推測:早期華人移民為沿海地區吃不飽的難民,面對英國紳士般的統治者,以及後來李光耀所推動的政策,當膚色無法改變,語言可以選擇的時候,父母使用兩種語言是最能夠平衡後殖民認同的不協調,所以父母也可以同時對小孩使用兩種語言,就是第三種類型的雙語發展。 第一種和第二種類型的雙語發展,被認為是較成功的雙語策略,新加坡擁有第二種類型的條件,因為有李光耀的未雨綢繆;第三種和第四種類型的雙語發展,華族的家庭以第三種為主,馬來族的家庭以第四種為主,新加坡畢竟是以華人為主要組成的社會,所以新加坡不是華語和馬來語、華語和淡米爾語、馬來語和淡米爾語等任何組合的雙語社會,而是華語和英語的雙語社會。通常第三種和第四種雙語發展,主會在經濟弱勢、移民或勞工階級的家庭發生,但新加坡從制度上,使所有族群的語言都成為相對於英語的非主流語言,所以第三種雙語發展也發生在華族的家庭中。
我讀《Foundations of Bilingual Education and Bilingualism》的〈Bilingualism: Definitions and Distinctions〉二
和杭士基使用了相同的術語:語言能力(language competence)和語言表現(language performance),但是Bachman將語言能力的內涵再進行了充實。在Bachman的模型裡頭,語言能力不只包括語法的知識,還包括在特定脈絡下使用語言的知識。具體內容可以再分兩大能力:組織能力和語用能力。組織的能力包括語法的能力和篇章的能力。語法的能力將句子內的詞彙以正確的順序呈現;篇章的能力則可以在口語或書面下使兩句以上的句子有連貫的呈現。 語用的能力則包括工具性的能力和社會語言的能力。工具性的能力,是以語言進行下面四個功能:傳達意義、達到目標、解決問題和捏造幻想。社會語言的能力則可以對於不同地區、不同風格的語言具有敏感度。 這些能力都是在和其它人互動時所不可或缺的能力,Bachman與Palmer(1996)則這它們視為一種策略的能力(strategic competence),
我讀《Foundations of Bilingual Education and Bilingualism》的〈Bilingualism: Definitions and Distinctions〉一
雙語論在討論到個人層次的時候,有兩個互相對立的觀點,它們分別是以單語觀的雙語論以及全面的雙語論。單語觀的雙語論也有人稱為「片斷式」(fractional)的雙語論,這樣的論點認為雙語者就是「兩個單語者所合成的一個人」。在這樣的論點下,「單語」才是「正常」的、「純淨」的,以台灣為例,即便在社會上存在以華語為第二語言的雙語者,這些雙語者仍會被要求以同華語母語者的標準去要求對於華語的閱讀或成就測驗。如果這些雙語者的華語無法同母語者的華語,那就要求他們的兩個語言都能達到熟練的程度,特別是他們的華語。當這些人的華語無法達到熟練的程度時,他們可能被視為弱勢。在台灣,新移民、新移民之子、未受過國民義務教育的皇民或少數語言的繼承者,就會被要求去參加識字班或體制外的語言課程。 相對於單語觀的雙語論,另一個對立的觀點就是全面的雙語論。全面的雙語論再認為雙語者是兩個單語者的總合,而認為一個雙語者,同一個華語單語者或者一個英語單語者一樣,都有它獨特的一面。如果一個華語單語者是短跑的選手、一個英語單語者是跳高的選手,那華語英語雙語者可能是跨欄的選手。要求跨欄的選手去和短跑選手比短跑或跳高的選手比跳高,是一個不公平的要求。全面的雙語論認為,即便雙語者和雙語者自己比較都不應該存在。雙語者的語言使用可能在任何情境下,某些情境下用某個語言,甚至混雜著使用兩個語言都有可能。全面的雙語論是理想,往往在現實條件下無法實現,尤其面對人力需求市場的挑戰時。
我讀《Foundations of Bilingual Education and Bilingualism》的〈The Measurement of Bilingualism〉二
當我們把實施語言考試的人,放在政治的脈絡下,作為一個政治的實體去思考的時候,我們可以把這樣子思考的角度作稱為「批判性語言測驗」(critical language testing) (Shohamy, 1997, 2001, 2006)。 「批判性語言測驗」主要問的問題包括「議題」和「誰的知識」: 測驗是測誰所關心的議題?不論是明文或隱藏的。透過測驗傳遞了什麼樣的政治或教育意涵?實施語言考試的人要自問,自己想創造一個什麼樣的社會語言願景?例如,語言考試要滿足既有的課程、流利級目標,或都仍有其它隱藏的目的? 測驗的知識是屬於已經確立、相對穩固的知識或者仍在辯證、尋求進行一步研究的知識?語言測驗的成績對於受試者而言有什麼樣的意義?受試者如此使用這個成績? 「測驗」變成假客觀之名,滲透主觀權力到每個受試者身上的工具。社會的知識建立在社會大眾對於測驗結果的恐懼和信任。測驗滲透了實施考試的人的主觀控制,並將非主流的人排除在外。於是,「測驗」也變成由少數人控制的工具。出題的人和教學的人如果是同一個的話,「測驗」就難免會淪為政治的工具。
我讀《Foundations of Bilingual Education and Bilingualism》的〈The Measurement of Bilingualism〉一
常模參照考試(norm-referenced test)和標準參照考試(criterion-refrenced test): 常模參照考在解釋個別評量結果時,所參考的對象是以該樣本團體的平均數為標準,依其在團體中所占的相對位置來解釋個別評量結果的教學評量方式 。這種評量的內涵,即是在比較個人得分和他人得分之間的高低。常模參照評量的目的,旨在區分學生彼此間的成就水準高低,以作為教育決策之用。 而標準參照考試於解釋個別評量結果時,所參考的對象是以教師在教學前即已事先設定好的效標為依據,依其是否達到這項標準(達成者即為學習「精熟」,未達成者即為學習「非精熟」)來解釋個別評量結果的教學評量方式。標準參照考試的目的,旨在找出學生已經學會和尚未學會的原因或困難所在,以幫助教師改進教學和學生改進學習。 語言能力(language competence)和語言表現(language performance): 「語言能力」,根據杭士基(Chomsky)的說法,是語言的心理表徵,屬於內隱的、非外顯的心智系統。 「語言表現」,則是「語言能力」外顯的證據。藉由觀察人們對於語言的理解和產出,以推論在人們在進行語言表現的時候存在語言能力。
被社會遺棄的雙語者
雙語者在哪裡?傳統的定義為凡能夠像母語者一樣使用著兩種以上語言的人就是雙語者,這是較嚴格的定義,大概也是所有雙語者想達到的極致;另外一個極端則是初初開學學習第二個語言的人,即使他只像觀光客一樣,只會一些打招呼的片語,他仍然是雙語者。雙語者的範圍是如此廣泛,以致於社會上很難存在一個合適的標準去評量雙語者的語言能力。我今天在台灣大學學生第一活動中心的餐廳吃晚餐,有一個使用電動輪椅的身障人士在尋找餐桌。台大一活的餐桌旁的椅子是可以活動的,所以這個身障人士駛著自己的電動輪椅,先把餐桌旁的椅子移開,然後才能把自己的餐點放在餐桌上享用。我發現之後,我只是舉手之勞地協助這個身障人士將椅子挪開,以方便就餐。對於身障人士而言,畢竟移動椅子比移動身子容易得多。這個身障人士覺得很過意不去地一直向我說「不好意思。」我仔細思考這個過程,我才應該向這個身障人士說「不好意思。」我感到不好意思,台灣第一學府的餐廳規劃,居然讓身障人士必須費力地挪動椅子才能吃上一頓飯。這還不包括這個身障人士從點餐、取餐到能夠就餐的過程。 某個程度來說,雙語者在社會上,面臨著和身障人士相似的處境。這個社會的所有評量似乎是為了單語者所設計。以台灣社會為例,從國小開始,所有學科的評量都是以華語作為標準語言,舉凡數學、社會、自然…等。為了滿足每個學科的要求,學習華語就是必要之惡。但是對於華語能力有限的雙語者而言,這就會產生不公平,因為他受限於語言的能力而使得我們無法真正知道他在學科上的表現。不過,台灣社會也不是全然罔顧語言能力有限的雙語者。隨著台灣新移民人口的增加,在汽機車駕照的考試裡頭,已經開設有華語、閩南語、英語、日語、客家話、越南語、泰語、印尼語、柬埔寨語九種語言,對於這些雙語者而言,他們可以不必受限於華語能力,而能表達駕車的能力。那在語言這個科目上,要求雙語者同母語者的標準總沒有問題了吧?這對於嚴格定義下的雙語者而言,單就語言(排除文學或語文)肯定沒問題,但還有其它只有有限的語言能力雙語者而言,那恐怕只能把母語者當成目標,也無法強求其達標了。 不過,聰明的人類仍能找到解決之道。既然雙語者包含最強如母語者到最弱如初學者那麼大的範圍,那我們把建立屬於雙語者的常模,凡想知道自己的語言能力在雙語者當中是落在什麼程度,就以此常模為標準,這樣就能夠持續進步,也不會落入只是和母語者比較的窠巢。在我看來,多益就是這樣的考試制度。全世界的雙語者,不論是日英雙語者、法英雙語者、韓英雙語者,都可以在多益考試中知道自己的英語能力在所有雙語者之中的位置。以人為本的社會,制度將會趨近不同人們的需求,我們期待台大的餐廳規劃能夠讓所有人可以很方便地用餐,也期待各種語言的考試和學習,以母語者為目標,而不是以母語者為標準。
我讀袁毓林的《論元角色的層級關係和語義特徵》
論元(argument)的存在,是為了使謂語(predicate)能夠完整地被表達,因此也有人把論元視為一種補語(complement)。這裡所說的謂語,不是把句子分成兩個部份:主語和謂語。這裡的謂語指的是句子裡頭的主要動詞以及隨著主要動詞出現的成分,也就是論元。句法的論元和語義的論元有時候不一定能夠對應產生,例如: The vampire chase the ghost. The vampire was chased by the ghost. A句的句法的論元vampire和ghost依序分別是主格(subject)和受格(object),對應到語義的論元則是施事(agent)和受事(patient);B句的句法論元順序同A句,但是語義的論元vampire則變成受事,ghost就變成施事了。為了把表層結構(surface structure)的句法論元和深層結構(deep structure)的語義論元分開,我們就使用格語法(case grammar)去專門討論在深層結構下的論旨角色(thematic roles)。 本文將就袁毓林(2002)的《論元角色的層級關係和語義特徵》以及鄧守信和陳俊光的格語法進一步地歸納並加以評價,希望對華語教學工作有所啟示。 袁毓林 核心 核心 核心 核心 核心 核心 核心 外圍 外圍 核心 外圍 外圍 外圍 外圍 外圍 外圍 超級 施事 感事 受事 致事 對象 主事 系事 範圍 結果 與事 終點 源點 方式 場所 工具 材料 命題 格語法 […]
「國際華語研習所」(International Chinese Language Program, ICLP)及「中國語文組」(Chinese Langauge Division)參訪
「國際華語研習所」(International Chinese Language Program, ICLP)的前身是「跨大學華語研究所」(Inter-University Program for Chinese Language Studies, IUP),由美國史丹佛大學,民國50年於國立台灣大學成立。民國八十六年,北京另外成立了「跨大學華語研究所」,原有師資、教材、傳統由「國際華語研習所」接棒交給國立台灣大學。目前由台灣大學外國語文學系的系主任梁欣榮教授兼任所長,而研究所執行長則由資深華語教師陳立元教授擔任。該單位其為學習華語的外國人提供華語教學服務,學生多為漢學家、律師、商人、外交官等,可以說是菁英中的菁英,其畢業學生有75巴仙進入學術界服務,25巴仙為法、政、商界要角。「國際華語研習所」以開設專業華語課程馳名,在我們造訪的時間,正好碰到正在上佛教華語的課程。其內容包括:「摩訶迦葉」、「頭陀第一」等,光是能用華語把上面這些名相念出來就不容易了,更何況要去解釋甚至說明歷史。這也顯示「國際華語研習所」的師資是獨步於台灣,甚至是整華人圈的華語教學界的。每一學期「國際華語研習所」招收學生約一百到一百五十位左右,超過的也不再收,學術表現或語言能力未達標準的也不收。目標市場很明顯地就鎖定在菁英階層。在學期結束前,學生們也被要求要以華語進行口頭報告。 在同一個建築物下的另一個華語教學單位,則是隸屬於台灣大學文學院語文中心的「中國語文組」(Chinese Langauge Division),其於民國73年成立。目前由台灣大學中國文學系林宏佳教授擔任組長,主要業務由蔡宜倩幹事執行。並由組內華語老師共同推舉三個委員組成教務小組進行組內業務的決策、人事異動、課程規劃、組織發展等等。 「中國語文組」開設有學期密集班課程,並提供國立台灣大學外藉生、交換生授予學分的華語課程,同時以豐富、多元的選修課程為其特色。並積極向海外招生,例如:赴美國參加華語教育展。根據幹事的評估,目前海外華語教學市場(美國)需求以駐點教師和國內教材為大宗。中國語文組目前尚未有自己發行的華語教材,主要華語教材為《實用視聽華語》、《生活華語》、《迷你廣播劇》和《新聞選讀》,和國內華語中心的情況類似。每學期註冊學生約有200到250人,目前以日本為最大宗,但是美國、印尼和越南學生數也在成長。 我們再把台灣大學的「華語教學碩士學位學程」與前面的「國際華語研習所」和「中國語文組」一起比較看看。「華語教學碩士學位學程」是由語言學研究所、中國文學系、外國語文學系共同組織而成的學程,並沒有專責機構對華語教學進行人才培育。「國際華語研習所」,由外國語文學系的系主任兼任,可以說是隸屬於外文系;「中國語文組」則由中國文學系的教授擔任組長,也可以說是隸屬於中國文學系。換句話說,台灣大學的華語教學就是在多方共同支援下所成的游擊組織。當然,換個角度想,台灣大學或許也考量國際華語教學市場並沒有新聞媒體、華僑或懷抱高度熱忱的華語老師們所稱「中文熱」,所以對於相關單位的設立也相對嚴謹而保守。