語言測驗的類型、目的和作法(Nation, 2013)


語言測驗在詞彙的學習上有幾種類型,其相對應的目的也有所差異:

一、診斷測驗(diagnostic tests):用來找出學習者學習上的困難,並從這裡去加強。學習者怎麼的詞彙學習策略也可以歸類於診斷測驗。
二、分班測驗(placement tests):將學習者分到適合程度的班級。
三、短期成就測驗(short-term achievement tests):去看學習者是否能夠將所研究的詞彙學習到。
四、長期成就測驗(long-term achievement tests):評估整個課程在教學某些詞彙的時候是否成功、有效。
五、能力測驗(proficiency tests):去看學習者會多少詞彙。

若要知道學習者在詞彙學習的策略(例如:從脈絡裡猜字(guessing from context)、使用詞語的部件(using word parts)、直接學習(direct learning)或使用詞典(dictionary use))應用是否存在困難時,可以使用經過設計的診斷測驗。學習詞語策略上的應用,Sasao (2013) 提供了測驗的方法。

直接詢問學習者是否學習過目標詞語則可以用於分班測驗。

短期成就測驗,語言教師有個簡易、可操作的流程:假設我們有20個目標語詞要測驗,可以先由學生自單元內挑選10個詞語,接著老師可以在這10個詞語旁邊標記:如果標記「S」,則學生必須用這個詞語造個句子;如果標記「C」,則學生要寫出這個詞語的三種搭配,即共現詞;如果標記「M」,則學生要解釋這個詞語的意思;如果標記「F」,則學習者要和這個詞彙在同一個家族的詞彙。然後,老師再另外選擇10個詞語進行測驗。這樣的測驗即個性化也有由老師所提供的詞語。

而長期成就測驗,必須符合課程目標,如果課程目標是廣展閱讀詞彙,則在句子脈絡下的理解測驗就比較適合。當然,來自各個單元的詞語是平均的。

學習者的詞彙量也有不少方法可以進行測量,通常是在既有的已分級的詞語表抽樣進行測驗以推估學習者的詞彙量。但是在測量學習者的詞彙量之前,我們有幾個問題必須回答:

一、「詞語」怎麼計算?怎麼樣我們會說這是「一個詞語」?
二、我們如何選擇目標詞語去測驗?
三、我們如何測量學習者是否「知道」/「學會」一個詞語?

 

References

Nation, I. (2013). Testing vocabulary knowledge and use. In (), Learning Vocabulary in Another Language. Cambridge University Press.
Sasao, Y. (2013). Diagnostic tests of English vocabulary learning proficiency: Guessing from context and knowledge of word parts(Doctoral Dissertation). Retrieved from

學習第二語言詞彙的時候,詞語表是否真的毫無用處?(Folse, 2004)

Laufer and Shmueli (1997)比較四種呈現詞語的方式:一、只有詞語;二、詞語加上簡短的脈絡;三、把詞語放在句子脈絡;四、把詞語放在文章裡頭。猶太語母語者學習英語為外語的學生在這四種方式下學習詞語,測驗其學習後能夠記得多少語詞,結果發現前兩種的得分高於後兩種。

Prince (1996) 則比較高和低程度的學習者面對兩種呈現詞語方式(詞語對照一語的翻譯和詞語放在句子脈絡中)的學習成效,結果發現對於程度較低的學習者以有二語詞語搭配一語翻譯的詞語表學習,效果較佳。

這不是說我們應該要求學習者依詞語表去學習詞彙,我想說的是對於某些學習者而言,詞語表能夠提供的幫助可能大於其它方式。

References

Folse, K. S. (2004). Myths about teaching and learning second language vocabulary: What recent research says. TESL reporter, 37(2), 1-13.
Laufer, B. & Shmueli, K. (1997). Memorizing new words: Does teaching have anything to do with it?. RELC journal, 28(1), 89-108.
Prince, P. (1996). Second Language Vocabulary Learning: The Role of Context versus Translations as a Function of Proficiency. The Modern Language Journal, 80(4), 478. doi:10.2307/329727

學習第二語言的時候,詞彙是不是沒有語法或其它領域那麼重要?(Folse, 2004)

第二語言學習者需要詞彙,而且都將詞彙的習得視為是絕大的挑戰(Meara, 1980)。第二語言詞彙的知識和第二語言閱讀能力(Haynes, 1993; James, 1996)與寫作能力(Laufer, 1998) 有很顯而易見的關係,聽力和口語任務也是如此(Newton, 1995) 。要求學習者進行表達的時候,常常可以聽到學習者用不完美語法說出句子,語法是老師在課堂上會強調的部分。然而,學習者在沒有足夠的詞彙時,表達也就同時受到限制。完全沒有語法仍可以進行溝通,但是缺少詞彙就是會卡住。

我曾經作為交換學生在泰國的法政大學讀書5個月,儘管泰語作為第二語言,對於學術使用的語言肯定比不上華語和英語,但是買東西、日常生活的溝通肯定是沒有問題。一天,腳踏車的鎖頭因為下雨淋溼而生鏽,我得去買一個新的鎖頭。我要的是鎖腳踏車的鎖,我到五金行去,我先向老闆要โซ่(鎖鍊),我必須把老闆帶到我的腳踏車前以肢體動作示意,老闆才拿出了腳踏車專用的鎖。除了โซ่(鎖鍊)之外,我也會說กุญแจ(鎖頭)。但是,會說กุญแจ並不保證我知道它的意思,ลูกกุญแจ(鑰匙)和กุญแจ(鎖頭)就是一個子和母的關係。我把กุญแจ當成鑰匙,於是我無法順利地完成溝通的任務。即使我有完美的語法,我缺少相對應的詞彙知識,就會中斷流暢地交談。

References

Folse, K. S. (2004). Myths about teaching and learning second language vocabulary: What recent research says. TESL reporter, 37(2), 1-13.
Haynes, M. (1993). Patterns and perils of guessing in second language reading. In (), Second Language Reading and Vocabulary Learning (Vol. 83). Ablex.
James, M. O. (1996). Improving second language reading comprehension: A computer-assisted vocabulary development approach (Doctoral Dissertation). Retrieved from
Laufer, B. (1998). The development of passive and active vocabulary in a second language: same or different?. Applied linguistics, 19(2), 255-271.
Meara, P. (1980). Vocabulary acquisition: A neglected aspect of language learning. Language Teaching, 13(3-4), 221-246.
Newton, J. (1995). Task-based interaction and incidental vocabulary learning: A case study. Second Language Research, 11(2), 159-176.

用Lex30來測量二語學習者的詞彙量

Lex30是一個可以用來測量產出詞彙(productive vocabulary)的方法,學習者透過自由聯想(word association)針對30個刺激提供一連串的語詞清單。測量產出詞量,本來就是比測量接收詞彙(receptive vocabulary)更困難的工作。

過去測量產出詞彙的方法主要有兩個:

第一種是在句子脈絡中給予目標語詞開頭幾個字母作為提示,如:

The book covers a series of isolated epis___ from history.

學習者根據提示將缺失的地方填上合適的語詞(Laufer & Nation, 1999) 。

第二種是透過自由產出詞彙考試(free productive vocabulary test),例如Laufer and Nation (1999)的詞彙頻率描述考試(lexcial frequency profiling test)。分析學習者書寫或口說的論述,根據不同的主題和語詞的類別進行分析,語詞的頻率分為常見、較不常見、罕見的,若罕見的詞彙較多,則該學習者較被認為有較高的產出詞彙。

第一種方法在學習者的詞彙量是可以控制的情況下,是很有效率的方,但是這僅限於初學者。舉例來說:

The fra____ of the flowers filled the room.

當學習者不知道fragrance的時候,學習者可能知道senct、aroma或perfume,甚至其它能夠放到句子脈絡且罕見的語詞。然而,控制詞彙量的時候,無法真正測量到學習者的產出詞彙。

第二個方法,學習者的論述會受限於主題。而且,要求學習者在產出兩篇包含300個語詞上下的論述,至少需要2個小時以上的時候(Laufer & Nation, 1995) 。作為測量工具,顯得沒有效率。

Meara and Fitzpatrick (2000) 提出Lex30和先前兩種方法一樣,同樣想要測量產出詞彙,另外還得解決上述遇到的困難。下面為Lex30的簡述:

Lex30選擇30個刺激供學習者自由聯想。30個刺激選擇的標準如下:一、都是初學者前1000個會先學習者的語詞,即都是高頻的語詞;二、可以聯想的範圍很廣;三、避免產出共同語詞(common word),例如:and、even、but這樣的刺激。

對於每一個刺激,學習者有30秒去反應。學習者針對刺激進行自由聯想,去反應一個語詞清單(至少三語詞)。

每個學習者大約會有90左右的反應語詞。Lex30根據這90個反應語詞進行計分,若在初學1000字以內的詞彙,則不給分;若在初學1000字以外的詞彙則得1分。加總分數後,若得分越高,則此學習者的產出詞彙能力越好。

Lex30的30個語詞刺激為:attack、board、close、cloth、dig、dirty、disease、experience、fruit、furniture、habit、hold、hope、kick、map、obey、pot、potato、real、rest、rice、science、seat、spell、substance、stupid、television、tooth、trade、window。

References

Laufer, B. & Nation, P. (1995). Vocabulary size and use: Lexical richness in L2 written production. Applied linguistics, 16(3), 307-322.
Laufer, B. & Nation, P. (1999). A vocabulary-size test of controlled productive ability. Language testing, 16(1), 33-51.
Meara, P. & Fitzpatrick, T. (2000). Lex30: an improved method of assessing productive vocabulary in an L2. System, 28(1), 19 – 30. doi:10.1016/S0346-251X(99)00058-5

透過JabRef在LibreOffice上以APA格式進行文獻的引用

為什麼要用文獻管理軟體?研究生2.0曾經撰文告訴大家十個理由。研究生2.0使用文獻管理軟體的理由,我都同意。但我認為大多數研究生不會因為文獻管理軟體有諸多好處,而去使用它。對研究生而言,管理文獻只是為了人生中一篇僅僅為了畢業撰寫的論文,畢業後剩餘的人生根本不需要再寫論文,我根本不需要使用文獻管理軟體。

我思考自己使用文獻管理軟體的原因是因為修了《數位媒體編輯》。《數位媒體編輯》這門課不是讓我學會文獻管理軟體的課,它讓我學到的「工具獨立性」和「心智外包」(Extended Mind)。工具獨立性,是指可以用任何的軟體,達成一件整合性的作品。心智外包就是把原本應該親自花費心力的事,交給工具去完成。

《數位媒體編輯》的每一週課就是教你使用Word。但是學期作業要你作出一個雜誌,你可以使用Word,也可以使用InDesign,也可以使用各式各樣你覺得能夠完成雜誌所需的軟體。用Word,誰不會!反正就把Word打開,打字就好了,換個字型、換個顏色、放個圖片、用什麼文字藝術師就可以漂漂亮亮了,這個國小電腦課東西居然在大學一個三學分的《數位媒體編輯》進行!如果這樣的話,微軟公司也太好混了吧!Word有很多選單裡頭能做到的事,我們都沒注意過。這堂課當然不是在學Word的使用技術,我們學的是編輯一個雜誌,需要哪些技術,而這些技術在Word上怎麼辦到。知道哪些部分是軟體可以代替人力辦到的,我們就從工人智慧往人工智慧又進了一步。

因為工具獨立性和心智外包,電腦能做的事,自己就不去做;開源軟體能做的事,就不去使用付費的軟體。作業系統有很多,windows、ios,但是我使用ubuntu;統計軟體有很多,SAS、spss,但是我使用R;有名的辦公室軟體Microsoft Officea我也沒用,我用Libreoffice;文獻管理軟體也很多EndNote、Mendely、zotero,一開始猶豫使用zoteroJabRef,付年費使用2年的zotero之後,後來還是使用JabRef。

zotero因為能夠和Firefox瀏覽器上加上套件進行文獻管理,而且可以在Libreoffice的文件編輯的同時,進行文獻引用,因此網路上的資訊相對豐富,進入門檻就比較低。(當然,我想可能還是因為zotero進行收費,所以能夠有組織去使它變得更親民)

JabRef早期大多只有使用LaTeX撰寫科技論文的研究者使用,網路上的資訊也不多,門檻高,我都還沒進去就先放棄了。

但是,我使用zotero年費,每年是30塊美元,能夠管理的文獻數量只有2GB,在文獻一直增加的情況下,下一個級距就是6GB,我就必須付出年費60塊美元。因此,我還是再研究JabRef。五、六年的發展,JabRef有許多更親民的改變。但是,對於初初使用文獻管理軟體的人,恐怕還是不太容易。

我把一些可能遇到的問題和解決的方案收錄在下面,這些做法都是在lubuntu的作業系統下,使用LibreOffice可以參考的內容:

我怎麼樣可以LibreOffice上,用JabRef引用文獻?

我怎麼樣可以在使用文書軟體時,讓引用的文獻是符合APA的格式?
在JabRef上可以透過選擇.jstyle的檔案,使文獻引用符合自己所需要的格式。我沒有那麼努力自己去編輯,因為有網友提供了適合的.jstyle。今年二月有網友分享了許多期刊的格式,但是仍然缺少APA的格式。APA是很多期刊文獻引用的格式,今年5月有人提供了APA的.jstyle。

那些.jstyle適用於word,我用的是LibreOffice,怎麼辦?
適用於LibreOffice的.jstyle,有網友提供範例,只要依照範例和自己所需要的.jstyle去將兩個文件合併在一塊就可以。

參加「2017年華文教育名師巡講」泰國場次有感:一統天下到百花齊放

「考試」可能是中國人相當迷信的實用之一。它的實用在於可以很有效率地從茫茫人海中,找出有能力的人材;它的迷信在於茫茫人海中的人們認為考試可以用來作為佐證自己能力的證據。在考試盛行的地區,人們不擅於提出問題,但是追求答案。取得答案的過程通常不需要理性地推演,只要有一個權威機構發佈就可以了,簡稱「標準答案」。

對於語言學習,人們也常常追求權威機構。學習英語想參加英語考試時,你會選擇「財團法人語言訓練測驗中心」的全民英檢?還是美國ETS機構的托福、多益?學習泰語想參加泰語考試時,你會選擇「台灣泰國文化暨語言交流協會」的泰語檢定?還是泰國朱拉隆功大學的泰語能力檢定?學習漢語或華語,想參加漢語考試時你會選擇北京語言大學漢語水平考試中心的漢語水平考試?還是國家華語測驗推動工作委員會的華語文能力測驗?一個最容易判斷的標準就是主辦考試的機構所在的位置是不是在標的語的來源地,簡單地說,就是給你出考卷的人是不是母語者。

學習第二語言的時候,因為對於考試的迷信、對於母語者的迷信,我們認為有一個可以一統天下的「第二語言」,而忽略了「第二語言」百花齊放的可能性。英語作為第二語言,在全球化的發展較早,所以比較容易看到英語百花齊放的樣貌,大多數的人都同意學習英語如果只能聽懂美國人的英語,那就還能更進一步,去聽聽英國人的英語、澳洲人的英語、印度人的英語、新加坡人的英語。因為認識這樣的多樣性,所以自己學習英語的時候,就有一份自信說我講的是台灣人的英語或中國人的英語。但是這個有自信的台灣英語或中式英語,偶爾會被「考試」或「母語者」的陰影給籠罩,我們那個追求標準答案的小鬼讓我們失去自信。能夠讓英語紅紅火火的應該不會是一統天下的大英帝國,各地的英語百花齊放,才是現在看到英語風行於世界的模樣。

華語作為第二語言又是如何?清朝乾隆年間,東印度公司一個叫洪仁輝的英國人,因不滿地方官員勒索告御狀,乾隆氣得直哆嗦。於是,洪仁輝被判有期徒刑三年,罪名是:擅自學習漢字漢語。洪仁輝事件后,清廷感到必須加強對外夷的管理與防范。兩廣總督李侍堯在奏文中將事件原因歸結:
「細察根源,縱由內地奸民教唆引誘,行商通事不加管束稽查所致。查夷人遠處海外,本與中國語言不同,向之來廣貿販,唯藉諳曉夷語之行商通事為之交易,近如夷商洪仁輝於內地土音官話,無不通曉,甚至漢文字義,亦能明晰,此夷商中如洪仁輝之通曉語文言義者,亦尚有數人,設非漢奸潛滋教誘,何能熟悉?如奸民劉亞扁始則教授夷人讀書,圖謀財物,繼則主謀唆訟,代作控辭,由此類推,將無在不可以勾結教誘,實於地方大有關系。」
一統天下是中國很熟悉的概念,秦朝的書同文、車同軌就是最好的例子。外國人能夠通曉漢語,肯定也是中國人教授所致。歷史無法重演,如果乾隆那時候,在洪仁輝告御狀後,開始打貪反腐、鼓勵來華貿易的外國人學習漢語,現在世界的政治版圖會不會不一樣?世界第二語言的景象又會是怎麼樣?

現在世界著名推廣外國人學習漢語的機構「孔子學院總部」,孔子學院被國家漢辦所指導,國家漢辦又直隸於教育部,於2004年11月21日在韓國首爾成立全球首家孔子學院。透過「考試」(HSK)或「母語者」(志願者)到世界各國教授漢語的孔子學院,是對外漢語的權威機構。

另外一個沒那麼有名,但同樣致力於海外華文教育的的「中國華文教育基金會」,其主管單位是國務院僑務辦公室,也在同一年2004年成立。我參加了由其主辦「2017年華文教育名師巡講」泰國場次的培訓,它展現了百花齊放的可能性。這個培訓的課程內容包含:繪本閱讀、古詩教學、團隊心理輔導、口語交際以及臉譜,由中山市石歧中心小學的教育團隊負責,校長和來自該校的優秀教師組成團隊完成巡講任務。參加培訓的學員,來自曼谷各級學校的華語老師。這些華語老師,有一些是泰國本地的老師,也有一些來自台灣或中國大陸的老師。你可能會懷疑道:「這是把在大陸對母語者的教育課程原封不動地搬到海外!」。然而,如果你有抱著一點點多元文化的期待,你就會相信這些原汁原味的課程,在不同的土壤下會有百花齊放的可能性。世界各地的老師會受到這些課程有所啟發。柬埔寨的華語、泰國的華語、汶萊的華語才有變成全球華語的可能性

我在造訪泰國正大管理學院的期間,有許多台灣的大學生到這裡實習。這一年,有兩個實習生雖然在台灣讀大學,但並非來自我們傳統上認為的華語的來源地(台灣或中國大陸),他們分別來自馬來西亞和香港。即便對於華語母語者的我來說,聽懂香港人講華語也是一件相當困難的事。但是,正大管理學院的泰籍老師黃偉榮卻認為學習華語的學生不可能只會遇到沒有方言口音的華語,因此聽香港人講華語也相當重要。在華語外圈的泰籍老師,看到華語內圈語言的多樣性;在華語內圈的華語老師們,是否也看到華語外圈華語的多樣性?

到曼谷租公寓,要備齊哪些生活必需品?到Big C去淘寶。

你可以說我住在曼谷,但準確地說,我是住曼谷北邊的暖武里省(นนทบุรี,Nonthaburi)的巴革區/縣(ปากเกร็ด,Pak Kret)的文建路上(ถนนแจ้งวัฒนะ,Chaeng Watthana Road)的小區裡頭的公寓。我住的公寓叫Diamond Place,每個月的租金是5500元,若需要冰箱和電視可另外租(月租500元),枕頭、床單什麼都沒有,僅有床墊、書桌、梳妝台、鏡子、櫃子。

因為什麼東西都沒有,所以我需要自己去買齊這些東西,幾乎所有東西都在Big C買的,都是最便宜的東西…

這是去一趟Big C之後買的東西,共699.25元,除了一些讓我空盪盪的房間多一點舒適感的東西外,我也買了一餅乾和豆漿準備來過午不食了!

 從浴室出來的時候,腳溼溼的,所以我需要一個腳踏墊。原價129元,特價只要34元。

睡了兩天沒有枕頭的覺,枕巾79元。

 我對睡眠品質的要求很高,我不能買最便宜的枕頭(64元),我買了第二便宜的枕頭89元。我好想買乳膠枕頭,才399元。

 水門市場路邊買的羅勇涼被,原價300元,特價250元。

《大家來學泰語》第八課:日/月/年(補充教材)-วัน เดือน ปี

中介語(Interlanguage)是指從母语(L1)始至習得得第二語言(L2)止,其間經歷的一系列的語言過渡「階段」裡,所產生之「語言」。以學習泰語為目標的時候,我們就不必在意翻譯的「信、達、雅」,所以下面的華語注釋,可能會覺得不美、不通順。你可以把這些不美、不通順的注釋當成是中介語,因為它既不是華語,也不是泰語,但它是幫助我們學習泰語的。如果想找比較美的華語歌詞翻譯,可以看此部落格

วันจันทร์ฉันคอยอยู่
อังคารก็คอยดู
ดูๆว่าเธอเป็นไง
wan-jan-chan-kaawy-yuu
ang-kaan-gaaw-kaawy-duu
duu-duu-waa-tur-bpen-ngai
星期一我等著
星期二還等著等
看看你是怎樣

พุธเธอก็ไม่มา
เช้าสายก็ไม่มี
พฤหัสว่างเปล่า
poot-tur-gaaw-mai-maa
chao-saai-gaaw-mai-mee
pha-reu-hat-wang-bplao
星期三沒來
早晚上都沒有
星期四沒空

ศุกร์หรือเสาร์หรือว่าอาทิตย์
ไม่มีวันไหนไม่คิดถึง
suk-reu-saao-reu-waa-aa-tit
mai-mee-wan-nai-mai-kid-teung
星期五或星期六抑或是星期日
沒有哪天不想你

ไม่มีวันไหนที่เธอจะย้อนมา
สู่วันเก่าๆของเรา
mai-mee-wan-nai-tee-tur-ja-yaawn-maa
suu-wan-gao-gao-kaawng-rao
沒有哪天你會願意來
回到我們的舊日子

วันที่ฉันเจอเธอ
วันที่ได้ใกล้กัน
วันที่เราจูงมือ
wan-tee-chan-jur-tur
wan-tee-dai-glai-gan
wan-tee-rao-jung-meu
與你見面的那一天
與你接近的那一天
我們牽手的那一天

วันที่ฉันรักเธอ
วันที่ฉันพูดไป
วันที่เธอรับฟัง
wan-tee-chan-rak-tur
wan-tee-chan-pud-bpai
wan-tee-tur-rab-fang
愛你的那一天
我說出口的那一天
你願意聽我說的那一天

อีกนานไหมฉันก็ไม่รู้
(อีกกี่เดือนหรือจะอีกปี)
eek-naan-mai-chan-gaaw-mai-ruu
(eek-gee-deuan-reu-ja-ekk-bpee)
再多久我也不知道
(還要幾個月或幾年)

กี่หมื่นพันล้านความทรงจำที่มี
ไม่เคยไม่คิดถึงเธอ
gee-meun-pan-laan-khwaam-song-jam-tee-mee-
mai-keuy-mai-kid-teung-tur
幾千萬十萬的有的記憶
不曾不想念著你

มกราก็ยาวนาน
กุมภาก็เลือนลาง
มีนาก็ยังเลื่อนลอย
mohk-ga-raa-gaaw-yaao-naan
goom-phaa-gaaw-leuan-laang
mee-naa-gaaw-yang-leuan-loy
一月還很長
二月還很模糊
三月也很模糊

เมษาก็ร้อนรน
พฤษภาก็ทุกข์ทน
มิถุนาว่างเปล่า
me-saa-gaaw-raawn-ron
phreut-sa-phaa-gaaw-took-ton
mi-thoo-naa-waang-bplao
四月很焦慮
五月要忍耐
六月沒有空

อีกนานไหมฉันก็ไม่รู้
(อีกกี่เดือนหรือจะอีกปี)
eek-naan-mai-chan-gaaw-mai-ruu
(eek-gee-deuan-reu-ja-ekk-bpee)
再多久我也不知道
(還要幾個月或幾年)

กี่หมื่นพันล้านความทรงจำที่มี
ไม่เคยไม่คิดถึงเธอ
gee-meun-pan-laan-khwaam-song-jam-tee-mee
mai-keuy-mai-kid-teung-tur
幾千萬十萬的有的記憶
不曾不想念著你

อีกนานไหมฉันก็ไม่รู้
(อีกกี่เดือนหรือจะอีกปี)
eek-naan-mai-chan-gaaw-mai-ruu
(eek-gee-deuan-reu-ja-ekk-bpee)
再多久我也不知道
(還要幾個月或幾年)

กี่หมื่นพันล้านความทรงจำที่มี
ไม่เคยไม่คิดถึงเธอ
gee-meun-pan-laan-khwaam-song-jam-tee-mee
mai-keuy-mai-kid-teung-tur
幾千萬十萬的有的記憶
不曾不想念著你

一個能夠搜尋平衡語料庫和華語文語料庫(COCT)的方法:透過CQP語法進行語料檢索

每每聽到「○○○語料庫『不好用』」的時候,「不好用」包含了許多可能性。它可能指的是語料庫的語料不夠多(數量),也可能指的是語料庫所涵蓋的文體或範圍(質量)並非使用者所期待。學了一些入門的語料庫檢索的方法之後,我想大部分人在說「○○○語料庫『不好用』」這句話的時候,想表達的應該是「○○○語料庫(界面)的查詢功能『不好用』」。

中央研究院的平衡語料庫自2007年開始未再更新,而檢索界面看起來最後設計是在2013年,它透過勾選、搜尋框和下拉選單等網頁工具給人一種「很好用」的印象。國家教育研究院的華語文語料庫(COCT)則自2013年開始蒐集語料,其語料數量已經超過平衡語料庫,同時透過國教院語料索引典系統的設置,在同一個系統內,可以檢索不同的語料庫(目前開放的為中研院平衡語料庫4.0、COCT 口語語料庫、華語中介語語料庫、COCT 書面語語料庫)的語料。索引典系統還「不太好用」,因為它還不能透過人類直觀的感覺去進行查詢,使用者必須學習電腦的語言(Simple Query或Corpus Query Processor, CQP),才能找到符合要求的語料。

在CQP的表示式中,
[word=”把” & (pos=”Nf” | pos=”Na”)]
的意思是查詢「把」這個詞中,屬於詞性是Nf和Na的語料。Nf和Na就是語料庫中,透過斷詞系統或人工檢查所標註的詞性,中研院詞類標記列表 有所標註的代號。

CQP包含下面萬用字:

[word=”好高.遠”]
.代替一個字

[word=”哈*”]
*前字重覆0~n次

[word=”副.+”]
+前字重覆0~n次

[word=”[台臺]灣”]
[AB..]任選一個字

[word=”一[^百千萬]二[^百千萬]”]
[^AB…]否定一組字

[word=”(台北|高雄)市”]
“(X|Y)Z”任選一組字

根據上面的表示式和萬用字,我們可以就可以對電腦說很多話。假設我現在要查四字格裡頭,第一個字是「生」,第二個字是「死」的時候,我就可以用以下表示式:
[word=”….”&char(word,0)=”生”&char(word,1)=”死”]
同理,我可以請電腦幫我找,第一個字是「生」,第三個字是「死」
[word=”….”&char(word,0)=”生”&char(word,2)=”死”]
第一個字是「生」,第四個字是「死」
[word=”….”&char(word,0)=”生”&char(word,3)=”死”]
第二個字是「生」,第三個字是「死」
[word=”….”&char(word,1)=”生”&char(word,2)=”死”]
第二個字是「生」,第四個字是「死」
[word=”….”&char(word,1)=”生”&char(word,3)=”死”]
第三個字是「生」,第四個字是「死」
[word=”….”&char(word,2)=”生”&char(word,3)=”死”]

接著我可以用|把上面這些條件取聯集,我就得到一個「四字格裡頭,包含『生』和『死』兩個字,而且『生』在前面,『死』在後面」的表示式
[word=”….”&char(word,0)=”生”&char(word,1)=”死”]|[word=”….”&char(word,0)=”生”&char(word,2)=”死”]|[word=”….”&char(word,0)=”生”&char(word,3)=”死”]|[word=”….”&char(word,1)=”生”&char(word,2)=”死”]|[word=”….”&char(word,1)=”生”&char(word,3)=”死”]|[word=”….”&char(word,2)=”生”&char(word,3)=”死”]

跟日本人說話,我們要用日語;跟泰國人說話,我們要用泰語;跟語料庫說話,我們可以用第四代語料庫語言CQP。當然,有時候找個日語翻譯或泰語翻譯也是解決溝通上的方法,而和語料庫溝通的翻譯就是那些擁有資工專長的人們。

CQP的使用可以參考中國外語教育研究中心許家金的使用手冊

試題反應理論(Item Response Theory)中,需要看配適度(Fit)嗎?

從每個人在每個項目的實際得分(observed score)和該人該項目的預期得分(expected score)的差,除以變異數,可以得到這個資料點對模型的標準化的殘差(standardised residual),把所有這些標準化的殘差平方後再求平均,就是未權重配適度均方(unweighted fit mean-squar);若根據該資料點的變異數進行權重,則叫作權重配適度均方(weighted fit mean-square)。前者也叫outfit,因為它對極端值(outlier)相當敏感,如果高能力的人答錯簡單的題或低能力的人答對較難的題,則整個均方就會變大,資料和模型的配適就不好;後者又叫infit,因為其根據每個資料所能提供的資訊(information fit)進行權重,極端值的變異較小(例如:0.9*0.1或0.1*0.9,但中間的資訊較多(0.5*0.5)。
我們可以使用R裡頭的TAM套件的msq.itemfit,去取得模型中每個項目的outfit和infit。把outfit的值畫出來的話,會如下圖:

在有800個來自常態分佈的樣本下裡的20個項目中,越接近1的項目,配適地越好,反之則越差。

隨著樣本數的增加或減少,在模擬的情況下,可以操控fit和1的距離。下面為樣本數為80和8000的情況。

如果看配適度t值的話,就沒有上面的問題。但是,在真實資料的情況下,又會遇到另一個問題,當樣本數越大,則越容易發現配適地不好的項目,越容易發現資料和模型之間存在差異。

我們可以這麼去理解配適度,它是一個項目和其餘項目總和的關係。從這個角度去理解配適度的話,其實「信度」或「鑑別度」已經提供我們足夠的資訊去決定一個項目的優劣了。如果我們以「配適度」去決定是否要採用某個項目,那反而會將具有鑑別度的項目剔除。當outfit離1很遠的時候,有兩種情況:一個是正方向的離1很遠,一個是負方向的離1很遠。正方向的離1很遠具有好的鑑別度,但我們可能因為判斷它的配適度不佳而刪除。倘若要從配適度去剔除不好的題目,就從outfit值最小的開始吧!