Author: Dicky

用Lex30來測量二語學習者的詞彙量

Lex30是一個可以用來測量產出詞彙(productive vocabulary)的方法,學習者透過自由聯想(word association)針對30個刺激提供一連串的語詞清單。測量產出詞量,本來就是比測量接收詞彙(receptive vocabulary)更困難的工作。過去測量產出詞彙的方法主要有兩個: 第一種是在句子脈絡中給予目標語詞開頭幾個字母作為提示,如: The book covers a series of isolated epis___ from history. 學習者根據提示將缺失的地方填上合適的語詞(Laufer & Nation, 1999) 。 第二種是透過自由產出詞彙考試(free productive vocabulary test),例如Laufer and Nation (1999)的詞彙頻率描述考試(lexcial frequency profiling test)。分析學習者書寫或口說的論述,根據不同的主題和語詞的類別進行分析,語詞的頻率分為常見、較不常見、罕見的,若罕見的詞彙較多,則該學習者較被認為有較高的產出詞彙。 第一種方法在學習者的詞彙量是可以控制的情況下,是很有效率的方,但是這僅限於初學者。舉例來說: The fra____ of the flowers filled the room. 當學習者不知道fragrance的時候,學習者可能知道senct、aroma或perfume,甚至其它能夠放到句子脈絡且罕見的語詞。然而,控制詞彙量的時候,無法真正測量到學習者的產出詞彙。 第二個方法,學習者的論述會受限於主題。而且,要求學習者在產出兩篇包含300個語詞上下的論述,至少需要2個小時以上的時候(Laufer & Nation, 1995) 。作為測量工具,顯得沒有效率。 Meara and Fitzpatrick (2000) 提出Lex30和先前兩種方法一樣,同樣想要測量產出詞彙,另外還得解決上述遇到的困難。下面為Lex30的簡述: Lex30選擇30個刺激供學習者自由聯想。30個刺激選擇的標準如下:一、都是初學者前1000個會先學習者的語詞,即都是高頻的語詞;二、可以聯想的範圍很廣;三、避免產出共同語詞(common word),例如:and、even、but這樣的刺激。 對於每一個刺激,學習者有30秒去反應。學習者針對刺激進行自由聯想,去反應一個語詞清單(至少三語詞)。 每個學習者大約會有90左右的反應語詞。Lex30根據這90個反應語詞進行計分,若在初學1000字以內的詞彙,則不給分;若在初學1000字以外的詞彙則得1分。加總分數後,若得分越高,則此學習者的產出詞彙能力越好。 Lex30的30個語詞刺激為:attack、board、close、cloth、dig、dirty、disease、experience、fruit、furniture、habit、hold、hope、kick、map、obey、pot、potato、real、rest、rice、science、seat、spell、substance、stupid、television、tooth、trade、window。 […]

透過JabRef在LibreOffice上以APA格式進行文獻的引用

為什麼要用文獻管理軟體?研究生2.0曾經撰文告訴大家十個理由。研究生2.0使用文獻管理軟體的理由,我都同意。但我認為大多數研究生不會因為文獻管理軟體有諸多好處,而去使用它。對研究生而言,管理文獻只是為了人生中一篇僅僅為了畢業撰寫的論文,畢業後剩餘的人生根本不需要再寫論文,我根本不需要使用文獻管理軟體。我思考自己使用文獻管理軟體的原因是因為修了《數位媒體編輯》。《數位媒體編輯》這門課不是讓我學會文獻管理軟體的課,它讓我學到的「工具獨立性」和「心智外包」(Extended Mind)。工具獨立性,是指可以用任何的軟體,達成一件整合性的作品。心智外包就是把原本應該親自花費心力的事,交給工具去完成。 《數位媒體編輯》的每一週課就是教你使用Word。但是學期作業要你作出一個雜誌,你可以使用Word,也可以使用InDesign,也可以使用各式各樣你覺得能夠完成雜誌所需的軟體。用Word,誰不會!反正就把Word打開,打字就好了,換個字型、換個顏色、放個圖片、用什麼文字藝術師就可以漂漂亮亮了,這個國小電腦課東西居然在大學一個三學分的《數位媒體編輯》進行!如果這樣的話,微軟公司也太好混了吧!Word有很多選單裡頭能做到的事,我們都沒注意過。這堂課當然不是在學Word的使用技術,我們學的是編輯一個雜誌,需要哪些技術,而這些技術在Word上怎麼辦到。知道哪些部分是軟體可以代替人力辦到的,我們就從工人智慧往人工智慧又進了一步。 因為工具獨立性和心智外包,電腦能做的事,自己就不去做;開源軟體能做的事,就不去使用付費的軟體。作業系統有很多,windows、ios,但是我使用ubuntu;統計軟體有很多,SAS、spss,但是我使用R;有名的辦公室軟體Microsoft Officea我也沒用,我用Libreoffice;文獻管理軟體也很多EndNote、Mendely、zotero,一開始猶豫使用zotero或JabRef,付年費使用2年的zotero之後,後來還是使用JabRef。 zotero因為能夠和Firefox瀏覽器上加上套件進行文獻管理,而且可以在Libreoffice的文件編輯的同時,進行文獻引用,因此網路上的資訊相對豐富,進入門檻就比較低。(當然,我想可能還是因為zotero進行收費,所以能夠有組織去使它變得更親民) JabRef早期大多只有使用LaTeX撰寫科技論文的研究者使用,網路上的資訊也不多,門檻高,我都還沒進去就先放棄了。 但是,我使用zotero年費,每年是30塊美元,能夠管理的文獻數量只有2GB,在文獻一直增加的情況下,下一個級距就是6GB,我就必須付出年費60塊美元。因此,我還是再研究JabRef。五、六年的發展,JabRef有許多更親民的改變。但是,對於初初使用文獻管理軟體的人,恐怕還是不太容易。 我把一些可能遇到的問題和解決的方案收錄在下面,這些做法都是在lubuntu的作業系統下,使用LibreOffice可以參考的內容: 我怎麼樣可以LibreOffice上,用JabRef引用文獻? 我怎麼樣可以在使用文書軟體時,讓引用的文獻是符合APA的格式?在JabRef上可以透過選擇.jstyle的檔案,使文獻引用符合自己所需要的格式。我沒有那麼努力自己去編輯,因為有網友提供了適合的.jstyle。今年二月有網友分享了許多期刊的格式,但是仍然缺少APA的格式。APA是很多期刊文獻引用的格式,今年5月有人提供了APA的.jstyle。 那些.jstyle適用於word,我用的是LibreOffice,怎麼辦?適用於LibreOffice的.jstyle,有網友提供範例,只要依照範例和自己所需要的.jstyle去將兩個文件合併在一塊就可以。

參加「2017年華文教育名師巡講」泰國場次有感:一統天下到百花齊放

「考試」可能是中國人相當迷信的實用之一。它的實用在於可以很有效率地從茫茫人海中,找出有能力的人材;它的迷信在於茫茫人海中的人們認為考試可以用來作為佐證自己能力的證據。在考試盛行的地區,人們不擅於提出問題,但是追求答案。取得答案的過程通常不需要理性地推演,只要有一個權威機構發佈就可以了,簡稱「標準答案」。對於語言學習,人們也常常追求權威機構。學習英語想參加英語考試時,你會選擇「財團法人語言訓練測驗中心」的全民英檢?還是美國ETS機構的托福、多益?學習泰語想參加泰語考試時,你會選擇「台灣泰國文化暨語言交流協會」的泰語檢定?還是泰國朱拉隆功大學的泰語能力檢定?學習漢語或華語,想參加漢語考試時你會選擇北京語言大學漢語水平考試中心的漢語水平考試?還是國家華語測驗推動工作委員會的華語文能力測驗?一個最容易判斷的標準就是主辦考試的機構所在的位置是不是在標的語的來源地,簡單地說,就是給你出考卷的人是不是母語者。 學習第二語言的時候,因為對於考試的迷信、對於母語者的迷信,我們認為有一個可以一統天下的「第二語言」,而忽略了「第二語言」百花齊放的可能性。英語作為第二語言,在全球化的發展較早,所以比較容易看到英語百花齊放的樣貌,大多數的人都同意學習英語如果只能聽懂美國人的英語,那就還能更進一步,去聽聽英國人的英語、澳洲人的英語、印度人的英語、新加坡人的英語。因為認識這樣的多樣性,所以自己學習英語的時候,就有一份自信說我講的是台灣人的英語或中國人的英語。但是這個有自信的台灣英語或中式英語,偶爾會被「考試」或「母語者」的陰影給籠罩,我們那個追求標準答案的小鬼讓我們失去自信。能夠讓英語紅紅火火的應該不會是一統天下的大英帝國,各地的英語百花齊放,才是現在看到英語風行於世界的模樣。 華語作為第二語言又是如何?清朝乾隆年間,東印度公司一個叫洪仁輝的英國人,因不滿地方官員勒索告御狀,乾隆氣得直哆嗦。於是,洪仁輝被判有期徒刑三年,罪名是:擅自學習漢字漢語。洪仁輝事件后,清廷感到必須加強對外夷的管理與防范。兩廣總督李侍堯在奏文中將事件原因歸結:「細察根源,縱由內地奸民教唆引誘,行商通事不加管束稽查所致。查夷人遠處海外,本與中國語言不同,向之來廣貿販,唯藉諳曉夷語之行商通事為之交易,近如夷商洪仁輝於內地土音官話,無不通曉,甚至漢文字義,亦能明晰,此夷商中如洪仁輝之通曉語文言義者,亦尚有數人,設非漢奸潛滋教誘,何能熟悉?如奸民劉亞扁始則教授夷人讀書,圖謀財物,繼則主謀唆訟,代作控辭,由此類推,將無在不可以勾結教誘,實於地方大有關系。」一統天下是中國很熟悉的概念,秦朝的書同文、車同軌就是最好的例子。外國人能夠通曉漢語,肯定也是中國人教授所致。歷史無法重演,如果乾隆那時候,在洪仁輝告御狀後,開始打貪反腐、鼓勵來華貿易的外國人學習漢語,現在世界的政治版圖會不會不一樣?世界第二語言的景象又會是怎麼樣? 現在世界著名推廣外國人學習漢語的機構「孔子學院總部」,孔子學院被國家漢辦所指導,國家漢辦又直隸於教育部,於2004年11月21日在韓國首爾成立全球首家孔子學院。透過「考試」(HSK)或「母語者」(志願者)到世界各國教授漢語的孔子學院,是對外漢語的權威機構。 另外一個沒那麼有名,但同樣致力於海外華文教育的的「中國華文教育基金會」,其主管單位是國務院僑務辦公室,也在同一年2004年成立。我參加了由其主辦「2017年華文教育名師巡講」泰國場次的培訓,它展現了百花齊放的可能性。這個培訓的課程內容包含:繪本閱讀、古詩教學、團隊心理輔導、口語交際以及臉譜,由中山市石歧中心小學的教育團隊負責,校長和來自該校的優秀教師組成團隊完成巡講任務。參加培訓的學員,來自曼谷各級學校的華語老師。這些華語老師,有一些是泰國本地的老師,也有一些來自台灣或中國大陸的老師。你可能會懷疑道:「這是把在大陸對母語者的教育課程原封不動地搬到海外!」。然而,如果你有抱著一點點多元文化的期待,你就會相信這些原汁原味的課程,在不同的土壤下會有百花齊放的可能性。世界各地的老師會受到這些課程有所啟發。柬埔寨的華語、泰國的華語、汶萊的華語才有變成全球華語的可能性。 我在造訪泰國正大管理學院的期間,有許多台灣的大學生到這裡實習。這一年,有兩個實習生雖然在台灣讀大學,但並非來自我們傳統上認為的華語的來源地(台灣或中國大陸),他們分別來自馬來西亞和香港。即便對於華語母語者的我來說,聽懂香港人講華語也是一件相當困難的事。但是,正大管理學院的泰籍老師黃偉榮卻認為學習華語的學生不可能只會遇到沒有方言口音的華語,因此聽香港人講華語也相當重要。在華語外圈的泰籍老師,看到華語內圈語言的多樣性;在華語內圈的華語老師們,是否也看到華語外圈華語的多樣性?

到曼谷租公寓,要備齊哪些生活必需品?到Big C去淘寶。

你可以說我住在曼谷,但準確地說,我是住曼谷北邊的暖武里省(นนทบุรี,Nonthaburi)的巴革區/縣(ปากเกร็ด,Pak Kret)的文建路上(ถนนแจ้งวัฒนะ,Chaeng Watthana Road)的小區裡頭的公寓。我住的公寓叫Diamond Place,每個月的租金是5500元,若需要冰箱和電視可另外租(月租500元),枕頭、床單什麼都沒有,僅有床墊、書桌、梳妝台、鏡子、櫃子。 因為什麼東西都沒有,所以我需要自己去買齊這些東西,幾乎所有東西都在Big C買的,都是最便宜的東西… 這是去一趟Big C之後買的東西,共699.25元,除了一些讓我空盪盪的房間多一點舒適感的東西外,我也買了一餅乾和豆漿準備來過午不食了!  從浴室出來的時候,腳溼溼的,所以我需要一個腳踏墊。原價129元,特價只要34元。 睡了兩天沒有枕頭的覺,枕巾79元。  我對睡眠品質的要求很高,我不能買最便宜的枕頭(64元),我買了第二便宜的枕頭89元。我好想買乳膠枕頭,才399元。  水門市場路邊買的羅勇涼被,原價300元,特價250元。

《大家來學泰語》第八課:日/月/年(補充教材)-วัน เดือน ปี

中介語(Interlanguage)是指從母语(L1)始至習得得第二語言(L2)止,其間經歷的一系列的語言過渡「階段」裡,所產生之「語言」。以學習泰語為目標的時候,我們就不必在意翻譯的「信、達、雅」,所以下面的華語注釋,可能會覺得不美、不通順。你可以把這些不美、不通順的注釋當成是中介語,因為它既不是華語,也不是泰語,但它是幫助我們學習泰語的。如果想找比較美的華語歌詞翻譯,可以看此部落格。 วันจันทร์ฉันคอยอยู่อังคารก็คอยดูดูๆว่าเธอเป็นไงwan-jan-chan-kaawy-yuuang-kaan-gaaw-kaawy-duuduu-duu-waa-tur-bpen-ngai星期一我等著星期二還等著等看看你是怎樣 พุธเธอก็ไม่มาเช้าสายก็ไม่มีพฤหัสว่างเปล่าpoot-tur-gaaw-mai-maachao-saai-gaaw-mai-meepha-reu-hat-wang-bplao星期三沒來早晚上都沒有星期四沒空 ศุกร์หรือเสาร์หรือว่าอาทิตย์ไม่มีวันไหนไม่คิดถึงsuk-reu-saao-reu-waa-aa-titmai-mee-wan-nai-mai-kid-teung星期五或星期六抑或是星期日沒有哪天不想你 ไม่มีวันไหนที่เธอจะย้อนมาสู่วันเก่าๆของเราmai-mee-wan-nai-tee-tur-ja-yaawn-maasuu-wan-gao-gao-kaawng-rao沒有哪天你會願意來回到我們的舊日子 วันที่ฉันเจอเธอวันที่ได้ใกล้กันวันที่เราจูงมือwan-tee-chan-jur-turwan-tee-dai-glai-ganwan-tee-rao-jung-meu與你見面的那一天與你接近的那一天我們牽手的那一天 วันที่ฉันรักเธอวันที่ฉันพูดไปวันที่เธอรับฟังwan-tee-chan-rak-turwan-tee-chan-pud-bpaiwan-tee-tur-rab-fang愛你的那一天我說出口的那一天你願意聽我說的那一天 อีกนานไหมฉันก็ไม่รู้(อีกกี่เดือนหรือจะอีกปี)eek-naan-mai-chan-gaaw-mai-ruu(eek-gee-deuan-reu-ja-ekk-bpee)再多久我也不知道(還要幾個月或幾年) กี่หมื่นพันล้านความทรงจำที่มีไม่เคยไม่คิดถึงเธอgee-meun-pan-laan-khwaam-song-jam-tee-mee-mai-keuy-mai-kid-teung-tur幾千萬十萬的有的記憶不曾不想念著你 มกราก็ยาวนานกุมภาก็เลือนลางมีนาก็ยังเลื่อนลอยmohk-ga-raa-gaaw-yaao-naangoom-phaa-gaaw-leuan-laangmee-naa-gaaw-yang-leuan-loy一月還很長二月還很模糊三月也很模糊 เมษาก็ร้อนรนพฤษภาก็ทุกข์ทนมิถุนาว่างเปล่าme-saa-gaaw-raawn-ronphreut-sa-phaa-gaaw-took-tonmi-thoo-naa-waang-bplao四月很焦慮五月要忍耐六月沒有空 อีกนานไหมฉันก็ไม่รู้(อีกกี่เดือนหรือจะอีกปี)eek-naan-mai-chan-gaaw-mai-ruu(eek-gee-deuan-reu-ja-ekk-bpee)再多久我也不知道(還要幾個月或幾年) กี่หมื่นพันล้านความทรงจำที่มีไม่เคยไม่คิดถึงเธอgee-meun-pan-laan-khwaam-song-jam-tee-meemai-keuy-mai-kid-teung-tur幾千萬十萬的有的記憶不曾不想念著你 อีกนานไหมฉันก็ไม่รู้(อีกกี่เดือนหรือจะอีกปี)eek-naan-mai-chan-gaaw-mai-ruu(eek-gee-deuan-reu-ja-ekk-bpee)再多久我也不知道(還要幾個月或幾年) กี่หมื่นพันล้านความทรงจำที่มีไม่เคยไม่คิดถึงเธอgee-meun-pan-laan-khwaam-song-jam-tee-meemai-keuy-mai-kid-teung-tur幾千萬十萬的有的記憶不曾不想念著你

一個能夠搜尋平衡語料庫和華語文語料庫(COCT)的方法:透過CQP語法進行語料檢索

每每聽到「○○○語料庫『不好用』」的時候,「不好用」包含了許多可能性。它可能指的是語料庫的語料不夠多(數量),也可能指的是語料庫所涵蓋的文體或範圍(質量)並非使用者所期待。學了一些入門的語料庫檢索的方法之後,我想大部分人在說「○○○語料庫『不好用』」這句話的時候,想表達的應該是「○○○語料庫(界面)的查詢功能『不好用』」。 中央研究院的平衡語料庫自2007年開始未再更新,而檢索界面看起來最後設計是在2013年,它透過勾選、搜尋框和下拉選單等網頁工具給人一種「很好用」的印象。國家教育研究院的華語文語料庫(COCT)則自2013年開始蒐集語料,其語料數量已經超過平衡語料庫,同時透過國教院語料索引典系統的設置,在同一個系統內,可以檢索不同的語料庫(目前開放的為中研院平衡語料庫4.0、COCT 口語語料庫、華語中介語語料庫、COCT 書面語語料庫)的語料。索引典系統還「不太好用」,因為它還不能透過人類直觀的感覺去進行查詢,使用者必須學習電腦的語言(Simple Query或Corpus Query Processor, CQP),才能找到符合要求的語料。 在CQP的表示式中,[word=”把” & (pos=”Nf” | pos=”Na”)]的意思是查詢「把」這個詞中,屬於詞性是Nf和Na的語料。Nf和Na就是語料庫中,透過斷詞系統或人工檢查所標註的詞性,中研院詞類標記列表 有所標註的代號。 CQP包含下面萬用字: [word=”好高.遠”].代替一個字 [word=”哈*”]*前字重覆0~n次 [word=”副.+”]+前字重覆0~n次 [word=”[台臺]灣”] [AB..]任選一個字 [word=”一[^百千萬]二[^百千萬]”][^AB…]否定一組字 [word=”(台北|高雄)市”]“(X|Y)Z”任選一組字 根據上面的表示式和萬用字,我們可以就可以對電腦說很多話。假設我現在要查四字格裡頭,第一個字是「生」,第二個字是「死」的時候,我就可以用以下表示式:[word=”….”&char(word,0)=”生”&char(word,1)=”死”]同理,我可以請電腦幫我找,第一個字是「生」,第三個字是「死」[word=”….”&char(word,0)=”生”&char(word,2)=”死”]第一個字是「生」,第四個字是「死」[word=”….”&char(word,0)=”生”&char(word,3)=”死”]第二個字是「生」,第三個字是「死」[word=”….”&char(word,1)=”生”&char(word,2)=”死”]第二個字是「生」,第四個字是「死」[word=”….”&char(word,1)=”生”&char(word,3)=”死”]第三個字是「生」,第四個字是「死」[word=”….”&char(word,2)=”生”&char(word,3)=”死”] 接著我可以用|把上面這些條件取聯集,我就得到一個「四字格裡頭,包含『生』和『死』兩個字,而且『生』在前面,『死』在後面」的表示式[word=”….”&char(word,0)=”生”&char(word,1)=”死”]|[word=”….”&char(word,0)=”生”&char(word,2)=”死”]|[word=”….”&char(word,0)=”生”&char(word,3)=”死”]|[word=”….”&char(word,1)=”生”&char(word,2)=”死”]|[word=”….”&char(word,1)=”生”&char(word,3)=”死”]|[word=”….”&char(word,2)=”生”&char(word,3)=”死”] 跟日本人說話,我們要用日語;跟泰國人說話,我們要用泰語;跟語料庫說話,我們可以用第四代語料庫語言CQP。當然,有時候找個日語翻譯或泰語翻譯也是解決溝通上的方法,而和語料庫溝通的翻譯就是那些擁有資工專長的人們。 CQP的使用可以參考中國外語教育研究中心許家金的使用手冊。

試題反應理論(Item Response Theory)中,需要看配適度(Fit)嗎?

從每個人在每個項目的實際得分(observed score)和該人該項目的預期得分(expected score)的差,除以變異數,可以得到這個資料點對模型的標準化的殘差(standardised residual),把所有這些標準化的殘差平方後再求平均,就是未權重配適度均方(unweighted fit mean-squar);若根據該資料點的變異數進行權重,則叫作權重配適度均方(weighted fit mean-square)。前者也叫outfit,因為它對極端值(outlier)相當敏感,如果高能力的人答錯簡單的題或低能力的人答對較難的題,則整個均方就會變大,資料和模型的配適就不好;後者又叫infit,因為其根據每個資料所能提供的資訊(information fit)進行權重,極端值的變異較小(例如:0.9*0.1或0.1*0.9,但中間的資訊較多(0.5*0.5)。我們可以使用R裡頭的TAM套件的msq.itemfit,去取得模型中每個項目的outfit和infit。把outfit的值畫出來的話,會如下圖: 在有800個來自常態分佈的樣本下裡的20個項目中,越接近1的項目,配適地越好,反之則越差。 隨著樣本數的增加或減少,在模擬的情況下,可以操控fit和1的距離。下面為樣本數為80和8000的情況。 如果看配適度t值的話,就沒有上面的問題。但是,在真實資料的情況下,又會遇到另一個問題,當樣本數越大,則越容易發現配適地不好的項目,越容易發現資料和模型之間存在差異。 我們可以這麼去理解配適度,它是一個項目和其餘項目總和的關係。從這個角度去理解配適度的話,其實「信度」或「鑑別度」已經提供我們足夠的資訊去決定一個項目的優劣了。如果我們以「配適度」去決定是否要採用某個項目,那反而會將具有鑑別度的項目剔除。當outfit離1很遠的時候,有兩種情況:一個是正方向的離1很遠,一個是負方向的離1很遠。正方向的離1很遠具有好的鑑別度,但我們可能因為判斷它的配適度不佳而刪除。倘若要從配適度去剔除不好的題目,就從outfit值最小的開始吧!

在項目反應理論(Item Response Theory)下,怎麼理解「難度」這個概念?三種取徑。

在項目反應理論(Item Response Theory)中,要描述一個項目的「難度」和古典測驗理論(classical test theory)有不一樣的方法。在古典測驗中,一個項目的「難度」被認為是參與答題者人中答對該項目的比率,越多人答對,難度越低。在項目反應理論中,我們可以從三個取逕來理解項目的難度。項目反應理論中的描述「難度」需要有兩個維度來定義,「樣本能力」和「答對機率」。在只有受試者只有1/0二元結果(答對或答錯)的情況下,以下圖為例,假設受試者的能力是0,則答對該項目的機率則為50%,則項目難度delta則為0。 同樣delta的概念,若在受試者的得分被評為三個等級,例如:0、1、2的時候,以下圖為例,黑色線(得0分的機率)和紅色線(得1分的機率)相交的地方,比50%小一點點的答對率;以及,紅色線(得1分的機率)和綠色線(得2分的機率)相交的地方,同樣比50%小一點點的答對率。前者往下延伸至x軸為delta1(難度為-0.5),後者往下延伸至x軸為delta2(難度為0.5)。delta1和delta2兩個節點,可以把人分成得0分、得1分和得2分機率最高的範圍。 如果把答對的機率累積起來,以下圖為例,則從50%答對率水平延伸至與黑線(得1分或2分的累積機率)和綠線(得2分的累積機率)相交(紅線為得1分、2分和3分的累積機率)後再往x軸延伸取得gamma1(難度為-0.5)和gamma2(難度為0.5)。gamma1和gamma2兩個節點,同樣可以把人分成得0分、得1分和得2分機率最高的範圍。 又或者利用預期得分,從受試者的能力去推估期可能的得分(0到2之間),當能力相同的時候,預期得分越高的項目,難度則越低;反之,難度則越高。或者,難度高的題目,給能力好和能力不好的兩個受試者去測試,能力好的受試者預期得分會高於能力不好的受試者。參考下圖:

在古典測驗理論(Classical Test Theory)中計算信度(reliability)

古典測驗理論(Classical Test Theory)中,存在一些假設:一、Observed Scored = True Score + (Measurement) ErrorX = T + E二、mean(X) = T三、Corr(E,T) = 0四、Corr(E1,E2) = 0五、Corr(E1,T2) = 0如果平行測驗的兩次所觀察到的分數滿足上述五個假設,則兩次的真實分數(True Score)相等,兩次的van(E)相等。van(E)為每一個題項(item)的變異數的總和。從古典測驗理論的假設下,可以延伸出以下:一、mean(E) = 0二、Var(X) = Var(T) + Var(E)三、[Corr(X,T)]squar = Var(T)/Var(X)四、Var(X) = Var(X’)(當兩者為平行測驗時)五、Corr(X,X’) = Var(T)/Var(X)(此用以計算單一測驗的信度) 計算單一測驗的信度,可利用Cronbach’s Alpha:Cronbach’s Alpha = (n/(n-1))*(Var(T)/Var(X))= (n/(n-1))*((Var(X) – Var(E))/Var(X))n/(n-1)用來校正,當n很大時,可忽略不計。 Cronbach’s Alpha作為信度係數,可以用測同一個構念的內部一致性(internal consistency)。若同一個構念中,含有多個子成分,各別子成分計算Cronbach’s Alpha,可討論各個子成分裡頭的內部一致性。然而,將以多個子成分組成的構念,再計算出一個屬於整體構念的Cronbach’s Alpha會很奇怪。[如果可以算一個Cronbach’s Alpha,為啥還要多個子成分的Cronbach’s Alpha?如果多個子成分才能組成一個構念,自然不存在內部一致性。]

輕鬆學習泰語聲母中、高、低子音

如果有一個「外星語言」,它肯定比起地球上,任何一個「外國語言」更難。地球人的發音部位、發音方式、聽覺器官都是同一套。至少不是像《降臨》裡頭的七肢桶語言,女主角形容就像「一隻濕漉漉的狗抖掉毛皮上的水時發出的聲音」,畢竟七肢桶有和地球人完全不一樣的發聲與聽覺器官結構。那為什麼我們學習外語會亂無章法,覺得理不出頭緒呢?我認為是因為我們太過於專注於第一語言和第二語言的差異,而忽略了第一語言和第二語言的共性。地球人能夠學好自己的母語(第一語言),就勢必能夠學習好外語(第二語言),至少比學習外星語言容易。共性在哪裡?每個人都有一個嘴巴,兩個耳朵。 美國人的耳朵和日本人的耳朵聽到的是否一樣?去問問美國人和日本人聽到/r/和/l/這兩個音的時候,聽到的是一種聲音或兩種聲音?也許有些人認為這是不可逆的事實。但這不是現在文章要討論的重點,我們實驗室的同學王靖雯研究就認為這耳朵是可以被訓練,《聽清楚才能真的講明白:加強聽辨能力是否有助於發音》也將在第十八屆全國語言學論文研討會上發表。 除了兩個耳朵是一樣的,我們還有一個嘴巴是一樣的,所有人類的發音部位和發音方式都是一樣,只是某些語言不使用某些部位或方式。擁有格里菲斯大學(Griffith University)認知與應用語言學學位,而且精通東南亞和中國語言的王懷樂(Stuart Jay Raj)把泰語的發音部位、方式進行有系統的解構。配合泰語符號(泰文)的來源(天城文、梵語),其目標在於能夠最後學習好泰語(不只是停留在泰母聲母、韻母階段),王懷樂撰文提醒我們有12個小撇步可以更容易學會泰語聲母,同時也為往後的聲調打下基礎。 「為愛學語言」的王懷樂寫的文章,如果沒有一點兒「語言學」或「泰語」的底子,可能讀起來會很吃力。不過,如果用心慢慢地細讀,並對照其所提供的表格的話,應該是不會有太大的困難才是。我將12個小撇步中譯如下,配合王懷樂的表格應該有助於學習泰語聲母。 一、書寫泰語符號(泰文)的時候,都從有「圈圈」的地方開始。*二、在泰語聲母表中,需要發出塞音(‘glottal’,第1個直欄),都是中子音。三、在泰語聲母表中,不需要聲帶振動,直接送氣發出的聲音(‘Non-Voiced-Aspirate’,第2個直欄),都是高子音。四、餘第3、4和5個直欄,都是低子音。五、泰語的「中、高、低子音」和「聲調」有相關,但不代表高子音就會發上揚的聲調。**六、印歐語言家族有濁音(‘voiced’)和送氣的濁音(‘voiced – aspirated’),泰語通通沒有。第2、3和4直欄的聲母,有幾乎一樣的發音,就是因為要聲帶振動的濁音以及強送氣的發音缺失。第2欄和第3、4欄唯一的差別就是在於高子音和低子音發音位置上的不同。***七、有好幾個泰語聲母無法在對應到印歐語系。這些無法對應的聲母是來自於天城文(Devanagari),它們看起來幾乎一模一樣,只有在某個部位長得不一樣,這包括:低子音的ช和ซ(ch/s),中子音的ด和ต (d/t),中子音的ฎ和ฏ(d/t),中子音的บ和ป(b/p),低子音的พ和ฟ(ph/f)以及高子音的ผ和ฝ(ph/f)。八、印歐語系的‘Sh’在泰語裡頭都發‘s’,而且都是高子音,包括ห (ho hiip)九、低子音的‘s’ ซ不是來自印歐語系,而是同‘ch’ ช的發音位置上,以不同的發音方式發出。十、泰語也沒有印歐語系的舌音(‘cerebral’),所以第3個橫列和第4個橫列幾乎就是一模一樣的翻版。第3個橫列就是原先在梵語(Sanskrit)裡頭會發舌音的符號。因此,比較第3個橫列和第4個橫列就會發現,第4個橫列(本來就是齒音(‘Dental’))較常出現,而第3個橫列(自舌音變形後的齒音)多出現在梵語詞彙。十一、第1、2和3直欄、鼻音(nasals)以及可兼韻母的聲音(semi vowels)和ส是較常見的聲母。十二、第4個直欄(過去是濁音送氣的發音方式)和第3個橫列(由舌音變形的齒音,包括本來不是齒音的ศ的ษ)就是比較少用的聲母。 *只有ก(ko kai)和ธ(tho thong)沒有「圈圈」。 **壯侗語言家族(Tai languages)傳統上被認為是帶聲調的單音節語言,然而泰語符號(泰文)的來源是複音節且沒有聲調的印歐書寫系統(Indic writing system)。泰語的聲母必須自帶中、高、低子音的屬性(聲音被發出時,所使用的方式),於整個音節中,自音節頭到音節尾依該聲母的屬性產生聲調。之所以要將聲母分為中、高、低子音,是為了可以運用標準聲調規則去知道音節的發音。 ***以第1個橫列(發音部位為喉嚨)為例,隨著不同的發音方式,應該會發出k、kh、g、gh、ng五種聲音;但是在泰語裡頭是k、kh、kh、kh和ng。濁音的‘g’ 和‘gh’和泰語都是清音的‘kh’。