Tag: 語言學習

國家教育研究院 3 等 7 級華語文教學字表應用

國家教育研究院 3 等 7 級華語文教學字表,可以在此下載,在基礎級第一級共收有200個字,利用華語文組字構詞的方式,共可組出2194個詞,相關辦法可以參考此文章。 如果規劃學生學習華語的時候,每天學習五個字,40天就可以學會200個字。試作一個簡單的作業記錄以及將所有詞列表。 學會200個字的作業記錄2194個詞的列表

對體賦認知(Embodied cognition)的生活經驗

 今天我衣服的扣子掉了,我跟照客師兄拿了針線來縫,她沒給我剪刀,我縫好後去找她要剪刀剪。她把衣服接過去,長開口用牙齒將打結處和針之間的線扯斷。她檢查了一下我縫的結果,把我的衣服收過去,她親自把它縫好。她縫的扣子就和其它衣服上的扣子一模一樣,我縫的就是不知道哪裡用力一扯的話,又要掉下來了。她擁有比我更好的縫扣子(賦體)認知,我只會用手還需要剪刀,她只要用手和牙齒;不過,她讓我穿線,可能我的眼睛還是比較好使。(賦體)認知不是只有感知,還包括動作。語言如果也和(賦體)認知有關的話,使用語言時,就會涉及動作,有的人扣子縫得好,有的人扣子縫不好;有的人會說話,有的人不會說話。 今天禪修課師父分享了一個他看過的影片,是央視的節目《挑戰不可能》。有一個小女孩的眼力超好,現場有300位觀眾,他們的臉拍照之後複製成5份,並將所有1500張的照片投影在螢幕牆,這些照片裡有一張照片是合成了現在女明星的照片,小女孩的任務是在10分鐘內看完所有照片好挑出這張合成的照片。小女孩看完1500張照片後,就像大家平常靜坐後會搓揉眼睛、舒緩一下一樣,然後就挑出那張合成照片了。她使用眼睛去達成這個任務。我們一張一張去看,都不見得可以找出來合成照片;1500張,即使1秒1張也要25分鐘。她是怎麼辦到的?為什麼她要在任務後搓揉眼睛,而不是搓揉大腦? 下面是挑戰不可能的影片:

語言測驗的類型、目的和作法(Nation, 2013)

語言測驗在詞彙的學習上有幾種類型,其相對應的目的也有所差異: 一、診斷測驗(diagnostic tests):用來找出學習者學習上的困難,並從這裡去加強。學習者怎麼的詞彙學習策略也可以歸類於診斷測驗。二、分班測驗(placement tests):將學習者分到適合程度的班級。三、短期成就測驗(short-term achievement tests):去看學習者是否能夠將所研究的詞彙學習到。四、長期成就測驗(long-term achievement tests):評估整個課程在教學某些詞彙的時候是否成功、有效。五、能力測驗(proficiency tests):去看學習者會多少詞彙。 若要知道學習者在詞彙學習的策略(例如:從脈絡裡猜字(guessing from context)、使用詞語的部件(using word parts)、直接學習(direct learning)或使用詞典(dictionary use))應用是否存在困難時,可以使用經過設計的診斷測驗。學習詞語策略上的應用,Sasao (2013) 提供了測驗的方法。 直接詢問學習者是否學習過目標詞語則可以用於分班測驗。 短期成就測驗,語言教師有個簡易、可操作的流程:假設我們有20個目標語詞要測驗,可以先由學生自單元內挑選10個詞語,接著老師可以在這10個詞語旁邊標記:如果標記「S」,則學生必須用這個詞語造個句子;如果標記「C」,則學生要寫出這個詞語的三種搭配,即共現詞;如果標記「M」,則學生要解釋這個詞語的意思;如果標記「F」,則學習者要和這個詞彙在同一個家族的詞彙。然後,老師再另外選擇10個詞語進行測驗。這樣的測驗即個性化也有由老師所提供的詞語。 而長期成就測驗,必須符合課程目標,如果課程目標是廣展閱讀詞彙,則在句子脈絡下的理解測驗就比較適合。當然,來自各個單元的詞語是平均的。 學習者的詞彙量也有不少方法可以進行測量,通常是在既有的已分級的詞語表抽樣進行測驗以推估學習者的詞彙量。但是在測量學習者的詞彙量之前,我們有幾個問題必須回答: 一、「詞語」怎麼計算?怎麼樣我們會說這是「一個詞語」?二、我們如何選擇目標詞語去測驗?三、我們如何測量學習者是否「知道」/「學會」一個詞語?   References Nation, I. (2013). Testing vocabulary knowledge and use. In (), Learning Vocabulary in Another Language. Cambridge University Press. Sasao, Y. (2013). Diagnostic tests of English vocabulary learning proficiency: Guessing from […]

試題反應理論(Item Response Theory)中,需要看配適度(Fit)嗎?

從每個人在每個項目的實際得分(observed score)和該人該項目的預期得分(expected score)的差,除以變異數,可以得到這個資料點對模型的標準化的殘差(standardised residual),把所有這些標準化的殘差平方後再求平均,就是未權重配適度均方(unweighted fit mean-squar);若根據該資料點的變異數進行權重,則叫作權重配適度均方(weighted fit mean-square)。前者也叫outfit,因為它對極端值(outlier)相當敏感,如果高能力的人答錯簡單的題或低能力的人答對較難的題,則整個均方就會變大,資料和模型的配適就不好;後者又叫infit,因為其根據每個資料所能提供的資訊(information fit)進行權重,極端值的變異較小(例如:0.9*0.1或0.1*0.9,但中間的資訊較多(0.5*0.5)。我們可以使用R裡頭的TAM套件的msq.itemfit,去取得模型中每個項目的outfit和infit。把outfit的值畫出來的話,會如下圖: 在有800個來自常態分佈的樣本下裡的20個項目中,越接近1的項目,配適地越好,反之則越差。 隨著樣本數的增加或減少,在模擬的情況下,可以操控fit和1的距離。下面為樣本數為80和8000的情況。 如果看配適度t值的話,就沒有上面的問題。但是,在真實資料的情況下,又會遇到另一個問題,當樣本數越大,則越容易發現配適地不好的項目,越容易發現資料和模型之間存在差異。 我們可以這麼去理解配適度,它是一個項目和其餘項目總和的關係。從這個角度去理解配適度的話,其實「信度」或「鑑別度」已經提供我們足夠的資訊去決定一個項目的優劣了。如果我們以「配適度」去決定是否要採用某個項目,那反而會將具有鑑別度的項目剔除。當outfit離1很遠的時候,有兩種情況:一個是正方向的離1很遠,一個是負方向的離1很遠。正方向的離1很遠具有好的鑑別度,但我們可能因為判斷它的配適度不佳而刪除。倘若要從配適度去剔除不好的題目,就從outfit值最小的開始吧!

在古典測驗理論(Classical Test Theory)中計算信度(reliability)

古典測驗理論(Classical Test Theory)中,存在一些假設:一、Observed Scored = True Score + (Measurement) ErrorX = T + E二、mean(X) = T三、Corr(E,T) = 0四、Corr(E1,E2) = 0五、Corr(E1,T2) = 0如果平行測驗的兩次所觀察到的分數滿足上述五個假設,則兩次的真實分數(True Score)相等,兩次的van(E)相等。van(E)為每一個題項(item)的變異數的總和。從古典測驗理論的假設下,可以延伸出以下:一、mean(E) = 0二、Var(X) = Var(T) + Var(E)三、[Corr(X,T)]squar = Var(T)/Var(X)四、Var(X) = Var(X’)(當兩者為平行測驗時)五、Corr(X,X’) = Var(T)/Var(X)(此用以計算單一測驗的信度) 計算單一測驗的信度,可利用Cronbach’s Alpha:Cronbach’s Alpha = (n/(n-1))*(Var(T)/Var(X))= (n/(n-1))*((Var(X) – Var(E))/Var(X))n/(n-1)用來校正,當n很大時,可忽略不計。 Cronbach’s Alpha作為信度係數,可以用測同一個構念的內部一致性(internal consistency)。若同一個構念中,含有多個子成分,各別子成分計算Cronbach’s Alpha,可討論各個子成分裡頭的內部一致性。然而,將以多個子成分組成的構念,再計算出一個屬於整體構念的Cronbach’s Alpha會很奇怪。[如果可以算一個Cronbach’s Alpha,為啥還要多個子成分的Cronbach’s Alpha?如果多個子成分才能組成一個構念,自然不存在內部一致性。]

交叉因子(crossed factor)和套疊因子(nested factor)的差別

當我們只有一個因子的時候,我們不需要去擔心因子間交叉(crossing)或套疊(nesting)的區別。但當我們有兩個以上的因子時,分辨因子間的關係就非常重要,因為這會影響我們對於資料的分析。 當兩個因子交叉的時候,不論是在A因子中的每一個類別,都可以在B因子中每一個類別同時出現。換句話說,每一種來自兩個因子可能的組合都會出現於我們的觀察值中。 倘若一個因子套疊於(nested within)另一個因子之中,若其出現在第一個因子中,則不會出現在其它因子中。同理,觀察值若出現在第二個因子中,則我們知道會有另一個觀察值出現在第一個因子中。所有的組合不會同時出現。 當兩個因子交叉時,就可以計算交互作用;如果彼此套疊,則會因為沒有同時出現的組合,而無法進行如此動作。 將兩個因子以列聯表(cross tabulation)呈現時,就可以知道彼此的關係是交叉或套疊了。 參考文章

在R進行重覆量數(repeated-measur)ANOVA

我們想知道「語境限制性」(context)和「接觸新詞的次數」(order)是否會影響學習者對於新詞的理解(meanbyid)。我們在R使用以下語法: rmanovaid2<- aov(meanbyid ~  context * order + Error(id/ (context * order)), data = averagebyid) 裡頭的公式「meanbyid ~  context * order + Error(id/ (context * order)」可以分為兩個部分去理解。前半部分「meanbyid ~  context * order」,指的是學習者對於新詞的理解會受到語境限制性和接觸新詞的次數的影響。「*」是「context + order + context:order」的簡化,指的是考慮了語境限制性和接觸次數的主效應(main effect)和語境限制及接觸次數的交互作用(interaction)。後半部分的「Error(id/ (context * order)」,則是我們在可以進行適當的統計檢定不可或缺的要素。 「Error(id/ (context * order)」使得殘差平方和(Residual sum of squares, RSS)的來源,可以分成幾個可預知的部分(error strata)。它是「Error(id + id:context + id:order + id:context:order)」的簡化,指的是我們要將可預知的殘差分為來自「個人因素」、「個人和語境限制性的交互作用」、「個人和接觸次數的交互作用」以及「個人、語境限制性和接觸次數的交互作用」。 summary(rmanovaid2) 將我們一開始使用的語法進行摘要之後,我們得到以下結果: 對於語境限制性的檢定,是基於「個人和語境限制性的交互作用」,顯示在「Error:  […]