單單靠新詞和情境連結無法決定這個新詞的意義。當聽到「Gavagai」的時候,這個詞在有兔子跳過的情境被接觸,該詞可能指的是兔子、草、樹、兔子的耳朵或這整個情況。早期利用規限(constraints)來解釋學習者在遇到新詞的當下如何化解新詞的不確定性。 只靠一次的接觸化解新詞的不確定性,而決定詞的意義,也許不是學習新詞唯一的機制。主要有兩個理由:首先,日常生活中,新詞和可能的指涉物的對應太多。就算接觸了新詞,也不是當下就可以決定新詞的意義。很大的可能性是,在有高度不確定性的情境下,學習者會先忽略當下的資訊,並等待下一次再一次接觸新詞(Brent & Siskind, 2001)。其次,有許多研究指出9個月、10個月和12個月大的嬰兒就已經累積了可觀的詞彙知識。從發展的時間點來看,有18個月大的嬰兒存在解決新詞不確定的困難,也有有些研究指出在最小在13、14個月大的嬰兒身上,可以在只有一個新詞和一個詞的意義下的情況下學到新詞,但是這個學習的成果是很容易消失。這些證據足夠讓我們相信,學習新詞除了在當下解決詞的意義外,應該還有其它可能性。 Smith 和 Yu 的研究指出在帶有不確定的情況下,12個月和14個月大的幼兒可以藉由「統計學習」解決多次的接觸下和個別接觸時的不確定性。 下面的圖和影片說明了為什麼「統計學習」可能是解決詞的意義不確定性的現象。 但是,如果考量複雜一點的情況,如果下面表格所描述的情況。在第一個嘗試次的時候,A有可能被錯誤的和b連結。但是到了第四個嘗試次的時候,一但學習者基於以下條件:有A卻沒有b;前面學過AB和ba;同時出現和沒同時出現的是誰;計算的結果和統計的結果要一致,那麼第一次的錯誤連結就可以被改正。 Trial Words Potential referents in scene 1 AB ba 2 CD dc 3 EF ef 4 GA ga 12到14個月大的幼兒參加研究,共有六個目標新詞和六個目標物以圖表示。共有30個投影片,每張投影片裡有2個目標物,每次投影片出現4秒,在500毫秒後兩個目標新詞播放,兩個新詞間間隔500毫秒。目標物的位置和和目標新詞的順序並沒有任何關係。每一組目標新詞和目標物正確配對出現的次數各有十次。三十個投影片是隨機出現。另外,在正式的30張投影片之前,有4張訓練用的投影片,內容是芝麻街的動畫用來吸引受試者。過程間,仍會間隔2到4張的投影片間以此方式維持受試者注意。整個訓練歷時不到四分鐘(30張訓練的投影片和19張芝麻街投影片)。 測驗階段共有12次,每次8秒。每次出現兩個物件(目標物和干擾物),同時播放四次目標新詞。 訓練投影片有兩套,兩套投影片目標物出現的位置左右對調,目標新詞出現的順序隨機。測驗階段亦有目標物位置左右對調的兩套投影片,以及隨機順序的目標標新詞。受試者隨機分派到任一套訓練投影片和訓練階段。 另外,兩位對於實驗操弄不知情的編碼者觀看影片,記錄幼兒眼睛看的方向。 分析2(個年紀組)*2(目標物/干擾物)*6(個目標詞)*2(套測驗投影片)。結果發現,在測驗階段,受試者看目標物的時間長於看干擾物的時間。同時,目標詞和目標物/干擾物存在交互作用,顯示有些詞學得比較好。年紀組和目標物/干擾物也存在交互作用,14個月大的幼兒注視於目標物的時間更長。 測驗時注視目標物的時間更長,顯示幼兒在跨情境學習之後具有儲存過往資訊的能力。
Category: 學術與投稿
跨情境學習(Cross-Situational Learning)
跨情境學習(Cross-Situational Learning)是藉由多次的接觸來學習詞語意義的方法,儘管每次接觸詞語的時候都可能保有對於詞語意義的不確定性。同一個詞語會在不同的情境下出現,而一個情境下又有多個可能的詞語候選。這是透過排除不可能的候選意義後,來最後留下可能性最大的意義。 但是上述的跨情境學習會現實世界中是行不通的。現實世界中,環境會傳遞情境的意義,因此可能的意義會受到環境影響;而且,同義詞和多義詞的情況,都會使詞語有超過一個以上的意義,沒有一個詞語的意義可以出現在所有接觸的情境裡。 跨情境學習要求在每次接觸的時候,都要有正確的詞語候選在情境裡,「最大的量」(接觸的次數);同時間,學習者必須能使用過去的跨情境學習策略,藉由過往所取得的可能意義馬上運用到當下的情境,「最小的運用」(當下接觸時,運用過去接觸的經驗)。如果沒有達到最大的量或最小的運用,而是界於兩者之間時,總比不上單純的跨情境學習那麼強大。因此,最後還是由頻率決定學習的結果。 許多研究指出成人和幼兒在學習少量詞語的時候,都是可以有效地運用跨情境學習。跨情境學習的效果會受到情境裡頭候選意義的數量影響。當不確定性增加(候選意義的數量多)的時候,學習的表現也會變差。這也會改變學習者的跨情境學習的機制,使它轉向為一個更輕鬆、更細微, 而和頻率更為相關的過程。 當學習者面臨開放性的問題時,就容易產生比較輕鬆的版本的跨情境學習。這個困難之處在於,這個合理的不確定性應該怎麼拿捏。
多元的學習方式:布魯納(Jerome Bruner)的學習者模型們
「學習」不是只有一種樣貌。 Any model of learning is right or wrong for a given set of stipulated conditions, including the nature of the tasks one has in mind, the form of the intention one creates in the leaner, the generality or specificity of the learning to be accomplished, and the semiotics of the learning situation itself-what it […]
葛斯瑞(Edwin R. Guthrie)的一次學習(One-Shot Learning)
葛斯瑞(Edwin R. Guthrie)如此解釋「學習」: A combination of stimuli which has accompanied a movement will on its recurrence tend to be followed by the movement. 用白話文來解釋就是:當一個有機體(包括人和貓咪)在某個情境下做了某件事之後,當這個情境又再一次重覆的時候,他會傾向把一模一樣的事再做一次。「刺激」和「反應」的連結是第一次發生的情境下就達成;它不會弱化也不會因為練習而強化。一但刺激造成了反應,未來也會有相同的反應。簡言之,學習就在一次嘗試就會發生。 「學習」並不是「刺激」和「刺激」的連結,而且「刺激」和「反應」的連結。你在甲情境下做了乙,當你下一次又重回甲情境的時候,你也會做乙。為了學做乙,你不需要反覆地做,也不需要有任何增強。如果做乙就是為了回應甲,那乙和甲的連結強度在當下和未來是相當的。 葛斯瑞講一次學習用了「tend」這個詞,保留了「不確定性」。舉例來說,爸爸跟幼兒說「尿布」的時候,幼兒也跟著說出「尿布」。當下一次又有人說「尿布」的時候,幼兒還會說「尿布」嗎?答案是肯定的,幼兒的反應仍是說「尿布」。答案也可能是否定的,幼兒不說「尿布」,因為第二 次的「combination of stimuli」和第一次爸爸跟幼兒說「尿布」的時候不完全一樣。有很多東西可能不一樣,幼兒第二次沒有尿溼尿布、第二次是不同人講「尿布」、幼兒正在專心玩玩具…等等。 An act is learned in the singles occurrence, and the need for repetition comes from the need for executing the act in a variety of circumstances. […]
試題反應理論(Item Response Theory)中,需要看配適度(Fit)嗎?
從每個人在每個項目的實際得分(observed score)和該人該項目的預期得分(expected score)的差,除以變異數,可以得到這個資料點對模型的標準化的殘差(standardised residual),把所有這些標準化的殘差平方後再求平均,就是未權重配適度均方(unweighted fit mean-squar);若根據該資料點的變異數進行權重,則叫作權重配適度均方(weighted fit mean-square)。前者也叫outfit,因為它對極端值(outlier)相當敏感,如果高能力的人答錯簡單的題或低能力的人答對較難的題,則整個均方就會變大,資料和模型的配適就不好;後者又叫infit,因為其根據每個資料所能提供的資訊(information fit)進行權重,極端值的變異較小(例如:0.9*0.1或0.1*0.9,但中間的資訊較多(0.5*0.5)。我們可以使用R裡頭的TAM套件的msq.itemfit,去取得模型中每個項目的outfit和infit。把outfit的值畫出來的話,會如下圖: 在有800個來自常態分佈的樣本下裡的20個項目中,越接近1的項目,配適地越好,反之則越差。 隨著樣本數的增加或減少,在模擬的情況下,可以操控fit和1的距離。下面為樣本數為80和8000的情況。 如果看配適度t值的話,就沒有上面的問題。但是,在真實資料的情況下,又會遇到另一個問題,當樣本數越大,則越容易發現配適地不好的項目,越容易發現資料和模型之間存在差異。 我們可以這麼去理解配適度,它是一個項目和其餘項目總和的關係。從這個角度去理解配適度的話,其實「信度」或「鑑別度」已經提供我們足夠的資訊去決定一個項目的優劣了。如果我們以「配適度」去決定是否要採用某個項目,那反而會將具有鑑別度的項目剔除。當outfit離1很遠的時候,有兩種情況:一個是正方向的離1很遠,一個是負方向的離1很遠。正方向的離1很遠具有好的鑑別度,但我們可能因為判斷它的配適度不佳而刪除。倘若要從配適度去剔除不好的題目,就從outfit值最小的開始吧!
在項目反應理論(Item Response Theory)下,怎麼理解「難度」這個概念?三種取徑。
在項目反應理論(Item Response Theory)中,要描述一個項目的「難度」和古典測驗理論(classical test theory)有不一樣的方法。在古典測驗中,一個項目的「難度」被認為是參與答題者人中答對該項目的比率,越多人答對,難度越低。在項目反應理論中,我們可以從三個取逕來理解項目的難度。項目反應理論中的描述「難度」需要有兩個維度來定義,「樣本能力」和「答對機率」。在只有受試者只有1/0二元結果(答對或答錯)的情況下,以下圖為例,假設受試者的能力是0,則答對該項目的機率則為50%,則項目難度delta則為0。 同樣delta的概念,若在受試者的得分被評為三個等級,例如:0、1、2的時候,以下圖為例,黑色線(得0分的機率)和紅色線(得1分的機率)相交的地方,比50%小一點點的答對率;以及,紅色線(得1分的機率)和綠色線(得2分的機率)相交的地方,同樣比50%小一點點的答對率。前者往下延伸至x軸為delta1(難度為-0.5),後者往下延伸至x軸為delta2(難度為0.5)。delta1和delta2兩個節點,可以把人分成得0分、得1分和得2分機率最高的範圍。 如果把答對的機率累積起來,以下圖為例,則從50%答對率水平延伸至與黑線(得1分或2分的累積機率)和綠線(得2分的累積機率)相交(紅線為得1分、2分和3分的累積機率)後再往x軸延伸取得gamma1(難度為-0.5)和gamma2(難度為0.5)。gamma1和gamma2兩個節點,同樣可以把人分成得0分、得1分和得2分機率最高的範圍。 又或者利用預期得分,從受試者的能力去推估期可能的得分(0到2之間),當能力相同的時候,預期得分越高的項目,難度則越低;反之,難度則越高。或者,難度高的題目,給能力好和能力不好的兩個受試者去測試,能力好的受試者預期得分會高於能力不好的受試者。參考下圖:
在古典測驗理論(Classical Test Theory)中計算信度(reliability)
古典測驗理論(Classical Test Theory)中,存在一些假設:一、Observed Scored = True Score + (Measurement) ErrorX = T + E二、mean(X) = T三、Corr(E,T) = 0四、Corr(E1,E2) = 0五、Corr(E1,T2) = 0如果平行測驗的兩次所觀察到的分數滿足上述五個假設,則兩次的真實分數(True Score)相等,兩次的van(E)相等。van(E)為每一個題項(item)的變異數的總和。從古典測驗理論的假設下,可以延伸出以下:一、mean(E) = 0二、Var(X) = Var(T) + Var(E)三、[Corr(X,T)]squar = Var(T)/Var(X)四、Var(X) = Var(X’)(當兩者為平行測驗時)五、Corr(X,X’) = Var(T)/Var(X)(此用以計算單一測驗的信度) 計算單一測驗的信度,可利用Cronbach’s Alpha:Cronbach’s Alpha = (n/(n-1))*(Var(T)/Var(X))= (n/(n-1))*((Var(X) – Var(E))/Var(X))n/(n-1)用來校正,當n很大時,可忽略不計。 Cronbach’s Alpha作為信度係數,可以用測同一個構念的內部一致性(internal consistency)。若同一個構念中,含有多個子成分,各別子成分計算Cronbach’s Alpha,可討論各個子成分裡頭的內部一致性。然而,將以多個子成分組成的構念,再計算出一個屬於整體構念的Cronbach’s Alpha會很奇怪。[如果可以算一個Cronbach’s Alpha,為啥還要多個子成分的Cronbach’s Alpha?如果多個子成分才能組成一個構念,自然不存在內部一致性。]
使用R將預測變數的交互作用以圖形視覺化
當我們想要知道兩個變數之間是否存在交互作用時,可以使用下面函數產生視覺化的圖形加以輔助:interaction.plot(pred1, pred2, resp) pred1和pred2為要進行檢查的兩個變數,而resp則是反應變數。示例如下: interaction.plot(averagebyid$context, averagebyid$order, averagebyid$meanbyid) 從每個人的平均得分來看,在接觸1次的時候,高語境限制性和低語境限制性的得分並沒有太大的差異。 interaction.plot(averagebyword$context, averagebyword$order, averagebyword$meanbyword) 從每個字的平均得分來看,接觸1次、2次和3次新詞的在語境限制性的差異不大。 interaction.plot(averagebyid$order, averagebyid$context, averagebyid$meanbyid) 從每個人平均得分來看,接觸1次時,高語境限制性和低語境限制性的得分並沒有太大的差異。 interaction.plot(averagebyword$order, averagebyword$context, averagebyword$meanbyword) 從每個字平均得分來看,接觸1次時,高語境限制性和低語境限制性的得分並沒有太大的差異。 但是這些圖形只是暗示我們進一步檢定的話,可能存在交互作用。我們後續仍需要進刪統計檢定才可以驗證其顯著性。
在R進行有兩個隨機因子以上的混合線性模式
當我們只有一個隨機因子的時候,我們可以下面公式表示固定效果和隨機效果(以下公式皆使用lme4套件的lmer函數): correct ~ context + order + (context + order | id)correct ~ context + order + (1 +context + order | id) 上面兩種寫法,傳達相同的意思。兩種寫法中,前半的「context + order」為主要效果;後半的「(context + order | id)」和「(1 +context + order | id)」包含「|」的則是隨機效果。在「|」右邊的是隨機因子(id),而「|」左邊的則是受到隨機因子的影響,為了固定因子所產生、計算的截矩和斜率。 當我們有兩個隨機因子時,我們則必需先考慮這個因子的關係是交叉或套疊,才能撰寫相對應的公式。 當兩個因子彼此是套疊的時候,例如班級因子(class)套疊於學校因子(school),我們將兩者的交互作用另立一個欄位(school_class)去計算,如此我們可以有以下公式,下面兩個公式也是同義的公式: correct ~ context + order + (1 | school/class)correct ~ context + order + (1 | school) + […]
交叉因子(crossed factor)和套疊因子(nested factor)的差別
當我們只有一個因子的時候,我們不需要去擔心因子間交叉(crossing)或套疊(nesting)的區別。但當我們有兩個以上的因子時,分辨因子間的關係就非常重要,因為這會影響我們對於資料的分析。 當兩個因子交叉的時候,不論是在A因子中的每一個類別,都可以在B因子中每一個類別同時出現。換句話說,每一種來自兩個因子可能的組合都會出現於我們的觀察值中。 倘若一個因子套疊於(nested within)另一個因子之中,若其出現在第一個因子中,則不會出現在其它因子中。同理,觀察值若出現在第二個因子中,則我們知道會有另一個觀察值出現在第一個因子中。所有的組合不會同時出現。 當兩個因子交叉時,就可以計算交互作用;如果彼此套疊,則會因為沒有同時出現的組合,而無法進行如此動作。 將兩個因子以列聯表(cross tabulation)呈現時,就可以知道彼此的關係是交叉或套疊了。 參考文章