Category: 心理語言學

跨情境學習(Cross-Situational Learning)

跨情境學習(Cross-Situational Learning)是藉由多次的接觸來學習詞語意義的方法,儘管每次接觸詞語的時候都可能保有對於詞語意義的不確定性。同一個詞語會在不同的情境下出現,而一個情境下又有多個可能的詞語候選。這是透過排除不可能的候選意義後,來最後留下可能性最大的意義。 但是上述的跨情境學習會現實世界中是行不通的。現實世界中,環境會傳遞情境的意義,因此可能的意義會受到環境影響;而且,同義詞和多義詞的情況,都會使詞語有超過一個以上的意義,沒有一個詞語的意義可以出現在所有接觸的情境裡。 跨情境學習要求在每次接觸的時候,都要有正確的詞語候選在情境裡,「最大的量」(接觸的次數);同時間,學習者必須能使用過去的跨情境學習策略,藉由過往所取得的可能意義馬上運用到當下的情境,「最小的運用」(當下接觸時,運用過去接觸的經驗)。如果沒有達到最大的量或最小的運用,而是界於兩者之間時,總比不上單純的跨情境學習那麼強大。因此,最後還是由頻率決定學習的結果。 許多研究指出成人和幼兒在學習少量詞語的時候,都是可以有效地運用跨情境學習。跨情境學習的效果會受到情境裡頭候選意義的數量影響。當不確定性增加(候選意義的數量多)的時候,學習的表現也會變差。這也會改變學習者的跨情境學習的機制,使它轉向為一個更輕鬆、更細微, 而和頻率更為相關的過程。 當學習者面臨開放性的問題時,就容易產生比較輕鬆的版本的跨情境學習。這個困難之處在於,這個合理的不確定性應該怎麼拿捏。

多元的學習方式:布魯納(Jerome Bruner)的學習者模型們

「學習」不是只有一種樣貌。 Any model of learning is right or wrong for a given set of stipulated conditions, including the nature of the tasks one has in mind, the form of the intention one creates in the leaner, the generality or specificity of the learning to be accomplished, and the semiotics of the learning situation itself-what it […]

葛斯瑞(Edwin R. Guthrie)的一次學習(One-Shot Learning)

葛斯瑞(Edwin R. Guthrie)如此解釋「學習」: A combination of stimuli which has accompanied a movement will on its recurrence tend to be followed by the movement. 用白話文來解釋就是:當一個有機體(包括人和貓咪)在某個情境下做了某件事之後,當這個情境又再一次重覆的時候,他會傾向把一模一樣的事再做一次。「刺激」和「反應」的連結是第一次發生的情境下就達成;它不會弱化也不會因為練習而強化。一但刺激造成了反應,未來也會有相同的反應。簡言之,學習就在一次嘗試就會發生。 「學習」並不是「刺激」和「刺激」的連結,而且「刺激」和「反應」的連結。你在甲情境下做了乙,當你下一次又重回甲情境的時候,你也會做乙。為了學做乙,你不需要反覆地做,也不需要有任何增強。如果做乙就是為了回應甲,那乙和甲的連結強度在當下和未來是相當的。 葛斯瑞講一次學習用了「tend」這個詞,保留了「不確定性」。舉例來說,爸爸跟幼兒說「尿布」的時候,幼兒也跟著說出「尿布」。當下一次又有人說「尿布」的時候,幼兒還會說「尿布」嗎?答案是肯定的,幼兒的反應仍是說「尿布」。答案也可能是否定的,幼兒不說「尿布」,因為第二 次的「combination of stimuli」和第一次爸爸跟幼兒說「尿布」的時候不完全一樣。有很多東西可能不一樣,幼兒第二次沒有尿溼尿布、第二次是不同人講「尿布」、幼兒正在專心玩玩具…等等。 An act is learned in the singles occurrence, and the need for repetition comes from the need for executing the act in a variety of circumstances. […]

理解華語,找主詞?還是找受詞?

句法結構在進行語義角色指派的過程,我們稱之為「斷詞」(parsing),就是把句子分出一個一個屬於各個句法類別的項目。關於句子結構的理解,在英語的研究裡,常常就是找句子的主詞。在這些對於人們語言理解的研究裡頭,大多關注於人們的句子斷詞機制(human sentence parsing mechanism)。斷詞的研究,大概可以分為自主模組派(autonomous models)和交互模組派(interactive models)。自主模組派認為人們對於語言的理解,分為兩階段,先進行句法處理,而後語義處理才會進來;交互模組派則認為句法和語義的訊息都是在同一時間建構表徵的,彼此互相合作。花園小徑語句(garden path sentence)常常被用來進行斷詞的研究,以了解究竟是什麼因素影響著斷詞。這些語句是說乍聽之下有點聽不太懂,在細究後才能理解,就好像順著花園小徑走,順順走著走著,最後才發現卻撞進死巷。比方說: The log (that) floated past the bridge sank. 句標that(complementizer)被省略的時候,我們直接聽到句子: The log floated past the bridge sank. 我們很容易會把float當成是log的動詞,直到聽到最後面真正的動詞sank出現之後,才能夠正確地理解從float past the bridge應該是修飾log的詞組,也就是一個被省略的關係子句(reduced relative clause)。英語被修飾的成份在前方,修飾的成份在後面,是屬於由名詞領銜而後跟著關係子句。然而,華語的修飾成份是在名詞前面,研究上或者能夠有其它別於語言之處。 在英語、葡萄牙語、荷蘭語、法語、德語等語言,透過不同的研究方法已經知道主詞關係子句(subject relative clauses, SRCs)的理解是比受詞關係子句(object relative clauses)更快速、更容易。而修飾成份在名詞前面的,則有較歧異的結果,日語和華語都屬於這樣子的語言,但是有些研究說主詞關係子句較容易被理解,有些研究說受詞關係子句較容易被理解。分別以一個主詞關係詞組和一個受詞關係詞組,進行實驗即可分辨出其差異: 愛慕音樂家的作曲家作曲家愛慕的音樂家 在主詞關係詞組裡頭,其語義角色指派依序為動詞-受事-施事;而受詞關係詞組裡頭,其語義角色順序則為施事-動作-受事。部份研究認為受詞關係詞組較容易被理解;部份研究認為主詞關係詞組較容易被理解。根據這樣的詞組,我們可以進行這樣的語料設計: 我討厭愛幕音樂家的作曲家。我討厭作曲家愛慕的音樂家。愛幕音樂家的作曲家討厭我。作曲家愛慕的音樂家討厭我。 透過這些語料以各種實驗方法,例如:自我步調閱讀任務(self-paced reading tasks)、音素/點擊監控任務(phoneme/click-monitoring tasks)、事件相關電位(event-related potentials)、詞彙判斷任務(continuous lexical decision tasks)、眼動追蹤(eye tracking)或功能性磁振造影(fMRI,functional magnetic resonance imaging)從便宜到貴的實驗方法,並根據問題意識找到受試者就可以解答究竟是什麼因素影響華語斷詞的機制。 華語中,動詞詞組是中心起始(head-initial)即動詞加受詞的結構,而名詞詞組則是中心後置(head-final)即修飾成分加名詞的結構。泰語的動詞詞組和名詞詞組都是中心起始,我們可以如這樣的問題意識:理解泰語的斷詞機制,是否也是同英語、德語等一樣,主詞關係子句較容易被理解?如果泰語和華語的斷詞機制是各有偏好的,這是否會造成泰語母語學習者學習華語的理解華語語句的困難?以泰語、英語和華語的語言學研究中,多著墨於聲調,或許斷詞機制的研究是吾人能夠著力、貢獻之處。

我讀Trevor A. Harley《The Psychology of Language》的〈Language Production〉一

人類要產製語言的時侯,會經歷這樣的過程:形成概念(conceptualization)、組成(formulation),最後編碼(encoding)。形成概念時會決定要說什麼東西,這是屬於訊息處理層次;把概念的表徵轉化成語言形式就是組成的步驟;最後執行階段把語音和發音貼上去。在中間的組成階段,有兩個比較主要的內涵就是詞彙化(lexicalization)和句法計劃(syntactic planning)。前者指的是我們所選取的詞彙,後者指的是我們將所有詞彙組成句子。目前研究語言產製的模型,多來自於對於主動說出來的話語偏誤分析(speech errors)。這些話語偏誤能夠告訴我們什麼呢?話語的偏誤可以來自日常生活的分析,也可以來自實驗的資料,如果兩者在推論產生衝突的時候,通常實驗的資料是比較能夠使人信服的。在叫名錯誤(naming errors)的眼動實驗中,我們發現人們在準備標的物的名字時,是同時盯著標的物看的(Griffin, 2004)。因此,盯著斧頭看時,喊出「鎚子」是不會發生的,因為錯誤不是來自於倉促的準備(rushed preparation)。相反的,當受試者去對於自己發出錯誤的名字糾正時,他正在進行修復,也會花更多時間盯著標的物看。 目前,以話語偏誤分析的建立模型的就是基於葛瑞特(Garrett)所發出的一系列研究,該模型就稱葛瑞特模型。在形成概念時,對應到訊息層次(Message level);在組成時,則對應到功能層次(functional level)、詞序層次(positional level)以及聲音層次(sound level);在編碼時,就是最後發音的層次(Articulaory instructions)。這個模型建立在一個序列處理的前提。所以你會看到的就是如下的序列處理過程: 訊息層次→功能層次→詞序層次→聲音層次→發音層次 對於功能層次和詞序層次的區別說明,在功能層次時,只有語義相關內容的字詞會被分派到對應的句法角色;在詞序層次時字詞才會被明顯地排序。這也相當程度地說明了詞彙和句法是處於分離的階段。功能層次時主要在選擇語義的內容字詞(content words);詞序層次時,則是選擇句法的功能字詞(functional words)。 當人們產出「媽媽洗了很多盤子」這句話時,我們可以用葛瑞特模型來解釋: 訊息層次:表達特定意圖 功能層次:先找出主格(媽媽的概念),動詞(洗的概念),受格(盤子的概念),時貌(完成的概念),受格的數量(多),這時候相同句法角色會互換,距離不會造成影響;然後會運用句法的框架把功能字詞放進去,所以就會有「媽媽」、「洗『了』」、「『很』多」、「盤子」,「了」和「很」就是功能字詞。接著就能有「媽媽」、「洗了」、「很多」、「盤子」這些詞彙了。 詞序層次:接著把這些詞彙安插到各個位置上,依序為「媽媽」/「洗了」/「很多」/「盤子」。 聲音層次:然後就是把這些位置上的詞彙依序對應到聲音的表徵。如果會有聲音交換的,也是發生在這個層次。 發音層次:就是最後發出聲音的結果了。 使用英語句子的證據更能說明語言產製在不同層次之間是序列發生的。 打算表達的語句:a weekend for maniacs實際說出的語句:a maniac for weekends 上面兩個例句的重音位置都沒有改變,這說明詞彙和韻律在兩個不同層次運作;複數詞素-s仍在原先的位置,說明詞根(maniac)和複數詞素-s也是在兩個不同層次運作,這個叫詞素擱淺(morpheme stranding);複數詞素-s被發出的時候,是隨著weekend同化(accommodation)成/z/,而不再是原先的/s/,所以真正到發音的層次時,就是和所選到的內容字詞同化。 儘管如此,仍有一些偏誤的語料說明可能是認知侵擾(cognitive intrusion)所致,這包括非計畫的內在偏誤(non-plan-internal errors)和語音類化(phonologically facilitated)。甚至是外在環境造成語誤的,則稱環境污染(environmental contamination)。這些不同類型的偏誤,都可以在哈利(Harley, 1984)的報告中看到。

我讀David W. Carroll《Psychology of Language》的〈The Internal Lexicon〉三

有哪些變數是會影響詞彙讀取呢?它們包括:字頻(word frequency)、語音變數(phonological variables)、句法類別(syntactic category)、構詞複雜度(morphological complexity)、語義促動(semantic priming)以及詞彙歧異(lexical ambiguity)。構詞的複雜度如何影響詞彙讀取呢? 我們可以先將詞彙分有詞綴(affixes)和字根(root word)。由馬凱(MacKay, 1978)個實驗是這麼設計的,它提供動詞如:decide、govern、exist,要求受試者在最短時間內反應出其所對應之名詞,根據其反應的時間,從簡易到複雜可以有以下排序:-ment、-ence、-ion,複雜度和詞綴及字根本身結合的過程有關。 另外,還有一個塔夫塔(Taft)設計的實驗發現,前綴字詞(prefixed words)如remind和偽前綴字詞(pseudoprefixes words)如relish所需判斷的時間則是前者快於後者。眼動實驗也證實相同的結果,在偽前綴字詞中,眼球停留的時間較長。在同一文章裡頭,如果前綴字詞和偽前綴字詞的比例是一比一的話的確存在判斷時間上的差異;但若將比例調整為一比九的話,兩者判斷的時間又沒有差異了。這樣的實驗報告是由魯賓團體所提出(Rubin, Becker, & Freeman, 1979)。 語義促動的意思是先出現的字詞會激活另一個語義相關的字詞。關於語義促動的實驗任驗進行分有兩階段:首先,給予促動刺激(priming stimulus)來源。受試者對第一次的促動刺激不會有太大的反應或沒有反應。第二次出現的刺激(second stimulus)就是其標的,記錄受試者對於反應的時間。要求受試者的反應可以是唸出字詞或判斷是否為字詞。比較有促動刺激和沒有促動刺激以檢驗當中的效果。「butter」對於「bread」就比「nurse」有更好的促動效果。 詞彙歧異指的是聽到單一字詞可以指涉多個意義。例如:聽到 Rapid righting with his unijjured hand saved from loss the contents of the capsized canoe. The man started to drill before the truck arrived. 在righting,一開始會先以writing去理解,而且沒到最後一個字詞,writing都可以可以完整地被解釋;另一個則是在語音監控的實驗中要求去找出含有/b/的字,因為drill本身的歧異,所以找到/b/的時間稍稍地增加一些。 關於詞彙歧異對於詞彙讀取的影響,也有人就整個語境進行研究。由上而下的過程是由語境或句子來使個人對於個別字詞的辨別;由下而上的過程則是多管齊下地將所有可能的意義激活。那麼究竟是什麼樣的過程對於詞彙讀取有主要的影響呢? Rumor had it that, for years, the government […]

我讀David W. Carroll《Psychology of Language》的〈The Internal Lexicon〉二

有哪些變數是會影響詞彙讀取呢?它們包括:字頻(word frequency)、語音變數(phonological variables)、句法類別(syntactic category)、構詞複雜度(morphological complexity)、語義促動(semantic priming)以及詞彙歧異(lexical ambiguity)。我們可以透過「語音監控」(phoneme monitoring)的任務去證明字頻對會影響詞彙讀取。語音監控會要求受試者聽一段連續的文章,除了得理解該文章外,還要其找出特定音素,例如/b/。文章的設計將標的音素分別安排在高頻字詞和低頻字詞的後面,結果發現若標的音素安排在低頻字詞後面,則標的音素被找到所需的時間則比較長。因為低頻字詞所花費的資源更多,所以出現在低頻字詞後面的標的音素的資源較少,於是所花的時間就較長。 「判別字彙任務」(lexical decision task)則以視覺辨視為主,實驗將一連串字詞和非字詞混在一塊兒,要求受試者快速地判斷它是否為字詞。當清單中包含較多低頻的字詞時,整體判斷的時間都會變長。相反地,若都是高頻字詞時,判斷的時間就會變短。 透過眼動的實驗,也都證實人們感興趣區域(region of interest, ROI)如高頻字詞和低頻字詞的停留時間(fixation)是不一樣的,而且後者長於前者。 語音變數則包括韻律的變項(prosodic factors)如重音(stress)、抑揚頓挫(intonational patterns)等。或者我們會使用發音相近的字詞去取代人們表達的字詞。這些都說明詞彙被讀取時,會受到語音變數的影響。 句法類別也會影響詞彙的讀取,大多數討論高頻字詞和低頻字詞時,多聚焦在開放的字詞(open-class words)。但高低頻的封閉字詞(closed-class words)目前還沒有任何差異。這也是為什麼我們可以把「詞彙」從「語言」抽離出來的原因。

我讀David W. Carroll《Psychology of Language》的〈The Internal Lexicon〉一

關於已經儲存為內在詞彙(internal lexical)的字詞,我們是怎麼去讀取、理解的呢?凱洛(David W. Carroll)整理了三個解釋詞彙讀取(lexical access)的模型,它們分是搜尋模型(Search Models)、羅國根模型(Logogen Model)以及共時模型(Cohort Model)。搜尋模型依字詞識別系統分為書寫(orthographic)特質和語音(phonetic)特質。較長出現的字詞會被較少出現的字詞更早被搜尋到。這模型由弗斯特(Forster)提出,其預設「詞彙」是個獨立於「語言」處理的過程,而是和「認知」有更大的關連。 羅國根模型由莫頓(Morton)於民國五十八年提出,該模型把一個一個的詞彙表徵為一個一個的羅國根,一個羅國根就是該字詞的屬性,這包括其形(orthographic)、音(phonological)、義(semantic)。羅國根被激活的來源有二,其分別是感官的輸入(sensory input)和語境的訊息(contextual information)。 Her closest relative was appointed as her legal guardian. 後面出現的「guardian」是由於前面先出現的字暫時降低了激化標的字的門檻(temporarily lowering threshold),於是「監護人」的語義就更容易被辨識。羅國根模型認為感官的輸入和語境的訊息是可以被人們平行地被運作(work in parallel)。 共時模型則專門用以解釋聽覺字詞的辨視。當字詞被聽到的200毫秒到250毫秒時,聽者就開始辨視字詞了,通常聽者對於這個辨視點(recognition point)是相當敏感、敏銳的,也是從這裡開始分出其它可能的字詞。馬斯蘭威爾遜(Marslen-Wilson)以三個階段解釋這個字詞辨視的過程:一、聽到的第一個聲音(acoustic-phonetic)後所有候選的字詞就會跑出來,這稱為字詞起首共時(word-initial cohort)階段;二、選擇一個字詞後進行下一步的分析;三、最後把被選擇的字詞整合到語義和語法的語境下。當聽到「Angela misplaced her ba…」時,它大概是這麼運作的: 字詞起首共時:bag, bat, bath, bass …. 利用語境或語音等更多方式,例如:聽到/g/後,刪掉其它侯選,留下:bag, bagpipe …. 當範圍縮小之後,語義就會較清晰了。 共時模型可以說是融合了搜尋模型和羅國根模型的特徵。共時模型和羅國根模型對於語義激活的來源都認為是平行地被處理的;另一方面,共時模型又包含字詞起首共時,這是屬於由下而上,從小到大地整合,也和搜尋模型有相似之處。

小孩子是否天生具有句法能力?

當嬰兒進入二字期(two-words utterance)時,這些語料常常是有固定的語序,我們可以用樞紐字詞(pivot words)來指稱它們。它可能是屬於位置在前面的樞紐字詞,這佔大多數,如more、no;還有少部份的如off。與樞紐字詞搭配的的開放字詞(open words)則是可以替換的成份,所以more milk、no pee以及light off這樣類似句法的發展就展開了。然而,二字期的句法限制有其侷限,因為同樣一個「媽媽抱」,在不同情境下都可以被小孩子使用,它既可以是要求媽媽抱自己,也可以是自己抱媽媽,還可以有多種可能,這個被稱為豐富詮釋(rich interpretation)。因此形式不一定能夠決定其句法發展。但是,我們也無法理解小孩子說出「媽媽抱」的時候究竟是只有一個意義或多個意義,所以這也不能斬釘截鐵地說由於有多重意義所以這沒有句法能力。小孩子使用more和其它開放字詞搭配時,究竟把more和開放字詞視為一體而學習起來?還是理解more本身具有「更多」的意義? 從樞紐字詞和開放字詞的搭配出發,我們把這個類化到動詞和論元的搭配。小孩子對於動詞和論的習得可以用U型曲線來描述,這指的是一開始能產出正確的搭配,然後開始過度類化產生創誤,最後達到和成人一樣的產出。為了解釋這樣的U型曲線,學者們提出一些理解。它們分別是語義動作分類假說(semantic verb class hypothesis)、動詞島嶼(verb islands)以及壕溝防衛假說(entrenchment hypothesis)。語義動作分類假說認為小孩子能夠學習動詞精準的語義就能夠進行和論元的搭配;動詞島嶼認為小孩子先學會一些特定高頻的例子,作為第一個島嶼,而後開始類化;壕溝防衛假說則認為小孩子聽到的動詞多了,就比較不會犯錯,就像建起壕溝、圍籬一樣,把特定的動詞論元搭配限制在一個範圍內。這些假說把字詞的頻率和小孩對於語意、語境的曝露通通攪在一起,我們很難知道究竟小孩子的句法是如何習得的。 進一步我們會詢問,小孩子的語義發展和句法發展,孰先孰後?認為語義先發展而後才發展句法的(late-syntax)學者們認為,句法是需要花時間學習的,而且還要詞彙以及動詞特定的知識,才能習得抽像的經驗;認為句法先發展的(early-syntax)學者們則相信小孩子擁有天生、內隱的抽像能力去習得句法。 從目前神經科學的研究來看,似乎小孩子是擁有天生、內隱的抽像能力。民國九十四年的事件相關腦波電位的研究指出,小孩有異於大人的電位軌跡(Oberecker, Friedrich, & Friederici, 2005)。實驗讓受試者被動地去聽可能是合語法也可能是不合語法的主動句。大人和小孩(平均2.8歲)都先後出現負電位(early left anterior negativity,ELAN)再出現正電位(centro-parietal positivity,P600)反應。負電位用以句子分詞(sentence parsing),正電位則是屬於有意識的訊息處理(controlled processes)。但是小孩子出現負電位和正電位的時間,都比大人來得晚且持久。如果我們把負電位的出現視為是小孩子專屬的句法能力,或許小孩子不需要靠語義就有句法能力。

我們能教會猩猩說話嗎?

在我看來,我們是無法教會人類之外的靈長類語言,如果你和我都同意語言的四個特徵是結構二重性、構詞、詞組結構以及語言生產性的話。我們找來最聰明的靈長類:倭黑猩猩(bonobo Pan paniscus),倭黑猩猩之中的明星坎吉(Kanzi)在沒有被施以食物的強化、利誘,他自然地從他媽媽那兒學到亞克仕「語言」系統(Yerkish),這是專門設計給靈長類使用的語言。坎吉在30個月大的時候,數數兒能力的能力比兩歲大的人類嬰兒還來得好;46個月大時,就學會了五十個符號且可以透過這些符號產生出八百種排列組合,而且坎吉常常有自發性的語言產生(Spontaneous utterances)。我們可以科普書籍《腦,在演化中》(Allman, 2002)所提到的「童形」解釋坎吉為什麼能夠發展得比同年紀甚至更大年的兒童學得更好。童形指的是生物體在發育上加快速度和縮小體型的結果,其造成後代子孫成年期的模樣如牠們祖先的幼年期一般。我們同意人類是靈長類的童形(pedomorphism),換句話說,人類和其它靈長類在變成為成熟個體所需的時間,會長於其它靈長類,也就是人類達到成熟的時間比其它靈長類來得晚。但這仍沒解決我們的問題,究竟坎吉是不是學會了語言? 史汀柏格和佩第托(Seidenberg & Petitto, 1987)在民國七十六年對於坎吉所學到的東西是否能夠稱為語言感到質疑,並有以下的評論:坎吉的行為把「草莓」這個字用來對應「到草莓生長的地方去」、「我要吃草莓」,以及所有用來指涉所有和草莓有關的動作、事件、物品,其中大多數是屬於動作。這說明儘管坎吉能夠認得的符號比人類小孩來得多,但是卻沒有屬於詞類或句法的能力。 透過坎吉的例子,我們知道坎吉的認知能力雖然比人類嬰兒來得好,但是仍無法具備人類一般的語言能力。因此,我認為我們可以教其它靈長類語言,只是結果可能是徒勞無功。