教材裡有這樣一組詞,學生被要求對這組詞進行辨析。「性情」和「性格」A:那個人性情孤僻、待人冷漠,所以他的朋友很少。B:長期生活在福利機構中的兒童往往會出現性格孤僻、心理封閉、社會適應能力差等問題。學生的問題是:性情「孤僻」和性格「孤僻」有什麼差別?我何時使用「性情」?何時使用「性格」? 我認為,在這兩個句子裡,性情和性格調換過來也沒有問題。我不能很草率地說,課本這個使用了兩個不好的例句。因此,我試著為課本這樣的安排,提出我的解釋和辨析。「性情」和情緒、脾氣有關,不容易量化;「性格」則和態度、人格有關,心理學的量表可以測量。由此來看,A句和B句的句子脈絡中,A句應該使用性情,B句應該使用性格。我為了一個不會為自己辯白的課本提供了一個我自己也接受的說法。 AI(ChatGPT)沒有感覺,它是資料驅動的。王文傑的文章[1]提到:即使深度學習模型已經列出「100-6×2」的數學式,卻仍然計算出錯誤的答案;或是雖然已經描述出「蘋果和香蕉都是水果」,但卻計算出「三種水果」。這個模型似乎提供了一個「原因」,但卻沒有根據這個「原因」來計算出正確的「結果」。為什麼這樣一個耗費上億元訓練成本、經過了大量訓練資料的深度學習模型,在遇到甚至是200元雜牌計算機都能處理的數學問題時卻仍會出錯呢?原因在於它是資料驅動的,而不是因果邏輯驅動的。資料驅動的思維模式與人類的心智運作方式完全不同。 統計學習被認為是人類在有大量的輸入時,可以逐漸掌握機率分佈和字字/詞詞的銜接概率;AI(ChatGPT)在文字接龍的表現上,看起來好像也是如此。然而,要提供一個有邏輯(或者看似有道理)的解釋A句和B句,為什麼都可以和孤僻搭配,如何決定哪一個和性情搭配?哪一個和性格搭配?也許人類的因果邏輯驅動還是可以派上用場。 前面關於性情「孤僻」和性格「孤僻」的區辨,聽起來想是硬拗,確實這是建立在把課本當作標準答案時的回應。關於性情「孤僻」和性格「孤僻」的區辨,我在兩個不同時間被學生詢問過一樣的問題,我回應的語言文字當然沒有一模一樣,但主旨是相去不遠的。也許人和chatGPT的差異之一是,問chatGPT的時候,你會得到來自集合眾人智慧的發散性答案;但是,你去問一個人的時候(這排除了只以一個人的作品為語料訓練chatGPT所建立的模型,例如:龍應台chatGPT),雖然人心也是抓摸不定,但你應該會得到相對穩定的答案。我想這是chatGPT和人的差別。如果我只靠輸入的統計學習,那我可能真得會變成chatGPT;還好,我還有因果邏輯的思考,我的思考模式不會越來越像AI。
Tag: 應該
對於比較抽象的概念,我們怎麼掌握?
有一些概念是比較抽象的,例如:「基金經理人」、「斷奶」、「CLIL」等等,在這些概念下的事物,應該存在某些基本特質使它們可以被歸類為同一個概念。既然如此,那關於這些抽象概念中,使事物間彼此有關的特質是什麼?我們對這些事物的知識又是從何而來的?經驗主義(empiricist)認為,基於我們認為的相似之處(可能是感官上或因為語言經驗),它會逐漸形成一個抽象的表徵。經由對於環境的特質進行類似統計的分析,我們會形成一些表徵,形狀和顏色都是這麼來的。當我們對於「基金經理人」這個概念的特質更敏感時,我們就會形成這樣的概念。 但是,也有一些人認為「基金經理人」並不是來自於我們的感官;它可能是根植於一些我們本來就有的隱性知識,例如「社會」、「金錢」或「工作」等等。這個叫「理論的理論」(theory theory)。在比較溫和的版本,理論的角色在於引導我們在給定的情境下對於可能有關特質進行選擇,例如適合食物的顏色或著適合手工藝品的形狀。比較強的版本認為理論會產生新的特質(Wisniewski & Medin, 1994) 。最強硬的版本甚至完全拒絕基本的特徵。Murphy and Medin (1985) 給了一個例子,想像在派對上,一個盛裝打扮的人跳到游泳池中,我們會認為這個人「醉了」。「醉了」這個概念並沒有和其它「醉了」有共享的特徵,我們是因為這個人的行為而形成這個概念的。 References Atran, S. (1998). Folk biology and the anthropology of science: Cognitive universals and cultural particulars. Behavioral and brain sciences, 21(4), 547-569. Bloom, P. (1996). Intention, history, and artifact concepts. Cognition, 60(1), 1-29. Bloom, P. (1998). Theories of artifact categorization. Cognition, 66(1), 87-93. Dennett, […]
我們如何描述二語學習者的詞語知識?
如何知道一個人的詞語知識規模(Vocabulary Knowledge Scale),Nagy,Herman and Anderson (1985) 透過訪談的方式,Wesche and Paribakht (1996) 將訪談的方式改為紙筆測驗,如此可以大規模施測。在給定目標詞語言,學習者回答:一、我從沒看過這個詞。二、我看過這個詞,但我不知道是什麼意思。三、我看過這個詞,我認為它的意思是…四、我知道這個詞,這個詞的意思就是…五、我可以用這個詞造一個句子。 這分別對應於: 一、完全不熟悉。二、熟悉,但不知道意思。三、可以給出同義詞或翻譯。四、能夠把詞語在合適的語義使用於句子。五、能夠把詞語在合適的語義使用於句子,且合於語法規範。 我們可以看到這兩組人把認識一個詞語以辨別它的形態(form)、知識它的意思(meaning),然後可以使用於句子(in sentence)當成是一個進程。然而,可以使用於句子時,也未並可以完全知道一個詞的意思。 Waring (2002) 認為,詞語知識規模的問題在於其把詞語知識視為一翻兩瞪眼(incremental)的分類,其認為詞語的知識應該是具有累積性(accretive)的,也就是我們應該知道詞語的知識是和其所在的脈絡有關,而這個是自外於考試之外,因為功能而存在的。 References Laufer, B. & Goldstein, Z. (2004). Testing vocabulary knowledge: Size, strength, and computer adaptiveness. Language learning, 54(3), 399-436. Nagy, W. E., Herman, P. A. & Anderson, R. C. (1985). Learning words from context. Reading research quarterly, […]
理解華語,找主詞?還是找受詞?
句法結構在進行語義角色指派的過程,我們稱之為「斷詞」(parsing),就是把句子分出一個一個屬於各個句法類別的項目。關於句子結構的理解,在英語的研究裡,常常就是找句子的主詞。在這些對於人們語言理解的研究裡頭,大多關注於人們的句子斷詞機制(human sentence parsing mechanism)。斷詞的研究,大概可以分為自主模組派(autonomous models)和交互模組派(interactive models)。自主模組派認為人們對於語言的理解,分為兩階段,先進行句法處理,而後語義處理才會進來;交互模組派則認為句法和語義的訊息都是在同一時間建構表徵的,彼此互相合作。花園小徑語句(garden path sentence)常常被用來進行斷詞的研究,以了解究竟是什麼因素影響著斷詞。這些語句是說乍聽之下有點聽不太懂,在細究後才能理解,就好像順著花園小徑走,順順走著走著,最後才發現卻撞進死巷。比方說: The log (that) floated past the bridge sank. 句標that(complementizer)被省略的時候,我們直接聽到句子: The log floated past the bridge sank. 我們很容易會把float當成是log的動詞,直到聽到最後面真正的動詞sank出現之後,才能夠正確地理解從float past the bridge應該是修飾log的詞組,也就是一個被省略的關係子句(reduced relative clause)。英語被修飾的成份在前方,修飾的成份在後面,是屬於由名詞領銜而後跟著關係子句。然而,華語的修飾成份是在名詞前面,研究上或者能夠有其它別於語言之處。 在英語、葡萄牙語、荷蘭語、法語、德語等語言,透過不同的研究方法已經知道主詞關係子句(subject relative clauses, SRCs)的理解是比受詞關係子句(object relative clauses)更快速、更容易。而修飾成份在名詞前面的,則有較歧異的結果,日語和華語都屬於這樣子的語言,但是有些研究說主詞關係子句較容易被理解,有些研究說受詞關係子句較容易被理解。分別以一個主詞關係詞組和一個受詞關係詞組,進行實驗即可分辨出其差異: 愛慕音樂家的作曲家作曲家愛慕的音樂家 在主詞關係詞組裡頭,其語義角色指派依序為動詞-受事-施事;而受詞關係詞組裡頭,其語義角色順序則為施事-動作-受事。部份研究認為受詞關係詞組較容易被理解;部份研究認為主詞關係詞組較容易被理解。根據這樣的詞組,我們可以進行這樣的語料設計: 我討厭愛幕音樂家的作曲家。我討厭作曲家愛慕的音樂家。愛幕音樂家的作曲家討厭我。作曲家愛慕的音樂家討厭我。 透過這些語料以各種實驗方法,例如:自我步調閱讀任務(self-paced reading tasks)、音素/點擊監控任務(phoneme/click-monitoring tasks)、事件相關電位(event-related potentials)、詞彙判斷任務(continuous lexical decision tasks)、眼動追蹤(eye tracking)或功能性磁振造影(fMRI,functional magnetic resonance imaging)從便宜到貴的實驗方法,並根據問題意識找到受試者就可以解答究竟是什麼因素影響華語斷詞的機制。 華語中,動詞詞組是中心起始(head-initial)即動詞加受詞的結構,而名詞詞組則是中心後置(head-final)即修飾成分加名詞的結構。泰語的動詞詞組和名詞詞組都是中心起始,我們可以如這樣的問題意識:理解泰語的斷詞機制,是否也是同英語、德語等一樣,主詞關係子句較容易被理解?如果泰語和華語的斷詞機制是各有偏好的,這是否會造成泰語母語學習者學習華語的理解華語語句的困難?以泰語、英語和華語的語言學研究中,多著墨於聲調,或許斷詞機制的研究是吾人能夠著力、貢獻之處。