Author: Dicky

三個和「樹」有關的故事

三個和「樹」有關故事。 岸樹井藤樹神度婆羅門永遠有希望的樹(ต้นไม้แห่งความสมหวัง) 「曠野無明路,人走喻凡夫,大象比無常,井喻生死岸。樹根喻於命,二鼠晝夜同,齧根念念衰,四蛇同四大。蜜滴喻五欲,蜂螫比邪思,火同於老病,毒龍方死苦。智者觀斯事,象可厭生津,五欲心無著,方名解脫人。鎮處無明海,常為死王驅,寧知戀聲色,不樂離凡夫。」 

我讀陳春敏、陳振宇的《實驗研究法》:實驗設計的基本術語

依變項(變量)、自變項(因子)水準、實驗情境(處理)隨機選取(選機抽樣)、隨機分派受試者間、受試者內獨立樣本、相依樣本固定效果、隨機效果變異來源 陳春敏.; and 陳振宇. 2015. 實驗研究法. 社會及行為科學研究法, ed. by 瞿海源. 1版. 臺北市: 臺灣東華.

我讀《How Science Takes Stock: The Story of Meta-Analysis》:如果只看p值的話…

當p值小於.05的時候,進行假設檢定的人就可以推論實驗組和對照組有差異的機會在20次當中,只會有不到1次。而當我們真得遇見這樣的可能性時,我們就可以大膽地說實驗組和對照組確實存在差異。但是僅僅透過點估計(point estimate),很可能因為抽樣誤差而對於實際的情況有誇張或不足的推論。只看統計顯著性的p值,是無法告訴我們差距大小。信賴區間(confidence interval)是p值無法告訴我們的。越小的樣本,信賴區間會越大、越寬;相對的,大樣本,的信賴區間小,研究者就更有信心地說樣本的推論接近母體。 當實驗組和對照組的操弄或處理的效果是非常小的時候,要說明兩個組別確實存在差異時,可能就不夠力(powerful)。假設實驗處理只有很小、很小的效果,當樣本數也非常小的時候,它的信賴區間便會擴大,於是可能存在的效果就會被遺忘在較大的信賴區間裡了。 即使樣本夠大,它可以說明母體具有統計上的顯著的差異,但是只靠p值仍無法知道這樣的效果究竟多大,也許這樣的效果根本不值得我們去追求。 只看p值就會遇到以上的問題,它有點像一人一票(vote-counting),只看最後的結果。如果我們想知道實驗組和對照組的差異多大時,這是p值無法提供的。 Hunt, M. (1999). How Science Takes Stock: The Story of Meta-Analysis (Revised ed. edition). New York: Russell Sage Foundation.

在R進行兩比例值的比較

比例值資料是二項類別資料,族群資料之特徵只有兩種觀測值,如資料只有雌與雄、死與活、答對與答對。這些是沒有度量衡的測定單位。把其中一種特徵當成0,另一個特徵當成1,整個資料只有0和1兩種觀測值。這樣的族群稱為二項族群(Bernoulli population)。其平均數為p,而變方則為pq。甲選手在25場比賽中,贏了17場比較;乙選手在20場比賽中,贏了8場比賽。 甲選手和乙選手兩個人贏比賽的機率是否相等?(兩個族群的平均數是否相等?)prop.test(c(17,8),c(25,20),correct=FALSE) 甲選手贏比賽的機率是否等於乙選手贏比賽的機率(0.4)?乙選手贏比賽的機率是否等於甲選手贏比賽的機率(0.68)?某一個族群的平均數是否等於某個特定的值?binom.test(x=17,n=25,p=8/20)binom.test(x=8,n=20,p=17/25) http://stats.stackexchange.com/questions/123609/exact-two-sample-proportions-binomial-test-in-r-and-some-strange-p-valueshttps://stat.ethz.ch/R-manual/R-devel/library/stats/html/binom.test.html

我讀陳振宇的《整合分析》:效應量

每一個研究假設都會產生一個研究結果(或者效果),透過研究假設中兩個群體的比較,而且是有方向性預則的比較(可以是A大於B或B大於A,不可以只有A不等於B),並將這些結果轉換為能夠與其它襄究比較的單位。一個最典型、最傳統,用於在同一個問題意識下,但是不同的研究假設和研究成果的就是「效應量」(effect size、ES或效果量)。效應量告訴我們有關每個群體相對於另一個群體的位置的概念,以統計學家的話說就是「樣本資料所得到的差異是幾個標準差」,依據效應量的大小能夠判斷具有顯著差異的研究結果是否具有實驗意義或重要性。效應量越大,研究結果的實驗意義就越大;效應量越小,研究結果的實驗意義就越小。效應量的大小代表不同群體的資料分布的差異,是否足以說明兩個體立群體的平均數差異。 在單一研究時,個別受試者的行為表現是反應變項;進行整合研究(meta-analysis)時,會將很多個相同問題的的研究結果集合起來,這時候每一個研究的效果(效應量)就是反應變項了。

為什麼研究需要報告「效應值」(size effect)?因為型一錯誤和型二錯誤的不平衡

研究者在「虛無假設統計檢定」設定的顯著水準為0.05時,認為自己所做的推論犯錯的機會只有不到5%。然而,算進型二錯誤的話,犯錯的機會可能會提高。型二錯誤指的是真實的情況下,母體存在著差異,但是研究者卻做出了沒有差異的推論;與型二錯誤相對的就是統計檢定力(statistical power),即母體存在差異,且研究者的樣本資料也發現顯著差異。在真實的情況下,母體中兩個比較的群體存在差異的,由於抽樣後觀察到的檢計量或p值落在拒絕域之外,即p值大於0.05,於是研究者宣稱無法拒絕虛無假設並推論兩個群體並不存在差異,這就犯了型二錯誤。增加樣本數就會降低型二錯誤。在真實情況兩個群體(控制組和實驗組)存在差異時,要達到研究者所設定的顯著水準(比方0.05)而拒絕虛無假設時,則至少需要有1.645個標準差的差異。假設樣本數只有15個實驗組和15個控制組,標準差為0.38。如果檢定統計量落在1.645個標準差的右邊(單尾檢定,實驗組之於控制組有正向的效果)則拒絕虛無假設;但是檢定統計量也可能落在1.645個標準差的左邊,這時就無法拒絕虛無假設,就會犯了型二錯誤。在控制組和實驗組確實存在差異,且作出正確的推論的機率是37%(統計檢定力);同時,作為錯誤推論的機率則為63%(型二錯誤)。如果更改顯著水準自0.1(1.282個標準差)或0.01(2.327個標準差),那統計檢定力和型二錯誤的機率又會有所改變。 研究者所選取的顯著水準會使得型二錯誤和型一錯誤有不平衡的結果,於是也開始有研究者報告效應量(effect size、ES或效果量)來提供研究更多的訊息。 陳振宇. (2013). 整合分析. In 社會及行為科學研究法(三):資料分析 (3版.). 臺北市: 臺灣東華.

我讀陳振宇的《整合分析》:「虛無假設統計檢定」的推論、作法與不足

研究者心裡面有一個所欲論述的假設(對立假設),與之相反的就是虛無假設。研究者盡力收集證據的情況下,仍沒有足夠的證據能夠支持虛無假設時,研究者於是可以認為對立假設為真。通常,研究者所欲證實的假設,指的是某個變項所進行的操弄是有效果;而虛無假設則是操弄沒有效果。每一次研究的觀察都可能出現抽樣的誤差。該次的抽樣所觀察到的效果可能是真實的,也可能是來自沒有效果的母群抽樣。於是,研究者必須採取某種標準判斷。以大多數專業期刊所採取的標準或顯著水準0.05為例,即該研究者認為如果來自沒有效果的母群抽樣的機率不到5%的話,那麼研究者願意判定這個效果不是來自虛無假設的母群,而宣稱對立假設成立。宣稱對立假設成立的同時,虛無假設仍有最高5%的機率為真的可能性。如果這樣的情況發生了,就是型一誤差。不過,只要沒有進行普查的話,我們永遠不知道型一誤差是否會發生。 「虛無假設統計檢定」的推論,決定選擇虛無假設或對立假設取決於研究者所採取的顯著水準。想像以下兩種情況,甲情況下p值是0.1,乙情況下p值是0.77,在顯著水準備為0.05的前提下,不論在甲情況或乙情況下,研究者都會選擇接受虛無假設,但是甲乙兩個情況下的檢定統計量可能是天差地遠。如果將顯著水準設為0.1,在甲情況下,研究者會拒絕虛無假設,而乙情況下仍會接受虛無假設。結果,只因為研究者的風險設定,就會決定了最後統計的判定和推論。 陳振宇. (2013). 整合分析. In 社會及行為科學研究法(三):資料分析 (3版.). 臺北市: 臺灣東華.

第二語言習得:造成語音遷移的因素

當第二語言的學習者認為第一語言和第二語言很相近的時候,遷移就可能發生,;而當第二語言的學習者認為該結構是標記的(marked)或語言專屬的(language-specific),則遷移就較不可能發生。這些遷移可能發生或不可能發生,就是遷移力(transferability)。我們可以從幾個因素去討論遷移力,也就是影響遷移發生的可能性因素。 我們先從語言學和心理語言學的因素去討論。 當學習者的接收語(recipient language)和來源語(similar language)相近時,學習者比較容易在接收語有遷移的表現;反之,接收語和來源語的差異較大時,則較不會有遷移的表現。其次,語言距離較近的語言,標的語往往在「理解」和「表現」之間有較大的鴻溝;反之,語言距離較遠的語言,標的語「理解」和「表現」的鴻溝就較小,特別在外語學習的環境。 我們可以使用語言親近性(language similarity)來指涉來源語和接收語之間的關係,當然,語言差異性(language difference)也是一樣。再細分,可以分有客觀親近性(objective similarity)、客觀差異性(objective difference)、主觀親近性(subjective similarity)以及主觀差異性(subjective difference)。客觀的親近性/差異性是基於語言本體間的一致性的程度,主觀的親近性/差異性則是第二語言學習者所認為存在親近或差異的程度。通常,學習者主觀上對於語言距離的估算往往誤導了遷移的可能性。主觀的親近性會影響學習者在使用接收語時,依靠來源語的程度;客觀的親近性則影響可能的遷移是正遷移或負遷移。 主觀的親近性和客觀的親近性的差異產生了三種普遍的情況:一、第二語言學習者無法辨視實際存在的親近性;二、第二語言學習者誤解了某些存在於語言間的親近性;三、第二語言學習者預設了實際上根本不存在的語言親近性。郭安銳(Kellerman)認為,學習者只會對某些類型的客觀親近性有感覺,而其它類型的親近性則由學習者主觀上的判斷將決定,很大一部份是來自第一語言的特定成份。主觀親近性,使學習者產生中介語;主觀差異性使學習者避免遷移。客觀的親近性和差異性似乎不會產生跨語言影響,而是決定遷移是屬於正遷移或負遷移。我們可以說,「遷移」主要來自學習者主觀上對於親近性和差異性的認定。 我們再把主觀親近性分為感知的親近性(perceived similarity)和預設的親近性(assumed similarity)。前者指的是當二語學習者接觸接收語的輸入時,判斷其形式、意義、功能存在和來源語相似的特徵;後者指的是,不論二語學習者是否接觸過接收語的輸入,其已經預設接收語存在和來源語形式、意義、功能相似的部份。兩者並非互斥,而反倒有點像集合和子集合的關係,感知的親近性是較大的集合,包含預設的親近性。 而感知的親近性會在學習者跨過某個門檻之後,使學習者開始預設許多額外的親近性。其來自於學習者累積了足夠的感知親近性,而開始預設兩個語言間有很大的親近性,於是開始對於未接觸的親近性進行預設,預設其具有親近性。 接著,我們從累積性的語言經驗和知識這個因素,去看遷移力。 累積性的語言經驗和知識,我們可以簡單地、化約地說就是「時間」和「遷移力」的關係。依序將討論「年紀」、「曝露的時數、頻率、強度」、「標的語地居住時間」、「習得語言的數目和順序」。 在語音上,研究發現,年紀較大的學習者有更多的順向遷移,但在詞彙和構詞上,卻不明顯。而後期的遷移(包括第二語言和第三語言之間順向和逆向的遷移),同樣是年紀較大的學習者有較明顯的遷移,多是詞彙方面的遷移,這也取決於第二語言和第三語言之間的相似程度。語音上,而逆向的遷移中,年紀較大的學習者的遷移少於年紀小的學習者。 對此,傅雷卡(Flega)提出「口說學習模式」(Speech Learning Model),其假設第一語言和第二語言中,同一個位置的語音是可能互相影響的。在第二語言習得的過程中,利用越多的第一語言語音位置時,則第二語言受到第一語言的影響則較大。反之,則越小。 透過對於語言在感知和產出的正確性,馬凱(MacKay)和傅雷卡對於遷移和習得年紀進行研究。純就帶著口音的發音而言,其實不影響語言的感知和產出,於是「語速」(speech rate)成了另一個和習得年紀相關的應變項。研究發現,抵達標的語地的年紀和其語速是有相關的,越早抵達美國的移民,其英語語速越快,句子持續的時間越短,韓國裔和義大利裔皆然。同一個研究,再回過頭看第一語言的語速,其發現早期雙語者(2到13歲間抵達美國)和晚期雙語者(15歲之後到達美國)相比,早期雙語者的英語比其第一語言的語速快,而晚期雙語者則相反。我們可以結論,「年紀」在順向遷移和逆向遷移中都有影響。 「曝露的長度、頻率和強度」是另一個大家所關心的因素。有研究指出,二語教學的總量越多,遷移越多(西語母語者和巴斯克語母語者學習英語);也有得到相反結果的研究(芬蘭語和瑞典語母語者學習英語)。有人解釋這是因為前者找的是初級學習者,後者找的是高級學習者。換句話說,曝露的總量和遷移的關係是一開始先上昇後下降的曲線。而逆向的遷移則是匈牙利的學童在學習過英語或法語的寫作之後,對於其第一語言(匈牙利語)的寫作都有提昇的效果。 「待在標的語環境的時間」(length of residence)也常被拿當作指標。順向的遷移中,同樣馬凱和傅雷卡的研究中指出在標的語地的時間越長,其語速越快(句子持續的時間越短),而且越接近英語母語者的英語,但比起抵達的年紀,這仍是比較微弱的因素。而後期的順向遷移中,漢堡格(Hammarberg)先生找了一個第一語言是英語、第二語言是德語,第三語言是瑞典語的人,他住在瑞典四個月之後,原先會用德語取代在瑞典語中的情況慢慢減少,直接一年半後完全沒有這樣的情況。這些研究說明,在標的語的時間越長,遷移是會減少甚至解除的。 而逆向的遷移則發現在第二語言環境待得越久,人們對於第一語言搭配的判斷會變差,尤其在詞彙語義和構詞句法上,都有顯著的發現。而這個第二語言環境,必須是充足的(sufficient)。所謂「充足」指的是其和標的語母語者互動的總量。這樣逆向的遷移是會改變第二語言學習者的第一語言的知識結構的。 「習得語言的數目和順序」對於遷移力的研究,我們可以先觀察習得語言的順序。在戴維樂(Dewaele)的研究中,他找了兩組人,其中一組人,依其習得順序,其具備了德語、法語和英語;另一組人,則具備了德語、英語、法語。比較這兩組人的法語,第一組人的法語受到第一語言的影響較多(順向),第三語言的影響較小(逆向);第二組人的法語,則受到第二語言的影響較多(順向),第一語言的影響較小(順向)。法語因為習得順序的不同,而遷移力的大小也就有所差異。接著,我們看習得語言的數目。關於習得語言的數目,對於遷移力的影響有兩種說法,一派認為學習的語言越多,更可能有來自不同語言的遷移;另一派認為,學習超過兩個語言以上的人,比較不會侷於舊有語言的束縛。然而,關於習得語言的數目和遷移力的關係,至少在民國九十五年之前,學術界仍沒有定論。 以上,我們透過「語言學和心理語言學」和「累積性的語言經驗和知識」兩個因素討論遷移發生的可能性(遷移力)。我們可以知道這一方面仍有很長一段路,需要由專家學者們致力貢獻。