泰語角:《擺起地攤當老闆2(聖誕節特別企劃)》課前學習
泰語角:《擺起地攤當老闆》課前學習
三個和「樹」有關的故事
我讀陳春敏、陳振宇的《實驗研究法》:單因子實驗設計和多因子實驗設計
我讀陳春敏、陳振宇的《實驗研究法》:實驗設計的基本術語
Mi創想學院的泰語教室:四個泰語學習短片
我讀《How Science Takes Stock: The Story of Meta-Analysis》:如果只看p值的話…
當p值小於.05的時候,進行假設檢定的人就可以推論實驗組和對照組有差異的機會在20次當中,只會有不到1次。而當我們真得遇見這樣的可能性時,我們就可以大膽地說實驗組和對照組確實存在差異。但是僅僅透過點估計(point estimate),很可能因為抽樣誤差而對於實際的情況有誇張或不足的推論。只看統計顯著性的p值,是無法告訴我們差距大小。
信賴區間(confidence interval)是p值無法告訴我們的。越小的樣本,信賴區間會越大、越寬;相對的,大樣本,的信賴區間小,研究者就更有信心地說樣本的推論接近母體。
當實驗組和對照組的操弄或處理的效果是非常小的時候,要說明兩個組別確實存在差異時,可能就不夠力(powerful)。假設實驗處理只有很小、很小的效果,當樣本數也非常小的時候,它的信賴區間便會擴大,於是可能存在的效果就會被遺忘在較大的信賴區間裡了。
即使樣本夠大,它可以說明母體具有統計上的顯著的差異,但是只靠p值仍無法知道這樣的效果究竟多大,也許這樣的效果根本不值得我們去追求。
只看p值就會遇到以上的問題,它有點像一人一票(vote-counting),只看最後的結果。如果我們想知道實驗組和對照組的差異多大時,這是p值無法提供的。
Hunt, M. (1999). How Science Takes Stock: The Story of Meta-Analysis (Revised ed. edition). New York: Russell Sage Foundation.
在R進行兩比例值的比較
比例值資料是二項類別資料,族群資料之特徵只有兩種觀測值,如資料只有雌與雄、死與活、答對與答對。這些是沒有度量衡的測定單位。把其中一種特徵當成0,另一個特徵當成1,整個資料只有0和1兩種觀測值。這樣的族群稱為二項族群(Bernoulli population)。其平均數為p,而變方則為pq。
甲選手在25場比賽中,贏了17場比較;乙選手在20場比賽中,贏了8場比賽。
甲選手和乙選手兩個人贏比賽的機率是否相等?
(兩個族群的平均數是否相等?)
prop.test(c(17,8),c(25,20),correct=FALSE)
甲選手贏比賽的機率是否等於乙選手贏比賽的機率(0.4)?
乙選手贏比賽的機率是否等於甲選手贏比賽的機率(0.68)?
某一個族群的平均數是否等於某個特定的值?
binom.test(x=17,n=25,p=8/20)
binom.test(x=8,n=20,p=17/25)
http://stats.stackexchange.com/questions/123609/exact-two-sample-proportions-binomial-test-in-r-and-some-strange-p-values
https://stat.ethz.ch/R-manual/R-devel/library/stats/html/binom.test.html
我讀陳振宇的《整合分析》:效應量
每一個研究假設都會產生一個研究結果(或者效果),透過研究假設中兩個群體的比較,而且是有方向性預則的比較(可以是A大於B或B大於A,不可以只有A不等於B),並將這些結果轉換為能夠與其它襄究比較的單位。一個最典型、最傳統,用於在同一個問題意識下,但是不同的研究假設和研究成果的就是「效應量」(effect size、ES或效果量)。
效應量告訴我們有關每個群體相對於另一個群體的位置的概念,以統計學家的話說就是「樣本資料所得到的差異是幾個標準差」,依據效應量的大小能夠判斷具有顯著差異的研究結果是否具有實驗意義或重要性。效應量越大,研究結果的實驗意義就越大;效應量越小,研究結果的實驗意義就越小。效應量的大小代表不同群體的資料分布的差異,是否足以說明兩個體立群體的平均數差異。
在單一研究時,個別受試者的行為表現是反應變項;進行整合研究(meta-analysis)時,會將很多個相同問題的的研究結果集合起來,這時候每一個研究的效果(效應量)就是反應變項了。