Category: 實驗設計

試題反應理論(Item Response Theory)中，需要看配適度(Fit)嗎？

Post author By Dicky
Post date April 23, 2017
Categories In 研究方法, 統計軟體R, 資料分析, 實驗設計
No Comments on 試題反應理論(Item Response Theory)中，需要看配適度(Fit)嗎？

從每個人在每個項目的實際得分(observed score)和該人該項目的預期得分(expected score)的差，除以變異數，可以得到這個資料點對模型的標準化的殘差(standardised residual)，把所有這些標準化的殘差平方後再求平均，就是未權重配適度均方(unweighted fit mean-squar)；若根據該資料點的變異數進行權重，則叫作權重配適度均方(weighted fit mean-square)。前者也叫outfit，因為它對極端值(outlier)相當敏感，如果高能力的人答錯簡單的題或低能力的人答對較難的題，則整個均方就會變大，資料和模型的配適就不好；後者又叫infit，因為其根據每個資料所能提供的資訊(information fit)進行權重，極端值的變異較小(例如：0.9*0.1或0.1*0.9，但中間的資訊較多(0.5*0.5)。我們可以使用R裡頭的TAM套件的msq.itemfit，去取得模型中每個項目的outfit和infit。把outfit的值畫出來的話，會如下圖：在有800個來自常態分佈的樣本下裡的20個項目中，越接近1的項目，配適地越好，反之則越差。隨著樣本數的增加或減少，在模擬的情況下，可以操控fit和1的距離。下面為樣本數為80和8000的情況。如果看配適度t值的話，就沒有上面的問題。但是，在真實資料的情況下，又會遇到另一個問題，當樣本數越大，則越容易發現配適地不好的項目，越容易發現資料和模型之間存在差異。我們可以這麼去理解配適度，它是一個項目和其餘項目總和的關係。從這個角度去理解配適度的話，其實「信度」或「鑑別度」已經提供我們足夠的資訊去決定一個項目的優劣了。如果我們以「配適度」去決定是否要採用某個項目，那反而會將具有鑑別度的項目剔除。當outfit離1很遠的時候，有兩種情況：一個是正方向的離1很遠，一個是負方向的離1很遠。正方向的離1很遠具有好的鑑別度，但我們可能因為判斷它的配適度不佳而刪除。倘若要從配適度去剔除不好的題目，就從outfit值最小的開始吧！

在古典測驗理論(Classical Test Theory)中計算信度(reliability)

Post author By Dicky
Post date April 16, 2017
Categories In 統計學, 資料分析, 實驗設計
No Comments on 在古典測驗理論(Classical Test Theory)中計算信度(reliability)

古典測驗理論(Classical Test Theory)中，存在一些假設：一、Observed Scored = True Score + (Measurement) ErrorX = T + E二、mean(X) = T三、Corr(E,T) = 0四、Corr(E1,E2) = 0五、Corr(E1,T2) = 0如果平行測驗的兩次所觀察到的分數滿足上述五個假設，則兩次的真實分數(True Score)相等，兩次的van(E)相等。van(E)為每一個題項(item)的變異數的總和。從古典測驗理論的假設下，可以延伸出以下：一、mean(E) = 0二、Var(X) = Var(T) + Var(E)三、[Corr(X,T)]squar = Var(T)/Var(X)四、Var(X) = Var(X’)(當兩者為平行測驗時)五、Corr(X,X’) = Var(T)/Var(X)(此用以計算單一測驗的信度) 計算單一測驗的信度，可利用Cronbach’s Alpha:Cronbach’s Alpha = (n/(n-1))*(Var(T)/Var(X))= (n/(n-1))*((Var(X) – Var(E))/Var(X))n/(n-1)用來校正，當n很大時，可忽略不計。 Cronbach’s Alpha作為信度係數，可以用測同一個構念的內部一致性(internal consistency)。若同一個構念中，含有多個子成分，各別子成分計算Cronbach’s Alpha，可討論各個子成分裡頭的內部一致性。然而，將以多個子成分組成的構念，再計算出一個屬於整體構念的Cronbach’s Alpha會很奇怪。[如果可以算一個Cronbach’s Alpha，為啥還要多個子成分的Cronbach’s Alpha？如果多個子成分才能組成一個構念，自然不存在內部一致性。]

在R進行有兩個隨機因子以上的混合線性模式

當我們只有一個隨機因子的時候，我們可以下面公式表示固定效果和隨機效果(以下公式皆使用lme4套件的lmer函數)： correct ~ context + order + (context + order | id)correct ~ context + order + (1 +context + order | id) 上面兩種寫法，傳達相同的意思。兩種寫法中，前半的「context + order」為主要效果；後半的「(context + order | id)」和「(1 +context + order | id)」包含「|」的則是隨機效果。在「|」右邊的是隨機因子(id)，而「|」左邊的則是受到隨機因子的影響，為了固定因子所產生、計算的截矩和斜率。當我們有兩個隨機因子時，我們則必需先考慮這個因子的關係是交叉或套疊，才能撰寫相對應的公式。當兩個因子彼此是套疊的時候，例如班級因子(class)套疊於學校因子(school)，我們將兩者的交互作用另立一個欄位(school_class)去計算，如此我們可以有以下公式，下面兩個公式也是同義的公式： correct ~ context + order + (1 | school/class)correct ~ context + order + (1 | school) + […]

交叉因子(crossed factor)和套疊因子(nested factor)的差別

Post author By Dicky
Post date December 19, 2016
Categories In 統計學, 資料分析, 實驗設計
No Comments on 交叉因子(crossed factor)和套疊因子(nested factor)的差別

當我們只有一個因子的時候，我們不需要去擔心因子間交叉(crossing)或套疊(nesting)的區別。但當我們有兩個以上的因子時，分辨因子間的關係就非常重要，因為這會影響我們對於資料的分析。當兩個因子交叉的時候，不論是在A因子中的每一個類別，都可以在B因子中每一個類別同時出現。換句話說，每一種來自兩個因子可能的組合都會出現於我們的觀察值中。倘若一個因子套疊於(nested within)另一個因子之中，若其出現在第一個因子中，則不會出現在其它因子中。同理，觀察值若出現在第二個因子中，則我們知道會有另一個觀察值出現在第一個因子中。所有的組合不會同時出現。當兩個因子交叉時，就可以計算交互作用；如果彼此套疊，則會因為沒有同時出現的組合，而無法進行如此動作。將兩個因子以列聯表(cross tabulation)呈現時，就可以知道彼此的關係是交叉或套疊了。參考文章

我讀陳春敏、陳振宇的《實驗研究法》：單因子實驗設計和多因子實驗設計

Post author By Dicky
Post date December 4, 2016
Categories In 研究方法, 資料分析, 實驗設計
No Comments on 我讀陳春敏、陳振宇的《實驗研究法》：單因子實驗設計和多因子實驗設計

陳春敏.; and 陳振宇. 2015. 實驗研究法. 社會及行為科學研究法, ed. by 瞿海源. 1版. 臺北市: 臺灣東華.

我讀陳春敏、陳振宇的《實驗研究法》：實驗設計的基本術語

Post author By Dicky
Post date December 4, 2016
Categories In 研究方法, 資料分析, 實驗設計
No Comments on 我讀陳春敏、陳振宇的《實驗研究法》：實驗設計的基本術語

依變項(變量)、自變項(因子)水準、實驗情境(處理)隨機選取(選機抽樣)、隨機分派受試者間、受試者內獨立樣本、相依樣本固定效果、隨機效果變異來源陳春敏.; and 陳振宇. 2015. 實驗研究法. 社會及行為科學研究法, ed. by 瞿海源. 1版. 臺北市: 臺灣東華.