在項目反應理論(Item Response Theory)下，怎麼理解「難度」這個概念？三種取徑。

在項目反應理論(Item Response Theory)中，要描述一個項目的「難度」和古典測驗理論(classical test theory)有不一樣的方法。在古典測驗中，一個項目的「難度」被認為是參與答題者人中答對該項目的比率，越多人答對，難度越低。在項目反應理論中，我們可以從三個取逕來理解項目的難度。

項目反應理論中的描述「難度」需要有兩個維度來定義，「樣本能力」和「答對機率」。在只有受試者只有1/0二元結果(答對或答錯)的情況下，以下圖為例，假設受試者的能力是0，則答對該項目的機率則為50%，則項目難度delta則為0。

同樣delta的概念，若在受試者的得分被評為三個等級，例如：0、1、2的時候，以下圖為例，黑色線(得0分的機率)和紅色線(得1分的機率)相交的地方，比50%小一點點的答對率；以及，紅色線(得1分的機率)和綠色線(得2分的機率)相交的地方，同樣比50%小一點點的答對率。前者往下延伸至x軸為delta1(難度為-0.5)，後者往下延伸至x軸為delta2(難度為0.5)。delta1和delta2兩個節點，可以把人分成得0分、得1分和得2分機率最高的範圍。

如果把答對的機率累積起來，以下圖為例，則從50%答對率水平延伸至與黑線(得1分或2分的累積機率)和綠線(得2分的累積機率)相交(紅線為得1分、2分和3分的累積機率)後再往x軸延伸取得gamma1(難度為-0.5)和gamma2(難度為0.5)。gamma1和gamma2兩個節點，同樣可以把人分成得0分、得1分和得2分機率最高的範圍。

又或者利用預期得分，從受試者的能力去推估期可能的得分(0到2之間)，當能力相同的時候，預期得分越高的項目，難度則越低；反之，難度則越高。或者，難度高的題目，給能力好和能力不好的兩個受試者去測試，能力好的受試者預期得分會高於能力不好的受試者。參考下圖：

在項目反應理論(Item Response Theory)下，怎麼理解「難度」這個概念？三種取徑。

Related

Leave a Reply Cancel reply