本文探討了如何自動量化並比較不同領域和子領域文本中情感特徵,特別是報紙語料庫中各個子類型內情感詞彙的分布情況。研究基於Warriner等人的工作,對約14,000個英文單詞進行了情感評分,涉及情感的三個參數:價值感(V)、激活度(A)和支配度(D)。研究分析了《衛報》十個子版塊的100,000個詞樣本,計算了每個子版塊的平均V、A和D值,發現犯罪和旅遊版塊的情感評分最為異常。
研究方法包括提取每個子版塊的平均情感評分,並詳細檢查情感評分差異最大的兩個子版塊。通過泡泡圖展示了情感評分的分布,其中旅遊版塊在價值感和支配度方面評分較高,而犯罪版塊在激活度方面評分較高。研究還進行了統計檢驗,結果顯示新聞子版塊間的情感差異在統計上具有顯著性。
本研究提供了一種有效的方法來揭示報紙不同子版塊間的情感差異,尤其是犯罪和旅遊文章。這種方法也可能適用於分析其他類型的語言使用,如族群感知、性別差異、情感隨時間的變化,以及不同類型新聞中情緒語言的變異。
如何對情感進行評分?
本文中的情感評分依據Warriner等人提供的情感詞彙列表進行,該列表包含約14,000個英文單詞的情感評分。這些單詞按三個情感參數進行評分:價值感(Valence,V)、激活度(Arousal,A)和支配度(Dominance,D)。情感評分是在九點量表上進行的,其中:
- 價值感(V)指的是由單詞喚起的情感的愉悅程度,從痛苦到快樂不等。
- 激活度(A)反映了單詞觸發的情感強度,從平靜到強烈不等。
- 支配度(D)表示感知者對刺激的控制程度。
研究分析了《衛報》十個子版塊中的100,000個詞樣本,對照Warriner等人的情感詞彙列表,計算每個子版塊的平均V、A和D值,從而評估不同報紙子版塊中情感詞彙的分布情況。
英文單詞的情感評分
14,000個英文單詞的情感評分是基於Warriner等人的研究,這份評分列表包括了大約14,000個英文單詞,這些單詞按照價值感(Valence, V)、激活度(Arousal, A)和支配度(Dominance, D)三個情感維度進行了評分。這些評分是在九點量表上進行的,具體包括:
- 價值感(V):這個維度評估單詞喚起的情感是愉快的還是不愉快的,量表範圍通常從1(非常不愉快)到9(非常愉快)。
- 激活度(A):這個維度衡量由單詞觸發的情感強度或激活程度,量表範圍從1(非常平靜)到9(非常激動)。
- 支配度(D):這個維度表示單詞喚起的情感使感知者感到多大程度上是被控制或有控制力的,量表範圍從1(感覺非常被動或無力)到9(感覺非常主動或控制力強)。
這份情感評分列表是心理語言學研究中的重要資源,因為它提供了大量單詞的情感屬性評估,可以用於分析文本情感或進行跨語言情感比較研究。單詞列表中包括名詞(佔63.5%)、形容詞(佔22.5%)和動詞(佔12.6%),其餘則屬於其他詞類。
這項工作為自動評估文本中情感特徵提供了一個豐富的資源,使研究人員能夠更精細地分析不同文本或語料庫中情感詞彙的使用情況。
Brett, D., & Pinna, A. (2013). The distribution of affective words in a corpus of newspaper articles. Procedia – Social and Behavioral Sciences, 95, 621-629.