high angle photo of robot

英文報紙必學詞彙:打造專業詞彙列表的科學方法

《Towards the Development of a Word List for English Newspapers》由Mostafa Saeedi、Reza Khany及Khalil Tazik撰寫,刊登於《Reflections》雜誌2023年5月至8月期。研究旨在開發一個英文報紙詞彙列表,收錄最常用且對理解英文報紙各部分極為有用的詞彙。研究透過分析1,221,970字的語料庫,根據頻率、範圍和專業化三個標準,得出包含858個詞族的詞彙列表。此詞彙列表與通用詞匯結合,覆蓋了語料庫中94.64%的詞彙使用頻率,對於學習英語作為外語或第二語言的學習者、英文報紙的讀者和作者均具有實際應用價值。

本研究基於大型語料庫建立詞彙列表,該語料庫由四份英美報紙的文本組成,涵蓋廣泛的新聞版塊。研究使用頻率、範圍和專業化三個標準選擇詞彙,結果顯示,與通用服務列表(GSL)結合後的新詞彙列表能有效覆蓋大量報紙文本。研究建議英語教學者和學生應關注此詞彙列表,以提高閱讀報紙的效率和理解能力。

三個詞彙選擇標準

提到的三個詞彙選擇標準包括頻率、範圍和專業化。

  1. 頻率:詞彙選擇的一個常用標準是頻率,即詞彙在語料庫中出現的次數。在本研究中,選擇的詞形至少要在1.2百萬字的語料庫中出現37次。頻率是詞彙選擇的重要參考因素,因為它反映了詞彙在文本中的普遍使用情況。然而,由於詞彙在不同文本中出現的不均勻性,單獨以頻率作為選詞標準是不夠的。
  2. 範圍:範圍是指詞彙在不同文本或文本類型中出現的情況,作為第二個詞彙選擇標準。在這項研究中,範圍標準要求詞形必須出現在20個新聞版塊中的至少一半,即10個版塊中。這個標準確保了所選詞彙不僅限於特定的文本或作者。僅考慮範圍作為選詞標準並不充分,因為可能存在一些在不同文本類型中出現的低頻詞。
  3. 專業化:專業化是通過專家諮詢來確定是否將某個詞族從最終的英文報紙詞彙列表(ENWL)中排除。與West(1953)的通用服務列表(GSL)類似,GSL作為理解和開發眾所周知的詞彙列表的前提不容忽視。然而,一些GSL的詞彙可能被識別為技術性或學術性詞彙,這種專業用途可以通過專家的判斷確定。因此,在本研究中,通過諮詢兩位專家,保留了一些GSL詞彙並排除了那些看起來過於通用的詞彙,以形成更專業的英文報紙詞彙列表。

這三個標準共同作用,以確保所選詞彙列表既有廣泛的適用性,又能具有專業性和實用性,有助於英語作為外語或第二語言的學習者理解英文報紙的內容。

詞彙列表與語料來源

858個詞族的詞彙列表是由研究者通過對英文報紙語料庫的分析而得出的,這個語料庫包含1,221,970個詞彙。在選擇詞彙時,研究者採用了頻率、範圍和專業化作為主要標準。經過篩選,從最初的2,887個詞族中排除了一些與通用服務列表(GSL)重疊的詞族和專家認為過於通用的詞族,最終確定了858個詞族的詞彙列表。這份列表中的詞彙根據它們在語料庫中的出現頻率來排列,旨在幫助學習者更好地理解英文報紙的內容 。

研究中使用的四份英美報紙文本包括來自英國的《衛報》(The Guardian)和《獨立報》(The Independent),以及來自美國的《聖荷西水星報》(The San Jose Mercury)和《華爾街日報》(The Wall Street Journal)。這些報紙在各自的國家中讀者量大,影響力強。

這些報紙文本被分為五大新聞類別,進一步細分為20個部分和子部分,包括國際新聞、國內新聞、商業、娛樂、體育、藝術、商業、時尚、健康與醫學、宗教、軍事、教育、科學技術、歷史、天氣、電影、電視、經濟、廣告、食品、社會與人物新聞、觀點和廣告。這種廣泛的範圍和細分旨在確保詞彙列表涵蓋各種類型的報紙內容,以滿足不同讀者和學習者的需要。

Saeedi, M., Khany, R., & Tazik, K. (2023). Towards the Development of a Word List for English Newspapers. Reflections, 30(2), 506-525.

Leave a Reply

Your email address will not be published. Required fields are marked *