high angle photo of robot

商業新聞語料庫:挖掘學術與專業詞彙的寶藏

本研究的主要目的是檢視Coxhead的學術詞彙表(Academic Word List, AWL)在商業新聞文章中的覆蓋率,並創建基於商業新聞文章語料庫(Business News Article Corpus, BNAC)的詞彙表。語料庫收集了2023年1月至2月發布於CNN、BBC、The Guardian和Reuters網站上的商業新聞文章,包含1,258,448個運行詞。使用AntWordProfiler處理235個文本文件,產生了兩個初步詞彙表:商業新聞文章學術詞彙表(BNAAWL)和商業新聞文章專業詞彙表(BNASWL)。研究發現,儘管AWL詞彙和特定於商業領域的專業詞彙出現頻率較低,但在商業新聞文章中仍然具有顯著存在,分別占21.22%(279詞)和18.33%(241詞)。通過三名專家的驗證過程,從BNAAWL中刪除了35個詞彙,剩餘301詞,從BNASWL中刪除了108個詞彙,剩餘201詞。這兩個列表合併後,形成了包含502個詞項的最終詞彙表。此詞彙表旨在滿足學術和特定領域學生的詞彙需求,研究強調EAP和ESP從業者可以有效利用商業新聞文章作為補充材料來設計教學內容,鼓勵學生獨立接觸這些文章以增強他們的學術和專業詞彙​​。

Coxhead的學術詞彙表

Coxhead的學術詞彙表(Academic Word List, AWL)由Coxhead於2000年開發,目的是為了提供一份涵蓋各學科領域常用學術詞彙的清單,以幫助學習者提高他們在學術英語環境中的詞彙知識。AWL包含570個詞彙家族,從3.5百萬詞的學術文本語料庫中選取,這些文本來自藝術、科學、法律和商業等不同學科。這份清單排除了West(1953年)的常用服務詞彙表(General Service List, GSL)中的前2000個最常用詞彙家族,以確保詞彙表專注於學術用途。

AWL被劃分為10個子列表,每個子列表根據詞彙出現的頻率來編排,其中子列表1包含最常見的詞彙,而子列表10則包含最不常見的詞彙。這份詞彙表為英語學習者提供了一個目標,幫助他們學習和掌握在學術閱讀、寫作、聽力和口語交流中可能遇到的核心詞彙。AWL的廣泛應用不僅限於英語作為第二語言(ESL)和英語作為外語(EFL)的學習者,還包括作為學術英語教學(EAP)和專業英語教學(ESP)資源。

商業新聞文章語料庫(Business News Article Corpus, BNAC)的詞彙表

商業新聞文章語料庫(Business News Article Corpus, BNAC)的詞彙表是基於從商業新聞文章中提取的數據建立的。這些文章主要來自CNN、BBC、The Guardian和Reuters的商業版塊,時間範圍是2023年1月至2月。BNAC包含約1,258,448個運行詞,形成了兩個主要的詞彙表:商業新聞文章學術詞彙表(BNAAWL)和商業新聞文章專業詞彙表(BNASWL)。

  1. 商業新聞文章學術詞彙表(BNAAWL):這個詞彙表收錄了出現在商業新聞文章中且屬於學術範疇的高頻詞彙。它的目的是提供一個針對學術目的的詞彙列表,這些詞彙不僅在商業領域中頻繁出現,而且在其他學術文本中也常見。
  2. 商業新聞文章專業詞彙表(BNASWL):這個詞彙表專注於商業領域的專業術語,包括那些在商業新聞報導中經常出現的詞彙。這些專業詞彙通常與商業、經濟和財務相關,對於商業學科的學習者來說非常重要。

這兩個詞彙表在研究過程中經過專家驗證,確保詞彙的選擇對學術英語目的(EAP)和專業英語目的(ESP)的學習者具有實際的教學價值。BNAC詞彙表的最終目的是為學習者提供一個全面的詞彙資源,幫助他們在學術和專業領域內有效地提高語言能力。

商業詞彙表的建置

這些詞彙表是通過對商業新聞文章語料庫(Business News Article Corpus, BNAC)的系統分析生成的。以下是產生商業新聞文章學術詞彙表(BNAAWL)和商業新聞文章專業詞彙表(BNASWL)的具體步驟:

  1. 語料庫的編纂:從CNN、BBC、The Guardian和Reuters的商業版塊收集商業新聞文章,形成BNAC。這些文章涵蓋了2023年1月至2月的商業新聞,總共包括1,258,448個運行詞。
  2. 數據處理:將收集到的新聞文章保存為文本文件(.txt),以便進行處理。在進行詞彙分析之前,從文本中移除所有非內容性資訊,如數字、表格、日期、月份和作者名稱。
  3. 詞彙分析
    • 使用AntWordProfiler這類詞彙分析工具對BNAC進行分析。
    • 創建高頻內容詞列表,這包括從商業新聞文章中提取的高頻使用的詞彙。
  4. 建立初步詞彙表
    • 學術詞彙表(BNAAWL):選擇那些除了最常用的2000個詞彙(如West的常用服務詞彙表)外,在商業新聞文章中高頻出現的學術性詞彙。
    • 專業詞彙表(BNASWL):選擇那些在商業新聞文章中高頻出現且與商業領域專業相關的詞彙,這些詞彙不包含在最常用詞彙和學術詞彙表中。
  5. 專家驗證
    • 進行專家驗證,以確保詞彙表中的詞彙對學術目的(EAP)和專業英語目的(ESP)學習者具有實際的價值。
    • 刪除不適合或與學術和專業目的不相關的詞彙。
  6. 詞彙表的最終化:綜合學術詞彙表和專業詞彙表,形成一個包含兩者的綜合詞彙表,以便於學術和專業英語學習者使用。

通過這個過程,BNAAWL和BNASWL能夠精確反映出在商業領域中學術和專業語境下頻繁使用的詞彙。

Amornsiripong, S. (2022). Developing an Academic Word List in Business News Articles: A Corpus-Based Study. Independent Study, Master of Arts in English Language Teaching, Language Institute, Thammasat University.

Leave a Reply

Your email address will not be published. Required fields are marked *