這篇文章[1]評估了 ChatGPT 生成論述性文章的表現,並與人工寫的文章進行比較。作者進行了大規模的研究,使用標準評估標準評估 AI 生成的內容和人寫的文章。評估分析還考慮了語言特徵。結果顯示,ChatGPT 生成的文章相對人寫的文章在質量上更高,但在寫作風格上有所不同。文章建議教育系統應該利用 AI 模型來釋放時間,用類似計算器對數學的方式,采用 AI 工具作為輔助,利用學童自身完成學習目標。本研究為評估人寫和 AI 生成的論述性文本質量提供了統計學上嚴謹和系統化的方法, 為我們提供了解這些語言模型如何發展的洞見。 根據文獻(p. 1)ChatGPT生成的文章質量更高,這是根據使用標準評估標準比較人寫的論文和AI生成的內容所得出的。ChatGPT模型的寫作風格展現出與人寫的文章不同的語言特徵,例如使用的話語和知識標記較少,但是名詞化和詞匯豐富度更高。另外,文獻(p. 11)中的統計分析結果顯示,用ChatGPT生成的文章在語言掌握方面得分更高,而人寫的文章則更容易犯錯。這些指標說明ChatGPT生成的文章質量更高。 使用的話語和知識標記是指作為AI語言模型 ChatGPT 和人類寫手之間識別的一些特徵,表達作者意見和想法的方式有所不同(p. 3)且它們是用來評估人類寫作和AI生成的論述文本質量的標準(p. 1)。話語標記可以用來衡量文本的一致性質量,比如Somasnudaran等人研究了故事的講述方面,Nadeem等人則將它們納入了他們基於深度學習的自動文章評分方法中(p. 9)。排除了常用於表示話語關係以外的詞語(如“like”,“for”,“in”等)的PDTB話語標記列表被用於本研究中(p. 9)。知識標記則用於識別作者對自己語句的承諾,將有關epistemic的表達式,如“I think”,“it is believed”和“in my opinion”,識別為知識標記(p. 9)。 研究還建議,教育系統需要納入AI模型的使用,為其他學習目標釋放時間,就像數學使用計算器一樣(p. 1)。此外,本研究還討論了以前基準的限制以及模型所有者的利益衝突問題,這對於解釋性能構成問題(p. 4)。此研究提供了一種統計嚴謹和系統性的方法來評估人類撰寫和AI生成的辯論文本的質量,提供了這些語言模型如何隨時間發展的洞察(p. 1, 14)。
Tag: 標準
華語教學概述和第二語言習得
一般外國人學華語,會遇到哪些問題,根據張金蘭老師的教學經驗,學習華語的外國人普遍會遇到以下現象:對於漢字圈的學生,如日本、韓國或越南的外國人,建立在曾經有使用漢字的基礎上,讀和寫兩個能力是很容易進入的,也因此就會輕忽習字;非漢字圈的朋友,就是所謂的「外國人」,聽和說的學得快,上課的時間不會說又很愛講;而華裔的外國人,則只會聽說,甚至只會粵語或閩南語。 普遍外國人學習華語不外乎有以下原因:一、被華人的爸爸、媽媽逼著學習華語;二、中國強大;三、喜歡華語流行;四、具挑戰性。教導華語者如果是正(繁)體的慣用者,通常會面臨和簡化字的比較,而正體字和簡化字分別在中國大陸和台灣被使用,只要依據學生需要教導,通常不會有太大的問題。張金蘭老師另外討論了,中國大陸和台灣在世界推動華語的優勢:在中國大陸,透過國家漢學辦公室,領導層級高,能夠快速地進入各國國家;台灣老師的優勢在於設備、師資、教學多元和科技的應用。 從幾個外國學生的訪問記錄來看,學華語對不同國藉的學生有不同的難處,俄羅斯學生覺得聽力難;奧地利學生覺得寫字和發音難;韓國學生覺得發音難;美國學生覺得辨字難、筆畫難;日本學生覺得發音和寫文章、用成語的時候難。每個人都有每個人不同的學法。波蘭學生學習華語倒沒有這些障礙,根據張金蘭老師的說法,波蘭語有所有能夠對應到華語的發音,所以很多音可以很輕易的上手。 華語教學市場上缺少兒童或外國學童華語教材。泰國的學校學童仍使用過去南一版的國語課本,原先設計給母語者使用的教材,在非母語國家使用,可能會讓學童不能有效率地學習。有興趣投入華語教學的朋友,不妨考慮開發外國兒童華語教材。 華語老師認為好的華語老師應具備:老師該有的人格特質、專業(包括語法、發音…等)、常識(上知天文、下知地理)。學華語的外國學生則認為好的華語老師應該有:活潑的教法、鼓勵學生、標準的發音。且選擇母語者為學習語言的對象,似乎是普遍的對象。 以上為今日參加華語師資培育班的心得和小筆記。