自動化語言評量新紀元
從學習者語料到能力指標的實證探索
語文教育及編譯研究中心 | 吳欣儒
隨著語料庫大數據與人工智慧技術加速應用,語言能力評量正迎來重大變革。本院語文教育及編譯研究中心於2025年4月18日邀請國立臺灣大學外國語文學系暨研究所的高照明教授,以學習者語料分析為起點,分享從詞串提取、句法特徵分層,到語言能力指標驗證的研究成果,並說明如何結合自動化工具,提升語言評量的效度與細緻度,並分享他多年來在學習者語料庫分析與語言能力指標驗證上的研究成果。
高教授擁有英國曼徹斯特科技大學語言工程博士學位,專精於自然語言處理、語料庫語言學與電腦輔助翻譯等領域,長期以來,他致力於語言科技與教育應用的跨界整合,近年更積極探索生成式人工智慧 (Generative AI) 在語言學習與評量中的創新應用,推展自動出題與評分系統的研發,為語言教育注入新的技術動能與發展可能。
首先,高教授以「中英文錯誤類型與英文文法能力指標的自動辨識」為主題,依序探討三個關鍵議題。他先介紹關於GEPT中級寫作測驗的研究,透過自動化技術提取學習者作文中的詞串 (lexical bundles) ,分析高分組與低分組學生在語言使用上的差異,研究鎖定出現頻率超過20次的3至6字詞組,並依據語篇功能加以分類,進一步描繪出不同能力層級學習者的語言特徵輪廓。高教授指出,這種詞串的使用模式,不僅可作為能力區分的依據,也可對比母語者的真實語料庫 (authentic corpus) 進行驗證,進一步提升語言評量的信效度,這種以大數據為基礎的分析方法,為語言能力評估提供客觀且可量化的標準。
接著,高教授聚焦於學習者語料庫中的句法特徵變化,他指出,隨著語言能力等級的提升,學習者不僅詞彙量增加,句法運用也展現出更高的靈活度與層次感,以LTTC Learner Corpus為例,中高級學習者 (high-intermediate level) 能自然運用副詞片語(如 much better than )、形容詞片語(如 more organized )、插入語(如 , that is, )以及帶有數量詞與形容詞修飾的名詞片語(如 these two negative effects ),這些結構的出現,代表著學習者在組織語意、強化語篇連貫性的能力顯著成長。高教授強調,語言能力的發展,應從真實語料中細緻描摹,透過對照如EGP (English Grammar Profile) 等國際語法標準,研究者能更精準掌握學習者在不同發展階段的語言表現,為語言教學與測驗設計提供具實證基礎的支持。
最後,高教授總結本次分享的核心觀點,他提出,語言能力指標的建構,應同時涵蓋已具備的能力 (positive features) 與尚未掌握的能力 (negative features) ,只有完整描繪學習者「能做什麼」與「還無法做什麼」,才能真正呈現語言發展的全貌。高教授同時介紹他正在推動的幾項研究工作,包含自動翻譯評分、作文自動回饋、錯誤自動辨識與標註系統,以及中文語法能力檢測工具,為未來語言教育與智能評量勾勒清晰藍圖。
整場演講內容緊湊且深具啟發性,高教授以條理分明的講述方式,深入淺出地將理論與實證研究結合,此次分享不僅為語言教學者與評量設計者提供重要參考,也為未來以數據驅動的語言能力標準化發展,勾勒出清晰且可行的方向。
語言能力指標 (另開新視窗) 語言評量 (另開新視窗)