語料庫科技在語文教學的應用

【語文教育及編譯研究中心研究員兼中心主任 林慶隆】

 

  語料庫指蒐集大量圖書、雜誌、及新聞等文本文字或口說的聲音及文字,建置資料庫,並提供字詞語及語法使用的檢索和分析。語料庫有大量實際使用的語言資料,經由統計分析,可以顯示字詞語及語法真實的使用語境和使用頻率。一個大型的華語文語料庫結合數位科技即可應用在建構漢字、詞語,及語法點分級標準,編輯教材、文法書及學習者辭典;並可應用在發展華文拼字檢查、文法檢查、易混淆字詞表、搭配詞參考工具、華文作文評分、易讀性自動分級,甚至華語教學應用軟體、E-learning學習平台、自動產生華文例句及試題等教學學習應用。

  國教院語料庫索引典系統提供一個漢字、詞語及語法點的使用情境、頻率及搭配詞,也可以提供詞義分析及例句編寫等應用。例如,在其書面語語料庫2017查詢頁面鍵入「運動」一詞,按下「Start Query」,查詢的結果如圖1,除了顯示「運動」一詞的前後文使用情境,亦可分析「運動」可能的詞義,例如棒球及各種運動,健身運動,運動設施,民主運動,拒抽二手菸運動,及地球的造山運動等的「運動」詞義。在圖1頁面的右上角,選擇「collocations」選項,按「Go!」,在所顯示的頁面,再按「Create collocation database」,得到圖2的頁面,系統歸納「運動」一詞的搭配詞,包括伸展、有氧、啟蒙、社會等詞語。若要瞭解搭配「伸展」的實際情形,則可在「Observed collocate frequency」的項目,按「775」則可顯示在語料庫的例子。

  例句編輯輔助系統提供詞語的分級資訊,當使用者將例句或文章輸入系統,系統即標出每個詞語的等級,以瞭解內容的難易度,並替換太簡單或太難的詞語。圖3為教育部國語辭典簡編本「快樂」一詞釋義在本系統查詢的結果,發現釋義用詞比原詞語難,且例句也用到較難的詞。華語文初級學習者使用時需再查詢「愉悅」、「喜樂」等詞的釋義,才能瞭解「快樂」的涵義。


資料來源

林慶隆、柯華葳、吳鑑城、白明弘、陳茹玲(2019)。《建置應用語料庫及標準體系》期末研究報告。國家教育研究院研究計畫成果報告(編號:NAER-107-12-F-1-01-00-1-11)。新北市:國家教育研究院。