「語料庫於華語文應用論壇」活動報導

| 劉寶琦

 【文/編譯發展中心研究助理 劉寶琦】

  國家教育研究院(以下簡稱國教院)於本(105)年328日在臺北院區舉辦「語料庫於華語文應用論壇」,內容包括專題演講及語料庫應用論壇,頗獲好評。

  國教院於102年承接教育部華語文八年計畫之「建置應用語料庫及標準體系」計畫,自103109年進行建置臺灣當代華語文語料庫(COCT),目前已建置書面語語料11仟多萬字、口語語料約960萬字、華英雙語語料340萬字、華語中介語料42萬字;國教院為提供大數據在華語教學、辭典編輯、教材研發應用的討論交流,及慶祝五週年院慶,特舉辦此活動。

  本次特別邀請香港理工大學黃居仁講座教授就漢語語料庫為主題進行專題演講。黃教授從漢語語料庫的學/術/藝,分享其結合中國詩詞獨特的闡釋,從「長溝流月去無聲」、「上善若水」、「數大便是美」講述語料庫的歷史、語料的特性等,讓人耳目一新。

  論壇由編譯發展中心林慶隆主任主持,與談人包括教育部《重編國語辭典修訂本》總編輯許學仁教授、中華語文知識庫《兩岸常用辭典》總編輯蔡信發教授,及在計算語言學及大數據在教學運用的專家學者清華大學張俊盛教授、臺灣師範大學陳浩然教授、臺灣大學高照明教授。林主任引言介紹語料庫可能之應用及本院COCT建置之情形,許學仁教授從辭典編輯規範與變動角度切入語料庫收取新詞時應考慮的議題、蔡信發教授談及兩岸詞語可能之差異,高照明教授從利用新聞語料庫調查新詞彙的方法,發展出如何從語料中找出新詞及如何判斷詞彙出現的年代的兩大關鍵技術,陳浩然教授講述華語語料庫在教學上的多種應用,張俊盛教授則闡述藉由COCT擷取華語文法規則來發展同步樣式文法(Pattern Grammar)的方向。

  閉幕時國教院柯華葳院長除表達感謝之意,並表示國教院將持續辦理類似活動,啟發大家思考如何善用語料庫的資源,並希望更多的年輕學者多多參與。

  本次論壇與會者逾百餘人,活動圓滿成功。