以語料庫工具輔助分析近義詞研究

| 李詩敏

【語文教育及編譯研究中心助理研究員 李詩敏】

  第一語言及母語通常是在不知不覺中學會的,但是細緻的詞義分辨及使用,例如:「高興」、「開心」、「愉快」、「快樂」、「喜悅」、「興奮」是近義詞(或稱「同義詞」、「相似詞」),仍需特別學習。以國民小學國語教科書為例,依據九年一貫課綱編撰的三個版本教科書,有些版本直接在課文中介紹近義詞,有些則間接在課文後練習語詞替換。同樣地,107年發布的十二年國教國語文課綱也載明:第二學習階段能「分辨字詞義」。從上述可知,即便以中文為第一語言或母語的學習者仍須透過教學來學習近義詞的用法及差異。而另一方面,對以中文作為第二語言的學習者(例如:外籍學生)而言,過去研究結果也顯示,近義詞辨析為學習難點之一。

目前近義詞的選取依據及定義大多參考教材內容,或由學者自行判定,或是參考學生寫作錯誤。分析近義詞意思及句子結構,則參照辭典釋義,或是逐一分析檢視語料庫索引典的例句用法。以上研究方法,優點為分析精細,適合用在近義詞及語料例句數量較少的時候,一旦近義詞及語料例句變多,僅用人力逐一檢視分析句子,近義詞分析就變得耗力費時。

  本研究選取過去近義詞文獻最常討論的「高興」作為分析對象之一,同時為了避免上述研究方法的缺點,本研究採用語料庫工具輔助並運用大數據概念,找出及分析和「高興」同樣表達「心情好」的語詞。在研究分析過程中,運用語詞意思和結構可以被轉換為矩陣向量的自然語言處理模型,在「國教院語義場關聯詞查詢系統」檢索「高興」,找出和「高興」在上下文語境中表現相近的語詞(即「語義場關聯詞」)共2,000個;接著,為了更進一步篩選出和「高興」在結構及句子運用上相似的語詞,便增加詞類訊息(例如:動詞、名詞),篩去和「高興」詞類不同的語詞,留下和「高興」在文法結構上可以替換的語詞;再應用「國教院華英雙語索引典系統」、「臺灣師範大學雙語索引典」,查找這些語詞的英文意思是否和「高興」相似,最後保留和「高興」具有部分相同英文詞義的中文語詞;經由以上分析方法及過程所得到的語詞,不論在文法結構,或在意思上,都和「高興」極為相近。但為了更進一步保留近義詞替換在結構與文字韻律的和諧,本研究要求「高興」的近義詞在字數上必須和「高興」一樣為二字詞,藉此要求,最後找出包括「高興」在內的20個表示「心情好」的近義詞組。而後,再運用「華語文語料庫」的「語料庫查詢處理器」(簡稱CQP)語法檢索,找出包含這20個語詞在內的例句,觀察及分析這些語詞的搭配結構、文法表現,分析近義詞的異同。傳統上「高興」與「快樂」常被當作近義詞,本研究發現,「高興」和「快樂」僅在詞義上部分相似,若考量其他語言特徵(例如:詞類、文法、一起出現共用的搭配結構),則「高興」和「快樂」並非如此相似,在各項特徵中和「高興」最為相近的語詞是「慶幸」,而和「快樂」最為相近的是「開心」。

  上述本研究所採用的以語料庫工具輔助分析「高興」近義詞的研究方法適用於所有近義詞研究,這種研究方法不僅可以避免傳統分析近義詞耗力費時的缺點,也因為語料庫具備實際生活情境而解決過去選取近義詞不夠客觀的問題。本研究不僅客觀篩選出豐富的近義詞,並可快速分析近義詞的差異及各語詞在語言真實情境中使用的特徵。本研究成果可進一步應用至其他近義詞分析,可幫助語文學習,亦可應用至教材編輯:

(一)在教學上,因為近義詞是意義相近的語詞,因此可使用語詞替換方式讓學生具體了解近義詞在文法上的不同。例如,「快樂」可以用在祈使句(或稱「祈願句」)(我們說「祝你生日快樂」),但「高興」卻不可以(我們不說「祝你今天高興」)。

(二)在教材編輯上,以中文作為第一語言的教材可參考語詞出現頻率,以中文作為第二語言的教材可參考國教院華語文八年計畫「建置應用語料庫及標準體系」所發展的詞彙分級,建議學習順序可分別依據從高頻詞到低頻詞、從初級到高級來安排。


資料來源

李詩敏、林慶隆(2018)。再探「高興」類近義詞:基於語料庫工具輔助之辨析研究。華語文教學研究,15(1),45─84。