借鏡中國、日本、香港評量架構思索我國評量試題方向

| 林宜臻

【文 / 測驗及評量研究中心助理研究員 林宜臻】

展開評估系統不再只定位於教育成果的檢核,而用於全民教育發展水準與品質的提升,已蔚為趨勢。香港在2001年國際閱讀素養調查(PIRLS(1)排名第17,而於2006年躍升至第2名;在國際學生能力評量計畫(PISA(2)的閱讀素養排名由2003年第10名,2006年則躍升至第3名,2009年第4名。日本在國際數學與科學教育成就趨勢調查(TIMSS(3)表現優異(4),然在PISA的數學排名,卻由2000年的第1名,2003年的第6名,2006年降至第10名,排名與學習意願逐次下滑,2009年止跌至第9名。反觀我國在PIRLS 2006年排名22,而PISA 2006的閱讀素養排名162009年下滑至第23名。

中國的「建立中小學生學業品質分析、反饋與指導系統」以雙基與核心素養能力架構學科的測試框架,在基礎知識與基本技能的雙基上,用真實的情境與客觀性試題,考察學生高層次認知能力,命題內容除一般常見的學科核心知識、技能的理解和掌握外,尚包括:(1) 綜合運用所學知識,解決實際問題的能力;(2) 收集與分析資訊能力;(3)反思批判的能力等。此外,結合索羅分類法設計題目選項,以瞭解學生解決問題時表現出的認知發展水準,精細區分學生能力。

日本的「全國性學力與學習狀況調查」,其強調「知識」相關的A卷,以影響後續學年的學習內容,以及活用於生活中不可缺少的知識與技能為主;強調「活用」相關的B卷,則考查學生能否將知識與技能等活用於實際生活中的能力,以及解決課題的構思、評鑑、改進等能力。不僅調查「知識」的學習表現,試題內容主要調查學生能否將知識與技能等活用於實際生活中的能力,以及解決課題的構思、評鑑、改進等能力;出題型式不再只是選擇題,也包括開放式答題。

香港的「全港性系統評估」不評核各學習階段內的所有基本能力,而是評估學生能否應用所學之相關知識和技能解答;測試內容主要根據課程發展處的基本能力文件,中國語文與英國語文測試,涵蓋「說」、「讀」、「聽」、「寫」四個學習範疇,除了紙筆評估之外,尚包含中文與英文的說話評估。

同為亞洲國家/地區的中國、日本、香港已積極推展學科能力監測機制,以掌握學校教育的現狀與課題,建立保證義務教育質量之架構。中國、日本及香港的命題,已朝向高層次思維的評估,測試內容切合學生日常生活的經驗,並提供有意義的情境,讓學生能綜合運用學科能力。

檢視當前國家教育體制與政策實施成效,檢核或描述學生的學力表現是否達到預期的水準,確有其必要。我國宜藉由教育評估系統的數據分析,準確且客觀地掌握學生的學力與學習狀況,為教育政策、課程設計,以及學校政策等之決策,提供科學化依據,以為檢核教育的施策成果,進而制定切實可行的改進措施。面對知識經濟之際,應著眼於提升學生轉化課本知識為實質的關鍵能力。我國教育評估系統對學力的要求,除了如TIMSS檢視課程實施狀況外,同時宜如PISA檢視學生的學習究竟掌握了多少明日世界能力(Learning for Tomorrow’s World)。教育評估系統不宜只問是否已達監測之功能,測試內容不宜僅侷限於瞭解學生是否學會基礎知識與技能,尚須進一步瞭解學生能否擷取有用知識、反省思考,以及解決問題。


【註解】

1Progress in International Reading Literacy Study

2Programme for International Student Assessment

3Trends in International Mathematics and Science Study

4TIMSS19952003小四數學第3名、TIMSS20074名; TIMSS 1995的國二數學第3名,TIMSS-R2003 2007獲得第5名。