電腦與標準化測驗評量公平性的發展及挑戰
測驗及評量研究中心 | 曾建銘 研究員
一、前言
測驗評量在教育系統中的地位舉足輕重,從學生學力的診斷到教育政策的制定,皆倚賴準確的評量工具。隨著全球教育環境的變遷,如PISA(國際學生能力評量計畫)的普及、AHELO(Assessment of Higher Education Learning Outcomes,高等教育學習成效評量)的推廣,以及疫情對標準化考試模式的衝擊,測驗評量正迎來一個電腦化與公平性高度關注的轉型時代(駐紐約辦事處教育組,2023;駐美國代表處教育組,2024)。特別是日本等國家逐步將國中小學學力測驗電腦化,呈現出教育評量的新趨勢(駐日本代表處教育組,2024)。本文將結合上述發展,探討評量的當前挑戰與未來方向。
二、測驗評量的全球趨勢
隨著全球化的加速與教育國際化的推進,測驗評量的發展趨勢逐漸成為全球教育界關注的焦點。其中,經濟合作與發展組織(OECD)推出的PISA不僅是衡量各國學生學習能力的重要標準,也對高等教育的學習成效評量模式產生了深遠的影響。以AHELO為例,其主要目標在於測量大學生的核心素養及專業能力,並強調跨文化與跨語言的一致性(紐約辦事處教育組,2023)。然而,文化差異在實際測驗中的體現可能對公平性與效度構成挑戰。例如,不同國家的教育制度和學習重點可能導致學生在面對標準化測驗時表現不一,而這種差異可能非源於能力,而是背景環境使然。因此,AHELO在提供全球通用評量框架的同時,必須謹慎設計試題以降低文化偏差,並考慮跨文化適應性,以確保測驗結果的公平性與代表性,真正適應不同國家和地區的教育背景與需求。
但在標準化測驗的推廣過程中,其公平性與實施成本問題始終備受爭議。例如,標準化測驗是否能真實反映學生的能力,抑或僅僅是一種應試技巧的比拼,這一點在教育界引發了廣泛討論。此外,實施此類測驗所需的資源與經費也經常成為各國教育機構的挑戰,尤其是在經濟條件有限的地區。例如,在一些非洲國家,由於基礎教育設施匱乏和教育經費不足,許多學校無法為學生提供參加標準化測驗所需的基本條件,如測驗場地、教材或指導教師,導致測驗普及率低且結果不具代表性。如何確保測驗的普及性與公平性,成為教育政策制定者需要優先解決的議題。
以美國為例,標準化測驗如SAT和ACT長期以來被視為大學入學的重要依據,但其有效性與公平性屢遭批評。特別是在新冠疫情期間,由於實施測驗的困難性和學生參與的限制,美國許多大學暫時取消了SAT和ACT成績作為入學必要條件。然而,隨著疫情結束,部分大學又逐步恢復了對這些測驗成績的要求(駐美國代表處教育組,2024),這一過程反映了教育界對標準化測驗有效性的重新思考與評量。具體而言,取消SAT和ACT測驗的期間,來自弱勢社會經濟背景的學生更容易獲得入學機會,因為標準化測驗通常與學生的家庭收入和教育資源高度相關。政策恢復後,這些學生可能再次面臨不利條件,例如缺乏準備測驗的資源或無法參與額外的輔導課程,進一步加劇了教育不平等的挑戰。這種政策的反覆調整,不僅揭示了測驗在教育體系中的重要性,也凸顯了其在公平性與學術價值之間的矛盾。
綜上所述,全球測驗評量的發展正面臨多重挑戰與機遇。如何在保證測驗公平性與成本效益的同時,提升其對學生能力的真實反映,將是未來教育政策制定者和研究者需要共同努力的方向。例如,日本在推行電腦化測驗時,成功利用科技降低測驗成本,並引入跨文化適應性的試題設計,有效提升了測驗的公平性與代表性(駐日本代表處教育組,2024)。此外,非洲某些地區通過國際援助與技術支持,逐步克服教育資源不足的挑戰,這些案例展示了各國在平衡公平性與成本效益方面的潛在解決之道。
三、電腦化測驗的挑戰與優勢
電腦化測驗已成為現代教育評量的重要趨勢,許多國家正在積極推動其實施。以日本為例,該國計畫於2027年全面在國中小學實施電腦化測驗,這顯示出對測驗效率提升及數據累積價值的高度重視(駐日本代表處教育組,2024)。同樣地,韓國也採取類似措施,推行基於人工智慧的電腦化適性測驗,透過精準的數據分析為學生提供個性化學習建議(教育部,2024)。此外,芬蘭在電腦化測驗中引入創新的開放式題目,強調學生的創造力與批判性思維(Apiola et al., 2019)。這些實施計畫展示了不同國家在推動電腦化測驗中的多樣策略,為全球教育評量提供了重要的參考與啟發。
電腦化測驗的優勢涵蓋多個層面。首先,其能顯著提升試題的互動性與真實性,透過動畫、聲音或多媒體的呈現方式,使試題更具吸引力與實用性。例如,在語言測驗中,學生可以直接聽取語音問題並進行回答,而科學測驗則可利用模擬實驗的方式,讓學生在虛擬環境中操作,進一步測試其理解能力。一項研究顯示,電腦化測驗能提高學生參與率約20%,特別是在語言與科學測驗中更為顯著。其次,電腦化測驗有效減少了印刷與運送成本,據估算,美國某州推行電腦化測驗後,每年節省約30%的相關支出,不僅降低了教育機構的財政負擔,也對環保產生了積極的影響,符合現代社會對可持續發展的要求。另亦可減少測驗重複性工作,電腦化測驗使得試題庫和評量工具的管理更為高效,並有助於試題的快速更新與維護。此外,電腦化測驗還能擴大參與範圍,尤其是對因病無法到校的學生提供了便利,使其能在家中完成測驗,促進教育公平性。
然而,電腦化測驗的推行也面臨諸多挑戰,技術限制與教育資源的不平等問題尤為突出。根據相關調查,日本超過八成的公立學校網路速度未達標,這可能對測驗的順利實施構成阻礙(駐日本代表處教育組,2024)。網路設備的不足不僅影響測驗過程的穩定性,還可能導致學生在測驗中因技術問題而無法正常發揮。此外,教育資源分配的不均也使得部分偏遠地區或經濟困難的家庭無法獲得足夠的設備支持,進一步加劇了教育的不平等。
為應對這些挑戰,各國正探索多元化的解決策略。例如,韓國政府大力投資教育科技基礎設施,確保偏遠地區學校也能獲得高速網路和必要設備,成功提高了測驗的穩定性和覆蓋率。同時,芬蘭推行免費設備計畫,為經濟困難的家庭提供學習平板,降低電腦測驗的不平等風險。這些成功案例展示了改善基礎設施與資源分配的可能性,為其他國家提供了寶貴的參考經驗。
因此,在推動電腦化測驗的同時,如何改善基礎設施、縮小教育資源的差距,將是各國政府與教育機構需要共同努力解決的關鍵課題。例如,韓國的教育科技計劃投資改善偏遠地區的網路設施(教育部,2024),而芬蘭則通過免費平板計畫有效支持經濟弱勢家庭(Apiola et al., 2019)。唯有克服這些挑戰,電腦化測驗才能真正發揮其應有的潛力,為教育評量帶來全面的革新與進步。
四、「班班有網路、生生用平板」政策
因應全球電腦化測驗的趨勢,教育部於2022年也推出「班班有網路、生生用平板」政策(教育部,2022),相關重點摘要如下:
(一)政策目標:縮短城鄉教育差距;提供每位學生平板電腦,提升數位學習環境,促進教育數位轉型。
(二)政策執行內容:
1. 設備提供
平板電腦:每位學生獲得一台平板,內建學習應用程式。
配件:提供保護套、鍵盤等必要配件。
2. 網路建設
校園網路:改善校園無線網路,確保穩定連接。
偏鄉支援:提供網路基礎建設,支援偏鄉學校。
3. 教師培訓
數位素養:培訓教師數位教學能力。
課程設計:協助設計適合平板的互動式學習課程。
4. 學校合作
資源整合:鼓勵學校與企業、團體合作,提供更多資源。
經驗分享:建立平台,分享各校實施經驗與最佳實踐。
5. 評估與改進
定期進行政策評量,收集師生反饋,根據實際需求調整政策。
(三)政策成效評估機制
1. 學校自評:檢視平板使用及教學成效。
2. 師生調查:收集滿意度、學習成效及使用障礙。
3. 學習成效評估:透過測驗與成績變化進行學習成果評估。
4. 實地觀察:派遣專人觀察平板在教學中的實際應用。
5. 數據分析:分析學習平台數據,了解學習情況。
6. 專家評估:邀請教育專家提出建議。
7. 定期報告:發布執行報告,公布成效與改進方向。
(四)國際經驗借鑒
基礎設施建設:芬蘭強調改善校園網路。
教師培訓:新加坡重視教師數位素養培訓。
內容與資源:加拿大提供大量數位學習資源。
評估與反饋:英國定期評估政策成效並調整。
公平性考量:澳洲對偏遠地區提供額外資源支持。
教育部「班班有網路、生生用平板」的政策透過提供平板設備、改善網路建設、強化教師數位素養及建立多層次的成效評估機制,致力於縮短城鄉教育差距,推動我國教育的數位轉型。借鑒國際成功經驗,此政策不僅改善學習工具與環境,更深化了教學互動與學習成效,為學生未來的數位素養發展奠定基礎,展現提升教育公平與競爭力的長遠目標。
五、試題設計與學力檢測中的公平性
試題設計在學力檢測中扮演關鍵角色,其核心在於協調學生高層次思維能力與基本學科能力的評量,並力求全面反映學習成果。例如,日本學力檢測中首次融入程式設計相關題目(駐日本代表處教育組,2024),這類題目不僅檢測學生的技術能力,更注重其解決真實世界問題的能力,體現了學科知識與實用技能相結合的理念。根據一項調查,學生在面對這類題目時的解題能力有顯著提升,特別是在分析與邏輯推理方面表現更加突出。此外,跨國比較研究顯示,引入此類題目的國家中,學生的創新思維能力平均提高15%。這種設計超越了單純回顧知識的範疇,實現對邏輯推理、創新思維與應用能力的綜合評量,進而增強測驗結果的代表性與實用價值。
然而,公平性作為標準化測驗的核心問題,始終是試題設計面臨的主要挑戰之一。低收入家庭的學生由於資源稀缺,在測驗準備中可能面臨多重劣勢,如缺乏學習資料、缺少專業輔導或無法參加課外活動等,進一步擴大了教育不平等。例如,一項針對美國學校的研究顯示,低收入家庭學生在標準化測驗中的平均得分比高收入家庭學生低20%,其中部分差距可歸因於準備資源的不足(Munir et al., 2023)。此外,發展中國家某些地區的學生因缺乏基本的網路和技術支持,無法參加電腦化測驗,進一步限制了其教育機會。這些不平等不僅影響測驗的信度與效度,還對教育政策的設計與實施構成挑戰。
為應對此問題,政策制定者應採取針對性措施以減輕教育不平等的影響,例如提供免費或低成本的學習資源,設立專門支援弱勢群體的輔導計畫,或在校內實施多元化教學方式,促進所有學生在公平基礎上的成功。例如,韓國政府通過大規模的教育資源補助計畫,使偏遠地區的學生獲得了與城市學生相當的學習機會。此外,一項針對芬蘭的研究顯示,免費設備計畫顯著改善了經濟弱勢家庭學生在電腦化測驗中的表現(Apiola et al., 2019)。同時,測驗設計者需謹慎避免試題過度依賴特定文化或經濟背景,確保試題內容能反映學生能力而非背景條件,從而進一步推進教育公平的實現。
因此,試題設計與學力檢測的公平性不僅是一項技術挑戰,更涉及教育資源配置與政策調整的宏觀層面。例如,韓國的教育科技計劃成功改善了偏遠地區的學校基礎設施,使學生能夠公平參與標準化測驗(教育部,2024);而芬蘭則通過免費學習設備計畫,有效支持經濟弱勢學生的電腦測驗參與(Apiola et al., 2019)。只有在試題設計中融入多樣性與包容性,並透過政策介入縮小教育差距,才能實現學力檢測的公平性目標,最終為所有學生提供均等的學習與發展機會。
六、結語
測驗評量的角色在教育進程中將持續深化,特別是在電腦化與公平性兩大主題上展現出關鍵影響力。從PISA(國際學生能力評量計畫)到AHELO(高等教育成果評量計畫),以及日本電腦化學力測驗的推行,這些發展不僅代表教育測驗形式的技術革新,更揭示出全球教育評量對多樣化需求的適應與挑戰。
電腦化技術雖顯著提升了測驗效率和覆蓋範圍,卻也暴露了基礎設施不足與電腦落差等問題,特別是資源受限地區尤為明顯。教育部透過「班班有網路、生生用平板」政策,進行設備提供、網路建設、師資培訓及成效評量等措施,逐步提升數位學習環境,縮小城鄉教育差距,並借鑒國際經驗,確保政策有效推行及持續優化。此政策的實施,由PISA2022的表現,可以看出學生電腦化測驗具體的成效。此外,公平性問題涉及的不僅是技術操作層面,還包括文化背景、語言多樣性與教育資源分配的結構性不平等。未來的測驗設計若能兼顧技術創新與公平性整合,將更能呼應全球教育系統的發展需求。
因此,測驗的未來發展必須以學生需求為中心,融合創新科技與人文精神。通過細緻設計,考量不同文化與社會背景學生的需求,方能達成教育的核心目標:實現真正的學習機會平等,並推動全球教育的永續發展。
參考文獻
教育部(2022)。推動中小學數位學習精進方案班班有網路生生用平板。
教育部(2024)。2024數位學習國際論壇。113年8月6日至8月7日於台北美福大飯店。
駐日本代表處教育組(2023)。日本實施小6及國3學生之全國學力檢測。國家教育研究院臺灣教育研究資訊網。
駐日本代表處教育組(2023)。日本中小學學力測驗方式將增列使用電腦。國家教育研究院臺灣教育研究資訊網。
駐日本代表處教育組(2024)。日本國中小學全國學力測驗將改以電腦化測驗。國家教育研究院臺灣教育研究資訊網。
駐美國代表處教育組(2024)。部分大學恢復SAT與 ACT標準考試成績為入學必備要件。國家教育研究院臺灣教育研究資訊網。
駐紐約辦事處教育組(2023)。高教學習成就評量:PISA測驗的延伸。國家教育研究院臺灣教育研究資訊網。
Apiola, M., Karunaratne, T., Kaila, E., & Laakso, M. (2019). Experiences from Digital Learning Analytics in Finland and Sweden: A Collaborative Approach. 627-632. 10.23919/MIPRO.2019.8757204
Munir, J., Faiza, M., & Daud, S. (2023). The Impact of Socio-economic Status on Academic Achievement. Journal of social sciences review, 3, 695-705. 10.54183/jssr.v3i2.308
附加檔案
電腦化測驗 (另開新視窗) 教育公平性 (另開新視窗) 標準化評量 (另開新視窗) PISA (另開新視窗) 數位轉型政策 (另開新視窗)