測評中心研習活動「電腦適性化測驗專題演講」摘要

| 謝名娟

【文、圖/測驗及評量研究中心副研究員 謝名娟】

為提升測評中心研究同仁的專業知能,特邀旅美學者辛慶偉博士與簡月梅博士於8月七日下午至本院演講,講題為電腦適性測驗於閱讀測驗的應用。辛博士與簡博士均畢業於美國愛荷華大學測驗統計學系,辛博士畢業後在Pearson Education 心理計量部門擔任首席研究員(principal Research Scientist)的工作,而他的專長是研發與設計電腦適性測驗的線上施測系統。而簡博士則在Pearson Education擔任資深研究員(Senior Research Scientist),簡博士具有深厚的電腦程式基礎,主要工作為執行適性測驗的相關模擬研究。兩位博士均屬於實務型的學者,目前在Pearson所研發的電腦適性軟體,廣為美國各州使用,每個月上線人數都有七、八萬人次。

演講中由辛博士主講、簡博士補充說明。其演講內容精彩豐富,深入淺出,共分為六個部份,第一部分為介紹最新美國測驗相關政策PARCC(the Partnership for Assessment of Readiness for College and Careers)SBAC(Smarter Balanced Assessment Consortium),這兩種測驗都是以電腦化測驗為主。而第二部份則簡介電腦適性測驗的相關理論,包括題庫建置、起始點的設立、選題演算法、能力參數估計與測驗結束的機制。 第三部份則介紹適性測驗的優勢,然而,演講中也提到理論和實務之間的衝突,透過理論、文獻提出最佳、最準確的施測方法,實務不見得可行。像是一般適性測驗,題庫的試題量應為施測量的8~12倍,但真正在執行時,龐大的出題成本會造成公司執行上的壓力。因此要透過不停的模擬,找出雖然不是最為精確、但是最節省成本、且執行者、委託者都能大致接受的題庫量來進行施測。第四部份則是紙筆測驗、電腦化測驗到發展電腦適性測驗的相關考量因素。這部分提到了如何進行題目預試、等化、標準設定等,每種技術性考量都和紙筆測驗有很大的不同。第五部分則舉出了閱讀的電腦適性測驗,由於閱讀試題多為題組,因此選題的考量相當的複雜。最後一部分則提出了研究方向,如何跟認知診斷的概念結合?如何找到最佳的試題題庫量? 如何進行預試等,這些都是值得研究者深思的新興議題。

會後,辛博士與隨行的簡博士熱情解答同仁的相關問題,而所有與會同仁、長官們都覺得獲益良多,並期盼未來能與兩位旅美學者有更多學術交流的機會。