請說說您在劍橋領思考試研發中的工作內容。
我主要參加了新的劍橋領思口語測試研發工作,負責設計並開展實證研究,以探索對測試有效性的潛在威脅,並收集支持(或否定)劍橋領思測試分數在不同環境中的解讀和使用情況的有效性證據(或反證)。 根據研究結果,我提供測試設計的建議並確保劍橋領思公開資訊的準確性。
劍橋領思與其他考試不同的地方是什麼?
劍橋領思考試在運用尖端語言測評技術方面是獨一無二的。劍橋領思閱讀和聽力二合一測試是電腦自我調整的,這意味著測試內容是根據應試者表現量身定制的,從而能實現對其語言能力的精確評估。我們進一步提升劍橋領思寫作測試的自動評分技術品質,使其可即時對寫作部分進行評分。
您在開發劍橋領思時有什麼心得?
我認識到提升相關單位對語言測評技術的認識是非常重要的。例如,教師、學習者和其他測試用戶會無法立刻理解劍橋領思中的電腦自我調整測試和自動評分概念。這意味著我們需要對此作出解釋,打開幕後的“黑盒子”,以確保劍橋領思考試運用得當,並對語言教學產生正面影響。
如今劍橋領思已經問世,就產品和市場接受度而言,您最滿意的是什麼?
我很高興聽到許多試用過劍橋領思考試的英語學習者說,劍橋領思評估了日常交流所需的基本英語技能,而且上機測試並沒有影響他們的發揮。
您覺得劍橋領思在未來兩到三年內會如何發展?
劍橋領思將不斷探索將尖端技術與英語測評相結合的新方法。
您目前在研究什麼?
我目前在做自動評分品質保證方面的研究專案。還在寫一篇關於自動口語測試原型的研究論文。
考慮到人工智慧的應用情況,您覺得以後的電腦機考會如何變化?
隨著人工智慧用的越來越多,機考會變得更加個人化,並更加以學習者為中心。除了能指示語言能力的各個等級外,人工智慧還能夠準確診斷語言學習者的優缺點,以幫助打造量身定制的教學材料和學習活動。
同時,它將有助於減少基於機考帶來的干擾。例如,在學習者在電腦上進行學習時,人工智慧可以同時進行風險較低的評量。總之,可以預見,語言學習和評量在不久的將來會無縫接軌。
在今後五年內,是否還有影響語言學習和測試的其他主要趨勢?
科技的快速發展應該會對語言學習和測評產品的設計產生巨大影響。在今後五年內,可能會出現的一個突出趨勢是人工智慧教師。它們能幫助人類教師給作業評分,設計課內外活動,對學生學習情況進行形成性和總結性評估,並追蹤學生的學習進展,從而能大大減少人類教師的工作。