在中国,对于应试考试的负面影响,不乏尖锐的批评。也有声音认为,考试是最公平的竞争,目前还没有其他的替代方式。
随着AI在教育测评领域的应用,考试、作业等传统的教育测评方式逐渐被打破,创新型教育测评手段迅速开发并推广。同时,也需要警惕新技术带来的负面影响。
近日,由中国教育三十人论坛、香港大学教育政策研究中心、田家炳基金会、深圳香港培侨书院龙华信义学校联合举办的第七届世界教育前沿论坛举行。多位专家学者以及一线教育工作者讨论了教育测评改变的路径和方法。
打破传统测评手段
教育测评具有深刻的社会和时代背景。当今社会,常规认知技能的需求正在下降,技术密集型任务增加。考试、作业等传统教育测评的有效性逐渐被打破。
在论坛上,经济合作与发展组织(OECD)教育与技能司司长、“PISA之父”安德烈亚斯·施莱歇尔介绍,当ChatGPT回答最新(2022年)的PISA测评的问题时,它在阅读方面表现得比15岁学生还好,但在数学方面,学生的成绩仍领先。不过,AI的数学能力进步迅速,将很快赶上15岁学生的水平。
安德烈亚斯·施莱歇尔认为,我们需要改变评估方式。学校应该帮助学生理解他们的存在意义、价值观、热爱的事物以及他们想要实现的目标,这需要个性化的教育和评估方法。
韩国江原大学副教授申铁均在论坛上分享了韩国在2013年开始实施的“免考试学期”计划。这一计划是为了克服填鸭式教育、标准化考试制度、低学习动机和过度竞争等问题而开展的。
“免考试学期”通常是中学一年级的第一学期,不进行期中和期末考试,而是开展过程性评估,教师在学生档案中记录学生的教育活动——换句话说,是有“评估”没“考试”。
标准化考试取消的同时,课时也相应减少,以更多开展“免考试学期”活动,如职业探索活动、艺术和体育活动等。
申铁均介绍,“免考试学期”计划的意义在于,它有助于摆脱以考试为中心的竞争教育。教师在“免考试学期”里需要调整课程结构,并实行以学生为中心的班级管理。因此,体验过“免考试学期”的学生对学校的满意度更高。
香港培侨小学校长吴佳筠也介绍,学校原先每学期都有期中和期末考试,但后来认为单一的试卷不能全面反映学生的能力,因此取消考试,转而采用多元化评估方式,包括实际操作、实验、文字应用等,强调在评估过程中观察学生的知识运用、技能、创造力和态度。
例如,五年级学生在学习“地方描写文”后,要选择一个地方进行研究,并扮演小导游向同学介绍,同时制作PPT进行展示。评估标准非常详细,包括内容、结果,甚至口头报告的声量等。四年级开展大规模的综艺课程,学生选择自己喜欢的项目学习,最终通过全年级同学共同完成的音乐剧表演来展示学习成果。
技术与教育测评的革新
依托大数据分析、机器学习、自然语言处理等先进技术,全球范围内,教育测评正从传统的纸笔考试模式,向着智能化、个性化的方向迈进。
在论坛上,香港圣公会阮郑梦芹银禧小学副校长李伟铭分享了一个案例,该校六年级学生阅读二年级学生创作的故事,不仅进行有趣的讨论和思考,还利用AI技术创作相关主题的图片。
李伟铭认为,AI时代要求教师重新思考作业的目的和方向,从简单的理解、牢记转向更高层次的创作。教师不再是权威的知识传授者,而是知识的共享者和引导者,与学生一起学习和反思。教师需要思考如何赋能学生,鼓励他们互相评论、评审和评赏,以促进学生的进步。
江苏省常熟中学教师苏建玉分享了AI技术融合课堂教学的实践。她谈到,AI技术能够辅助作文批改,节省了她的时间,让老师有更多精力投入到课堂互动中。
对于学生来说,AI能够促进个性化学习,提供包括电影、文学和新闻在内的优质学习资源,帮助学生更深入地理解语言的实际应用等。AI还通过生成故事、音频、视频和思维导图等方式,提升学生的数字素养和成就感。
深圳市宝安中学(集团)校长袁卫星介绍了教育测评的创新案例。比如,学生们在设计文创产品的过程中,不仅学习美术设计,还要进行项目推销、文化研究、材料采购和产品制作,最终以产品发布会的形式向虚拟客户推销自己的作品。这种跨学科融合的测评方式,强调实践操作和创造力,让学生在参与中学习。
袁卫星认为,教育测评应基于需求,以学生为中心,根据学生的感受调整测评的频率和难度,真正体现学生为主体、教师为主导的教学理念。
AI给教育测评带来挑战
AI为教育测评提供了更为高效和个性化学习的机会,但也带来了一系列技术和伦理挑战,包括测评结果的公平性、技术故障等问题。
湖南师范大学教授杨志明曾使用ChatGPT写了一篇关于“创新人才培养”的“八股文”,按照高考作文满分60分的标准,13位专家给出的分数为49分,ChatGPT给自己写的这篇文章打了54分。
杨志明谈到,AI的发展带来许多机遇,例如通过自然语言处理技术,人机可以直接用自然语言进行交流,大数据和神经网络的发展使得处理海量数据成为可能,量子芯片更是展示了算力上的突破等。
“在目前的技术水平下,AI可以作为助手,但还不能完全担任主角,因为这样做可能会带来较大的风险,就像现在没有人敢完全依赖AI开出的药方一样。”杨志明指出,AI可能存在数据偏见,导致考试题目对某些文化群体或种族存在不公平,AI的评分标准可能与人类存在差异,考务管理可能存在安全风险等。
伦敦大学学院教育与社会学院教授韦恩·霍姆斯指出,在教育领域引入AI工具,一个关键问题是缺乏独立证据来验证这些工具的安全性、有效性和对课堂的影响。虽然这些工具可能已经经过某些测试,并声称具备有效性和安全性,但实际上缺乏独立证据来支持这些说法。
他指出,这种情况可能导致孩子们成为未经充分控制的实验对象,这与科学实验应在良好道德控制下进行的原则相违背。韦恩·霍姆斯建议将AI工具的使用从无根据的尝试转变为基于充分证据的技术应用。
(文章来源:21世纪经济报道)