■侯杰泰
教育质量的监测现在成为全世界都关注的话题,教育质量是否提高,对于不同的人来说,比如家长、学生、主管部门和学校往往会有不同的感受。从2000年开始,我们从PISA的题库中挑选出了一批题目进行了大数据分析,来看PISA是如何来监测教育质量,再对比我们目前不少地区正在进行的教育质量监测,可以发现,不合理的教育质量监测方式,也许会使我们的教育与我们的期望南辕北辙。
对教育质量的监测与学校评价指标挂钩使得学校不可避免地操练学生
这个世界上的教育正在发生什么?亚洲几乎所有的国家,不论巴基斯坦还是瓦努阿图,几乎都在对所有的学校和年级进行持续的教育质量监测。中国也在做学生的学业质量监测考试,定期监控所有学生的成绩,再根据所有学生的成绩,得到一个班级、一个年级、一所学校,乃至一个地区的成绩,最终汇总成我们的教育质量。
但是,近两年来,欧洲、美国很多地方的学生、家长都反对质量监测。最重要的原因就是,现在的教育质量监测使得我们学生的负担越来越重,并且不可避免地陷入到了一种应试的操练之中。
最简单的就是,现在所有的教育质量监测都对学校的各种评价指标有着直接的影响,在这样的情况下,学校和老师必然会想方设法提升学生的表现,经验告诉我们,所有有责任心的老师都知道要想考好成绩,只有一个方法就是加班加点,老师和学生一起加班加点去应付考试。
学生不可避免地成了“陪葬品”。因为教师必然要操练学生。虽然家长会支持老师给学生多一点操练,但是一旦孩子回来说,每天晚上功课要因此做到12点,那么家长必然会反对。当然,也有家长愿意选择这样的生活。因为从某种程度上来说,考试为一部分人提供了改变命运的机会,所以他们希望考试,根据分数来评定学生。
但是,大多数情况下,在家长反对的重重压力下,教育主管部门为了减轻学校操练的压力,解决方法就是———只监察低能力水平,避免追求高分数所带来的操练。比如香港只列出合格线;美国的NCLB(不让一个孩子掉队),只监察最低级;有些地方原本分四级监控的,现在只有是否达标。
然而,是否达标这一监控线,对于政府和学校来说信息太少。因为这些只关注基本能力的题目对学生来说很容易,在各个能力区的分数敏感度都很低。而且为了避免学生感觉困难,题型也非常狭隘。这就造成了只有几种题型主导课程教学,这样的测试并不理性。对很多学校来说,这样的监测做和不做,并没有什么影响,不做也知道学校合格率是85%以上。如果题目太浅了,对于好一点的学校意味着———这样的考试是浪费时间。
更令人担忧的是,如果所有的题目都只监测最低等级,那么这些题目就必须要保证大多数学生合格———那就意味着这些题目必须人人会! 仅以香港为例,很多家长希望这些考题自己的孩子都见过,甚至有时候学生考到的题目没有见过,家长就会责怪教育质量监测机构———“每年都出新的应用题,小孩要操练得越来越辛苦!”于是老师为了保证所有的题,学生都见过,就要编很多新的应用题让学生训练,这就出现了题海战术。
这也是为什么现在中小学的校长们有很大压力的原因。因为我们现在要如何培养学生呢———猜怎么出题。为了应对各种质量监测以及各种考试,老师会猜考试的题目,也许也会出一些很多其他地方都没有见过的题。如果监测时准备出100道题,他就会出2万道题,他要保证你的100道题在这2万道题中。
如果考的题目学生全部见过,那我们考的是他的能力还是考他的记忆力?我们的目标是考素养,但如果这样的考试,那就是考记忆力。
那么当我们不断在考记忆力的时候,学生操练得到的回报是高还是低?在这样的情况下,操练更加厉害。
事实上,我们的调查发现,经过十多年的训练,每个地方都或多或少出现这些问题。
教育关注的应该是增值,而非绝对值
事实上,教育质量的监测如果只设立合格线,那对教育质量是徒劳无功。因为教育应该关注的是增值,而不是它的绝对值。
一讲绝对值,所有学校都无需提升教学能力,也无需提升教育质量。因为如果招收的学生是最好的学生,那么毕业的时候成绩必然好。所以我们永远应该关注教育的“增值”部分才对。
如果一所学校能够使得学生的质量提升迅速,那么这样的学校才是有着优质的教育。所以,当我们监测一所学校的教育质量时,我们关注的应该是学生在这所学校的分数的提升,是跨年的质量波动。
事实上,现在连PISA每年的测试都在改变。2000年PISA的监测内容与现在的监测内容相比已经有了很大的变化。
2000年至今PISA测试在检查学生的能力、兴趣、自信等方面,共用了70多组的题目,每组含几道题目。然而70多组的题目,没有一组题目每次都用,除了性别。有55组题目只用过一次。而且PISA测试都是紧贴当前教育最关心的议题,比如网络成瘾,十几年前就没有这类题目。
对于我们的教育主管部门来说,并不需要监控所有的学校都必须“合格”,而必须监控所有的学校都在进步。教育质量监控的重点不是从接受质量监控的100所学校中找到最差的5个学校,而是希望这100个学校都进步。这也是PISA测试的科学之处,它的测试是希望所有国家都有进步,他不是找全世界最差的国家,而是我们每年验收检查,了解所有国家都有改进的地方,到最后大家都有改进。
而且,对于教育来说,过于频繁的教育质量监测并不好。因为秤猪不会让猪更肥,反倒是减肥一定要买秤。教育质量监控也不是只考学生常见的题目,这样的监控使得我们无法知道我们究竟在考学生的记忆力还是在考学生的理解力,而且只会让学生操练得更厉害。
教育质量监控不应该只监控学校教学
在我们所谓的质量监测中,很多变量是教育领域的专家是很难关注的。我们测的质量究竟是什么质量? OECD的很多题目中其实都是很有道理的也值得我们思考:
1.改善学生学习能力,最有效的两种方法是什么? 改善学习有什么方法?
2.小学三年级与初中三年级,上床就寝时间相差多少?
3.初中三年级,能有八小时睡眠的学生,占百分比多少?
4.初中三年级,男生还是女生更迟睡觉?
5.若只能睡六小时,早点睡觉是否更好?
6.家中藏书越多成绩越好?
7.焦虑越高的学生,睡眠时间越短?
8.高社经地位的学生成绩更差?
9.高社经地位家长更经常与学生探讨学校生活?
10.孩子总是认为父母 (经常/很少) 与他们讨论学校生活吗?
11.初中学生,百分之多少每天吃早餐?
12.男女吃的早餐种类有何分别?
13.家庭社经地位较高的学生,更常吃早餐吗?
14.早餐对贫或富学生的贡献有分别吗?
15.班中较早月份出生学生 (年龄大数个月) 成绩更佳吗?
调查发现,家庭文化程度、家庭的收入、孩子是否运动、孩子是否早睡、家长是否跟孩子讨论学校生活与孩子的成绩相关。有没有吃晚饭,有没有闲谈,其实这类题目都是PISA里最好的题目。尤其是否吃早餐对学生的学业成绩很重要。
说到底,我们的任何监测都是为了改变教育,而不是监控教育。
(作者为香港中文大学教育心理学卓敏讲座教授,也是PISA2018香港地区的主要负责人,此文根据他在华东师范大学课程与教学研究所主办的上海国际课程论坛上的发言整理)