“学习性评价”于1998年在国际教育界首次提出,随后《黑箱内:通过课堂评价来提升标准》发表,国际教育界开始了“学习性评价”的推广应用,掀起一场学校教育的革新。
近十来年,“测评与学习”也受到中国教育界关注。但是,相对而言,中文里的测试、考试(或测评)、评价等词的含义,更接近英语单词test、assessment、evaluation。
在中国的学校教育中还难以看到“形成性评价”“以学习为导向的评价”等模式的实践,更多的还是各种传统的学科测验,以及被学生戏称为“周周爽”“月月爽”的考试。
新高考推行后,逐年形成的大数据,使得测评对教与学的提升成为可能。
竞争性测评推动应试学习模式
升学考试、公务员考试、律师资格考试……大多数竞争性的测评都会产生成功者和失败者、高成就者和低成就者,绝大多数人很难在考试中实现优秀、获得自尊,只有极小部分人才能从中获得奖励和自信。
虽说不断进步的技术保证了大规模测评的科学性、客观性,其标准化、集约化的高效率也很好地回应了社会与公众的要求。但是众所周知,这种由一次测试决定结果的终结性评估方式只能反映被测学生过去的积累,而并非全部能力,也无益于学生在学习上的自我完善与能力提升,反而会引起更大的考试焦虑,形成强烈的应试学习模式。
以最近四十多年的高考为例,过去极低的录取率使升学竞争十分激烈。尽管高考是由多门科目的测试所组成,但较之单门科目分数的得失,人们往往更关心总分,对总分的关心也是集中于其在总体中的排名是否达到了大学的录取分数线标准。
虽然命题专家围绕课程标准、教学状况和高校选拔要求对各科试卷进行了精心开发与设计,也对考试过程和评卷质量进行了精确控制,但结果仅仅是各门科目总分的反映,实在令人非常无奈。由此所形成的以模拟考试代替教学的高强度应试局面也是必然的结果。
新高考为测评发挥正向作用提供基础
从1999年起,国家增加高等教育投入,不断扩大大学的招生规模,使得高考的录取率连年提高,各地区普遍在80%左右、甚至有超过90%,但是业已形成的应试教育模式难有根本改观,高中学生普遍是早晨7点踏进教室、晚上9点离开学校。
正是在这样的背景下,国家坚决推出了高考综合改革方案。
从测评的视角看,新高考被分成了两个部分:即所有学生参加的语文、数学、外语科目的统一考试,与思想政治、历史、地理、物理、化学、生命科学科目的高中学业水平考试。
而高中学业水平考试又根据学习的深入程度分为统一参加的合格性考试和选择其中三门参加的等级性考试。即把一部分科目的测评以常模参照呈现,作为个体学生与其他学生的比较,而另一部分科目的测评以标准参照呈现,以期降低测评整体的竞争性。
因为学业水平考试的标准参照还是与得分率分布相联系,依然呈现出高利害性。但是学业水平考试的定位与设计,评价维度与指标体系,使得评价标准的意义得到体现,为测评对教学和学习的正向反拨奠定制度基础。
完善的测评回归其评价与推动教育的作用,提升了高中教育质量
就上海而言,2014年启动新高考,由于政策、环境的稳定,特别是高考总分分布的稳定可期,促使大家越来越关注如何通过测评提升高中培养质量。
目前,各考试科目依据不同的定位,兼顾知识学习与能力提升,辅之以系统的学业评价标准,从内容和能力两个维度,通过相应的各分项指标形式得以呈现。
因此当学生完成考试以后,他所获得的反馈还包括根据评价维度所描述的各分项指标以及对应的得分情况,学生可以了解自己的学习情况以及在群体中的相对位置。
对于各科目的高中学业水平考试,学生更可以通过合格性考试的成绩报告,发现自己在科目学习上的长处与短处,以完善下一步的学习,并争取在等级性考试中取得好成绩。
我们通过上述方法所形成的学校和区域的成绩报告,对改善学校的教育教学起到了促进作用。
如考试数据表明,上海师范大学附属中学闵行分校在思想政治科目合格性考试上的表现非常突出,他们的学生在内容领域和能力目标评价维度各分项指标上的得分率每年都比前一年有进步。
如果以2017年该科目平均成绩的位次为基准,则2018年比2017年在全市提升了23名,2019年又比前一年提升了65名。
闵行第三中学,在思想政治、地理、化学、生命科学四门学业水平等级性考试科目上的进步也很显著,各科目的整体成绩排位三年来实现了两位数的增长。经深入调研,闵行区是很好地运用了学校和区域的成绩报告信息,区教育学院通过集体分析反馈和分学科到学校指导相结合的办法,对学校的学科教学进行了有效干预,提升了学生的学习质量。
测评的目标指向是学习。在高考综合改革之前,测评的功能是以科目总分的方式实现学生学业的评价与筛选;在新高考的推动下,测评还能够依据所建立的学业评价体系给予多维度多指标的分析评价,实现对教与学的正向反拨;未来还可通过更多分析工具、更多分析视角探索测评与教和学的深度融合,即把测评贯穿于学习过程中或者教学过程中,更有效地促进学习、促进学习质量的提高。
从不同维度分析学生测评大数据,对学校的教学有不同的改善空间
在前期的工作基础上,我们尝试不同的分析方法与工具,对考试数据进行分析和挖掘,并反馈所获得的有用信息,以促进学校教学质量的提高。我们采用统计中的聚类方法(Cluster analysis)进行评价维度的综合聚类,结果发现,对于学校来说,不同学科从不同维度来分析,可以得出不同的评价结果,而且对于不同的学校都有不同的需要提升之处。
仅以2019年数学科目高考学生的成绩来分析各高中的数学教学情况。
数学科目按照内容领域和能力目标两个维度进行评价设计的,150分的试卷试题中——
分属内容领域维度的四个分项指标:方程与代数(占40分)、函数与分析(占43分)、数运算数据整理和概率统计(占13分)、图形与几何(占54分);
分属能力目标维度的五个分项指标:数学基础知识与基本技能(占61分)、逻辑推理能力(占19分)、运算能力(占19分)、空间想象能力(占19分)、数学应用与探究能力(占32分)。
为保证分析结果的统计意义,我们确定204所高中学校的39000多名学生为分析对象,他们参加了2019年本市的高考数学科目考试且得分都位列前95%,并且每所学校的实际考生人数都大于或等于50。
我们以学校为单位,分析各学校的每位学生在各评价维度相应分项指标上的得分率,寻求他们的共性,以呈现不同学校的类型和特点,希望能为学校的教学提供参考。
根据计算,204所高中学校从内容领域维度得分上被分为了五类。这五类所含学校数目不等,分别是26所,49所,59所,41所和29所。
仅以其中两类为例,我们可以发现,包括上海中学等人们通常所说的“四校八校”在内的29所学校被归为一类,这些学校都是近年来表现突出的优质高中学校。包括天山中学、复旦中学等在内的49所中学被归为另一类,也都是公认的好学校。
从内容维度来分析,可以得出的结论是——学生在试卷上的得分可以反映出这些学校的教师在数学科目内容知识的教学是成功的。
但是,如果对能力目标维度也进行了综合聚类分析,同样将学校分为五类,却发现上述29所学校中有10所学校形成了单独的一类,无疑,单单根据这一年的数据来看,这10所学校是两个维度下综合聚类分析表明最好的一类学校。
上述29所学校中的其他19所学校与49所学校中的22所组成了能力目标维度综合聚类分析结果中的单独一类,这意味着这些学校的学生在高考答题时,在这一维度上有相似性。
虽然不同的分类方法会给出不同的结果,但是通过多元的观察视角,结合具体维度的分项指标,就不难发现教与学改善的空间。
>>>相关链接:
按照教学内容维度分类:
以下29所学校被归为一类(排名不分先后):
格致中学、格致奉贤、大同中学、南洋模范、上海中学、位育中学、延安中学、市西中学、曹杨二中、市北中学、复兴高中、控江中学、交大附中、复旦附中、七宝中学、华二紫竹、交大闵行、行知中学、交大嘉定、建平中学、进才中学、华师大二附中、复旦浦东、市实验学校、上外浦外、金山中学、松江二中、复旦青浦、奉贤中学。
49所学校归为另一类:
向明中学、向明浦江、大境中学、敬业中学、市二中学、南洋中学、中国中学、徐汇中学、西南位育、市三女中、天山中学、复旦中学、育才中学、晋元高中、宜川中学、曹杨中学、曹杨二中国际班、新中高中、风华中学、六十中学、彭浦中学、久隆模范、华师大一附中、北郊高中、虹口高中、北虹高中、杨浦高中、同济一附中、上师附中闵行、闵行中学、莘庄中学、上外闵行、上大附中、吴淞中学、罗店中学、嘉定一中、上中东校、南汇中学、上师大附中、洋泾中学、东昌中学、高桥中学、川沙中学、华师大三附中、松江一中、青浦高中、朱家角中学、曙光中学、崇明中学。
按照能力目标维度分类:
南洋模范、上海中学、交大附中、复旦附中、七宝中学、华二紫竹、交大闵行、交大嘉定、华师大二附中、市实验学校等10所学校形成了单独一类。
格致中学、格致奉贤、大同中学、位育中学、延安中学、市西中学、曹杨二中、市北中学、复兴高中、控江中学、行知中学、建平中学、进才中学、复旦浦东、市实验学校、上外浦外、金山中学、松江二中、复旦青浦、奉贤中学、向明中学、向明浦江、市二中学、徐汇中学、西南位育、复旦中学、育才中学、晋元高中、曹杨二中国际班、新中高中、华师大一附中、杨浦高中、上师附中闵行、闵行中学、上大附中、吴淞中学、嘉定一中、上中东校、上师大附中、洋泾中学、川沙中学、青浦高中等40多所学校也组成了能力目标维度综合聚类分析结果中的单独一类。
(作者为上海市教育考试院院长,本文根据考试评价国际研讨会主报告节选)
作者:郑方贤
编辑:李晨琰
责任编辑:樊丽萍
*文汇独家稿件,转载请注明出处。|图源:pixabay