2005年,浙江省的杭州市余杭区、宁波市北仑区、义乌市三个国家基础教育课程改革实验区,首次实行了与新课程相配套的初中毕业生学业考试与高中招生制度改革,并取得了良好的效果。初中毕业生学业考试(以下简称“学业考试”)是初中毕业和高中招生制度改革的重要组成部分,“是义务教育阶段的终结性考试,目的是全面、准确地反映初中毕业学生在学科学习目标方面所达到的水平。”[1]学业考试是在中等学校入学考试(以下简称“中考”)基础上进行的变革,但无论是考试的背景,还是考试的性质和任务,学业考试都有别于中考,因此,学业考试应有其独特价值追求和实现的路径。
一、学业考试的背景
理解一项改革举措的意义,首先需要分析这项改革所发生的背景。我省进行学业考试改革具有三个基本的背景,就是新课程的实施、浙江省基础教育发展的状况以及综合素质评价配套改革。
(一)新课程的实施
学业考试是在新课程实施的背景下提出的,是新课程在“改变课程评价过分强调甄别与选拔的功能,发挥评价促进学生发展”的评价改革方面的重要举措。
学业考试的目的是全面、准确地反映初中毕业学生在学科学习目标方面所达到的水平,考试结果既是衡量初中毕业生学业水平的主要依据,也是高中阶段学校招生的重要依据之一。在《基础教育课程改革纲要(试行)》中,分别从课程功能的改革和课程实施方式的改革对学科学习目标进行了描述。在课程功能方面,“改变课程过于注重知识传授的倾向,强调形成积极主动的学习态度,使获得基础知识与基本技能的过程同时成为学会学习和形成正确价值观的过程。”也就是,新课程要改变以往以知识传授为中心的倾向,应做到知识与技能、过程与方法以及情感态度价值观三方面协调发展。在课程实施的方式方面,“改变课程实施过于强调接受学习、死记硬背、机械训练的现状,倡导学生主动参与、乐于探究、勤于动手,培养学生搜集和处理信息的能力、获取新知识的能力、分析和解决问题的能力以及交流与合作的能力。”也就是,新课程希望改变单一的教学方式,通过学生的主动学习,使学生在创新意识和动手能力等方面得到更好的发展。
因此,在新课程实施的背景下,对学业水平的内涵应有更全面的理解。它不仅包括原来一贯重视的基本知识和基本技能,还应包括通过主动学习学生才能掌握的过程和方法,以及渗透相应的情感态度价值观。
(二)浙江基础教育发展的现状
这几年浙江省基础教育发生了历史性的变化,2004年,幼儿园入圆率为85.6%、义务教育阶段入学率为99.9%、高中入学率为87.76%,同时,实现了高等教育大众化。2004年教师节的时候,省委书记习近平同志宣布,浙江省基本普及了从学前三年到高中段的十五年教育。我省基础教育已经到了“高位运行”的阶段。在解决了“有书念”的问题后,接着就是要让学生“念好书”。
“念好书”实际就是注重教育内涵的发展。现阶段基础教育的内涵发展,我们认为有两层含义:其一是要按教育规律办事,提高教育教学效益,让学生真正健康地成长;其二,是实现均衡发展,也就是要在不断提高质量的前提下,努力缩小区域之间、城乡之间、学校之间的差异。
因此,学业考试应为基础教育的内涵发展服务。首先要承认学生之间是有差异的,应从“以人为本”出发,为学生的发展留出空间,为此,学业考试应面向全体学生,恰当地掌握要求层级,它应当是学科学业方面最基本的要求;其次,应将学业考试定位为标准参照的水平考试,关注学生达标的程度,降低考试的甄别与选拔功能,避免强化高中生源上的不均衡性。
(三)综合素质评价配套改革
学业考试就评价方式而言,是一种纸笔测验。作为一种评价方式,纸笔测验在收集信息方面具有自己的功能。纸笔测验可测量的目标主要包括:(1)检测对知识的识记、理解和运用;(2)逻辑推理和理性分析判断能力;(3)探究的心智技能;(4)表达和交流的能力。新课程的目标中,纸笔测验能测量学生的认知目标和部分能力目标,对情感态度和价值观是难以直接进行检测,对能力中相对内隐的部分和外显的操作技能也难以测量。因此,纸笔测验并不能测量课程的所有目标。通过学业考试并不能反映学生所有的成长状况。
为全面反映学生在义务教育阶段的发展状况,在初中毕业和高中招生制度改革中增设了综合素质评价。综合素质评价以道德品质、公民素养、学习态度与能力、交流与合作、运动与健康、审美与表现等方面的基础性发展目标为基本依据,根据学生的平时表现、活动记录、学习作品、特长潜能、奖惩情况等,全面、客观、公正地反映学生的总体发展水平。
学业考试与综合素质评价是配套的,共同承担评价学生全面发展状况的任务。因此,学业考试应重在发挥它自身应有的评价功能,不应承担它不具有的评价功能。
二、学业考试的价值追求(一)体现新课程的理念
新课程注重学生的全面发展,具体落实在相关学科的三维目标的达成上。根据纸笔测验的功能,学业考试在体现新课程理念上应落实对三维课程目标的要求,力求做到知识与技能、过程与方法并重,并渗透情感态度价值观。
以往的中考比较关注考查学生的知识和技能的掌握情况,但对过程和方法重视不够。这在一定程度上强化了基础教育注重传授知识和技能的倾向,使得学生在创新方面存在比较大的问题。将传授知识作为教学的唯一目的,这已经使教学缺乏活力和生机,学生缺乏创新的动机和激情。新课程强调将学生学习获得基础知识与基本技能的过程,同时成为学会学习和形成正确价值观的过程,为此,我们应将过程和方法放在与知识和技能同等重要的位置。由于纸笔测验较难对情感态度价值观进行直接的测量,因此,学业考试应当进行适当地渗透。为体现新课程理念,在学业考试命题时,应做到重理解、凸主干;强任务、考探究;设情景、渗情感。
1.重理解、凸主干
在有关知识和技能的考查方面,学业考试应让学生充分地展示自己的知识视野和理解能力。不仅要了解学生是否懂得一个特定的事实或概念,还要了解学生理解的广度和深度。对知识理解的行为表现也远比已经获得知识表面含义的行为表现来的复杂,一般可以从两个方面来界定学生理解知识的行为表现:联系性和应用性原则。[2]
联系性原则涉及个人的知识结构,根据这个原则,知识被理解应表现在:学习者会用适当的方式阐述该知识,并能与其他知识相联系,特别是与学习者原有的知识和观念相联系。具体为(1)与学习者原有知识的联系;(2)与现实世界的事物和现象的联系;(3)与其他知识和观点之间的联系。例如,学生若能说出“燃烧是氧与物质发生反应,一种新物质生成,有时有新的物质释放出来”,表明他符合了理解的联系性原则。
应用性原则涉及个人知识的功能和作用,根据这个原则,知识被理解表现在:学习者能运用知识成功地完成他们生活的社会环境中的任务,具体为(1)学习者有能力完成各种任务;(2)这种任务被普遍认为是有价值的;(3)学习者应当在一定的社会环境下,用其他参与者认为合适的方式完成任务。如学生若能说明为什么扑灭汽油引起的火灾不能用水的原因,表明他符合了理解的应用性原则。
对一个知识,学生只有表现出联系性和应用性原则应有的行为时,才能被认为是达到了对知识的理解。因此,学业考试中,引导学生对一些现象进行解释并对解释作出分析是一种评价学生学业成就的有效方式。
在命题时,还应当突出学科的主干,将学生的学业成就与受到重视的学科课程目标联系在一起,为此在命制试题时,应注意实现以下几方面的转变(见表1)。
表1 学生考试命题的转变命题时不必过分强调命题时应强调枝节内容
核心内容
零散的知识
具有良好结构的知识
单纯的事实
应用性较强的知识和原理
偏重记忆的内容
理解力和推理能力
学生还不理解那些知识
学生理解了那些知识
2.强任务、考探究
学业考试的试题可以分为四种类型:直接针对知识本身的、倾向于知识和技能理解的、倾向于过程和方法的、知识和技能与过程和方法相结合的。第一种和第二种试题主要检测学生对知识和技能的理解;第三种和第四种试题更多地指向检测学生探究的心智技能,即如何形成假设、寻找证据、构成结论或观点等的能力。在以往的考试中,前两类试题是比较多的,占据很大的比重,而后两类试题较少。学业考试重视对过程和方法的检测,则必须增加后两类试题的比重。
相应的,学生在解题时,有三种解题的心理路径:(1)问题→确定事实、概念或原理→再现、再认或判断;(2)问题→选择概念或原理→正确使用概念或原理→解决问题;(3)任务→相应的探究技能和相关的概念或原理→综合使用探究技能和知识→正确完成任务。显然,第一条心理路径涉及较为低层次的思维,而第二、第三条心理路径涉及较为高层次的思维。命题时,应充分考虑学生在解题过程中的心理历程,三种心理历程应当根据学科现状做到适当分布。换言之,与以往的中考相比,在学业考试中,倾向检测探究心智技能的任务型历程应该有明显的增加。因此,指向过程和方法的、学生在解题时经历任务型心理历程的试题应是学业考试命题的努力方向。
3.设情景、渗情感
在纸笔测验中,情感态度价值观是比较难直接进行测量的,但作为新课程的一个重要的目标,应该得到应有的重视。在学业考试的命题中,往往通过以下两种方式渗透对情感态度价值观的考查。第一是选材,即在选择与情感态度价值观相应材料作为试题的情景,如语文或英语选择具有丰富人文精神的文章作为阅读材料、科学或社会等选择环境保护等涉及价值观的内容作为试题的情景等等;第二是设问,即要求学生作出有关的价值判断或态度取向。
(二)减轻学生过重的学业负担
毫无疑问,目前我国的学生,尤其是初中学生的学业负担是沉重的。过重的学业负担主要是由高利害关系的考试引起的。因此,高利害关系的考试,如初中毕业生学业考试,在设计试卷难度时应当考虑学生的学业负担问题。
过重的应对考试的学业负担,有两种直接的危害:第一是危害学生的健康。学习是一种艰苦的劳动,但这种劳动也应当是有基准的,即以不影响学生的身心健康发展为底线。目前,学生之所以投入大量精力在练习上,主要是出于对高利害关系考试的担忧。第二是挤占了学生的所有时间,一方面机械训练造成知识的去条件化、去情景化,只是死记硬背,创新意识和动手能力发展不起来,另一方面,更影响了学生在德育、美育、体育等各方面的发展。
目前,高强度的练习之所以被广泛采用,其实是迷信过度学习效应的结果。所谓过度学习,就是为了避免学习之后的遗忘,则必须学会后再加的练习。这种为避免学习后迅速遗忘,在达到100%学习之后再多加的练习,就称为过度学习。然而,研究表明过度学习的效果,大约在50%到100%之间最好,太多的过度学习并无益处。如果试卷的难度过大,高强度的过度学习是会获得溢出效益的;如果控制试卷的难度在一定合适的范围,则高强度过度学习基本是无效的。因此,为了减轻学生应对学业考试而产生的不必要的负担,在学业考试的难度设计上,应以“学生正常学习状态作为参照点,并力求将过度学习的效益降到最低”作为难度设计的基本原则,并采取以下措施。
1.将学业考试试卷的难度值稳定在0.75左右
由于目前的初中毕业生为应对学业考试,普遍处于高强度的过度学习状态,因此,用一般的考试理论来设计试卷的难度是不合适的。从浙江省的实际出发,我们认为在目前的情况下,要检测正常学习状态下学生在学科学习目标方面所达到的水平,并使高强度的过度学习效益降到最低,合适的难度值应该在0.75左右。这样能逐渐引导学生和教师降低学习的强度,回归到正常的学习状态中去。
2.要科学规划试卷的难度结构
试卷的难度受几个方面的影响,包括试卷的长度、试题的类型、分值的分布以及试题的难度等等,其中试题难度是主要因素。试卷难度值的下降,并不意味着每道试题都容易,而是应当考虑试卷各试题的难度构成。试题的难度指数P=(高分组答对人数+低分组答对人数)/全部取样人数,因此,P=1,表示所有学生都答对,为最容易;P=0,表示所有学生都答错,为最难。一般将难度P=0.9左右的试题作为容易题,P=0.70左右的试题作为稍难题,P=0.5左右的试题作为较难题,P=0.4左右的试题作为难题。难度结构是指试卷各种难度试题的构成情况,这包括:(1)各种难度值试题的比例,如规定容易题∶稍难题∶较难题=7∶2∶1;(2)各种题型的难度安排,如选择题的总体难度以及各道选择题的难度梯度;(3)各种目标要求的难度安排,如将只需再现或再认知识的难度设置得很大,是不合适的,因为那样就要考一些比较冷僻的内容,而将要求能运用的知识的难度设置得很小,同样也是不合适的,因为,那样只能检测学生对知识本身含义的认识了。
3.要反映学生的智慧水平
难度下降不是只去检测学生对知识的记忆,不是通过平庸来降低难度,而是在坚持检测学生智慧水平的前提下,降低难度。这对命题人员是一个挑战。因此,既要反对简单考查对知识的记忆,又要反对使用大量的陈题或熟题,还要反对单纯考学生解题技巧。既要反映学生的智慧水平,又要降低难度,命题时,应使用通畅思维路径试题和恰当地控制试题条件。
(1)使用通畅思维路径试题。试题的难度与正确解题所需要的思维路径畅通与否有关,图1呈现了两种路径畅通情况。任何试图1题都有起点和终点,两者之间的距离是需要考生来填补的。甲图表示的是学生在填补这个距离过程中,会遇到许多陷阱,每一个曲折的地方,都会有学生掉到陷阱中,最后能走到终点的学生并不多。这类试题的一个最大的问题是,要绕过这些陷阱所需的技巧,在现实生活和将来的工作中几乎没有什么用处,只在解题时有用。这类强调解题技巧的试题,不应当提倡。乙图表示的是另一种路径畅通情况,从起点到终点有多条路径可走,每条路径是直的,其关键在学生如何确定走的路径,也就是如何建构问题模型。这种根据相关信息建立问题模型的能力,在现实生活和将来的工作中是十分有用的,也是成功的关键。这类畅通的思维路径试题是值得提倡的。
图 1(2)试题的难度与许多因素有关(见表2),可采用一定策略进行控制。
表2 影响试题难度的因素和控制策略因素易难策略1. 题目条件
对象
过程
现象
简单条件
n对象=1
n过程=1
n现象=1
复杂条件
n对象≥2
n过程≥2
n现象≥2
适度控制
2. 条件表述的隐蔽性
直接
需要转化
提倡联系实际
3. 运用几个规则
N规则=1
N规则≥2
不过分强调
4. 数学处理水平
一般
较高
不过分强调
5. 答案
不必讨论
需讨论合理性和多解性
少量采用
6. 原有解题经验的影响
正面影响
无影响或负面影响
使用新情景
(三)促进教育的均衡发展
新课程关注每一个学生的发展,相关的学科课程标准是全体受教育者应当达成的最基本的要求。因此,九年义务教育中的学科教育应当关注的是全体学生达到课程标准要求的程度,学科教育的高质量,应当体现在全体学生都能达到这个基本要求。作为九年义务教育终结性考试的学业考试,其关注的也应当是这个达标程度。只有坚持水平考试的性质,才能为学生的全面发展和健康成长腾出空间,学生的个性发展才有可能;只有不过分强调考试的区分性,才能减少对教学要求的任意拔高和拓宽,改变以考试为中心的教学,减少人为地扩大高中生源上的不均衡性。
对于学业考试应坚持水平考试的性质,可能会引起导致学习能力降低的担心。然而,许多强制推行学习能力考试的国家,如英国,正在反思考试所引起的负面作用。在1979年撒切尔政府建立之前,英国甚至没有全国统一的教育计划,置于各地方政府管辖下的各学校,根据自己的教育方针,实施重视每个孩子个性的教育。随后,撒切尔政府重视“基础学习能力”的教育,对教育实施了彻底的改革,建立了全国统一考试制度。改革的结果是,如果某所学校的学生在全国统一考试中成绩差,学生的父母将不送孩子去那个学校上学,该校的学生数量减少,学校的预算额也减少,甚至关门。所以,学校都努力争取学生在全国统一考试中取得好成绩。然而,这种做法的弊端逐渐显现,其中最大的弊端是,学校因为过于重视学生在全国统一考试中的成绩,教育方法变成了以考试为中心,出现了“填鸭式教育”的倾向。教师认为:“老师一年到头为准备考试而忙碌,对孩子的评价以考试结果为准,在这种情况下怎么能让学生感到学习的乐趣呢?”英国的全国教师工会认为:“即便某学校学生的成绩提高了,也只不过表明教师的考试对策成功了而已。”
在我国,“考试至上主义”的负面影响同样也是十分明显的。在现有的社会条件下,统一的考试一时尚难以取消,那么,就需要平衡“重视学习能力”和“重视个性”之间的关系。难度较大、区分性强的考试,似乎加强了学生的学习能力,但必然会使考试挤满学生的所有时间,个性发展、全面发展就成为“不可能的任务”。因此,面向全体学生、坚持水平考试性质,为学生的发展留出空间,应该是一种平衡的做法。
为此,学业考试应做到:(1)严格根据学科课程标准的要求,精确定义考试的要求;(2)以全体学生正常学习状况为基准,确定达标的表现;(3)转变选拔考试的命题指向,适度降低考试的区分性。
三、学业考试需要关注的问题从中考到学业考试,不仅仅是考试名称的变化,更重要的是考试的价值取向以及相应内涵的改变。这种改变应当是在继承中考改革成果基础上的发展,应当是渐进式的变革。在这个改变过程中,必然会面临新问题。笔者认为,目前迫切需要关注的有如下两个问题。
(一)如何恰当地确定学业水平标准
根据上述分析,学业考试所检测的学习目标水平,应当是符合学科课程标准的、面向全体学生的。课程标准规定的是全国学生应达到的基本要求,而在一定区域内,如浙江省,全体学生应达到的基本要求应如何定位、如何进行清晰的定义,是一个回答起来比较困难的问题。
这里有两个前提条件是必须明了的,其一是学生学习机会的质量,其二是学生正常学习的状况。学生的学习机会包括教师的专业知识、教学时间、教学资源、人均经费等方面,学习机会的质量就是指上述方面的保障程度,它与学生可能达到的学业水平有着密切的关系。各地教育质量的高低在很大程度上,与学习机会质量的高低有关。因此,要定位一定区域内学生应达到的学业水平,就必须仔细地分析区域内学习机会的质量。学生正常学习的状况则是另一个影响学业水平的重要因素。学生的正常学习状况当然可以从学习的时间来描述,但学习的努力程度和效果显然也是应当考虑在内的。
总之,要恰当地把握学业水平的标准,必须准确地把握上述两个方面的因素,这就需要进行细致地调查和长期的跟踪观察。同时,随着教育的发展,学习机会的质量将逐渐提高,加上新课程理念的落实,学生学习效果也会提升,学业水平将逐步提高。因此,要用动态的、发展的眼光看待学业水平标准。
(二)如何在保证评价真实性的前提下降低难度
评价的真实性,有两种含义:其一,是指真实评价(Realistic Assessment),即通过学生在与现实世界中可能遇到的情况和科学家实际工作相似的情景中,应用知识和技能的活动,来评价学生的学习过程及其成果。评价的习作包含真实的任务、难题或专题,当中牵涉学生的判断及创新意念。在评价过程中,让学生自己动手完成有关习作,模仿现实世界的情况,包含一定的复杂性,并提供机会改进表现。其二,是指真实的评价(Authentic Assessment),即通过评价所收集的信息应当是可靠的。这两种含义之间略有差别,“真实评价”更多是从评价的方式考虑,强调要增加评价与真实生活相联系,提倡评价问题的真实性、情景性。“真实的评价”则更强调评价所收集信息的可信程度。实现“真实的评价”的途径很多,“真实评价”应是其中的一种。
由于普遍存在应对考试的教学,纸笔测验在许多时候,并不能获得真实的信息。例如,许多教师,尤其是一些有经验的老教师都有这样的经历,考试卷刚刚下发,学生还正在答卷,教师看了试卷后,就能对班上同学的最高分、最低分和平均分进行估计。试卷批改出来后,教师当初的估计与最后的结果之间是吻合的,甚至是非常吻合的。这些教师为什么这样神?教师认为是由于他对自己的学生十分了解的缘故,然而,仔细分析教师推断的过程,可以发现这样的逻辑关系:(1)试卷中的试题,教师都曾经组织学生复习过;(2)学生对各类试题都已经进行了充分的训练,比较熟练;(3)教师十分了解学生在解这些类型试题时的准确率,由此,教师可以比较准确地预测成绩。从这个事例,可以看出,这种纸笔测验最终获得的信息是不可靠的,是不真实的。
学业考试试卷中的每道试题都有自己的检测功能。例如,有的试题是检测有关核心知识的语义信息的(心理路径一),有的是检测解决问题能力(心理路径二),有的是检测科学探究技能的(心理路径三)。然而,由于目前存在的应试倾向,教师应对考试时,自觉不自觉地采用了“层级下移”策略,即通过将试题类型归类、模式化,辅之以超强度的训练,最终教师试图使学生在考试的时候,能将检测高层次思维的试题(如问题解决的试题、探究技能的试题),下降到再现、再认的层级。也就是,原本命题者希望能测量学生是否具有探究心智技能的试题,因学生在复习时已经做过类似题目且非常熟练,那么,在考试时,遇到同样类型的试题,其心理过程就不是运用探究的心智技能,而仅仅是模式试题的再现、再认而已。如果平时准确率较高,则在这种考试中就会获得较高的成绩,教师也能较为准确地预测他的成绩。
如何才能保证评价收集的信息是可靠的?真实评价的思路是可以借鉴的,即应当使试题的情景远离学生机械训练过的、比较熟悉的情景,也就是学生在一个变式的、比较陌生的试题情景中,运用所学的知识,解决问题或完成任务,将较为真实地反映出学生的学业水平,这样才能提高信息的可靠程度。自然是丰富多彩的,生活是日新月异的,科学面对的问题是千变万化的,这都为真实的评价提供了可能。试题更多地结合学生生活实际、社会实际、科学探索实际,一方面有助于提高评价的真实性,另一方面,能更好地反映学生在解决真实生活中真实问题的能力。评价的真实性,将有利于学生形成对现实生活的领悟能力、解释能力和创造能力,即“能从学校带走的知识”。
显然,评价的真实性程度越高,越能真实地反映学生的实际水平。但是,这对试卷难度控制提出了挑战。由于应试的强化训练,使学生解模式化的试题能力大为提高,一旦试题远离他所熟悉的情景或模式,难度自然增加。为了降低难度,比较可行的办法是渐进式的变革,即每年逐步增加确保评价真实性的试题,增加检测“能从学校带走的知识”的比例,同时,对教学进行正确的引导,逐步转变“以考试为中心的教学”,使教学更关注学生的成长、更关注学生智慧的提升。
学业考试是一种新的考试,它与中考存在明显的差异,但它必须在继承中考改革所取得成果的基础上发展,同时有理由相信,随着研究深入、教育事业的发展,对学业考试的目标和内涵的认识会更加准确和清晰,这都需要我们不懈地努力,不断地探索和完善。
参考文献:[1]教育部.教育部关于基础教育课程改革实验区初中毕业考试与普通高中招生制度改革的指导意见[Z].教基[2005]2号.
[2]Shawn M Glynn,Russell H Yeany,Bruce K Britton.科学学习心理学[M].王磊,编译.海口:海南出版社.2000.43-45.