您的当前位置:首页正文

课堂教学评价

2021-08-05 来源:易榕旅网
当前位置:第一章 课堂教学评价概述学习引入

把握评价环节,促进学生发展

下午,临近上课(内容是学生进行调查活动的阶段性反馈)几分钟,易崴同学拿着一张纸走到我跟前:“老师,你看,我去调查了,这是我的调查记录!”我有些意外,因为他平时总有各种理由不参加实践活动。非但如此,还常常捣乱,老师多次与他的个别谈话、开导收效甚微,同学们都不愿意和他同一组,即使老师有意安排在一组,大家对他也是无可奈何,只求他少捣乱制造麻烦。他,今天居然这么主动!噢—一张沾有一大片油渍的纸,皱皱巴巴,上面写有几个调查问题和一些所谓的调查记录,字迹歪歪扭扭。我马上就要到教室检查大家的活动情况,他为什么要赶在上课之前单独拿来给我看呢?我把目光移到他的脸上:满头大汗,一双眼睛望着我,明显带着某种期翼。要是换了别的同学,我会强调他应该保护好调查记录不要弄得又脏又皱,应该„„可对于他,我十分珍惜这来之不易的主动,就象对待一棵初发的幼苗。我还没开口说话,上课铃声响了。我摸摸他的头,笑着说:“真不错,你进步了!先去上课,好吗?”他兴奋地一溜烟跑了,我边向教室走去,边打算着该如何抓住他这次难得的主动?

课堂上,在检查各小组的活动进程的同时,我让各组进行数据归拢,还让他们在活动小组内进行阶段性自评和互评。我有意走近易崴所在的小组,想的是更关注他们对易崴的评价。只见易崴一改过去不安分、捣乱的表现,也和大家围成一堆,也拿出自己的“成果”说:“你们看,这是我的调查记录。”A生:“又脏又皱,字又乱,看不清楚,哪能要?”B生:“你才采访了两个人呀?”C生看到我在旁,对我说:“老师,那天我们设计采访问题,他不但一个问题都没想出来,还捣乱。” 此时,易崴一脸的不在乎,但我知道他内心是感到委屈的。从这情形看来,大家是深受过去对易崴否定看法的定势影响,于是对他这次的表现仍然看不上眼,对他的评价尽是“挑刺”。这时,我靠近他们,亲切地说:“以前你们不是希望他能跟大家一起参加活动吗?”D生:“是呀,以前他从来不去调查。”我说:“现在他去了,这和以前比起来怎么样?”E生:“是呀,尽管他做得不够好,但比起以前也算进步了。”我说:“那是不是值得表扬呢?我们总不能用老眼光来看人呀!”F生:“对呀,我们应该评他个‘进步奖’,不是吗。”我接着说:“其实他也想做好一点,那就得慢慢跟大家从头学呀。易崴,是不是?”他点了点头。A生:“易崴,你以后得学学我们,把调查的资料夹在大本书里,这样保管平整一点。” B生:“还有,不写的时候及时收起来,这样就不会弄脏。”他们给易崴提了不少建议,获得‘进步奖’的他有些兴奋,第一次倾听大家的建议,表示接受。他们继续着小组活动,我向下一个小组走去„„后来,我又和易崴个别交流,听他说那一节课上,由于表现好,大家还评他一个‘合作奖’。

(1)通过这一教学案例,使我们认识到了什么?

(2)你是怎么知道你的课堂教学已经达到了预定的目标?

(3)回忆自己参加过的与课堂教学评价有关的活动,整理其中有关与评价有关的评价过程和评价方法的资料,然后对照学习内容,分析和评价自己所参加过的评价活动。 认真思考以上问题,结合教师引导及后续的学习内容加以学习分析,并把个人心得记录下来。

个人心得

孩子们的活动评价能力是一点一点积累起来的,在学习如何评价这一过程中,老师及时、正确的引导必不可缺,这样的引导会使学生们学会客观地评价自己和别人,除了横向对比,也懂得纵向对比,多发现、多肯定“闪光之处”。老师的评价观、评价行为潜移默化地影响

学生评价指向。反思教学以往的种种,是不是无时无刻在无意识中为孩子们“挑刺”呢?看来,除了指导、要求他们努力把实践活动做得更好之外,还应该更多地在如何完善评价上多下功夫。

1、学习本章内容。

2、参阅以下学习资料并加以分析。 (1)《构筑新型课堂教学评价观》 (2)《课堂教学评价标准的反思与重构》

(3)《新的课堂教学理念,新的教学评价标准》 当前位置:第一章 课堂教学评价概述第一节 新课程改革的基本问题 一、新课程改革的背景

主要是当今时代发生了重要的变化。 (一)知识经济时代的到来

“知识经济”的概念来源于1996年联合国经济合作与发展组织(OECD)在《科学、技术和产业展望》的报告中。相对于人类曾经经历过的农业经济、工业经济而言的,知识经济是人类生产方式的又一次重大变革。知识已经成为最重要的生产要素,其对于经济增长的贡献率已经超过其他生产要素贡献率的总和。知识经济是建立在知识的生产、分配和使用之上的经济,因此,知识对于经济发展的意义相当于农业经济时代的土地、劳动力,工业经济时代的原材料、工具、资本,而成为经济发展的直接资源。

在知识经济时代,劳动者的素质和结构将发生重大变化,知识劳动者将取代传统的产业工人。所谓知识劳动者,主要是指从事知识、信息收集、处理、加工和传递工作的劳动者。此外,在知识经济时代,科学技术的不断更新,将改变“文盲”这一概念的传统内涵,“文盲”一词将不再单纯是指没有文化、知识的人,而是指不能继续学习,不能更新自己的知识、技能的人,正是在这个意义上,有人也把知识经济称为“学习经济”。

(二)国际竞争空前激烈

刚刚过去的20世纪,人类曾经经历过空前惨烈的两次世界大战。第二次世界大战以后的所谓“冷战”时期,发生过150余场战争,而因战争造成的死亡人数多达2000万左右。“冷战”结束后,被“冷战”长期掩盖的国与国之间、民族与民族之间,以及宗教团体之间长期潜在的矛盾、冲突日益突现出来,国际间的竞争空前激烈。美目的霸权主义削弱了联合国与其他国际组织的权威和本应发挥的作用;美国等西方国家打着“人权”的幌子粗暴践踏他国主权;信息技术发达国家的信息霸权在经济、军事以及文化方面对其他国家的控制、渗透,都使和平与发展不断面临新的不确定性。如果说既往的国际竞争主要表现在意识形态、军事实力等方面,那么,当前的国际竞争则主要体现在综合国力方面,而且这种竞争越来越表现为经济实力、国防实力和民族凝聚力的竞争。

(三)人类的生存和发展面临着困境

这种困境主要是指人类目前面临的诸如生态环境的恶化、自然资源的短缺、人口迅速膨胀等威胁着人类自身生存和发展的一系列重大问题。在工业经济时代,社会的发展主要依赖于科学技术的进步,然而,科学技术本身是一把双刃剑,它既会造福于人类,也会给人类带来灾难。事实上,目前人类所面临的困境乃是人类自身在善良动机下滥用技术的“副产品”。应该特别指出的是,除了人与自然和谐关系被破坏之外,由于工具理性对价值理性的长期压制,人类生存和发展的困境还表现为人的精神力量、道德力量的削弱或丧失,而这恰恰是任何现代科学技术或物质力量都无能为力的事情。正是由于对上述问题的清醒认识,人们开始对工业化以来的社会发展模式进行深刻的反思,并从20世纪70年代起,提出了诸如协调发展模式、文化价值重构模式等各种新的发展模式。1980年,联合国大会首次提出“可持续发展”的概念。1992年在里约热内卢召开的联合国环境与发展大会上,包括我国在内

的180多个国家和70多个国际组织的代表们共同提出了可持续发展的新战略和新观念。总之,为了人类的生存和可持续发展,在21世纪,除了必须对人类既往的所作所为进行客观的评价之外,我们还必须妥善处理物质文明和精神文明之间的关系问题。

从上述对当前时代的三个主要特征的阐述中,我们可以清楚地看到,同过去时代在经济发展、国力增强等方面的社会发展主要依赖于自然资源或物资力量相比较,具有高度科学文化素养和人文素养的人,对于21世纪人类发展则具有越来越关键的意义。所谓具有高度科学文化素养和人文素养的人,必须具备两个条件:一是要掌握基本的学习工具,即阅读、书写、口头表达、计算和问题解决;二是要具备基本的知识、技能,以及正确的价值观和态度。只有这样,他才能具有能够生存下去、有尊严地生活和工作、改善自己的生活质量、充分发展自己的能力,才能积极参与社会的发展,并能终身学习。源自《走进新课程——与课程实施者对话》

二、新课程改革的基本目标

新课程改革明确提出了以下六个方面的改革目标:

(一)改变课程过于注重知识传授的倾向,强调形成积极主动的学习态度,使获得基础知识与基本技能的过程同时成为学会学习和形成正确价值观的过程。

(二)改变课程结构过于强调学科本位、科目过多和缺乏整合的现状,整体设置九年一贯的课程门类和课时比例,并设置综合课程,以适应不同地区和学生发展的需求,体现课程结构的均衡性、综合性和选择性。

(三)改变课程内容“繁、难、偏、旧”和过于注重书本知识的现状,加强课程内容与学生生活以及现代社会和科技发展的联系,关注学生的学习兴趣和经验,精选终身学习必备的基础知识和技能。

(四)改变课程实施过于强调接受学习、死记硬背、机械训练的现状,倡导学生主动参与、乐于探究、勤于动手,培养学生搜集和处理信息的能力、获取新知识的能力、分析和解决问题的能力以及交流与合作的能力。

(五)改变课程评价过分强调甄别与选拔的功能,发挥评价促进学生发展、教师提高和改进教学实践的功能。

(六)改变课程管理过于集中的状况,实行国家、地方、学校三级课程管理,增强课程对地方、学校及学生的适应性。(源自《基础教育课程改革纲要(试行)》)

新课程改革的目标中不仅明确提出了新课程评价的目标,即强调评价的发展性,而且在其改革的首要目标中就显示了新课程改革评价的内容的重要变化,即对情感、态度、价值观的关注。

三、新课程标准的含义与意义

《基础教育课程改革纲要(试行)》明确指出,课程标准是教材编写、教学、评估和考试命题的依据,是国家管理和评价课程的基础。它体现国家对不同阶段的学生在知识与技能、过程与方法、情感态度与价值观等方面的基本要求,规定各门课程的性质、目标、内容框架,提出教学和评价建议。可见,国家课程标准与框架是整个基础教育课程改革系统工程中的一个重要枢纽。

(一)课程标准内涵

“课程标准”在我国并不是一个新词汇。在“废科举、兴学堂”的近代普及教育运动初期,清政府在颁布各级学堂章程中,就有《功课教法》或《学科制度及编制》章,列有课程门目表和课程分年表,这是“课程标准”的雏形。明确以“课程标准”作为教育指导性文件的是 1912 年南京临时政府教育部公布的《普通教育暂行课程标准》。

现代课程标准的内涵包括以下几方面:第一,课程标准主要是对学生学习结果的描述,而不是对教学内容的具体规定;第二,课程标准是由国家制定的对学生某一学习阶段的

共同的、统一的基本要求,而不是最高要求;第三,学生学习结果的描述是可达到和可评估的,而不是模糊不清、可望而不可及的;第四,课程标准渗透着“教师不是教科书的消极教授者,而是教学方案的积极设计者”的理念;第五,课程标准的范围应涉及认知、情感、动作技能三个领域,而不仅仅是知识方面的要求。

(二)“课程标准”代替“教学大纲”的意义 在新课改中,用“课程标准”代替“教学大纲”,不只是名称的更替,而是发生了质的变化。这些变化不仅是新改革理念的体现,更反映了新世纪教育的要求。

1、教学大纲只是强调内容规定,课程标准更着眼于未来国民素质的描述 在课程标准中,首先规定的是国家对未来国民各方面素质的基本要求,而不是过多地规定通过怎样的教学过程达到这一要求。课程标准是国家对学生接受一定教育阶段之后的结果所作的具体描述,是国家教育质量在特定教育阶段应达到的具体指标,而不是像教学大纲那样关注教学重点、难点、时间分配等具体内容。为此,对未来国民素质的目标要求和各学科应达到的标准,构成各学科课程标准的核心内容。

2、大纲侧重强调的是知识和技能目标,标准在关注知识和技能目标的同时,关注学生学习的过程、方法、情感、态度及价值观

新课程标准不仅对学生的认知发展水平提出要求,同时对学生学习过程和方法、情感、态度、价值观方面的发展提出目标要求,这是一个根本性的变化,体现了教育改革的新理念,对培养新时期具有良好素质和竞争力的新一代具有重要意义。在课程标准中,增加了过程性目标和体验性目标,例如强调学生“经历了什么”、“体会了什么”、“感受了什么”,由此引导学生主动参与、亲身实践、独立思考、合作探究,发展学生搜集处理信息的能力、获取新知识的能力、分析和解决问题的能力以及交流与合作的能力,形成良好的情感、态度、价值观。与此同时,课程标准还提出发展性目标,为学生的发展提供了空间。

3、课程标准突破学科中心,为学生终身发展奠定基础 以往教学大纲以学科为中心,内容目标更关注学科逻辑体系,要求学生对学科知识的掌握和技能的形成。而课程标准则在关照学科知识的同时,更关注学生综合能力的提高。课程标准中的内容标准部分,按照学习领域或主题组织学习内容,突破学科中心,精选终身学习必备的基础知识和技能,密切教科书与学生生活以及社会、科技发展的联系,从而体现基础教育的性质和功能,为学生的终身发展奠定基础。

4、课程标准体现了评价促进学生发展的教育功能 新课程改革中课程评价更加关注人的发展过程,并呈现出多元化的趋势。课程标准将学生的发展、教师的发展与课程的发展融为一体。各学科课程标准普遍淡化了终结性评价和评价的筛选评判功能,强化了过程评价和评价的教育发展功能,并力图结合本学科的特点提出有效的策略和具体的评价手段,引导学校的日常评价活动更多地指向学生的学习过程,从而促进学生的和谐发展。课程标准中的评价建议有多种,有极强的操作性。比如,成长记录、测验与考试、答辩、作业(长周期作业、短周期作业)、集体评议等。

5、课程标准为课程实施提供了广阔空间

教学大纲不仅对教学目标和教学内容作出清晰明确的规定,而且规定了知识点的具体要求及深度、难度指标。多数教学大纲还规定了详细的教学顺序(有的甚至以章节或第几课的形式出现),以及各部分内容分别占几课时等。这些对教师的教学有直接的指导作用,但同时也限制了教师创造性的开展教学工作,尤其对教材多样化发展起了阻碍作用。而课程标准规定的是学生素质应达到的基本要求,是对不同阶段目标的描述以及对事实过程的建议,因此它对教材编写、教师教学以及学业评价的影响是间接的、指导性的、具有弹性的。这样的设计便于教师准确把握国家课程标准,增强课程自主意识,提高对教材的驾驭能力,降低对教材的过分依赖,有利于拓展课程资源,创造性地开展教学。(源自《第七章 新基础

教育课程改革》)

当前位置:第一章 课堂教学评价概述第二节 课堂教学评价的基本问题 一、课堂教学评价的含义

课堂教学测评是促进学生成长、教师专业发展和课堂教学质量提高的重要手段。课堂教学评价涉及一系列相关概念,下面一一介绍。

(一)测量

测量从广义上讲是指根据某些法则与程序,用数字对事物在量上的规定性予以确认和描述的过程,如用称或天平称物体的重量,或者用温度计测量环境的温度。斯蒂文斯(Stevens,S.S)曾说,“广而言之,测量是根据法则给事物赋予数量”。即测量是根据一定的法则给事物的属性指派数字或符号的过程。测量包含三个要素。

测量的三个要素 (二)测验

阿娜斯塔西(Anastasi,A.)认为,“测验本质上是行为样本的客观的和标准化的测量”。如何来理解这句话呢?

首先,测验的对象是行为样本。我们知道,测量是对物的属性进行数字标定,如智力118,要想得到这个118,就需要测量其智力行为,而智力行为是很多的,作为测量的一种的测验就要选取这一领域中有代表性的行为来考察其在智力领域中的特征,如果从这些有代表性的行为的测验中能够获得有关个体这方面属性的信息,那么这些代表性行为――即行为样本就是一个很好的测验对象。

其次,标准化。它是指测验这种获取事物属性的量化特征的方式在编制、实施、计分及分数的解释等方面有一套系统的程序,只有这样,测验才有统一的标准,使不同人的测验结果具有可比性,从而也才能够减少无关因素对测验结果的影响,使之更有效。

第三,客观测量的评价指标。由于课堂教学评价属于间接测量,因此标准化是其客观的必然要求。标准化有一些指标:(1)对题目质量的分析,包括难度和区分度,这是筛选题目以构成一个好测验的基础;(2)信度,指测验结果的可靠性程度;(3)效度,指测验的有效性程度,这是评价测验质量最重要的指标。

简单来说,测验是测量的工具,用这个工具可以引起被测者的代表性的行为,通过这些由测验所激发的代表性行为,可以推测被测者某方面的心理特性。测量本身是给事物的属性标注数字的一个过程,但这个过程有很多的方法,测验是其中的一种方式。如,通过课堂观察,你认为学生掌握了今天的内容的80%;我们也可以出一套试题,它同样能够获得有关学生学习状态的基本状况,而这种方法就是测验。

(三)评价

评价是一个应用非常广泛的词,它泛指衡量、判断人物或事物的价值。评价的过程则是对人物或事物的价值进行分析、衡量和判断的过程,评价过程一般来说包括事实判断和价值判断。

教育评价。关于教育评价的概念,大体上有这样几种类型,一是着眼于信息,强调通过评价收集信息,为教育决策服务;二是着眼于方法,强调评价是成绩考查或调查的方法;三是着眼于效果,强调通过评价判断教育目标或教育计划的实现程度;四是着眼于过程,强调评价是信息收集的过程、提供决策依据的过程、判断效果的过程、教育优化的过程以及价值判断的过程等;五是强调价值,强调教育评价的关键在于价值判断。

课堂教学测评是与课堂教学有关的测量与评价的总称,它是指为促进学生学习和改善教师教学而实施的,对学生的学习过程与结果以及教师的教学所进行的测量和评价。在实际应用过程中,这两个方面也是相互有包含的,特别是那些测量和评价教师的课堂教学的工作通常也会包含学生的学习结果。

二、课堂教学测评的理论基础

课堂教学评价涉及教与学两个方面,教学过程和教学结果两个维度,因此课堂教学评价所涉及的相关理论比较丰富。

(一)目标理论

包括泰勒的行为目标模式和其后布卢姆的“目标分类模式”。

行为目标模式是20世纪30年代由美国教育家泰勒(Ralph.W.Tyler)提出,故也称为“泰勒模式(Tyler Mode)”。这种理论强调把学生的行为目标作为评价的主要依据,把教育方案、计划所达到的目标用可以进行观察测验的学生的行为来表示,认为评价就是判断教育活动实际达到目标的程度。同时,也就是找出教育活动偏离目标的程度,通过信息、反馈使教育活动尽可能逼近目标。

目标分类模式是20世纪50年代美国教育心理学家布卢姆提出的,他们指出,教育目标是教育教学评价的基础,而教育目标从整体上可以分为认知领域、情感领域和动作技能领域,每个领域在实现最终目标的过程中,都有相应的目标系列。这其中最为成熟的是认知领域的目标,该目标理论的提出,实际上解决了在教育和教学测评中,测什么的问题,在学术界引起了广泛的反响。

对西方学者课程目标模式讨论的述评 (二)多元智力理论

多元智能理论(The Theory of Multiple Intelligences),是由美国哈佛大学教授霍华德·加德纳(Gardner.H)于1983年提出的。他认为,人的智力结构至少由七种智力要素组成:即语言智能、数理逻辑智能、空间智能、身体运动智能、音乐智能、人际交往智能和自我认识的智能。多元智能本身具有多元性、文化性、差异性、实践性、开发性的特征。它给教育教学评价带来了新的思维方式,从评价观来说,他认为个体具有不同的智能及其组合,如果给予适当的教育,每个人都能发挥自己的优势智能,同时带动其他智能的同步发展,因而不存在智能水平高低的问题,只存在智能类型和学习类型差异的问题。所以,对学生的评价应由关注“学生的智商有多高”转为关注“学生的智能类型是什么”;就评价的目的而言,多元智能理论关注的是学生的智能特点及其发展状况,而传统评价则以预定教育目标为中心来设计、组织和实施评价,目的在于对学生进行选拔和鉴别;就评价的特征而言,评价是多元化的,这不仅体现在评价内容的多元化,还体现在评价主体、评价方式等的多元化。

多元智力理论:背景、意义、问题 加德纳的多元智力理论 (三)替代性评价

替代性评价(alternative assessment)只所以得名是因为这种评价是传统纸笔标准化测验的一种替代方式,由于多数评价任务比较接近于真实的生活,故又称为真实性评价(authentic assessment)、表现性评价等。兴起于20世纪90年代的美国,传统学生评价中采用的纸笔测验或标准化测验更多地是考查学生对知识的获取能力而非应用能力,随着教育实践的发展,人们发现,实际操作、解决问题的能力更为重要,因此替代性评价就成为评价学生实际操作能力和解决问题的能力的重要方式,它被认为是测量学习者运用先前所获得的知识解决新异问题或完成特定任务能力的一系列尝试,具体来说就是运用真实的生活或模拟的评价练习来引发最初的反应,由高水平评定者按照一定标准进行直接的观察、评判,其形式主要包括建构式反应题、书面报告、作文、演说、操作、实验、资料收集、作品展示等。

(四)有效教学的理论

有效教学研究的最初目的是想提高课堂教学的效果,并由此对教师的行为特征进行了系统研究研究。出现了一系列有代表性的观点,如:

伯利纳(Berliner,D.C)等通过研究阅读和数学教学,总结出了有效和无效教学行为,其中有效教学行为有:教师建设性地对学生情绪和态度作出公开的言语或非言语的反应;教师认真听学生在讲什么,谈什么;教师给学生某种指导或警告,并且说到做到;教师对所教的学科充满信心,并显示出对此学科的驾驭能力;教师检查学生的学习进度,并根据检查结果调整自己的教学工作;在教学过程中,教师表现出一种积极的、令人愉快的、乐观的态度和情绪;教师能够充分有效地利用课堂上出现的迹象预测意外事件;教师鼓励学生认真做好课堂作业,并对学生课堂作业负责。无效的教学行为有:教师突然改变教学程序,如从教学转向课堂纪律管理;教师当众训斥学生;教师为了打发空余时间,让学生在课堂上做一些无用的作业;教师在课堂上不是为了达到明确的教学目标,而是要表现自己。

三、课堂教学测评的原则与功能 (一)课堂教学评价的原则

课堂教学测评应该遵循以下一些基本原则: 1、多维性原则

多维性原则指的是在课堂教学评价中,应该从多种角度、运用多种方法对课堂教学的过程和课堂教学的结果进行测评。具体而言,多维性主要体现三个方面:首先是评价内容的多维性;其次是评价主体的多维性,指的就是评价的主体既有课堂教学之外的人员,也有课堂教学内的被评教师或学生的参与;第三是评价方法的多维性,既要重视客观、量化的评价方法,也要重视量化和质性评价相结合的方法。

2、过程性原则

过程性原则指的是改变以往评价中过分重视总结性评价的倾向,要把评价对象当前的状况与其发展变化的过程联系起来,由一次性评价改变为多次性评价。

过程性原则有三个基本的特征:一是把全部有价值的教育教学活动都纳入评价的范围,不论这些活动是否与预期的目标相一致;二是在方法论上,既倡导量化研究的方法,也给质性评价一定的位置;三是本质上受“实践理性”的支配,它强调过程本身的价值,强调评价者与评价对象之间的交流和相互理解。

3、真实性原则

真实性原则指的是课堂教学测评、特别是学生学习结果的测评过程中,强调在真实生活情景下对学生的发展进行评价,在真实性评价中应该包括有真实性任务,即某一具体领域中专家可能遇到的那些真实的生活活动、表现或挑战。

美国学者戈兰特·威金斯认为真实性评价有五个特征:一是评价既指向学生学习的结果,也指向学生学习的过程,凸显评价的诊断与服务功能;二是强调在现实生活(或模拟现实生活)的真实情境中,给学生呈现复杂的、不确定的、开放的问题情境,以及需要整合知识、技能的活动任务(即“有意义的真实性任务”)来对学生进行评价;三是任何一个真实性评价都必须事先制订好用以评价学生的“量规”(rubrics)或“检核表”(checklists)。学生应该提前知道评价的任务及具体标准,而不是像传统的测验那样需要保密;四是真实性评价承认个体差异,主张对不同的学生提供不同的评估策略,以适应各种能力、各种学习风格以及各种文化背景的学生,为展示他们的潜能与强项提供机会;五是评价通常整合在师生日常的课堂活动中,成为教师教学、学生学习的一部分。在真实性评价中,评价是师生共同的任务,学生不再是被动的测验接受者,而是评价活动的积极参与者,学生参与评价(包括对同伴的评价或自我评价)是学生学习的一种形式。

4、发展性原则

发展性原则指的是课堂教学测评着眼于促进学生发展,侧重于观察和衡量学生的表现,着眼于促进教师教学水平的不断提高,激励教师转变观念,进行课堂教学的改革。

发展性原则有以下特征:首先发展性原则着力于人的内在情感、意志、态度的激发,

着力于促进个体的和谐和发展,强调以人为本;其次,发展性原则强调评价主体多元化,主张使更多的人成为评价主体,特别是使评价对象成为评价主体,重视评价对象自我反馈、自我调控、自我完善、自我认识的作用;第三,发展性原则在重视教学过程中静态常态因素的同时,更加关注教学过程中的动态变化因素,由师生之间的情感等交互作用而使得课堂教学出现的偶发性和动态性;第四,发展性原则更加强调个性化和差异性评价;第五,发展性原则在重视指标量化的同时更加关注质性评价的作用,强调用质性评价去统整定量评价;认为过于强调细化和量化指标,往往会忽视了情感、态度和其他一些无法量化而对评价对象的发展影响较大的因素的作用。

课堂教学评价应重视的几个原则 (二)课堂教学评价的作用

1、课堂教学评价在教学过程中的作用 这种作用体现在课前、课中、和课后。 首先是教学前的测评。教学前的测评可以是一节课开始之前的测评,也可以是一个教学单元甚至一门课开始之前的测评,这种测评的主要目的是想弄清学生是否具备即将开始的学习所必须的具备的知识和技能,即确定学生的学习准备情况,它是进行教学活动的基础,直接关系到教学目标是否能够达成。

其次是教学过程之中的测验和评价。教学过程之中的测评往往为形成性测评提供基础。它们主要被用于监测学习进步、检测学习中的错误并为学生和教师提供反馈。这些测验是监控学生学习进展最重要的手段,也是进一步教学的基础。除了形成性测验在教学过程中的促进作用之外,教学过程中的诊断性测评同样具有重要作用。对于那些在形成性测验中持续出现困难的学生,必须采用诊断性测验来确定问题之所在,从而为学生的发展提供最有价值的建议。

第三是教学结束时的测评。在一个教学阶段(如教学单元或一门课程)结束时,我们关心的是学生的预期学习成果是否能够达到和达到的程度如何,要获得这方面的信息我们也必须使用相应的测评。教学结束时的总结性评价,如确定学生的学业成就或等级分数可以对学生进行分流安置等的活动提供相应的信息。而单元测验在为学生提供反馈、激励他们从事更有挑战性的工作、布置补偿性的作业、评价教学等方面具有重要作用。这些测验不仅可以是形成性的,也可以是总结性,甚至在某些时候还可能是预备测验。

2、课堂教学测评与师生的发展 这体现在两个方面。

首先课堂教学测评是教师的专业素养和能力的重要构成部分。对于教师而言,掌握课堂教学测评的方法和技术有助于教师获取以下信息:一是能够诊断学生的优势和不足,了解这方面的信息能够为教师提供有针对性的教学指导提供帮助,而且这些方面的不足也是今后教学中需要解决的问题;二是监控学生的进步。即教学测评能够帮助教师判断学生是否取得了预期的进步。课堂教学测评的功能之一就是评判学生是否正令人满意地朝着预期的教学目标迈进,这样可以为是否进行教学调整提供信息。三是评价自己的教学。教师可以根据学生在测评中的表现来评价自己的教学效果,帮助教师决定是保留现行教学方案还是进行修订或者另起炉灶。

其次是课堂教学评价能够促进教师和学生的发展。对于教师而言,课堂教学评价能够促使教师树立正确的教学观念,形成正确的教学行为,通过课堂教学测评能够促使教师不断反思自己的课堂教学,形成正确的课堂教学行为,提高自己的课堂教学水平。对于学生而言,课堂教学评价能够促进学生更好的发展。学校教育最主要的战场还是课堂,因此课堂教学成为学生发展最重要的阵地。如何有效提高课堂教学的效果也成为教育教学研究者和实践者孜孜以求的目标。有效的课堂教学评价,不仅能够真正确立学生在课堂教学中的主体地位,

还能够促进学生在课堂上的积极参与,使得学生充分活动,形成良好教学氛围和师生互动关系。而也只有在这样的课堂氛围中,学生才能更好的学习,得到更好的发展。

当前位置:第一章 课堂教学评价概述

第三节 有关教育目标的基本理论

一、布卢姆的教育目标分类理论

美国教育心理学家布卢姆(F.S.Bloom)将教育目标分为认知、情感和动作技能三个领域,每一领域的目标又由低级到高级分成若干层次。 (一)认知领域的目标

布卢姆(1956)将认知领域的目标从低到高分为六级:

1、知识:指对具体事物和普通原理的回忆、对方法和过程的回忆、或者对一种模式、结构或框架的回忆,包括具体事实、方法、过程、理论等的回忆。所要求的心理过程主要是记忆。

2、领会:领会是最低层次的理解。它指这样一种理解或顿悟:个人不必把某种材料与其它材料联系起来,也不必弄清它的最充分的含义,便知道正在交流的是什么,并能够运用正在交流的这种材料或观念。

3、运用:指能将习得的材料应用于新的具体情境,包括概念、规则、方法、规律和理论的应用。代表高水平的理解。 4、分析:指将材料分解成各种组成要素或组成部分,以便弄清各种概念的有关层次.或者弄清所表达的各种观念之间的关系。代表比运用更高的智能水平,因为它不仅要理解材料的内容,还要理解其结构。

5、综合:指能将部分组成新的整体。包括发表一篇内容独特的演说或文章,拟定一项操作计划或概括出一套抽象关系。它强调创造能力,需要产生新的模式和结构。

6、评价:指对材料(论点的陈述、小说、诗歌、研究报告等)作价值判断的能力。这是最高水平的认知学习结果。评价不仅是认知领域的目标的最高层次,而且它也是联系情感领域目标的一个重要环节。 (二)情感领域的目标

情感领域的目标是1965年由克拉斯沃尔(D.R.Krathwohl)负责完成的。情感行为的中心是价值(态度)、兴趣、爱好、欣赏。依据价值内化(指由外在的学习转化为个人内在的兴趣、态度、价值等心理特质)的程度,从低到高分为五级:

1、接受(注意):是指学习者愿意注意某特定的现象或刺激。例如静听讲解、参加班级活动、意识到某问题的重要性等。学习结果包括从意识到某事物存在的简单注意到选择性注意,是低级的价值内化水乎。

2、反应:指学生主动参与,积极反应,表示出较高的兴趣。学习的结果包括默认(如阅读规定的材料)、愿意反应(如自愿读规定范围之外的材料)及反应的满足(如以愉快的心情阅读)。

3、价值化:指学生将特殊的对象、现象或行为与一定的价值标准相联系。包括接受某种价值标准、偏爱某种价值标准和为某种价值标准做奉献(如为发挥集体的有效作用而承担义务)。

4、组织:指学习者在遇到多种价值观念呈现的复杂情境时,将价值观组织成一个体系,对各种价值观加以比较,确定它们的相互关系及它们的相对重要性,接受自己认为重要的价值观,形成个人的价值观体系。 5、价值与价值体系的性格化:指个人具有长时期控制自己的行为以致发展了性格化“生活方式”的价值体系。教学目标着重学生的一般适应模式(包括个人的、社会的、情绪的)。

强调学生作为的典型化和性格化。达到这一阶段以后,行为是一致的和可以预测的。例如,保持谦虚态度和良好的行为习惯;在团体中表现出合作精神等。 (三)动作技能领域的目标

该领域的目标分类以辛普森(E.J.Simpson)等1972年的分类较为有名,该分类有七级。 1、知觉:指运用感官获得信息以指导动作。 2、定向(定势):指对稳定的活动的准备。

3、有指导的反应:指复杂动作技能学习的早期阶段,包括模仿和尝试错误。

4、机械动作:指学习者的反应已成习惯,能以某种熟练和自信水平完成动作。此阶段的动作模式并不复杂。

5、复杂的外显反应:指包含复杂动作模式的熟练动作操作。操作的熟练性以迅速、连贯、精确和轻松为指标。

6、适应:指技能的高度发展水平。学生能修正自己的动作模式以适应特殊装置或满足具体情境的需要。

7、创新:指创造新的动作模式以适合具体情境。

布卢姆的教育目标分类理论 布卢姆认知目标分类修订的二维框架

教育目标分类学2001版对我国教学改革的启示

第三节 有关教育目标的基本理论

二、加涅对学习结果的分类 加涅(R.M.Gagné,1977)在《学习的条件》一书中,提出了五种学习结果:言语信息、智力技能、认知策略、动作技能和态度。 (一)言语信息的学习

即学生掌握的是以言语信息传递(通过言语交往或印刷物的形式)的内容或者学生的学习结果是以言语信息表达出来的。这一类的学习通常是有组织的,学习者得到的不仅是个别的事实,而且是根据一定的教学目标给予许多有意义的知识。使信息的学习和意义的学习结合在一起,构成系统的知识。 (二)智慧技能的学习

言语信息的学习帮助学生解决“是什么”的问题;而智慧技能的学习要解决“怎么做”的问题,如处理外界的符号和信息,又称过程知识。在各种水平的学习中都包含着不同的智慧技能,比如怎样把分数转换成小数,怎样使动词和句子的主语一致等等。加涅认为每一级智慧技能的学习都要以低一级智慧技能的获得为前提,最复杂的智慧技能则是把许多简单的技能组合起来而形成的。

智慧技能由低到高可分为辨别、形成概念、使用规则、问题解决等几类。

1、辨别是将刺激物的一个特征和另一个特征、或者将一个符号与另一个符号加以区别的一种习得能力。包括视觉、听觉、嗅觉、触觉、味觉等方面的辨别,如儿童能辨别三角形和正方形等几何图形,学习地质学的大学生能区别不同性质的岩石标本。学习辨别技能的重要性在于它是学习其它技能的必要前提。

2、形成概念是指在一系列事物中找出共同属性并给同类事物赋与同一名称的一种习得技能,例如在一组词汇中,将同义词和反义词归类。通常只有区别事物的不同特征,才能发现事物的共同属性,所以掌握辨别技能是形成概念的基础。概念又分为具体概念和定义性概

念,反映具体事物的概念是具体概念,如汽车、水果等;反映对象各种属性的概念是定义性概念,如“安全”、“教育”、“正义”、“勇敢”等。这些有关事物的性质以及事物之间关系的概念,由于其共同属性不能具体显现,只能用下定义的方式以语言涵义来表示。

3、规则是揭示两个或两个以上概念之间关系的一种言语表述。如,“圆的面积等于圆周率与圆的半径的平方之乘积”是一条规则。它是由圆的面积、圆周率、圆的半径等各个概念之间的关系构成的。

4、问题解决。问题解决是指运用各种习得的规则去解决问题的心理过程。问题解决常常需要多个规则的相互配合,而不再是单一规则的运用,因此,经过问题解决所学到的被称为“高级规则”。即是由规则组合在一起所形成的更复杂的规则。通过简单规则的重新组合而获得的高级规则具有更为广泛的应用性。高级规则作为一种学习结果,是学习者在解决问题过程中思维的产物,加涅指出,“学习者在试图解决一个特定的问题时,可能会把属于不同内容范围的两条或两条以上的规则结合在一起,从而组成一条能解决该问题的高级规则。”可见,高级规则还是规则,只是在复杂性上与作为其组成部分的较简单规则有所不同罢了。 (三)认知策略的学习

认知策略是“学习者借以调节他们自己的注意、感知、记忆和思维等内部心理过程的技能。”上面所述的智慧技能是运用符号处理问题的能力,即处理外部世界的能力,而认知策略是自我控制与调节的能力,即处理内部世界的能力。因此,从学习过程的模式图来看,认知策略就是控制过程、它能激活和改变其他的学习过程。这种使学习者自身能管理自己思维过程的内在组织策略非常重要。学习者通过认知策略指挥他自身对环境中刺激物的一定特点予以注意,对学习的事物进行选择和编码,对学习所得进行检索。学习者的认知策略还影响他对已掌握的言语信息和智力技能的综合思考,以提出解决问题的高级规则。 (四)运动技能的学习

运动技能是一种习得能力,以此技能为基础的行为结果表现为身体运动的迅速、准确、力量或连贯等方面,如乐器演奏、绘画、实验操作、打球等。动作技能也可存在于不使用器具或设施的活动中,如竞走、练拳、唱歌、舞蹈等活动中也有动作技能。

在学生的学习中,动作技能的学习往往与认知学习交织在一起。例如:学习英文打字,除学习打字动作外,学习者还必须了解有关英文字母、单词拼法、标点、文件格式、移行规则以及打字机的组成、各部分的作用和键盘上字符的位置等知识。没有这些知识背景,动作技能是不能学好的。同时,我们也看到动作技能学习中学习者感知因素的重要性和协调能力的关键作用。例如:初学英文打字的人是在稿子上看到一个字母,然后用眼睛在键盘上找到相应的字母,若离开这一视觉反应便打不出字来。而熟练的打字员几乎不看键盘,凭动觉(肌肉线索)来指导自己的按键反应,并且准确无误;又如初学者左右手和十个手指的操作很笨拙,断断续续地被分解成许多小步,而熟练者的动作却是连续流畅,协调得如同钢琴演奏家一般。所以,这里指的动作技能不是简单的外显反应,而是受内部心理过程控制的,故又称“心理运动技能”。

(五)态度的学习

态度是通过学习获得的内部状态,这种状态影响着个人对某种事物、人物及事件所采取的行动。作为一种学习结果,在教育心理学中态度被定义为:习得的、影响个人对特定对象做出行为选择的有组织的内部准备状态。特定对象包括事物、人和活动。当教学目标是使学习者形成先前未有的态度、或改变当前积极的或消极的态度时,这意味着我们要求学习者从事一项有关态度的学习任务。态度可以从各种学科的学习中得到,但更多的是从校内外活动中和家庭中得到。

加涅提出有三类态度:一是儿童所获得的促进他与社会交往的态度;二是对某类活动的积极偏爱;三是有关一般公民身份的态度。

加涅的学习目标分类理论 加涅的学习条件理论

当前位置:第一章 课堂教学评价概述

第三节 有关教育目标的基本理论

三、梶田叡一的教育目标分类 梶田叡一是日本著名的教育家,他借鉴布卢姆的理论,提出了具有东方色彩的教育目标分类理论,他认为学校教育至少要包含三种类型的教育目标:完成目标、提高目标和体验目标。

所谓完成目标,是指要求完成掌握的特定的具体知识和能力的目标。它是为客观地确认目标完成与否而做出的规定。目标完成时就必须就其状态做出明确的表述,通过表述结果与既定目标的比较、对照,无论是教师或是其他人,均可确认目标的达到度。使用行为目标这一形式来表述目标,正是为了确认目标达到度。 所谓提高目标,是要求学生向一定目标提高和发展或期待学生在某一方面有所提高或深化。如逻辑思维能力、鉴赏力、社会性、价值观等综合性的高级目标。对这类高级的目标进行评价,基本上采用自我比较或同他人比较这一形式去把握所取得的进步、提高和深化的程度。至于态度方面的目标,可以依据达到某个阶段时所表现出来的外部特征,做出近似的判断。

所谓体验目标,是通过学生的某种行为变化,了解学生所产生的某种切身体验。不是以学生表现出某种行为变化为直接目的,而是期待学生自身产生某种特定内容的体验。例如,在认知方面所得到的感受、在接触艺术作品中所受到的激励等。由于这种体验的变化不一定在学生身上马上表现出来,所以要确认体验是否发生了,应通过教师的观察或学生的自我报告及作文等形式来了解。

这三类目标都包含认知、情感、动作技能领域的一系列目标,并有具体达到的要求。

梶田叡一的三种教育目标类型 目标类型 认知领域 领 域 情意领域 达成目标 知识,理解等 兴趣,爱好等 提高目标 体验目标 逻辑思维能力,创造性等 发现等 态度,价值观等 熟练等 感触,感动等 技术成就等 动作技能领域 技能,技术等 梶田叡一针对日本学校重视知识记忆和理解,而忽视对学生兴趣爱好的培养,提出了“开、示、悟、入”的教育观点。“开”,意为开阔视野,唤起兴趣,耕耘心田;“示”,意为传授知识,让学生掌握要点;“悟”,意为学生将已学到的知识进行应用和实践;“入”,意为学生用学到的知识进行自我探索、追求,从而形成自己的人生观。 当前位置:第一章 课堂教学评价概述第三节 有关教育目标的基本理论 四、新课程的三维教学目标与二维评价目标 (一)新课程的三维教学目标

《基础教育课程改革纲要》中明确提出我国基础教育中的教学目标应该是知识与技能,过程与方法,情感态度与价值观三个维度。

1、知识与技能:知识是指事实、概念、原理、规律等,技能是指动作技能以及观察、阅读、计算、调查等技能。这两个方面就是过去常说的基础知识和基本技能,即“双基”。学科基础知识指各个学科所要求学生必须掌握的该学科所特有的基本事实、概念、规律、规则、原理、定理等。学科基本技能指各学科所要求学生必须掌握的该学科所特有的操作技能,比如,语文的听、说、读、写,数学的测量运算,理化的实验操作,生物的解剖观察,地理的勘察制图,以及音乐的演唱,体育的运动,美术的会画,手工的制作等。

在以前的基础教育教学中,由于过分强调了教育的知识传承功能,将学生掌握知识的多少来衡量教育教学质量高低,过分追求知识的系统性和复杂化,形成教学内容的“繁、难、偏、旧”,造成学生负担过重,影响了学生主动、活泼、全面的发展,特别是忽视了对学生创新能力、自学能力、实践能力的培养和健全人格的熏陶。这种教育价值取向的偏颇,并不是知识与技能本身带来的问题,而是对知识和技能的误导与异化造成的。

2、过程与方法:过程与方法是指认知的过程和方法,科学探究的过程和方法,认知过程中人际交往的过程和方法。特别强调在过程中获得和应用知识,学习和运用方法。课改纲要倡导“建构学习”,倡导“学生主动参与,乐于探究”,提出的过程与方法维度实际上就是建构学习的基本要求,表明了对学生自主获得知识的过程给予了高度重视。

相对教学结果而言,教学过程具有多样性、多变的、动态性、灵活性等特点。对过程的重视有利于强化思维训练,发展学生的求异思维、发散思维,使学生在动态的、开放的思维过程中,寻求解决问题的最佳方案,掌握目标达成的最好方法。

对过程的重视也离不开对方法的选择,过程中常常蕴含着一定的方法,一定的方法也只能体现在一定的过程之中。进化论的创立者达尔文说:“关于方法的知识是最可贵的知识。”方法的问题实际上是鱼与渔的问题,方法是解决问题的思维模式和途径,它的掌握不仅有利于问题的解决,更重要的是它能够触类旁通,迁移到类似的学习情景或者生活情景之中。 3、情感态度与价值观:情感、态度与价值观,一般包括对己、对人、对自然及其相互关系的情感、态度、价值判断以及做事应具有的科学态度、科学精神。“情感”有狭义和广义两种理解,狭义的“情感”就是我们常说的“感情”,是人们对客观事物的态度体验,包括喜、怒、哀、乐、爱、恶、欲等。广义的情感,是指人的心理素质,包括动机、兴趣、感情、意志乃至品格、个性等在内的心理特征,又称之为非智力因素。新课改的情感是一种广义的,它关注的是学生的心理健康和人格健全。就“态度”而言,最根本的态度,是对人生的态度,可具体细化为:对自己的态度和对他人的态度,对亲人的态度和对路人的态度,对家庭的态度和对集体的态度,对生活的态度和对事业的态度,对自然的态度和对社会的态度,对国家对民族的态度和对世界对人类的态度等等,它涵盖了一个人方方面面的社会责任感。 “价值观”则是指一个人一生的价值追求,价值取向,价值定位,也就是生活理想,人生目的,亦即通常所讲的世界观、人生观、价值观。 (二)二维评价目标

教育部2002年在《教育部关于中小学评价与考试制度改革意见》中提出了“基础性发展目标”与“学科学习目标”这个二维的评价目标。 1、基础性发展目标包括:

道德品质。爱祖国、爱人民、爱劳动、爱科学、爱社会主义;遵纪守法、诚实守信、维护公德、关心集体、保护环境。

公民素养。自信、自尊、自强、自律、勤奋;对个人的行为负责;积极参加公益活动;具有社会责任感。

学习能力。有学习的愿望与兴趣,能运用各种学习方式来提高学习水平,有对自己的学习过程和学习结果进行反思的习惯;能够结合所学不同学科的知识,运用已有的经验和技能,独立分析并解决问题;具有初步的研究与创新能力。

交流与合作能力。能与他人一起确立目标并努力去实现目标,尊重并理解他人的观点与处境,能评价和约束自己的行为;能综合地运用各种交流和沟通的方法进行合作。 运动与健康。热爱体育运动,养成体育锻炼的习惯,具备锻炼健身的能力、一定的运动技能和强健的体魄,形成健康的生活方式。

审美与表现。能感受并欣赏生活、自然、艺术和科学中的美,具有健康的审美情趣;积极参加艺术活动,用多种方式进行艺术表现。 2、学科学习目标:

各学科课程标准已经列出本学科学习的目标和各个学段学生应该达到的目标,并对评价方式提出了建议。如语文的课程目标:语文课程应致力于学生语文素养的形成与发展。语文课程应培养学生热爱祖国的思想感情,指导学生正确地理解和运用祖国语言,丰富语言的积累,培养语感,发展思维,使他们具有适应实际需要的识字写字能力、阅读能力、写作能力、口语交际能力。语文课程还应重视提高学生的品德修养和审美情趣,使他们逐步形成良好的个性和健全的人格,促进德、智、体、美的和谐发展。并且具体化为十项基本能力,每种能力在不同的能力阶段有不同评价要求。

“为了每位学生的发展”是确立“三维教学目标”的核心理念 体现全新教育理念 推进素质教育实施

当前位置:第一章 课堂教学评价概述

第四节 课堂教学评价的过程与方法

一般而言,课堂教学测评可以分为三个阶段。 (一)准备阶段

准备阶段主要就为什么要评价,谁来评价和评价什么等问题作充分准备。这一阶段主要工作包括:

1、组织准备

包括成立专门的评价领导小组或组建评价工作小组。 2、人员准备

主要是指组织与评价有关人员学习评价理论和有关文件,做好评价工作的知识与技能储备。

3、方案准备

主要是指评价的组织者根据课堂教学测评的目的,在教学评价实施前拟定的有关教学评价目的、内容、范围、方法、手段、程序和预期结果的纲领性文件。

方案通常包括以下内容:评价目的;评价对象;评价标准;评价方法;实施期限;评价报告完成的时间;评价报告接受的单位、部门或个人;预算等。 4、评价者和被评价者在准备阶段的心理现象与调控

在评价的准备阶段,评价者和被评价者会出现诸如晕轮效应、成见效应、应付心理、焦虑心理等一系列的心理现象,这些心理现象不仅会影响到评价者与被评价者之间的关系,而且还会影响评价的信效度,因此需要进行有效的调配。 (二)实施阶段

实施阶段是教学评价活动的中心环节,这个阶段的主要任务是,运用各种评价方法和技术,收集各种评价信息,并在整理评价信息的基础上,做出价值判断。 1、收集评价信息

根据先前制定的评价方案,利用相应的评价方法、手段、工具、仪器等收集所需要的评价信息。在这里评价工具非常重要,如评价表、量表、问卷等,它的科学性直接影响到信息收集的有效性。

2、整理评价信息 对收集到评价信息,通常需要进行审核和归类,前者是指需要对评价信息的有效性进行判断,如所填的问卷是否是在敷衍或者随心所欲,判断评价信息是被评价对象的真实反映;后者是指对评价信息根据其共同点进行归纳,以减少信息的杂乱和无序。 3、分析处理评价信息

在这个过程中,要注意以下问题:首先是要掌握评定标准和具体要求;其次评价者应该使用事先规定的计量或其他方法来处理评价信息,在评价结果中要给出明确的相应分数、等级或定性描述等评价意见;第三,条件许可的情况下,应该对评价者的测量或观察结果进行认定、复核。

4、做出综合评价

它是将分项评定的结果汇总成综合评价结果。它要求评价者根据汇总的评价结果,对评价对象做出准确的、客观的、定量的或定性的评价结论,形成评价意见。必要时,可对评价对象做出优良程度的区分,或做出是否达到应有标准的结论。 (三)评价结果的处理与反馈阶段

评价结果的处理和反馈通常包括以下几方面的内容:

1、评价结果的检验:一方面要检查评价程序的每个步骤,视其是否全面、准确地实施了评价方案;另一方面要运用统计检验方法,对评价结果进行检验。

2、分析诊断问题:评价的目的不是简单地对被评价者进行等级分类,相反是为了有效促进课堂中的教与学,因此需要对所收集的有关资料进行细致分析,并对被评价者的优劣状况进行系统评论,帮助被评价对象找出存在的问题以及问题的症结所在。 3、撰写评价报告:评价报告一般包括三大部分,即封面、正文和附件。

封面提供下列信息:评价方案的题目、评价者的姓名、评价报告接受者的姓名、评价方案实施和完成时间、提交报告的日期。

正文则包括:(1)概要:对评价报告简要综述,解释为什么要进行评价,并且可列举

主要结论和建议;(2)评价方案的背景信息:评价方案是如何产生的,重点叙述评价标准的编制过程及其理论依据;(3)评价方案实施过程的描述:主要叙述评价过程,即收集信息和处理信息的过程等;(4)结果及结果分析:介绍各种收集到的、与评价有关的信息,包括数据和记录的事件、证据等,以及处理这些信息所得到的结果;(5)结论与建议:对评价结果进行推断,得出结论,提出建议。 4、反馈评价结果

是指把评价结果返回给被评价对象或上级主管部门,以引导、激励评价对象不断改进、完善自己,同时为教师或教育管理机构提供决策依据。反馈评价结果的方式有多种,如个别交谈、汇报会、座谈会、书面报告等。

美国教师课堂教学评价

当前位置:第一章 课堂教学评价概述第四节 课堂教学评价的过程与方法 二、课堂教学测评的方法

课堂教学评价的方法很多,主要有以下几个方面: (一)随堂听课

这是获取课堂教学信息的重要途径,采用随堂听课这种方法,通常要做好以下几个方面的内容:

1、事先准备。这种准备一方面是评价者与被评价者之间就时间、地点、方式、观察重点等事项进行事先约定。另一方面,评价者需要在听课之前了解所听课的教学内容和教学目标,教学设计等,合理确定听课的重点。

2、课堂观察。在课堂观察中可以进行全过程观察和有重点观察。前者是指评价者全方位地观察课堂教学过程。通常这一类观察的难度较大,要求观察者有熟练的观察技能和丰富的观察经验。有重点观察则是指根据事先确定的观察重点,有针对性地进行观察和记录。观察者往往在观察过程中会借助一些事先准备的观察工具。

3、课堂记录。它是伴随课堂观察进行的,课堂记录通常有两种方式:一是利用事先选择或研制的观察工具进行记录,如弗兰德斯的相互作用分析系统等;二是描述记录法,它需要对课堂中的语言和非语言都进行记录,描述记录要求记录时应近可能把看到的和听到的所有内容都完整地记录下来,即进行课堂教学实录。

4、课堂快速调查。这可以通过快速调查来完成,常用的快速调查主要有两类:一是简单测试题,这可以了解学生的学习接受情况;二是微型问卷调查,向学生讯问一些简单的问题,如你今天上课举了几次手?你愿意在课堂上进行小组学习吗?老师讲的课都能听懂吗?你对这堂课满意吗等?

5、评价结果的反馈。对教师的评价结果的反馈往往以课后讨论的形式出现,其主要方法就是评价面谈。一般评价面谈包括下面几个步骤:(1)明确评价面谈的目的,这有助于消除被评价者的顾虑,让其能够畅所欲言;(2)让被评价者阐述本节课的总体安排、设想及其时限的程度,并对照评价标准进行自我评价;(3)评价者根据听课记录指出这节课的优势和不足,依据评价标准进行初步的评价,提出改进的意见;(4)在被评价者对评价者所做的评价和建议基础上,二者就双方存在分歧的问题展开讨论;(5)双方达成共识后,提出对以后课堂教学的要求。

(二)量表评价法

它是指通过编制评价量表来对课堂教学进行评价的方法。在课堂教学评价中使用量表评价法时,量表中的指标或指标体系是评价的基础。

1、评价指标体系的程序和技术

指标体系设计的基本程序通常包括:(1)发散阶段,主要任务是分解教育目标,提出详尽的初拟指标;在这个阶段通常可以采用头脑风暴法和因素分解法,前者是指在专家会议中,进行各抒己见,即席发言,初拟评价指标;后者是指将评价指标按照评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标的方法。(2)收敛阶段,即对初拟指标体系进行适当的归并和筛选。这个过程可以采用经验法、调查统计法和模糊聚类法。(3)试验修订。即选择适当的评价对象进行小范围的试验,并根据试验的结果,对评价指标体系及评定标准进行修订。

2、指标权重的确定

权重是指根据各组成指标在指标体系中的地位重要性和作用大小,所分别赋予的不同数值。权重代表了评价指标的重要性程度。

指标权重的确定可以采用关键特征调查法、两两比较法、专家评判平均法和倍数比较法。

关键特征调查法是先请被调查者从所提供的备选指标中找出最关键、最有特征的指标,对指标进行筛选并求出其权重的方法。两两比较法则是对指标进行逐对比较,并加以评分,然后分别计算各指标得分的总和。专家评判平均法则是对已经确定的指标,分别请专家评判其重要性,然后以专家评判结果的平均数为各指标的权重;倍数比较法则是以对已确定的指标,以每一级指标中重要性程度最低的指标为基础,计为1,然后将其他指标与之相比,作出重要性程度是它多少倍的判断,再经归一化处理,即可获得该级指标的权重。

当前位置:第一章 课堂教学评价概述第四节 课堂教学评价的过程与方法 (三)标准化测验

这是进行学业测试的传统方式,也是一种非常有效的方式。标准化测验要经历一系列的基本程序。

1、首先要明确测验目标,这样才能保证有向性,避免盲目性。通常测验目标就是教育目标,它是教、学、评、督、考的共同依据。

2、确定测验内容。通常这是在内容抽样和测验目标的基础上形成的。一般而言这个过程由双向细目表来确定测验内容中所涉及的每一内容范围的相对比例、测验目标中每一层次目标的相对比重、每一测验目标层次在每一测验内容范围上的相对比重,而双向细目表通常由测验目标,测验内容和权重构成。

3、测验设计。主要包括以下方面的工作:(1)测验形式的确定,即测验中采用何种形式的问题;(2)测验题目形式的确定,主要有主观题和客观题两种类型;(3)测验具体题型的确定与题目编制。即确定主观题和客观题中的具体形式并进行相应的题目编制;(4)测验题目的确定;(5)测验时间的确定;(6)测验题目的编排。

4、测验的技术分析与鉴定。主要包括以下几个程序:(1)编写复本与进行预测。前者是重要考试的必要步骤,预测则希望获取考生的信息,作为测验定量分析的依据。(2)测验的质量分析,主要包括定量和定性两类分析。而定量分析包括题目的难度分析、区分度分析、信度分析和效度分析;(3)测验的标准化,在标准化测试中不同的题型有不同的应用和设计技巧,后面有专门的叙述,这里不再重复。

(四)替代性评价

替代性评价是从标准化测试的基础上发展起来的,它与传统测验有很大的不同,这种不同不仅在于评价的方式,也表现在其评价对象的灵活性,它可以用来评价那些在传统测验中表现不佳或受到限制的学生,以帮助教师做出关于这种学生的有效推论。在评价的过程中,往往需要运用真实的生活或模拟的评价练习来引发始发行为,由高水平评定者按照一定的标准直接观察、评判,其形式主要包括建构式反应题、书面报告、作文、演说、操作、实

验、资料收集、作品展示。强调让学生在具体的真实或模拟的生活情景中,完成一定的任务,通过对学生在任务过程中的具体表现和完成任务的成果来评价学生。

表现性评价、档案袋评价法、概念图、量规等都是非常重要的替代性评价方法,在后面具体领域的评价中,有详细的叙述,这里不再重复。

(五)课堂观察与调查

课堂观察是研究者带着明确的目的,凭借自身感官及有关辅助工具(观察表、录音录像设备,直接(或间接)从课堂上收集资料,并依据资料做相应研究。课堂观察是搜集资料、分析教学实施的有效性、了解教学与学习行为的基本途径。

课堂观察的内容包括:师生交往的方式;教师提问的次数和问题类型以及学生对问题的反应;教学过程的开放性和探索性,教室的空间布局、班级规模等因素对学生认知、情感、态度和行为的影响。课堂观察技术方法和手段主要有:课堂教学录像、录音;以时间标识进行选择性课堂实录;座位表法;提问技巧水平检核表;弗兰德斯语言互动分类表;学习动机问卷调查和访谈;学习效果的后测分析等。

调查也是一种非常重要的获取课堂教学测评信息的手段。调查是一类方法的总称,根据不同的标准有不同的调查方法,而不同的调查方法所适应的需要收集的测评资料也是不同的,即不同的测评内容需要用不同的调查方法。

在实际的课堂测评中,还有一些其他的测评方法,在后面每个具体的测评领域有专门的介绍,这里不再重复。

关于发展性课堂教学评价指标体系的设计及其评价的方法与技术 教师课堂教学评价的定量分析 当前位置:第二章 学业成就的传统测评第一节 概述 一、什么是学业成就传统测评

(一)学业成就传统测评的涵义

学业成就的测评是指对学生在一定的阶段性学习时间内进行的对其所获得的学习结果的测量与评价。它所测评的内容是相对明确的,有利于教师发现教学中所存在的问题,改进教学,提高教学质量,促进学生更好地掌握知识,并能适时地进行应用和迁移。对学生的学业成就的测评已成为学校教育教学过程中的一个不可缺少的重要评价手段。它是衡量教师教得如何和学生学得如何的一个重要标志。

对学业成就的评价大体可划分为传统评价和替代性评价两类评价方式。其中学业成就的传统测评是指那些主要采用纸笔测试的方法对学生在一定阶段的学习时间内的学习成效所进行测量和评价。

(二)学业成就传统测评的特点: 1、所测评内容范围的明确性。

学业成就测评涉及有关学生的特定的知识学习经验,而且一般以阶段性的学习时间为准。所测评的知识内容也是在这一阶段性学习时间内的,是对学生阶段性学习结果的测量与评价。

2、测评的内容可反映学生对该内容的掌握程度,具有一定的代表性。 测评的内容应与测验的目的相一致,要符合教学目标的内容,而且内容应具有一定的代表性和切实性,能够鉴别出学生的学习水平,激励学生学习的积极性。

3、测评条件具有同一性。 测评过程中,各个学生所测试的内容材料都相同,而且有统一的时间限制和相同的指导语,都是测评学生在一定阶段学习时间内对知识或技能的掌握程度,利于对学生评价的客观公正性。

4、测评方法相对成熟。

在学业成就测评发展历程中,测评的方法在理论上已得到了相当的完善和丰富,测评的方法也层出不穷,种类也较全面,在教育实践中的应用也十分广泛和深入,已取得了相当大的成果,为教育评价的发展做出了重要贡献。

(三)学业成就测评的意义

学生学业成就的测评对教师搞好教育教学工作,提高教学水平,增进教育质量都具有重要的功能和意义。

1、诊断的功能。

对学生学业成就的评价不仅可以了解与评价学生的学习结果,而且还可以用来评价教师的教育教学,使教师了解每个学生的学习状况,诊断学生在知识掌握和能力发展上的不足及所存在的问题,以便于教师因材施教和进行个别学习指导。

2、有利于对教师的教学提供有效的反馈信息。 通过对学生学业成就的评价,教师可以及时了解学生的学习状况,发现自己教学中所存在的问题为改进教学方法,调整教学计划和内容,达到诊断学生学习上的困难和评价学生学习进步的目的,以及评定教学目标的完成情况和对学生知识的综合运用及迁移能力,为制定新的教育目标提供有效的依据,利于增强教学的实效性。

3、有利于激发学生的学习动机。

通过对学生学业成就的测评,能使学生更好地了解自己,进行自我评价,找出自己学习中的薄弱环节,调整和改进学习方法,为自己确定新的努力目标。

4、教育研究的功能。

通过测评,教师能不断总结教育、教学经验,提高教学方法,增强教学的实效性,为教学方法和教材的改革提供一定的实践材料,有利于教学改革。

当前位置:第二章 学业成就的传统测评第一节 概述 二、学业成就传统测评的种类

学业成就的传统测评的分类是一个相对的概念,按照不同的标准可以分为不同的种类。

(一)按测验的标准化分——标准化测验与教师自编测验

标准化测验是指由专家或专业的测验发行机构编制的,测验的设计、编制、实施、评分及分数解释等一系列过程都依据统一的标准而进行。标准化测验的试题取材广泛,题量多,涉及面广,具有较高的信度和效度,是学生学业成就测评的重要方式之一。然而。标准化测验的编制不易编制,相关的要求也比较高。

教师自编测验是教师依据实际的教学需要对学生的学习结果进行考查而自行设计与编制的测验。它编制较简单、灵活,使用范围广,可以针对不同情况的不同学生使用,贴近教学的实际,有利于教师正确评价学生的学习成就。教师自编测验的信度和效度的要求不如标准化测验的要求那么严格。

教师自编测验与标准化测验的比较

(二)按测验目的的特性划分——客观式测验与主观式测验

测验的试题可以客观地记分,不受主观因素的影响,而且答案唯一,这样的测验叫客观式测验。客观式测验的试题形式多样,主要包括再认式的选择题、是非题、匹配题和再现式的填空题、简答题等。客观式测验的优点是测试试题容易标准化,试题内容取材广泛,评分也客观公正,而且省时。不足之处是只能测评学生的一般的学习成就,而对较复杂的学习成就如学生语言文字材料的组织、表达能力,问题解决中的创造性等能力则难以胜任,而且也易受学生猜测因素的影响。

主观式测验是指传统的问答式测验,学生根据测验提出的问题自由作答。它包括论述题、说明题、作文题等形式。其中,论文式测验的优点是试题编制容易,学生可以充分表

达自己对问题的理解和看法,可以有效地测评学生的分析问题、理解问题、材料组织和应用等能力,而且学生的回答猜测因素较小。其缺点是取材范围有限,代表性不强,评分易受主观因素的影响,客观性不足而且也很费时。

(三)按测验的用途划分——形成性测验与终结性测验

形成性测验主要是指在教育教学的过程中教学者为了改进教学方法、提高教学质量而进行的对学生学习阶段及结果的测评。它有单元测验、平时的随堂考试等形式。形成性测验注重对学生学习过程中学习内容的评价,通过评价结果来调整教学内容或改进教学方法,使教学在不断的测评、反馈、改进中不断的完善;同时也有利于学生了解自己在学习过程中对知识的掌握程度以及自己进步状况,便于学生自我评价、自我促进、自我提高。形成性测验具有诊断和预测的功能。形成性测验的测试过程比较频繁,可以是一周一次或是一单元一次等,但其测试的概括水平不高。

总结性测验是指在课程或一个教学周期结束时对学生学习结果的测评。它主要评定学生的学业成绩,判定学生的学习是否达到教育教学目标的要求,同时也对学生的知识、技能及能力水平进行了综合的评估。总结性测验侧重于测评学生在较大范围内对知识的掌握程度,大多数是在形成性测评的基础上进一步进行的。它的取材内容广泛且具有一定的典型性和代表性,评价的频率不高,一般一学期或一学年两三次,如常见的期中考试、期末考试等。但是它的周期太长,只是对学生学习效果的“回顾式”评价,不能适时地解决学生在学习中所出现的问题。

(四)按学科的特征划分——单科测验和综合测验

学科测验是测量学生在一定阶段时间内通过学习各门具体学科所获得的知识和技能的一种重要测评工具。学科测验的种类很多,按科目来分,可以分为语文测验、数学测验、物理测验、化学测验等。这类测验的试题具有基础性和全面性的特点,它们在概念与标准化上与任何其他学科的测验无关。

综合测验是包括不同学科内容范围相互配合的成套测验进行的。此类测验是测量在各个教学阶段中,学生在若干学科上所获得的知识与技能。其优点在于,编题计划的综合性,即把主要的知识技能或主要的各课程内容设计到试题计划的各个组成部分中。测评的结果既可以进行综合性比较,也可以为分科性比较提供依据。

(五)按测验的形式划分—操作测验与书写测验(纸笔测验)

操作测验主要是考查学生实际的动手操作能力及知识的应用和迁移能力。尤其在理化生学科方面比较突出。操作测验的准备和实施很费时,而且评分也困难,测试的条件不易控制。

书写测验也叫纸笔测验。指以书面形式的测验工具,是评价学生在学习上的学业成就或认知能力的发展状况的一种测评方式,可分为再认式测验如是非题、选择题、匹配题等和回忆式测验如填空题和简答题等。纸笔测验是教育者了解学生分析和有效解决各类问题以及语言材料的组织、表达能力的有效手段。在传统的测评中一般以纸笔测验为主。

当前位置:第二章 学业成就的传统测评第一节 概述 三、学业成就传统测评设计的原则

无论标准化测验还是教师自编测验,都侧重于书写测验即纸笔测验,它们所包含的试题类型也大致相同。为了更好对学生的学业成就进行测评,提高测评的有效性和针对性,在采用纸笔测验时应明确以下设计原则:

1、试题的分布必须依据双向细目表,而且题目陈述的内容要有一定的代表性。对于测验编制者而言,细目表就像是“蓝图”,它详细说明了测验试题的数目、内容和性质,可以作为撰拟试题的指导。因此,在试题的编制过程中,试题的分布必须符合双向细目表的要求,而且,试题陈述的内容也要具有一定的代表性,这样才能编制出一份很好的测验。

2、试题陈述的应简洁、清晰、明了,避免使用含混不清的表达。在测验中,试题的陈述要见解、清楚,而不能含混其次,使学生老是停留在理解题意上,不能做出正确的回答,影响对学生学业成就的正确评价,达不到测评的最终目的。

3、试题题目的陈述要简明、扼要,突出重点。试题中,题目的谴词造句要明确,问题叙述要完整,且重点突出,这样有利于学生的正确作答,而不致使学生在解题上花费过多的时间,提高作答的效率。

4、试题所使用的材料应切合教学目标且符合学生现有的身心特征。试题中,所涉及的知识内容应符合学生身心发展的特征,并切合教学的目标,所使用的指导语、试题的类型、作答方式等都应符合学生的现有程度,不要让学生因看不懂题目而不会作答。

5、明确指导语,表述应清楚,便于学生作答。指导语包含了对测验目的的说明和如何作答、如何施测的指示。因此,测验中,试题的指导语应清晰、简明地指出对学生作答的要求,时间的限制等,让学生明确具体的要求,而不至于盲目作答,这样有利于提高测验的效率,达到正确评价学生学业成就的目的。

6、答案必须是公认的正确答案,应避免有争议的答案存在。试题编制应严密,保证答案的唯一性和公认性,而不是有歧义或争议的内容,至少在一定程度上是符合既定的规则。

7、各类试题应是相互独立的,在内容上应不要有重叠。在测验中,各试题类型间是相互独立的,而且兼顾教学目标的具体要求,在内容上也应没有重叠,这样编制的试题才能从整体和局部上都能反映出所要评价的学生各方面的层次,从能对其学业成就的评价提供正确的依据。

8、试题陈述中避免提供暗示性的语句。测验中,试题应清楚、确切,题目中不能潜藏着答题的线索,特别是在描述中应避免具有暗示性的特殊字词。这些暗示性的字词很容易使学生根据线索来猜题,从而影响学生对试题正确的评价,也会使学生的作答受到影响。

9、试题应具有良好的鉴别力,利于教师正确评价学生。试题应具有良好的鉴别力,能够很好地达到评价者的目的,能具有分辨、筛选、诊断和评鉴的功能,既兼顾认知的各个层次,又能达到正确评价学生学业成就的目的。

当前位置:第二章 学业成就的传统测评第二节 客观式测验 一、什么是是非题 (一)是非题的涵义及使用

是非题也叫二项选择题、正误判断题。是非题基本上是只有两个选项的选择题,当选项只有两种可能性时,以是非题出题比选择题更适合。是非题一般是由陈述句组成的。是非题的基本型式是提供一个叙述,让学生判断叙述的正确与否。它要求学生做出真假、正误、事实或观点等判断。每个问题都有两个可能的答案。

一般而言,是非题最适合考查学生对基本概念、性质、原理定则等的认知和判断能力。对低年级儿童的思维能力及对态度、兴趣等方面的测验等,不宜采用是非题来测验。

(二)是非题的优点及不足

是非题可以说是一种简化了的选择题,它在编制与使用中具有这样一些优点:(1)与选择题相比,是非题的编制较容易,评分也客观、公正;(2)是非题的作答迅速,能在较短时间内考核较多的教学内容,效率较高;(3)可以和解释性试题连用,来测量学生更高的认知能力和复杂的学习成就;(4)是非题的命题内容很广。

但是,是非题也有其不足之处:(1)猜测因素很强。由于是非题只有两个选项,即使学生对命题的内容一无所知,也有50﹪的机会猜对答案。(2)虽然是非题的命题内容广泛,但很难编制出能测量较高层次的认知能力的试题。是非题一般适用于测量学生较低层次的认知能力,如判断概念、定律、或规则的是与非,而对较高层次的认知能力目标就难以测量。

为了提高是非题的信度和鉴别力,可以采用以下方法来减少学生对试题的猜测因素:(1)当所有的学生都不知道正确答案时,鼓励他们都去猜测。(2)要求学生改正错误。运用这种方法时,在每个选项后面都留出一点空隙,如果学生判断题项有错误,就在空隙处给以改正。并要求学生把不正确的部分用横线标示,写出正确的内容。(3)鉴于是非题所存在的不足,可采用将是非题与说明题相结合。既让学生判断,又让其说明理由。既可以减少学生猜测的机会,也可以测量学生较高层次的认知能力。

(三)是非题的设计 鉴于是非题自身的特点,为了教师能够编制出一份高质量的是非题试题,发挥其鉴别的功能,教师在编制试题时应遵循以下命题要求:

1、编制时应尽量避免用否定语句的陈述,多用肯定的陈述,尤其应避免使用双重的否定语句。

2、避免使用具有暗示性的字词或特殊的限定词句。如“所有”、“通常”、“只有”、“可能”等。

3、每一题中只能包含一个核心的概念,应避免同时包含两个或以上的概念在同一试题中出现,而造成“似是而非”等的情形,干扰学生的判断及回答。

4、陈述命题时应简洁、明确,避免使用长的复杂句型。否则会使其变成阅读能力的测验,而达不到测试的目的。

5、试题的正确与错误的题数应大致相同,且应以随机排列的方式呈现,尽可能减少学生对试题猜中的机率。

6、试题的表述应清晰明确,语言要严密,不能模棱两可。是非题中试题的表述要清晰、明了,语言要严谨,不能含糊其次,“或左或右”,而影响学生做出正确的评判。

7、试题中的陈述应避免直接使用教材中的原话,应对陈述的内容重新组织加工。试题的取材不能一成不变地引用教材的内容,应适当地加以组织加工,以达到评价学生能力的目的,而不至于只评价学生的再认能力。

8、避免使用没有任何来源的观点,意见性的陈述必须指出参考资料的出处或依据。 当前位置:第二章 学业成就的传统测评第二节 客观式测验 一、什么是是非题 (一)是非题的涵义及使用

是非题也叫二项选择题、正误判断题。是非题基本上是只有两个选项的选择题,当选项只有两种可能性时,以是非题出题比选择题更适合。是非题一般是由陈述句组成的。是非题的基本型式是提供一个叙述,让学生判断叙述的正确与否。它要求学生做出真假、正误、事实或观点等判断。每个问题都有两个可能的答案。

一般而言,是非题最适合考查学生对基本概念、性质、原理定则等的认知和判断能力。对低年级儿童的思维能力及对态度、兴趣等方面的测验等,不宜采用是非题来测验。

(二)是非题的优点及不足

是非题可以说是一种简化了的选择题,它在编制与使用中具有这样一些优点:(1)与选择题相比,是非题的编制较容易,评分也客观、公正;(2)是非题的作答迅速,能在较短时间内考核较多的教学内容,效率较高;(3)可以和解释性试题连用,来测量学生更高的认知能力和复杂的学习成就;(4)是非题的命题内容很广。

但是,是非题也有其不足之处:(1)猜测因素很强。由于是非题只有两个选项,即使学生对命题的内容一无所知,也有50﹪的机会猜对答案。(2)虽然是非题的命题内容广泛,但很难编制出能测量较高层次的认知能力的试题。是非题一般适用于测量学生较低层次的认知能力,如判断概念、定律、或规则的是与非,而对较高层次的认知能力目标就难以测量。

为了提高是非题的信度和鉴别力,可以采用以下方法来减少学生对试题的猜测因

素:(1)当所有的学生都不知道正确答案时,鼓励他们都去猜测。(2)要求学生改正错误。运用这种方法时,在每个选项后面都留出一点空隙,如果学生判断题项有错误,就在空隙处给以改正。并要求学生把不正确的部分用横线标示,写出正确的内容。(3)鉴于是非题所存在的不足,可采用将是非题与说明题相结合。既让学生判断,又让其说明理由。既可以减少学生猜测的机会,也可以测量学生较高层次的认知能力。

(三)是非题的设计 鉴于是非题自身的特点,为了教师能够编制出一份高质量的是非题试题,发挥其鉴别的功能,教师在编制试题时应遵循以下命题要求:

1、编制时应尽量避免用否定语句的陈述,多用肯定的陈述,尤其应避免使用双重的否定语句。

2、避免使用具有暗示性的字词或特殊的限定词句。如“所有”、“通常”、“只有”、“可能”等。

3、每一题中只能包含一个核心的概念,应避免同时包含两个或以上的概念在同一试题中出现,而造成“似是而非”等的情形,干扰学生的判断及回答。

4、陈述命题时应简洁、明确,避免使用长的复杂句型。否则会使其变成阅读能力的测验,而达不到测试的目的。

5、试题的正确与错误的题数应大致相同,且应以随机排列的方式呈现,尽可能减少学生对试题猜中的机率。

6、试题的表述应清晰明确,语言要严密,不能模棱两可。是非题中试题的表述要清晰、明了,语言要严谨,不能含糊其次,“或左或右”,而影响学生做出正确的评判。

7、试题中的陈述应避免直接使用教材中的原话,应对陈述的内容重新组织加工。试题的取材不能一成不变地引用教材的内容,应适当地加以组织加工,以达到评价学生能力的目的,而不至于只评价学生的再认能力。

8、避免使用没有任何来源的观点,意见性的陈述必须指出参考资料的出处或依据。 当前位置:第二章 学业成就的传统测评第二节 客观式测验 二、什么是匹配题 (一)匹配题的涵义及使用

匹配题(matching item)是由两列词或短语组成的,要求学生从一列中的每一条与另一列的相匹配。又称为配对题。需要从另一列中找到对应信息的项目称为前提项。从中做出选择的那部分称为反应项。两列项目数完全相同的称为完全匹配题,不相同的称之为不完全匹配题。

凡是学习结果强调的是判断两事物之间联系的能力,并且有同质的前提项和反应项,那么就可以使用匹配题。一般认为,比较重要的联系有:

人物„„成就 日期„„ 历史事件 术语„„定义 规则„„ 例子 符号„„概念 作者„„书名 外语单词„„英文对应词 机器„„用途 动植物„„类别 原理„„说明 物体„„物体名称 部件„„功能 (二)匹配题的优点及不足 匹配题使用的范围很广,可与其它类型的试题连用来测量较高层次的认知能力。它的形式紧密,效率高,能在较短时间内测量到大量的相关内容信息,评分简便、客观、快速公正,有效地避免了人为的主观因素的干扰。但是,匹配题大多只能测量一些关系性的死记硬背的知识,不利于学生知识的应用和迁移;而且相关的线索较多,对学生的作答有一定的暗示性;编制具有足够同质性反应项的试题很困难,而且对编题人员的要求相对较高。

鉴于编制匹配题试题同质性难问题,可以采用多项选择来解决,因为每个题目都与一个特定的结果直接相联系,只有当同质材料使匹配题可以更加有效地测量同样的成就时,才选用匹配题。

(三)匹配题的设计

1、指导语必须明确、清晰,而不能含混不清,这样有利于学生回答。在试题中,指导语必须清楚明确说明答题的要求、原则,不至于学生因不懂题意而盲目作答导致不必要的错误。同时,也可以节省测量的时间。

2、题目陈述的内容必须是同质的或接近的(应都属于同一类别或同一性质、关系的事物)。在编制试题时,必须注意内容的同质性而不要泛泛而谈,这样有利于增强试题选项的迷惑性,达到辨别学生层次和所掌握知识水平的目的。

3、应尽量编制不完全的匹配题,而且每个备选项被选的次数应不受限制。编制试题时,尽量采用不完全的匹配题,对备选项被选的次数不加限制,可以被选一次或两次或三次等,这样有利于减少学生在作答时凭借猜测来回答的机率,增强了试题的有效性和鉴别力。

4、题目陈述的内容应当简洁、明了,反应项应按一定的方式呈现(如时间顺序、空间顺序、数字或字母顺序等)。在试题的陈述中,题目应简洁、明确,将更简练的反应项放在右边,而且,反应项应按一定的规律如时间先后顺序、数字大小或字母的先后顺序等随机呈现,这样,可以减少学生凭记忆的线索或盲目的猜测方式来作答。

5、试题中选项和被选项的数目应在10个以内,而不要过多,同时应减少与答题有关的线索。试题中前提项和反应项的配对数目过多,就会使材料难以达到同质的要求,而且容易给学生提供不必要的作答线索,也会增加学生作答的时间。如果在限定的时间内,反应项数目过多的匹配题就很容易成为是在对 学生的阅读和理解速度以及反应的准确性进行测评,而偏离了命题的本意。

6、应将同一匹配题试题中的所有选项和被选项放在同一页试卷上。将试题的所有部分放在同一页上,有利于学生减少翻页寻找选项的时间,而且也不会出现漏答的情况,同时也有利于提高学生作答的速度和测验的效率。

当前位置:第二章 学业成就的传统测评第二节 客观式测验 三、什么是简答题 (一)简答题的涵义及使用

简答题是指要求被试(学生)对所提为体用简短的语句来回答的一种题型。回答的内容可以是几个字词,也可以是几句话。常用的简答题题型类型有:解释题、直接问答题、列举题、简要说明题等。

(二)简答题的优点及不足

简答题适合于测量学生对所学基础知识、定义、原理等知识内容的回忆和再现的情形,在一定程度上也可以测评学生的推理和解决问题的能力。和填空题一样,简答题的编制较灵活、简便,可以从不同方向、不同侧面考虑出题的内容,有利于增强对学生所学知识评价的准确性,而且不受学生猜测因素的影响。

由于以上简答题所特有的特征,也限制了它难以对高层次的教育教学目标如对知识的综合、分析、评价等进行很好的测评,而且评分易受主观因素的影响如学生作题时字迹清晰度、错别字等以及教师评分时的主观性也较强,客观性不强。

鉴于简答题的限制,可将简答题与多项选择题相结合,组成新的题型——选择说明题。即要求学生在所提供的选项中选出正确的答案,然后解释原因。

(三)简答题的设计

鉴于简答题所特有的优缺点,在设计简答题时,应注意遵循以下编制原则:

1、问题陈述的内容应简洁、明确,使被试(学生)能用简单的语句来回答。使学生能力明确掌握试题的要求,而不会在理解题意上花费过多的时间。

2、问题的答案要简洁、唯一,避免出现有争议的答案存在。问题的答案要尽量唯一,避免有争议的答案。如果答案确实难以确定时,应选择最佳的,以利于评分的客观性和公正性。

3、测评应偏重于考查学生对所学知识的应用和迁移,而不要只考死记硬背的内容。 4、在考查某一公式的实际应用时,所提供的数字要便于计算,而不要复杂化。试题中,涉及计算的数字不要复杂化而要简洁,避免给学生的计算带来困难,而影响学生的作答。

5、问题的陈述应尽量以直接陈述为主,避免间接陈述,影响学生作答。问题的直接陈述较自然,而且问题的结构很严谨,也便于学生理解。而间接陈述则会影响学生对问题的理解,不利于学生对问题的掌握而正确作答。

四、什么是选择题

(一)选择题的涵义及使用

选择题是当今客观测验中被认为是最基本、使用最广、最深远的一种试题类型,尤其是配合电脑的使用,使得阅卷、计分、试题与测验分析结果都相当快速与正确。

选择题(multiple-choice item)是指从多项选择中挑选一项正确选项的试题类型,它由一个“题干”和几个“选项”组成。题干是根据所要考查的内容而编制的一个问题或一句不完整的话。选项则是根据题干而设计的几个备选答案。选择题按备选答案中正确答案的个数,分为单项选择题和多项选择题。单项选择题在备选答案中只有一个正确答案,多项选择题在备选答案中有两个或两个以上的正确答案,因此,在编制试题时,应明确说明选择的要求。

(二)选择题的优点及不足

选择题试题可以测量出学生各种不同层次的学习成就,也可适合用于各种不同学科范畴的课程内容,用来测评学生的认知能力。选择题可以与电脑配合使用,使得评分快速、客观、公正,更科学化。因此,它已成为当今教师自编成就测验所普遍使用的一类题型。

选择题具有以下优点:(1)选择题适用范围广,能较好地考查学生各个层次的认知能力,如学生的记忆、分析、推理和应用知识的能力等;(2)选择题的取材广泛,受学生的猜测因素较小,信度较高;(3)选择题试题的编制比较灵活,可以根据测试的目的,调整试题的难度,从不同的角度测评学生各层次的能力;(4)选择题的评分较客观公正,而且可以与电脑联合使用,评分省时、省力。

但是,选择题在使用与编制中也存在下列一些不足:(1)与论述题相比,选择题试题的编制相对费时、费力;(2)要编制出“似是而非”的良好的诱答选项或迷惑性选项很困难;(3)由于选择题的选项是相对固定的,测不出学生的问题解决、材料的组织与表达等能力;(4)选择题中试题的得分可能受学生阅读理解能力的影响。

当前位置:第二章 学业成就的传统测评第二节 客观式测验 (三)选择题的设计 一份有效的选择题,不仅能够很好地鉴别出学生对知识的掌握程度,也能甄别出学生对问题的解决能力和知识的迁移能力。为了更好地发挥选择题应有的功能,在编制选择题时应遵循以下设计原则。

1、题干陈述的内容应完整,并能清楚确切地表达一个问题,简洁、明确,避免选项将题干分成两部分,致使题干不完整。

2、试题所考查的内容应是重要的或关键性的知识。否则一方面增加了试题不必要的难度,另一方面,也不能到达测评的真正目的。

3、所编制的试题中,各个试题得到备选项个数应相同,一般以四个为宜。一般而言,各试题中备选项书目的数目应保持一致,不可偏多也不可偏少,以四个为宜,但至多不

能超过五个,这样有利于阅卷和评分,也便于对整个试题的统计分析 。

4、正确答案呈现应该是随机的。一份高质量的测验试题,应避免很容易备学生因猜题而答对的机会。因此,正确答案出现的位置应以随机的方式呈现,避免有规律性的排列;而且,各试题中正确答案在各选项中出现的机率应大致相同,以降低学生猜测的机会。

5、试题应与学生的生活实际相结合,利于学生知识的应用和迁移。在编制试题时,不要照搬教材的内容,而应将内容重新整合,创设新的问题情境,并与学生的实际生活相结合,既利于学生对问题的解决,也利于学生对知识的迁移,达到学以致用的目的,也增强了学生对知识的理解和掌握。

6、试题中各备选项在形式上应一致、结构上也应大致相同,而且应是相互独立的,彼此之间没有逻辑联系,而且,所有选项都应与题干在语法上保持一致。

7、选项表述要简洁、清晰,有相同的表述的放在题干中。试题中,备选项的表述要简洁,尽可能将各选项中相同的内容放在题干中,避免有重复的材料出现,这样不仅有利于试题的题意清楚、明确,利于增加试题的可读性,而且可以减少学生阅读选项时所花费的时间,提高学生作答的效率。

8、试题陈述的内容应是唯一的,而不应有两个或两个以上的概念存在。试题的题干应只提出一个问题,而且问题陈述的内容一个简洁、清楚,而在同一试题中不能同时包含两个或两个以上的问题,而使得题意含糊,不利于学生作答。

9、备选项应具有诱惑力,错误答案要有迷惑性。各备选项与题干都要有一定的逻辑联系,错误的答案应具有“似真性”,错误不能太明显,选择题试题编制的优劣就在于错误选项的描述是否具有似真性。一个“似真性”的错误选项很容易发挥出选择题应有的诱答或迷惑功能,能将“能力高低”与“能作答与否”的学生区别开来。

增加诱惑项迷惑度的方法一般有:(1)使用学生中共同的常犯的错误或过失来作诱惑项;(2)以学生惯用的模糊性用语来作诱答;(3)诱惑项的长度、措辞的复杂性与正确答案应相似;(4)诱惑项中使用迷惑性的线索,如与题干有某种语义联结等;(5)保持诱惑项表面上的同质性。

10、试题中应尽量避免出现“以上都是”或“以上都不是”的选项。 “以上都是”或“以上都不是”选项,很容易使学生觉得它具有暗示作用。这种题项的出现,增加了学生猜测的机会。而且,在选择最佳答案时,若出现该选项就会引起争议,达不到答案唯一的目的,还会降低试题的有效性

11、题干和选项的表述中应避免出现暗示学生作答的线索。一般而言,无论时正确答案还是诱答选项,如果叙述冗长、语法结构不一致、使用特殊的字词或内容重复等,都会对学生的作答提供暗示作用,而引起学生的猜测行为。

12、编制选择题时,所编制试题的数目不要过多。一份测验中试题的多少,应根据学生在一次考试情境中所能作答的数量为参照。试题过多,会变成速度测试,达不到评价的目的;试题过少,信度就会降低,也不容易测评出学生的学习成就。

13、试题中应尽量使用肯定的陈述语句,若有否定的字词出现时,应着重强调,以警示学生。否定结构过多地使用,会给学生带来阅读理解上的困难,不利于学生作答,也不利于教师了解学生对知识的掌握程度;而且,在某种程度上,肯定结构要比否定结构更具有教育、启发意义。

14、根据测评的目的可以通过改变试题题干或选项来调整试题的难易程度。通常,根据测评的目的,为了增强试题的难度或复杂性,鉴别学生更高的认知能力,可以通过改变题干或选项中任何一个来控制试题。但各备选项之间应是在教育意义上的差别,并且能与所要测评的学生的学习成就相一致。

15、在同一测验中,各试题间应是彼此独立的,没有任何逻辑上的联系。各试题间

应是彼此独立的,可以避免这个试题为另一试题提供暗示答案的线索,即每一试题的作答都应与其他的试题无关,是完全独立的,而且也不存在任何逻辑上的联系。

16、若有其他类型的试题更适合测评的要求或目的时,就不要使用选择题。上述的编制原则,可以灵活使用,以编制出更具有新颖性、创造性和有效性的试题。

当前位置:第二章 学业成就的传统测评第二节 客观式测验 五、什么是填空题 (一)填空题的涵义及使用

填空题是指在一个完整的陈述中,命题者故意抽去关键性的短语、词组、时间或重要性的概念、地名、人名等,再让被试(学生)来补充完整。

例:

《红楼梦》的作者是___。 (二)填空题的优点及不足 填空题的编制容易,而且取材范围广,可用来测量学生对知识的回忆和再现及理解能力,可特别使用于诊断性的测验中,该题型大大减少了学生作答时的猜测因素,也省时。

但是也有其不足。命题陈述中正确答案唯一较难得到,评分相对于前面的几种试题类型要麻烦、费时,而且学生的作答如字迹的清晰性、有无错别字、是否有增字或漏字的情形等都会影响评分的客观性和公正性。填空题测量学生的能力层次有限,只能测评学生对知识的回忆和再现能力,而较难对更高层次的认知能力进行评价,也易养成学生死记硬背的不良学习习惯,不利于学习对知识的应用和迁移。

将填空题型与选择题型相结合,编制改良式的克漏字测验(close test),这种题型是从所选择的文章中故意省去较为重要的内容,然后要求学生根据文章的内容进行分析,从所提供的众多选项中选择出正确的答案。这类题型在外语测验中,运用的较多。

(三)填空题的设计

1、所要测试的应是重要的或关键性的知识内容,而不是一些零散的或无价值的内容。

试题中空格处所填写的内容应是重要的或关键性的知识,能体现处学生对该知识的掌握和理解程度,具有一定的代表性,否则,填空题就很容易成为只测评学生零散知识的工具,而使得测评变得毫无疑义。

2、填空题的内容陈述要简洁、明确,而不要模棱两可,而且所填写的答案应唯一。 试题的题意要明确、限定要严密。并且答案应是唯一的。若题意不清,抹零两可,就可能出现多种答案,达不到测评的目的,也不利于阅卷评分,所以要避免有争议的答案出现。

3、试题中所要填写内容的空格不要太多,应突出重点,不要使试题变得空泛,达不到命题的真正目的。

试题中所要填写的空格数目应适中,而且应突出重点。如果空格过多,学生很难理解题意,难于作答,也很容易造成学生死记硬背答案的现象,而不能真正地掌握知识。待填写的空格也不要过于宽泛,否则会出现众多的答案,不利于评分的客观统一性。

4、命题中应尽量采用直接提问的方式来要求学生作答,少用不完全的陈述,这样有利于答案的唯一。

使用直接提问的方式来命题,题意清楚、明确,符合答案唯一的要求,同时也可以避免为学生提供作答的暗示性线索。而不完全陈述则可能会引起不必要的争论,会造成题意不明,使学生难以正确作答。

5、试题中所要填写空格的长度应相同,避免长短不一,造成学生回答的定势。 所填空格的长度应大致相同,避免随正确答案字数的多少而使空格长短不一,为学生的正确作答提供线索,而且学生会形成一定的定势:空格长的,填写的内容要多些;空格

短的,所要填写的内容就较少。因此,所要填写的空格应留得一样长,并且让学生充分作答,可以避免无意中为学生的作答提供暗示性的线索。

6、在所填写的内容中,若要是回答数字型的答案时,则应明确其作答要求。在试题中,若是有关计算的,最好应指明所填答案的要求如相关的单位、数字的精确程度等,利于学生正确作答。这样,既有利于学生所填答案的高准确性,也可以使他们避免浪费时间在进行过多的计算上,从而提高学生作答的效率。

7、所要填写的空格应尽量放在句末。把空格放在句末,可以使试题看起来更清楚,也可以使记分快而准确,同时也可避免将空格放在句中将试题分割成两部分而造成的误解,从而不利于学生正确作答。

8、试题的陈述应避免直接摘抄原文,以免学生死记硬背教材,而不利于对知识的理解和掌握。在编制试题中,若有以教材中的内容为题材时,不应直接照搬原文,应对其进行适当的加工,可依据内容创设新的问题情景,促进学生对知识的应用和迁移,而避免学生只是一味的知识进行死记硬背得不到提高。

9、根据测评的目的,可以采用多种形式的填空题试题。在命题中,可根据不同的测评要求,编制不同类型的填空试题。

如为了避免学生对知识的死记硬背,又可保证答案的唯一性,当所要考查的内容具有序列性时,可采用序列型的填空试题,即让学生按提供的事物的先后次序,根据问题的要求,将其排成先后次序,用1、2、3、4等数字来代表其次序。

例:(序列型试题)

依据下列著作写作的先后顺序排列其先后: ( )《中国社会各阶级的分析》 ( )《〈共产党人〉发刊词》 ( )《关于修改党章的报告》 ( )《反对自由主义》 ( )《整顿党的作风》 ( )《反对本本主义》 改错型试题既能检查学生对知识的再认能力,又能考查学生的再生能力。当所要考查的是比较容易混淆的内容时,采用该题型是比较适当的。这种题型要求学生将试题中错误的部分下边划线,将正确的内容填入括号内。

例:(改错型试题)

将下列成语中错误的部分下边划线,并在括号内填入正确的内容。 变本加厉 ( ) 信口开合( ) 试目以待( ) 小结: 当前位置:第二章 学业成就的传统测评第三节 复杂成就的传统测评 一、什么是解释性练习

(一)解释性练习的涵义及使用

解释性练习(interpretive exercise)又称“归类学习(classification exercise)”,“答案分类题(key-type item)”或万能列表题(Master-list item)常以题组的型式呈现,测验方式是给学生一篇导论文章,要求学生依该文章所提供或隐含的讯息,再一串编拟好的问题上作答。其中,导论性材料也可称之为背景材料。导论文章(interpretive exercise)可以为叙述性文字,图表,公式,符号,模拟的情境等。

解释性练习的题型形式多样,它可以与上述客观性测验中的任一题型相组合,不过大多是以选择题或是非题来呈现的。它不仅能测量客观性测评所能测评的认知能力,也能测量学生的理解和推理能力、问题解决能力及创造性等。

(二)解释性练习的优点及不足 解释性练习具有以下优点:(1)可以测量学生较复杂的学习结果,也可诊断学生的过程性的学习;(2)题型形式多样,可与上述各类题型结合,组成不同种类的解释性习题;

(3)背景性或导论性材料的使用,为学生的回答及对其评分提供了相同的标准和前提;(4)解释性试题如同 选择性试题一样,评分较容易、客观、可靠。

但是,它也存在这样一些需要注意的地方:(1)切合的背景性或导论性材料难找,编制有独创性的解释性习题比较费时;(2)由于这一题型是以背景性或导论性的材料为前提,就要求学生必须具备相应的阅读理解能力,因此,此类题型不适合于对低龄学生的评价;(3)背景性或导论性材料的提供也为学生作答提供了线索、思路;(4)虽然解释性练习能测评较高层次的认知能力,但难以对学生的创造性、语言组织及表达能力进行很好的测评。

(三)解释性练习的设计

解释性练习是综合上述各类题型而产生的一种新题型,故而,无论采用哪种形式的类型试题来命题,都应遵循相应的命题原则。而且,要编制一份高质量的解释性习题就必须选择好切合的导论性材料来进行设计。因此,设计解释性练习习题时,应遵循以下原则:

1、背景材料的选择应以教学目标为依据,而且必须符合学生现有的身心特征。背景材料选择的适当与否,直接关系着解释性练习试题质量的优劣。如果所选择的背景材料偏离了教学目标,编制再好的解释性练习试题也无济于事,达不到测评的真正目的。

2、所选择的背景材料应具有可读性、趣味性,内容也应具有一定的新颖性。这些材料可根据有关的报刊、杂志、课外读物等挑选,使其符合学生现有的阅读水平,内容简短、清楚,富有教育意义和趣味性,可读性应较强,这样可以有效地拓宽学生的知识视野,利于学生对知识的整合、应用和迁移。

3、背景材料应简短,具有一定的价值如启发教育意义等。所挑选的背景材料应简短,内容清楚、明确,这样可以减少阅读技能对测评的影响。如果选择的材料相对较长,应适当对材料进行重新加工、整合,同时要保持原材料的特点和主旨,体现材料相对完整性,这些材料应对学生的学习或生活有一定教育、启发意义,利于激发学生的学习动机,促进学生的学习。

4、依据测验的目的,对选择的背景材料可进行适当的加工、组织,整合后的材料内容应清晰、简洁,但又不失原文的风格或写作特点。一般而言,所选择的背景材料多数都要根据测验的目的进行一些加工、整合,充分发挥材料的有效性。

5、背景材料所涉及的文字、数字、图表、图片等应印刷清晰,而且应准确无误。背景材料中,有关的文字、数字、图表等都应印刷清晰,正确无误,易于辨认,这样可以有效地减少因印刷不清而造成的阅读困难,便于学生的阅读和提高学生作答的效率。

6、在依据背景性材料设计试题时,应将同质性问题进行归类,以避免重叠,同时应遵循相关类型试题的设计原则。根据背景材料设计试题时,应将同质性问题进行归类且各类别之间不应有重叠,每个选项都是独立的,而且每个试题应只有唯一的答案。

7、试题的数目的多少应与所提供背景材料的长度成比例。在编制试题中,应根据背景材料的长度来设计试题的数目。如果材料简短,却提出过多的问题;或者让学生分析一篇相对较长的材料,而只提一两个问题。显然,这样的效率是很低的,也不经济,同时也不能达到测评的目的。

当前位置:第二章 学业成就的传统测评第三节 复杂成就的传统测评 二、什么是论述题

(一)论述题的涵义及使用 1、论述题的涵义 一般说来,上面所介绍的几种类型的试题可以归结为客观式的测验试题。它们所测评的学生的能力层次较广,但难以对学生更高级的能力如组织、表达、思维的流畅性等进行测评。要达到对高级能力的测评,只有选择主观性测验,其中论述题是最常用的方式。

论述题是指向被试(学生)提出问题,要求他们根据问题的要求,用自己的语言组

织来呈现一份相对较长答案的试题。该题型允许学生根据试题的要求自由作答。学生的回答可以是一个简明、扼要的答案,也可以是学生对所体问题的深层次的思考,并充分陈述自己的观点。根据学生所陈述己见的自由发挥程度,论述题分为两类:限制性反应论述题和扩展性反应论述题。

(1)限制性反应论述题

限制反应的论述题是指限定了答题的内容和形式,学生的作答必须在一定的范围内进行,作答的篇幅也受到限制,不能自由发挥。限制反应型论述题有口头和书面两种形式。口头形式是指要求学生以口头表达的方式来回答被提的问题。书面形式则是要求学生写作的形式呈现自己对问题的理解、看法和观点等。这两种形式的问题都是限定了题目的反应方式和答案标准。

例1:(口头形式的限制性反应论述题) 说说两次国共合作的异同点。 例2:(书面形式的限制性反应论述题)

描述HIV、AIDS的三种主要传播途径,100字以内。 限制性反应论述题可以测量学生的多种学习结果,如对事物的表达关系、比较关系、对问题提出相应的假设、得到问题适当的结论、解释问题的因果关系、对问题的陈述做出预测等。它主要对测评学生的理解、应用和分析等层次的学习结果很适合,然而对综合和评鉴等层次的学习成果则不太适宜。

限制性反应论述题有以下缺陷:和选择题相比,限制性反应论述题在阅卷计分上较费时、费力,而且评分较不易客观;而且,试题取样范围也有限,较不具有代表性,内容效度较差。和扩展性反应论述题相比,较无法测量到组织、统整和创意表达的能力。

(2)扩展性反应论述题

扩展性反应论述题是指在所提出的问题下,学生可以自由地组织相关的知识材料,有条理地陈述自己的观点,回答的自由度很大。也称之为申论题。由于自由度大,学生对同一问题的理解不尽相同,故而会出现对问题回答的不同答案,因此,这就增加了评分客观性和标准化的难度,而且试题的代表性不强。它侧重于对学生较高层次的认知能力的评价,适合于年龄较大的学生或语言表达能力较好的学生层次。

扩展性反应论述题有以下限制:给予学生作答的自由度大,不适合用来测量特定的学习结果,而且造成计分上的困难;和限制性反应论述题相比,计分难度增高,试题取样范围也更为局限,信度和内容效度受到的威胁更大。

2、论述题的使用及评分

(1)限制性论述题的使用及评分

限制反应型论述题在以下几种情况中最适合使用: (1)教学目标要求学生能够呈现知识,而不是再认知识。原来的选择性反应题目往往难以测量呈现知识的情况。(2)需要测查的内容相对较少。如果有30个学生,你设计了一个由六道限制性反应题目组成的测验,这样评分将回花费大量时间。这时,你可以选用少量几道限制性反应题目,并与客观题目结合来使用。(3)还需要考虑测验的安全性。如果担心学生很容易抄袭选择题目的答案,这时选择限制性反应题目就比较好。通常情况下,编制一个限制性反应题目比编制一个好的客观题目能节省更多的时间。

在对限制性反应论述题评分时,大多是教师事先列出问题回答的参考答案,然后根据学生的回答来进行参照评分。为了尽量做到评分的客观性,增强评价的有效性,应做到:(1)编制一份质量较优的限制性反应论述题。问题的表述必须清楚明了,明确规定回答的长度如规定在多少字以内等,要求学生应尽量减少不必要的错误如错别字、语法错误等。(2)应采用多个限制性反应问题。可以对一个大问题分解成几个相对较小的限制性反应问题,从

不同的角度来评价学生,让学生从多方面展示自己的能力。(3)对每一问题都要有一个相应的参考答案,并列出相关的评分标准及细则,最好能在最大限度内包括与该问题有关的答案。在评分时,各评分者评价的尺度应进可能的统一,而不要各持一标准。

(2)扩展性反应论述题的使用及评分

扩展性反应论述题也适合于测验学生对某事物进行比较和对比、阐述自己对问题的看法立场并阐明理由、对其他的选择进行讨论和评价等。和限制性反应试题一样,对年龄较小的学生应以口头表达的方式来进行评价,对年龄较大的学生则采用书面的形式来进行评价。

扩展性反应论述题的评分分为整体评分和分项评分:

(1)扩展性反应论述题的整体评分。整体评分是指从整体的角度来关注论述题的答案。整体评分时也需要对分数的等级作出相应的详细说明,利于教师把握评分的尺度,尽可能对学生的回答作出客观的评价。国家教育进步评价委员会(The National Assessment of Education Progress,NAEP)使用六点整体评分细则来评价写作。

国家教育进步评价委员会(NAEP)所规定的写作的整体评分规则

(2)扩展性反应论述体的分项评分。分项评分则使教师在尽量注意学生答题的细节,并具体到每一个标准的评分方法。这类评分方法可以帮助教师看到学生回答中的优点及不足,并且可以依据评分的标准给学生更多细节上的反馈。但是,有时候教师可能过度地专注于某个细节,计较太多,就会出现偏差,忽视了学生回答的整体性。沃尔夫(Woif)等人设计了记叙文的评分细则,具有五个分项维度。这五个维度是:①主题,包括考虑主题表达的明确或含蓄的程度,以及教诲或启迪的程度;②人物,包括人物塑造的单一、静态或者“丰满”、动态的程度;③场景,包括场景是简单还是多功能的,以及它仅仅是陪衬的还是故事展开所必需的;④情节,包括它是简单还是复杂的,以及它是静态还是冲突的;⑤意义的传达,包括故事是基于上下文的,还是读者可以考虑的,以及是字面意义的还是象征意义的。每个维度上的六个表现水平都有具体的描述。

当前位置:第二章 学业成就的传统测评第三节 复杂成就的传统测评 (二)论述题的设计

单独就限制性反应的论述题而言,无论是口头形式还是书面形式的,在编制时都应注意下列问题:(1)编制试题前,要明确所要测试学生哪方面的能力,即测评的目的要明确;(2)问题的陈述应清晰、明了,并明确指明有关学生作答的要求及相关的评分标准,使学生做到心里有数。(3)对有关的热点问题或争议性的问题,应让学生陈述自己的态度、观点并给出相关的理由,只要言之有理即可(例:有些人认为教育经费应由政府来承担。你是否同意该观点,并陈述相应的理由。)(4)规定学生在限定的时间内作答,并指明问题作答的详细程度;(5)对于低龄学生应尽量限制其作答的时间,而不要规定他们对问题作答的篇幅;(6)问题的陈述应侧重于考查学生理解、分析、应用的能力,而不要只是测评学生回忆的能力。

针对论述题存在的不足,在编制论述题试题时,需要遵循下列命题原则,来提高论述题的质量:

(1)应当使用论述题来测量那些不能被客观题所很好测量的较复杂或较高层次的学习成就。一般而言,论述题只适合于对理解、应用、分析、综合和评鉴等较高层次的认知能力进行测评。只有在这些条件下,它才能有效地发挥论述题的功能。

(2)论述题的题目所陈述的要求应清楚、明确,以便学生作答。论述题问题的陈述应清楚、明确,而不能含糊不清,模棱两可,而误导学生作答。对学生所提出的问题,应以限制式论述题为宜,指出答题范围,使学生在所学的教材内容中作答,而不应使试题过于笼统。在考查学生复杂层次的能力时可以使用“比较”、“推论”、“应用”、“综合”、“评鉴”

等字眼,来引发学生的作答反应。而且,这些专门术语的使用也可以视所要测评的学业成就的复杂程度来灵活决定。

常用来测量复杂学习结果的论述题术语

例:试比较英、法两国资产阶级革命的异同。

(3)不允许学生对所回答的我问题进行有选择性地作答,而应全部回答,不能有遗漏。由于论述题试题本身已不具有较强的代表性,若再让学生自由地选题作答,就会增加评分的难度,也难以对学生的学习成就进行有效的比较,而且测验的信效度也不高,也难以达到统一评价学生的目的。

(4)论述题的试题设计应多用多题短答的限制性反应问题而少用扩展性反应问题。由于测验的时间有限,学生不可能在有限的时间内回答较长的论述题目,而且试题数目较少,测验的误差就会增大,信度也不高。同时,扩展反应问题取材范围较狭窄,代表性不强,效度也很低。

(5)论述题所要测评的目的应与教学目标相一致。论述题中所能测评的目的应和教学目标上要求的相一致,要侧重于对学生较高层次能力的测评。

(6)论述题的题目应有启发性、思想性和教育性。 论述题的题目应能够激发学生积极地思维,充分应用所学知识来分析所呈现的问题,有条理地论述问题,而不是让学生死记硬背教材中的某些原理知识或观点。

(7)论述题的答案应是既定性的或是相关争议较少的知识内容。没有定论的题目,不能达到对学生实际知识和能力的测评 ,而且还会造成评分的难度增大,误差也很大,不利于对学生的正确评价。为了减少这些不必要的干扰,在编制试题时,一般要限制学生作答所采用的观点,如“请根据或结合„„的原理来分析„„问题”等,从而有效地避免了有争议的问题。

例:结合马克思主义政治经济学基本原理和当前宏观经济形势,说明应当如何进一步完善宏观调控体系、提高宏观调控水平。

(8)应规定学生对每一题的作答时间,让学生在这一时间内充分作答。由于论述题需要学生对问题进行一定的思考并回答,因此,在编制试题时,要考虑到大多数学生的作答速度,在既定的时间内充分作答,以免使试题变成速度题,而减弱了测评的精确性。

当前位置:第二章 学业成就的传统测评第三节 复杂成就的传统测评 三、什么是操作测验

(一)操作测验的涵义及使用 在许多学科中,操作的方法和过程的把握与应用同样也是重要的测量目标。如数学课程学习、实验课、体育课、音乐课等。因此,在大多数的教学领域中,操作测验已成为纸笔测验的辅助测验。操作测验是介于纸笔测验和未来真实情境的实际活动之间,具有真实的情境模拟性。它是指模拟一些在自然情境下操作的测验,其模拟的程度高于一般的纸笔测验。

操作测验的分类很多。以测验情境真实性的程度来分,可将操作测验分为四类: (1)纸笔操作测验

纸笔操作测验是指利用纸笔测验模拟真实的实验情境来考查学生知识和技能的应用。与传统的纸笔测验最大的不同在于,它比较注重在模拟真实的情境下考查知识与技能的应用。这些应用能力的纸笔测验,可以引发所预期的学习结果,也可以用来作为测量高度真实性操作行为的初步测量。如让学生编制电路图。

(2)辨认测验(identification test)

辨认测验是指包括各种不同真实性程度的测验情境。有时只是要求学生简单地辨认某物,并指出其功能;有时会要求学生根据一个具体的操作工作,辨认完成该项工作所需的工具、装备和程序等;有时则会要求辨认事物的具体问题之所存在,并提出响应的解决办法。

如上生物课,要求学生辨认排列在教师中的生物标本,或辨认实施某个具体实验操作的装备和程序。辨认测验常被用来作为指导学生在真实或模拟情境中操作行为的教学设计。

(3)模拟操作测验(simulated performance)

模拟操作测验是指要求学生在模拟的情境中完成与真实作业相同的动作,其特点是强调操作程序的正确性。如在体育课中,要求学生对着想象的球挥棒,或者与假象的对手练习对攻等。有时,模拟操作测验也可作为操作技能的最后评估。如生物实验、化学实验,或采用角色扮演的方式,进行模拟的法庭辩论、模拟的教学试讲等。

(4)工作样本操作测验

这种测验要求学生完成所测量工作的部分活动。在所有的操作测验评价中,工作样本操作测验的真实性最高,通常样本工作包括了全部真实作业中最根本的要素,而且需要在控制的条件下去完成这些作业。

上述四类均有某中程度上的重叠,它们提供了测量应用操作技能的有用方法。 (二)操作测验的优点及不足

操作测试可以在于需要对某一特定课题的熟悉程度进行验证,但又不能通过知识测验来测量的情境发挥它的作用。操作测验的编制方法与其它类型成就测验的编制大致相同,但在程度上要复杂很多。通常,操作测验的情境很难有效地控制,也不容易标准化,而且测验的准备和实施都比较费时,评分也较为困难。一般而言,测验情境越接近于真实的作业情境,在评估时所遇到的问题就越复杂。

(三)操作测验的设计

针对操作测验的优点和不足,在编制过程中应注意以下几点:

1、明确说明所要测量的目标和学习结果,并将其操作化。要对整个操作进行工作分析,找出整体作业中具体代表性的工作样本,而且所选取的活动要能反映出教学时所强调的内容,并为每一个操作建立一个作业标准,包括对作业的精确性、步骤的正确性等的最低标准。

2、选择合适的真实性程度。在操作测验中,应根据教学目标的性质、客观条件的限制、工作本身的性质等多方面的因素来确定操作情境。因此,在准备操作测验时,应对这些因素进行权衡,力图获得最真实的情境。

3、以指导语来明确操作测验的情境。指导语应具体明确,不能因人而异,让学生知道要做什么和在哪些条件下去做以及具体的评价标准是什么。

4、确定评分的方法。通常对操作测验的评分有两种方法:(1)作品量表法(product scale)。是指用一些列不同品质层次的作品作为样本,将学生的作品与量表中样本作品相比较,来进行评定。这种量表对作品品质的判断很有帮助,通常是用来评定书法作品、艺术品、及 各种类型的职业计划。(2)核查表和评定量表。如果一个操作行为或作品可分别从几个不同的层面来评鉴时,可采用核查来考察学生每一个步骤或层面是否都做到了。用来评鉴作品的核查表,一般包括各层面(如大小、颜色等)的一览表,和核查每一个理想的特征是否具备的空格。评定量表是进一步评定每一个层面符合理想特征的程度。评定量表和核查表同是用来判断所有学生在同一组层面的优劣方式,它提供一种记录判断结果的简便形式。

因篇幅问题不能全部显示,请点此查看更多更全内容