文献一:
真实性评价的五维框架
原文作者 Judith T. M. Gulikers Theo J. Bastiaens Paul A. Kirschner
摘要:真实性是新评价模式的重要组成部分。问题是真正的评估是什么,是不确定的。
人们普遍认为,为了实现教育的目标,有必要在教学、学习和评价之间建立建设性的一致,在这篇文章中,我们首先回顾了关于评估者真实性的文献,并以专业实践为出发点,提出了一个设计真实评估的五维度框架。然后,uve提出了一项定性研究的结果,以确定该框架是否完整,以及这五个维度在护理职业学院学生和教师感知中的相对重要性。我们讨论对框架的影响,以及在设计真实评估时需要考虑的重要问题。
关键词:真实性,真实教学,五维框架
传统的面向学习事实的课堂教学,通过简答题或多项选择题进行评估,就是这种结合的一个例子。这种教育实践可以概括为教学途径-知识传递;学习记忆;评估程序标准化测试这种评估方法也被称为测试文化,主要由非文本化的、心理测量学设计的、以选择-反应形式测试知识和低级认知技能获得的项目组成。这些测试主要用于总结。
这是一种区分学生并根据他们的成绩进行排名的方法。然而,多年来,与当今教育目标相适应的联盟已经发生了变化。当前的教育目标更注重培养有能力的学生和未来的员工,而不是简单的知识获取。这些目标的实践表现为:以学习和能力发展为中心的教学方法;和评估程序语境化,解释性和绩效评估。在这里,评估的目标是获得更高层次的思维过程和能力,而不是事实知识和基本技能。评价的功能由总结性向综合性转变。评估是获得更高阶的暗示过程和能力,而不是事实知识和基本技能。评价的功能由总结性向综合性转变
同时也服务于促进和提高学生学习的形成目标。这种观点需要替代评估,因为多项选择测试不适合这种情况。Birenbaum和Dochy(1996)认为真实性评价的特点是:学生对自己的学习负有责任:他们与老师进行反思、合作和持续的对话。评估包括有趣的真实生活或真实的任务和环境,以及多个评估时刻和方法,以达到一个侧面分数,以确定学生的学习或发展。提高评估的自主性对学生的学习和动机有积极的影响。
这意味着(a)任务必须反映需要评估的能力,(b)评估的内容包括知识域的真实任务,代表现实问题评估和(c)专家使用的思维过程来解决这个问题在现实生活中也需要通过评估任务。基于这些标准,基于真实能力的评估比所谓的客观或传统测试具有更高的结构效度来衡量能力。
结果效度描述了评估对指导或教学和学生学习的意图和意想不到的影响。正如Biggs(1996)的建设性整体性理论所强调的,有效的教育需要指导。
然而,真实性只是评估的一个模糊描述的维度,因为它被认为是一个熟悉的和众所周知的概念,不需要明确的定义。本文着重于定义。
如果学生感知到教学信息与评估信息不匹配,则不太可能对学生的学习产生积极影响(Segers, Dierick, amp; Dochy, 2001)。Frederiksen(1984,“真实的测试偏差”)、Pro dromou(1995,“反洗效应”)、Gibbs(1992,“摇尾巴的狗”)、Sambell和McDow等研究人员证实了评价对教学和学生学习的影响。
摘要在大量文献研究的基础上,在不忽略替代评价的其他特征重要性的前提下,提出了一种由五个不同真实性程度的评价维度构成的评价模型。在描述了该框架之后,讨论了定性研究的结果。本研究探讨了该框架是对真实性的完整描述还是缺失了重要的部分。
Fredericksen和Prodromou暗示考试对所教的内容有很大的影响,因为老师是为了考试而教学的,即使考试可能会把重点放在老师认为不重要的事情上。吉布斯强调,学生的学习在很大程度上取决于评估和学生对评估要求的看法。Sambell和McDowell认为,教学和评估或学习的效果很大程度上取决于教师和学生对课程的看法,这可能会偏离课程的实际意图。这四种观点都支持命题学习和评价是同一枚硬币的两面,它们之间有着很强的相互影响。为了改变学生在能力发展的方向上的学习,需要真正的基于补偿的教学与真正的基于能力的评估相结合,以及这些维度的相对重要性在护理学院学生和教师的认知中是什么。
基于真实能力的评估人员的重要性
定义的评估
类似于标准情况。这个概念被理论框架扩展和指定,该理论框架描述了评估可以在多个维度上类似于标准情况。
问题是,什么是真实性?不同的研究者对真实性有不同的看法。一些人认为真实的评估是绩效评估的同义词(Hart, 1994: Torrance, 1995),而另一些人则认为真实的评估特别强调任务和环境的现实价值(Herrington amp; Herrington, 1998)。Reeves and Okey(1996)指出,绩效考核与真实考核的关键区别在于任务的保真度以及正常情况下绩效发生的条件。真实的评估注重的是高保真度,而这在绩效评估中并不重要。这些碎煤机结构之间的区别和真实的评估表明,每一个真实的评估是绩效评估,而不是反之亦然(梅耶,1992 Savery和达菲(1995)定义的真实性评估之间的相似性的认知要求思维要求评估和认知需求的评估是基于标准的情况。标准情境反映或模拟学生在实习或未来职业生涯中可能遇到的现实情境。
使问题复杂化的是可塑性是主观的这一事实(Honebein, Duffy amp; Fishman 1993;黄,2002;Petraglia(1998)和依赖于感知。这意味着,学生认为真实的东西不一定与教师和评估开发人员认为真实的东西相同。如果这些看法确实不同,那么教师通常根据他们自己的观点来开发真实的评估这一事实就产生了一个问题:尽管我们可能尽最大努力开发真实的评估,但如果学习者不这样认为,这一切都可能是徒劳的。这个过程称为预认证(Huang, 2002;
(Petraglia, 1998),可以解释为,在设计真实性评价之前,要么无法设计真实评估,要么非常重要的是仔细检查真实评估用户的体验(Nicaise, Gibney amp; Crane,200,我们选择了后一种解释)。
关于真实评价和有效性的讨论表明:
1. 根据建构对齐理论(Biggs, 1996),真实评价应与真实教学对齐,才能对学生的学习产生积极影响。
Darling-Hammond和Snyder(2000)认为只处理所需的思维太狭隘。在他们看来,学生需要发展自己的能力,因为现实生活要求学生具备整合和协调知识、技能和态度的能力,以及在新情况下运用这些知识的能力(范·梅里恩布尔,
真实的评估要求学生通过显著的、有意义的和有价值的成就来展示相关的能力(Resnick, 1987;bull;威金斯
2.Birenbaum(1996)进一步指定能力概念强调学生需要开发而不是仅认知补偿,如解决问题和批判性思维,而且反射等元认知能力和社会能力,如沟通和协作真实性评估用于本研究的定义是:一种评估,要求学生使用他们在教授的标准情境中所需要的相同的能力,或知识、技能和态度的组合。因此,一个事物的层次是由它的程度来定义的。
3.真实性是主观的,这使得学生的感知对于真实性评价影响学习具有重要意义
建立真实评估的五维度框架
为了定义真实评估,我们回顾了关于真实评估、真实性和总体评估以及学生对(真实)评估的感知的文献。真实评估的五个维度分别为:(a)评估任务;(b)物理环境;(c)社会契约文本;(d)评估结果或形式;及(e)评估准则。这些维度在真实性的级别(i它们是连续的)认为某物要么是真实的,要么不是真实的想法是错误的(克罗宁,1993;(Newmann amp; Wehlage, 1993),因为真实性的程度不仅仅是所选评估的一个特征;它需要在与专业跑的标准情况的关系中进行定义。例如:只有当所选择的评估任务在真实情况下也在团队中执行时,在团队中执行评估才真实
e.该框架的主要观点是,这五个维度中的每一个都可以在不同程度上与评价标准相似,从而增加或减少评估的真实性
因为真实的评估应该与真实的指导相一致(Biggs, 1996;(Van Mer rienboer, 1997),真实评估框架的五个维度也适用于真实教学。即使本文的重点是真实的评估
同时,本文还对真实教学的五个维度进行了解释,以说明如何用相同的维度来建立真实教学与真实评估之间的一致性。图2和图3所示的真实教学的维度和基础元素对真实评估也起到了相同的作用。
如图所示,学习和评估任务非常相似,因为学习任务刺激学生发展专业人员所拥有的能力和
任务要求学生在没有额外支持的情况下展示同样的能力(Van Merrienboer, 1997)。chnitzer(1993)强调,要使真实的评估有效,学生需要在将评估作为一种评估之前,有机会运用评估的形式进行实践。这就意味着学习任务必须与评估任务相似,只是在不同的基础上存在差异。学习任务是为了学习,评估任务是为了评估学生的学习水平
为了提高(形成性的)或为了做决定(总结性的)。这些模型显示了五维框架如何处理真正的研训所和评估之间(概念上)的一致。真实评定的五个维度的相互准备和验证将在本文的其余部分进一步解释和检验.
外文文献出处 《Educational Technology Research amp; Development》
文献二
真实性评价:现实中的检验
原文作者 Marilla D. Svinicki
摘要:新的学习模式带来了评价实践的改变,在这一章中,讨论了最符合这一范式的评估实践之一—真实性评价
关键词:学生评价,评价模式,真实性评价
真实性评价:在现实中的测试。最近,在普通教育和普通高等教育中使用的教学方法发生了显著的变化。尽管讲授-讨论法仍然是主要的教学模式,但是一些教师已经开始注意Barr和Tagg(1995)的建议,转向另一种学习范式,即学习者成为主动的建设者,而不是知识的被动接受者。如果那些做出改变的人这样做是因为他们采用了学习范式背后的哲学,那么他们必须认识到,随之而来的是也需要采用一种新的评估范式。如果学习变得更加以学习者为中心,那么评估也应该具有方向性。
什么是真实性评价?其中的一个在评价中最常见的在教学中的变化是走向更真实的评估方法。说评估是真实的是什么意思?这意味着评估是建立在尽可能接近真实世界的学生活动的基础上的,评估不再局限于纸笔或计算机训练和实践类测试。Wiggins(1998)提供了评价的6个特征,使其符合认证要求。1.它评估信息或技能在“真实世界”中的使用方式。2.评估需要判断和创新,它基于解决非结构化问题,这些问题很容易有多个正确答案,因此要求学习者做出明智的选择。3.评估要求学生“做”这门学科,也就是说,要经历这门学科所特有的程序。4. 评估是在与执行相关技能的环境尽可能相似的情况下进行的。5. 评估要求学生展示与复杂问题相关的广泛技能,包括一些涉及判断的技能。6. 评估允许反馈、实践和第二次机会来解决所处理的问题。威金斯还对真实评估和典型测试进行了比较。例如,一个典型的测试“必须事先未知以确保有效性”,而一个真实的测试“必须尽可能提前知道”,因为它基于可预测的技能和情况。如果评估是真实的,那么它所调用的技能在之前的许多情况下就已经被实践过很多次了,因此它们可以作为收入的指标进行预测。他还指出自动测试是迭代的——“包含重复的基本任务”,而典型的测试是“一次性的”。典型的测试只有正确的答案,而真实的测试更多的是针对反应的质量和公正。典型的测试样本可能来自可测试内容,但是真正的测试包括集成的挑战,要求学习者将组件组装成产品。典型的测试基于被测试内容和期望内容之间的相关性来推断学生的理解:真实的测试直接指向想要的结果。典型的测试在本质上更具总体性,但真实的测试为学生提供诊断信息和反馈,使他们能够看到在哪里以及如何进行纠正(Wiggins, 1998)。威金斯的意思并不是说有明确的界限,也不是说有一种两分法的把测试归为真实或不真实。相反,他认为存在一个真实性的连续体,评估可能会沿着这个连续体下降。例如,他提出了以下三种情况,作为这种连续体的魔鬼管理:一种不真实的衡量标准是“写一篇关于法律的论文”。一个更可信的方法可能是“写一篇有说服力的文章,解释为什么法律应该改变。”不同之处在于任务所处的环境和任务的性质,这更现实,因为可以想象,公民可以请求修改法律。然而,最真实的任务是“撰写一份提案,提交给适当的立法者,以修改现行法律”。这里有一个现实的环境和行为,这与生活中可能发生的事情是相同的。后两者的区别在于分配的受众。一个是仍然是教授,而另一个移动观众到教室外面。
背景图像真实性评估预期结果之间的差异与早期专家提出的标准相呼应,这些标准可作为创建真
剩余内容已隐藏,支付完成后下载完整资料
文献一:
A Five-Dimensional Framework for Authentic Assessment
Judith T. M. Gulikers Theo J. Bastiaens Paul A. Kirschner
Authenticity is an important element of new modes of assessment. The problem is that what authentic assessment really is, is unspecified. In this article, we first review the literature on authenticity of assessments, along with a
five-dimensional framework for designing authentic assessments with professional practice as the starting point. Then, we present the results of a qualitative study to determine if the framework is complete, and what the relative importance of the five dimensions is in the perceptions of students and teachers of a vocational college for nursing. We discuss implications for the framework, along with important issues that need to be considered when designing authentic assessments.
It is widely acknowledged that in order to meet the goals of education, a constructive align- ment between instruction, learning and assess- ment (ILA) is necessary (Biggs, 1996). Traditional frontal classroom instruction for learning facts, assessed through short-answer or multiple-choice tests, is an example of such an alignment. The ILA-practices in this kind of edu- cation can be characterized as instructional approach—knowledge transmission; learning approach—rote memorization; and assessment procedure—standardized testing (Birenbaum, 2003). This approach to assessment is also known as the testing culture (Birenbaum amp; Dochy, 1996) and consists primarily of decontextualized, psychometrically designed items in a choice-response format to test for knowledge and low-level cognitive skill acquisi- tion. The tests are primarily used in a summa- tive way to differentiate between students and rank them according to their achievement. How- ever, the alignment compatible with present- day educational goals has changed over the years. Current educational goals focus more on the development of competent students and future employees than on simple knowledge acquisition. The ILA-practices that characterize these goals are instructional-approach—focused on learning and competence development; learning-approach—reflective-active knowl- edge construction; and assessment-procedure— contextualized, interpretative, and performance assessment (Birenbaum, 2003). Here, the goal of assessment is the acquisition of higher-order thinking processes and competencies instead of factual knowledge and basic skills. The function of the assessment changes from being summa-
ETRamp;D, Vol. 52, No. 3, 2004, pp. 67–86 ISSN 1042–1629 67
tive to also serving a formative goal of promot- ing and enhancing student learning. This view requires alternative assessments because stan- dardized, multiple-choice tests are not suitable for this (Birenbaum amp; Dochy, 1996; Segers, Dochy, amp; Cascallar, 2003). Birenbaum and Dochy (1996) characterized alternative assess- ments as follows: Students have a responsibility for their own learning; they reflect, collaborate, and conduct a continuous dialogue with the teacher. Assessment involves interesting real- life or authentic tasks and contexts as well as multiple assessment moments and methods to reach a profile score for determining student learning or development. Increasing the authen- ticity of an assessment is expected to have a pos- itive influence on student learning and motivation (eg., Herrington amp; Herrington, 1998). Authenticity, however, is only a vaguely described dimension of assessment, because it is thought to be a familiar and generally known concept that needs no explicit defining (Petraglia, 1998). This article focuses on defining authenticity in competency-based assessment, without ignoring the importance of other char- acteristics of alternative assessment.
Based on an extensive literature study, a the- oretical framework consisting of five dimen- sions of assessment that can vary in their degree of authenticity is presented. After the descrip- tion of this framework, the results of a qualita- tive study are discussed. This study explored whether the framework is a complete descrip- tion of authenticity or is missing important ele- ments, and what the relative importance of the dimensions is in the perceptions of students and teachers at a nursing college.
The Importance of Authentic Competency-Based Assessment
The two most important reasons for using authentic competency-based assessments are (a) their construct validity and (b) their impact on student learning, also called consequential validity (Gielen, Dochy, amp; Dierick, 2003). Con- struct validity of an assessment is related to whether an assessment measures what it is sup- posed to measure. With respect to competency
assessment this means that (a) tasks must appro- priately reflect the competency that needs to be assessed, (b) the content of an assessment involves authentic tasks that represent real-life problems of the knowledge domain assessed, and (c) the thinking processes that experts use to solve the problem in real life are also required by the assessment task (Gielen et al., 2003). Based on these criteria, authentic competency-based assessments have a higher construct validity for measuring competencies than so-called objec- tive or traditional tests have.
Consequential validity describes the intended and unintended effects of assessment on instruc- tion or teaching (Biggs, 1996) and student learn- ing (Dochy amp; McDowell, 1998). As stated, Biggsrsquo;s (1996) theory of constructive alignment stresses that effective education requires instruc- tion, learning, and assessment to be compatible. If students perceive a mismatch between the messages of the instruction and the assessment, a positive impact on student learning is unlikely (Segers, Dierick, amp; Dochy, 2001). This impact of assessment on instruction and on student learn- ing i
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[278460],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。