- · 《延边教育学院学报》数[05/19]
- · 《延边教育学院学报》收[05/19]
- · 《延边教育学院学报》投[05/19]
- · 《延边教育学院学报》征[05/19]
- · 《延边教育学院学报》刊[05/19]
哲学与社会视角下的语言测试再审视介评
作者:网站采编关键词:
摘要:*本文为湖南省哲学社会科学规划基金项目“大学英语口语促学评价体系的构建与效度研究”(编号15YBA188)、湖南省社科评审委员会课题“商务英语诊断性测试体系构建研究”(编号XSP17Y
*本文为湖南省哲学社会科学规划基金项目“大学英语口语促学评价体系的构建与效度研究”(编号15YBA188)、湖南省社科评审委员会课题“商务英语诊断性测试体系构建研究”(编号XSP17YBZC074)和湖南省教育厅优秀青年项目“教育硕士专业能力促学评价体系构建研究”(编号17B115)的阶段性成果。
Fulcher. G. 2015. Re-examining Language Testing: A Philosophical and Social Inquiry. London and New York: Routledge. ISBN: 978-1-138--4. pp.x+244.
1. 引言
Glenn Fulcher是英国莱斯特大学教育学院教授,国际语言测试研究权威,主要研究方向为口语测试。Fulcher 教授的新书《哲学与社会视角下的语言测试再审视》,独辟蹊径从哲学和社会视角重新审视了语言测试研究的经典问题和新动向。作者结合个人在语言测试研究领域的心路历程,通过反思语言测试的意义融合了启蒙运动与古典实用主义的主要观点,从哲学、社会学角度剖析了语言测试研究中的主要问题,重点探讨了语言测试的效度研究、语言与人性、语言测试价值观、语言测试使用的伦理学等问题。本文将对该书的主要内容和特色进行简要评介。
2. 内容简介
本书共分九章,包括序言与跋文,可以分成三个部分。序言开篇点题,从启蒙运动思想着手强调了语言测试的实用主义观点,这是贯穿全书的核心理念。序言对全书的内容进行了简要概述并特别声明本书的创作是源自作者对困扰自己多年的观点的反思,作者希望本书能激发读者对语言测试的设计与使用以及那些他们曾经想当然接受的观点进行再思考。
第一部分(第一至三章)围绕推理、测量与语言三大要素展开讨论。测试是一项经典的推理活动,我们需要通过考试分数来对考生及其语言技能做出推论,这些推论是构建在对语言进行测量的基础之上。作者详细论述了语言测试推理所涉及的多个环节并指出了推论中的一些逻辑谬误,同时以Messick(1989)以及Fulcher和Davidson(2009)等经典研究为例描述了内容分析在论证推论合理性的作用及其不足。此外,第一章详细探讨了推理的三种方法即归纳、演绎以及不明推论,指出了三者的区别,分析了归纳法在测试中的局限。最后重点讨论了论证与备选假设的关系并将其与测试的效度研究关联起来。基于Toulmin提出的论证模型,作者以两个具体的例子探讨了该模型在效度研究中的具体运用。第二章围绕测量的定义、测量与社会科学、正态分布与测试数据以及工具设计与基本概念等环节详细阐述了测量与语言测试的关系。作者认为假设测试对设计和开发考试与评分工具至关重要。当前语言测试的主要问题是缺乏强大的、连贯的理论模型。而且语言测试的研究也离不开测量理论的支持。第三章围绕流利度、流利度标记、流利度与认知、言语产生与处理、认知流利度的证据等系统探讨了语言产生的流程、流利度的界定以及如何来论证语言流利度这一构念。通过比较分析,作者认为语言学手段比认知手段更为有效。其特别强调对语言本身的关注是使得语言测试独具特性的原因,因为语言可以向测试研究提供理论与内容。
第二部分(第四至五章)围绕数字与效度两个概念详细阐述了考试数据与语言测试效度研究的主要流派及其特点与缺陷,该部分是全书的重点,作者在第五章重点推出了他独具特色的效度研究方法。第四章从量化、样本与评价、数字的可靠性、数字游戏与数字悖论等方面讨论了语言测试有关考试分数评判的意义。作者认为语言测试面临的一个主要问题是如何确立分数的意义。也就是说只有当一项分数可以与现实生活一个有意义的行为相关联时,我们对于这个分数的推理才是可靠的。第五章在分类讨论了效度研究的四种流派后,针对现有研究方法的瑕疵,作者提出了自己所推崇的全新理念即实用现实主义(pragmatic realism)。第五章对效度研究的四种流派进行了系统回顾并指出了其各自的问题。工具主义在当前仍然比较流行,其主要研究假设是基于使用论证结构对分数的解释和使用进行评价,主要研究方法是使用Toulmin的论证结构来创造一个可解释的论证。工具主义面临的一个主要问题是伦理学问题。建构主义将“结果”置于效度的中心,是个人化倾向严重的哲学。建构主义支持者通常认为考试系统会对社会上的某一类人不公平。他们对构念的态度很极端,拒绝进步的理念,是彻底的悲观主义者。技术主义通过量表来向机构和利益相关者确保考试能达到目的。最常用的是Bachman 和Palmer(1996:155-161)“测试有用性”量表,效度研究的流程就是回答列表中的42个问题。技术主义开展效度研究的主要困难是耗时而且难以实施。现实主义认为我们探讨的构念并非在真实社会中存在。现实主义选择使用“Trait”而不是“construct”一词来代表考试构念。现实主义对效度的定义不涵盖考试使用的结果。最后作者还基于个人的工作经验详细描述了开展标准参照效度研究的方法和流程。
文章来源:《延边教育学院学报》 网址: http://www.ybjyxyxb.cn/qikandaodu/2021/0730/803.html