第二语言口语测试研究新探索(此文已发表在《外语电化教学》2007年 第二语言和外语的区别

第二语言口语测试新探

郑新民

(福州大学外语学院,福州 350002)

:《第二语言口语测试》一书吸收了第二语言教学方法,第二语言习得以及第二语言测试等最新科研成果,对以往口语测试评价标准的各种研究作了系统的和全面的整合。在批判和借鉴的基础上,该书创造性地发展了测试标准的新模式,从而拓宽了该领域的涵盖面。该书还从哲学的认识论角度出发,阐释了在第二语言口语测试中科学合理地使用定量和定性研究的重要性和必要性。此外,作者在处理篇章结构,定义诠释,实例列举,内容安排,重点把握等方面也都极具特色,十分成功。

关键词:第二语言;口语测试;评价标准


1.引言

作者简介:郑新民(1957-)男,博士,教授。研究方向:英语应用语言学、课程设置、教师认知、英语教学等。

口语测试具有瞬息瞬变,难以捕捉的特点。要制定出一套科学的,客观的,高效度的口语测试评价标准具有相当的难度,加上口语测试又是一种主观性较强的测试,主考教师能否准确地把握口语测试评价标准在客观上存在着一定的差异,因此在实践中要想真正做到保持口语测试的信度,效度和公平度绝非易事。上世纪70年代之前鲜有语言学家对口语测试进行系统性的研究,70年代以后,Bachman(1990),Wire(1990),Stansfield &Kenyon(1992:347-364),McNamara(1996),Graddol(1997),Skehan(1998),和Hughes(2003)等人借鉴Hymes(1972:269-293)关于“交际能力”的理论,从不同的角度,运用不同的方法,在理论和实践方面对口语测试进行了一系列的探索,为口语测试标准的建立和发展奠定了一定的基础,但至于如何制定出一套完善的测试标准,学术界各据其词,莫衷一是。GlennFulcher所著的《第二语言口语测试》一书是第一部从历史、理论和实践的角度来探讨第二语言口语测试的专著。该书为第二语言口语测试提供了极具参考价值和更加完善的理论体系,同时也提供了具有现实依据和切实可行的评价标准。该书所涉猎的主要内容有:对口语测试设计过程的阐释,建立口语测试设计项目的成本,口语测试的实际应用,口语测试的评价,口语测试任务的种类,以及如何对残疾人士进行口语测试等。

2.内容介绍

2.1历史回顾

第一章回顾了自第一次世界大战(1914-1918)以来口语测试在美国发展的历史。作者指出,第二语言口语测试作为一种语言特殊能力的测试是在特殊的历史背景下(第一、第二次世界大战期间以及冷战时期),为了特殊的目的(确保军人和特工的生命安全)应用而生和逐步发展完善起来的。作者认为,尽管口语测试一向备受关注,但一直没有一套符合美国流行的定量心理测量学的测试标准可供参考使用,造成了其地位无法跟笔试的地位平起平坐的客观事实。最后,作者在本章末尾还就主考教师(rater)评分的信度,可能出现的偏见,可能影响考生表现的几种因素,口语测试的反拨效应,语言能力和交际能力之间存在的张力(tension)等问题作了深入浅出的分析。

2.2口试构念的定义

给第二语言口语测试构念(construct)下定义不是一件简单的事情,既可以从语音语调,准确性和流利性的角度看问题,也可以从陈述策略的角度看问题,亦可以从互动关系的角度看问题,甚至还可以从语用分析或话语分析的角度看问题。作者指出,科学严谨地给第二语言口语测试构念下定义,对于测试评价的客观性和可信度具有不可低估的意义。本章对口语测试构念中一系列重大的问题进行了权威性的诠释,其中包括理论与研究之间的关系,能力与表现之间存在的差异,以及测试目标确定等。

2.3口试任务的种类

考试任务难度的设定一向是口语测试标准中的难点,也是众多研究者感兴趣的研究热点。在第三章中,作者吸收了第二语言教学方法,语言习得以及语言测试等科研成果,提出关于口语测试描述任务的新框架(aframework for describingtasks),其中包括:(1)任务的定位,(2)相互作用的关系,(3)目标的定位,(4)提问者与熟悉程度,(5)话题,(6)环境等。这一框架的提出为研究任务难度与其他因素之间的关系提供了新视角。作者还以一些考试题型为实例,探究不同的考试是如何采取不同的方法来激发考生在考场中发挥各自的表现能力,并对这些方法的优缺点作了颇具独到见地的点评。

2.4评价等级

尽管作者反复地强调口语测试任务的重要性,但他意识到单从任务种类的角度看问题是片面的和不客观的表现,他建议应该细致地研究任务种类,环境因素和主考教师行为之间的互动关系。作者在第四章中划分了测试中不同的评价等级,探讨了如何使用直观法(intuitivemethod)和另外其他三种不同的实证方法(empiricalmethods)来设计第二语言口语测试的评价等级等,这些内容都具有很强的实用性。

2.5测试规范

第五章提出设定考试内容规范的模板。综合第二至第四章所讨论的内容,作者在本章中阐释了效度(validity)的概念,作者指出,测试规范制定的过程不是一个线性的过程,而是一个“凌乱”的过程,因此保持口语测试构念,测试任务和测试评价之间的效度的稳定性是十分的重要。作者通过分析四个案例中的测试规范存在的问题,修正了Davidson&Lynch(2002)的测试标准模型,并将其发展成一种更为系统,更为合理的口语测试标准的通用模板(generictemplate)。

2.6主考教师,培训以及管理问题

在第六章中,作者指出,从某种意义上说,任何一种语言的口语测试的信度(reliability)在很大的程度上取决于主考教师的行为,有足够的证据表明主考教师之间评分的信度相对较低。为了改变这种状况,国际上各主要考试中心除了要制定完善的测试标准之外,还要十分重视对主考教师实施严格的培训和考核制度,这是一种耗资巨大的投入。作者建议使用培训制度来选拔淘汰主考教师,同时注意保持主考教师队伍的构成应具有一定的广泛性和多样性。最后,作者对考试的组织和实施等管理问题作了探讨,其中包括考试环境可能对考生得分所造成的影响,残疾人士所需要的帮助,成绩的派送,和考试经费使用等。

2.7口语测试的评估

第七章进一步探讨了口语测试中有关效度评估的问题。作者对直接口试法(OPI),小组讨论测试法(inpairs or groups),和间接口试法(computer ortape-mediated)等三种不同的测试形式的效度问题提出了独特的看法和积极的对策,接着作者总结了Messick(1989:13-103,1992:13-23)有关效度的研究模式,对独立性,结构性,内容,概化(generalizability)和结果等因素作出崭新的诠释。

2.8口语测试研究的方法论

在口语测试研究中广泛地采用定量和定性的研究方法已成为一种趋势,在以往出版的口语测试专著中对此亦有论述,只不过侧重点各有不同。作者在第八章中除了讨论定量研究中的相关分析、因子分析和Rasch模型分析之外,还着重讨论了概化研究(generalizabilitystudies)――一种借助ANOVA或MANOVA方差或协方差分量分解的方法对测量情景中的误差进行分解的方法,这一方法对分析口语测试中各种相关因素间的关系切实有效。作者还就定性研究中的专家判断(expertjudgment),访谈,问卷,话语分析和言语报告分析(verbal reportanalysis)等研究手段加以探讨。此外,作者还特别就如何科学、合理、正确、综合地使用这些方法提出了独到的见解,这在其他有关口语测试著作中是不多见的。

3. 简评

通读《第二语言口语测试》一书,我们不难发现,作者在梳理各家有关第二语言口语测试的原理时,采取“详人之所略,略人之所详”的研究方法,注重吸收他人的新思想,新理念,新观点,新视野,新成果,对以往口语测试评价标准的各种研究作了科学的、深入的、全面的整合。作者还勇于对一些高端的理论和模式提出质疑和修正,有批判、有借鉴、有创造性地发展了测试标准的新模式,从而拓宽了该领域的涵盖面。作者对如何选拔和培训主考教师的见解也颇具匠心,提出富有积极的建设性意见,同时,作者关心考生,尤其是关心残疾考生的提法充分体现了现代文明社会以人为本的教育理念。作者深厚扎实的理论功底,高度严谨的综合分析能力,清晰开阔的创新视野帮助我们深刻地解读科学哲学的认识论和方法论,使我们清楚地认识到在包括口语测试在内的应用语言学领域中,科学合理地使用定量和定性研究的重要性和必要性。此外,作者在处理篇章结构,定义诠释,实例列举,内容安排,重点把握等方面也都极具特色,十分成功,使读者能在较短的时间内最大限度地吸收和借鉴第二语言口语测试的理论精华和最新的科研成果。

当然,该书还存在着些许不足和尚待完善和深化之处。例如作者在论述定性研究时所用的数据过于贫乏单一,缺乏启迪性,作者对课堂和测试中使用的一种重要方法――传播人种学方法(theethnography of communication)(Mercer,1995;van Lier,1996:157-182,1998)――也只是蜻蜓点水,一带而过,有待于进一步的深化研究。尽管如此,瑕不掩瑜,《第二语言口语测试》一书无疑对我国在二语口语教学和口语测试研究中将起着具有积极的、现实意义的理论指导作用。

* Glenn Fulcher. 2003. Testing Second LanguageSpeaking. Harlow: Pearson Longman. xxi + 288pp.

参考文献

[1] Bachman, L.F.Fundamental Consideration in Language Testing [M].Oxford: Oxford University Press, 1990.

[2] Davidson, F. & B. Lynch. Testcraft: A Teacher's Guideto Writing and Using Language Test Specifications [M].London: Yale University Press, 2002.

[3] Graddol, D. The Future of English? : A Guide toForecasting the Popularity of the English Language in the21st Century [C]. London: BritishCouncil, 1997.

[4] Hughes, A. Testing for Language Teachers[M].Cambridge: Cambridge University Press, 2003.

[5] Hymes, D. Oncommunicative competence [A]. In Pride, J. & J. Holmes (eds.)Sociolinguistics [C]. Harmondsworth: Penguin, 1972.

[6] McNamara, T.Measuring Second Language Performance: A New Era inLanguage Testing[M]. New York: Longman, 1996.

[7] Mercer, N. The GuidedConstruction of Knowledge: Talk amongst Teachers andLearners[M]. Clevedon: Multilingual Matters, 1995.

[8] Messick, S.A. Validity[A]. In Linn, R.L.(ed.) Educational Measurement [C].New York: Macmillan, 1989.

[9] Messick,S.A. The interplay of evidence and consequencesin the validation of Educational Researcher performanceassessment [J], 1992 (23).

[10] Skehan, P. A. Cognitive Approach to LanguageLearning [M]. Oxford: Oxford University Press, 1998.

[11] Stansfield, C. & D. Kenyon. Research on thecomparability of the Oral Proficiency Interview and the SimulatedOral Proficiency Interview [J]. System, 1992(20).

[12] van Lier, L. Interaction in the language curriculum:Awareness, Autonomy, and Authenticity [M]. London:Longman,1996.

[13] van Lier, L. Constraints and resources in classroom talk:Issues of equality and symmetry[A]. In Byrnes, H. (ed.) LearningForeign and Second Languages: Perspectives in Research andScholarship [C]. New York: The Modern Language Association,1998.

[14] Wire, C.J. Communicative Language Testing[M]. New York: Prentice Hall International,1990.


第二语言口语测试研究新探索(此文已发表在《外语电化教学》2007年 第二语言和外语的区别

Review on Testing Second Language Speaking*.

ZHENG Xin-min

(College of Foreign Languages, Fuzhou University, Fuzhou,Fujian, 350002, China)

Abstract: The book offers the first systematic, comprehensiveand up-to-date treatment of the evaluation of specifications oftesting second language speaking,based on the latest researchoutput in second language pedagogy, second language acquisitionresearch, and second language speaking tests. This book criticallyand creatively develops the new theoretical framework and modelsfor explanations of the process of test design, evaluation ofspeaking tests, and task types for testing speaking. Fromphilosophical perspective, this book successfully demystifies theprocess of testing speaking and provides a thorough treatment ofthe key ethical and technical issues in speaking evaluation,including approaches to researching speaking tests and specificmethodologies

Key words: second language; testing speaking; evaluation ofspecifications

  

爱华网本文地址 » http://www.aihuau.com/a/25101016/323888.html

更多阅读

探索频道即将播出:《人类基因解码》

如果12月21日不是世界末日,请22日锁定Discovery探索频道。Discovery是全球知名专业科学频道,主要播放崭新科技,前沿科学的纪录片。Discovery亚太区域的收视户达到1.86亿,为全球覆盖最广及最具公信力的电视频道。因定位权威科学报道,所以

声明:《第二语言口语测试研究新探索(此文已发表在《外语电化教学》2007年 第二语言和外语的区别》为网友如果星星不发光分享!如侵犯到您的合法权益请联系我们删除