期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

期刊咨询 杂志订阅 购物车(0)

技能测试论文模板(10篇)

时间:2023-03-16 17:35:40

技能测试论文

技能测试论文例1

作者简介:赵晓君(1979-),女,河南南阳人,郑州轻工业学院软件学院,讲师;黄艳(1976-),女,河南信阳人,郑州轻工业学院软件学院,副教授。(河南 郑州 450002)

基金项目:本文系郑州轻工业学院校级青年教师教学改革项目的研究成果。

中图分类号:G642.0 文献标识码:A 文章编号:1007-0079(2013)07-0101-02

随着软件产业的快速发展,软件系统的规模越来越大,功能实现也越来越复杂,导致软件中存在的缺陷数量大大增加,这些缺陷将会带来各种损失,甚至出现灾难性的后果。因此,如何保证软件质量已成为所有使用软件和开发软件的人们关注的焦点。软件测试作为软件工程的一个重要组成部分,是目前用来验证软件是否能够满足用户需求功能的唯一有效方法,是保证和提高软件质量的重要环节。为适应软件产业的发展趋势和满足软件测试人才的大量需求,目前已经有许多大学在软件工程专业添加软件测试课程或者添加软件测试专业方向。

软件测试专业包含多门专业课程,有“软件测试理论”、“软件测试技术”和“软件缺陷管理”等,其中,“软件测试理论”课程重点为初学测试的同学讲解测试的基础理论知识,主要包括软件测试基本理论、软件测试方法和技术等,在多门专业课程中占有举足轻重的地位。

一、“软件测试理论”教学现状

“软件测试理论”课程重点介绍软件测试的基本理论,因此整个课程主要以教师讲授为主,在教学的过程中存在以下问题:

1.教学内容理论性较强,难以调动学生学习的主动性

对于初学软件测试的学生,首先要向其讲授相关测试理论,使其建立系统的测试理念。

但是学测试的学生大都是理科生,喜欢操作性强的课程,“软件测试理论”课程的理论性太强,需要背诵很多概念性的知识,这对于他们来说是比较困难,不能激发学习的主动性,教学效果不理想。

2.测试方法和技术案例实际应用价值不足,学生很迷茫

测试方法和技术是“软件测试理论”课程学习的重点和难点,这部分内容仅靠老师的讲解和书本上的案例很难让学生深入理解掌握测试技术的内涵,学生在学习这部分知识时会产生迷茫:学习这些知识有什么用处,在具体的项目测试中,应该怎样应用这些知识?没有实际的项目案例做支撑,学生会失去继续学习下去的兴趣。

针对上面的问题,本文提出将项目驱动法应用于“软件测试理论”课程的教学中,学生在进行项目实践的同时,根据需要学习软件测试相关理论知识,这样有助于提高学生的学习主动性,有助于理论知识的牢固掌握,有助于提高学生的实践技术能力,改善该课程的教学效果。

二、项目驱动法

项目驱动法是目前中国教育领域中一种比较新的教育教学方法。

所谓项目驱动法,是师生通过共同实施一个完整的项目工作而进行的教学活动,它既是一种课程模式,又是一种教学方法。[1]这里的项目根据课程教学内容的不同所包含的涵义也不同。在“软件测试理论”课程教学中,项目即指一个已经开发完成的软件测试工作。通常,项目教学都是实践导向的和任务驱动式的教学。

在项目驱动模式的教学活动中,教师根据学生现有的知识水平和项目经验选择一个合适的项目,以项目实施为主线展开教学活动,把课程相关的知识点的讲解融入项目操作的每个步骤中。在项目实施的过程中,以学生为中心,教师主要做组织和指导工作,学生在整个项目的实施过程中处于探索知识的情景中,充分发挥主动性、积极性和创新精神,综合运用所学的知识和技能解决实际问题,最终达到有效地将所学知识系统化深入化的目的。

这种模式从根本上将传统课堂中老师满堂灌转变为“学生为主体,教师为主导”的教学模式。同时,学生通过一个具体项目的实践,感受到了真实项目管理的思想和团队协作的必要性,提高了学生的创新能力和项目实践能力。拥有真实项目的实践经验使得学生在择业时拥有很大竞争优势。

将项目驱动法应用于“软件测试理论”课程教学中,在课程理论教学中加入一个完整的项目测试实践环节,通过项目实践能够很好地激发学生的学习主动性,使学生经历了一个“先做,遇到问题,再学,解决问题,再做,获得经验”的学习过程,最终完成一个完整的软件测试实践,同时也学到了“软件测试理论”课程应该掌握的理论知识。这样,既解决了软件测试理论课程理论性太强的问题,又解决了测试方法和技术案例实际应用价值不足的问题;而且丰富了学生的实践经验,提高了软件测试理论课程的教学效果。

三、“软件测试理论”课程教学目标和教学内容

1.教学目标

通过本门课程的学习和实践,理解软件测试理论与原则;掌握主流测试技术和方法,熟悉测试用例的编制、熟悉软件测试的基本流程,熟悉软件测试过程中各类技术文档的编制规范,并能灵活运用测试技术解决实际问题。

对于一个具体项目软件,每一个学生都能够顺利完成如下手工测试流程:根据软件需求规格说明书撰写测试计划,设计测试用例、进行测试环境配置和测试数据准备工作、执行各种测试,撰写缺陷报告、跟踪并修复缺陷、进行测试评测,最后提交测试总结报告,达到软件企业对测试专业人才的要求。

2.教学内容

“软件测试理论”课程的教学内容主要包括软件测试基本理论、软件测试基本技术、软件测试过程和软件测试工具。[2]

软件测试基本理论包括软件测试、软件缺陷和测试用例的基本概念,测试的目的、测试模型、测试分类和测试流程。

软件测试基本技术包括白盒测试和黑盒测试;其中白盒测试包括静态测试和动态测试,动态测试又包括程序插桩、逻辑覆盖、基本路径测试等;黑盒测试包括等价类划分、边界值分析、因果图法、判定表法、场景法等。这些基本技术都是在进行测试用例设计时使用的。

软件测试过程是指执行测试的过程,通常分为四个阶段:单元测试、集成测试、系统测试和验收测试。

软件测试工具有多种:功能测试工具、性能测试工具和测试管理工具等。

四、项目驱动法的应用方案

1.项目的设计

实施项目驱动法,首先需要设计项目。项目的设计与选取直接影响到该教学模式的教学效果及学生的学习兴趣。“软件测试理论”课程项目的选取与其他课程又有所不同,学生要进行的操作是对现有的或者已经开发完成的软件的测试工作,因此在设计项目时应遵循以下几条原则:

第一,项目是现有的软件或已经开发完成的软件,软件中有部分明显错误,有部分隐藏错误;明显错误有助于提高学生的测试积极性,隐藏错误有助于启发学生进行更深入的测试。

第二,项目具有典型性,代表大部分软件的共性。通过该项目的测试,学生可以掌握大多数软件的测试流程和测试方法。

第三,项目中有多种情景元素,符合使用多种测试技术和方法,有助于学生在进行项目测试的同时,学习使用多种测试技术设计测试用例的方法。

第四,项目大小和难易适中。每个项目组的人数控制在3~5个人,设计的项目能使学生通过努力在一定的时间内完成。

根据以上原则,本课程目前选择的项目是《企业薪酬管理系统》。

2.项目驱动法的实施

本课程通过让学生进行企业薪酬管理系统完整的测试流程实践的同时,讲解测试需求编写、测试计划编写、测试用例设计、测试环境配置、测试执行、缺陷跟踪和管理、测试报告撰写等内容。课程授课方式主要是分阶段讲解测试过程和测试要求,每一个阶段开始,老师先讲原理,选择部分内容做例子进行讲解,然后学生比照例子跟着做;阶段内容完成时,学生提交完成的文档,老师选择典型的问题进行讲评,然后进行下一个阶段的内容,如此类推直至测试结束。

企业薪酬管理系统测试流程设计如图1所示。

本课程课时为60学时,根据图1系统测试流程图安排,基于项目驱动法的“软件测试理论”课程安排如表1所示。

在课程进行的过程中,必须严格按照项目的测试流程进行,测试流程为:先获取项目测试需求,撰写测试计划,设计测试用例,执行测试,提交缺陷报告并跟踪修复缺陷,最后提交测试总结报告。课程结束,要求学生提交项目测试报告,测试报告包括多个文档,整个流程中每个阶段的工作必须有撰写规范的文档提交,如:测试计划、测试用例、测试执行报告、缺陷报告和测试总结报告等等。

测试报告既体现了教师项目教学的结果,也体现了学生对测试知识技能的掌握水平。通过评价学生作品,找出学生在学习过程中的薄弱环节,进一步改进项目驱动教学的教学安排,使其能够发挥最大的教学效果。

五、结束语

本文针对软件学院软件工程专业的培养对象和教学特点,把真实项目引入“软件测试理论”课程课堂教学中,采用项目驱动教学法,从项目的需求评审、测试计划、测试用例设计、测试执行、缺陷报告、测试评测到测试总结一个完整的测试流程,交给学生组建测试团队,按照流程进行任务分配和管理,最终完成整个项目的测试工作。通过一个完整项目测试流程的完成,有效提高学生的学习和实践能力、解决问题的能力、团队协作能力等,使学生在掌握软件测试的各种测试技术和基本流程的同时,积累了一定的项目测试经验,为他们今后的就业打下了良好的基础。

技能测试论文例2

《教育与心理测试标准》(以下简称《标准》)是教育与心理测验领域的权威性文献,体现了考试领域的行业标准。该文献认为考试的效度是编制和评价考试过程中最关键的因素,是一个统一的概念,代表了测试对构念(construct)进行测量的有效程度[1]。自新版《标准》1999年颁布以来,新的效度观和效度研究方法已经成为教育与心理测量的研究中心之一,但在语言测试方面此类研究尚不多见。与此同时,我国英语考试改革趋势内在需要新的考试研究方法。英语水平考试主要用于测量学生的语言能力,基于内容的效度证据证明考试内容是否以有效的语言观为依据,考试结果在多大程度上可以解释考生的语言能力及与语言能力相关的心理特征,效度证据收集方法主要来自于对考试所测量的各部分内容的逻辑分析和专家评价。本文采用美国教育考试服务中心(ETS)的研究人员研制的用于测量英语水平考试效度的考试题目和语言能力等级关系量表(Linking Test Questions to Task Statements)为研究工具[2],以2006年公共英语等级考试PETS-5为样卷[3],通过专业人士的分析评判,收集基于内容的效度证据,以考查目标考试对于考生语言能力进行测试的有效程度,即目标考试究竟测试了构成考生语言能力的哪些因素,从而探索英语水平考试基于内容的效度证据的效度研究方法。

一、考试效度

语言测试中的效度理论来自教育与心理测量学,效度理论发展可以分为三个时期:单一效度观时期、分类效度观时期和效度整体观时期[4]。单一效度观认为效度是指一项测试是否测量了它所要测量的东西;而证明效度的典型的方法是:“在多大程度上这项测试与其它有效且可靠的语言测试相关。”[5]分类效度观认为效度是“从测验所作出的推论的适当性或合理性的程度,反映已有证据可以在多大程度上支持根据测验分数所做出的推论”。按其证据的不同来源分为三种:构念效度、内容效度和标准效度。长期以来,这种关于效度的定义和分类,一直是教育与心理测量学界研究效度的基本框架。

效度整体观的概念最初由Messick提出,即“效度证据和理论依据在多大程度上支持基于测试分数的其它评估方式所做出的推断或采取的行动是充分和适当的,对这个问题的综合评价性判断就是效度”[6]。新版《标准》确立了构念的核心地位,明确了效度研究的对象是测试分数的解释和适用,而不是测试本身。效度成为关于测验分数的特定解释所得到的支持程度,来自累积的证据或理论。该解释是测试应用的基础。所谓测试解释,是关于测试所要测量的构念(construct)或概念(concepts)的解释,所有的分数都被视为对构念的测量。构念不再是效度证据的三种来源之一,而是用来定义效度。即效度指某测试对构念进行测量的有效程度,而构念则被定义为测试所要测量的概念或特征(the concept or the characteristic that a test is designed to measure),构念成为教育与心理测量中最重要、最核心的概念之一。

考试效度的研究指的是为解释考试分数提供科学依据而收集效度证据的过程。效度证据分为五类,即基于内容的证据(evidence based on content)、基于反应过程的证据(evidence based on response processes)、基于内部结构的证据(evidence based on internal structure)、基于与其他变量之间关系的证据(evidence based on relations to other variables)和基于测验结果的证据(evidence based on consequences of testing)。其中,基于内容的效度证据指的是和考试内容本身有关的证据,即证明考试内容的代表性即考试构念的证据。测试的效度依赖于测试的精心编制,更依赖于编制测试的理论基础。对于语言水平测试来说,测试的理论基础即构念就是测试意欲测量的相关语言水平和能力。

二、语言能力

当代语言学理论认为语言能力指的是语言交际能力(communicative language competence)。社会语言学中的语言功能、语言变异和社会文化原则,功能语言学中的系统功能原则以及语用学中的言语行为原则等为语言交际能力理论的产生提供了理论根据。

交际语言能力模式可以追述到Hymes的交际能力说以及在此基础上Canale和Swain在上世纪80年代初提出的交际能力理论模式[7]。现行的交际语言测试模式是90年代初美国应用语言学家Bachman提出的语言能力观。他认为语言能力就是把语言知识和语言使用的场景特征结合起来,创造并解释意义的能力,即语言交际能力[8]。该能力是由语言知识和一系列元认知策略组成,这两部分又可分出许多次类别。构成语言能力的各部分在具体的语言使用场合下,相互作用,相互影响,不可分割。

本文以Bachman的交际语言能力模式为基本理论框架,对英语水平测试所考查的语言能力进行检验,探索目标考试是否测试了相关的语言能力。

三、水平考试的效度研究

(一)全国英语等级考试(PETS-5)

全国英语等级考试(Public English Testing System,简称PETS)是教育部考试中心设计并实施的全国性英语水平考试体系。根据考试大纲,PETS考查的能力是建立在“交际语言行为模式”上,认为语言交际需要是掌握外语的目的,将语言能力分为“接受”、“产出”、“互动”能力。PETS考试根据各种情景和任务,在特定主题和话语下,结合相关的语言行为进行教学或考查,题型有:客观性试题――多项选择、选择配对等;半客观性试题――改错、填空、简单概括等;主观性试题――短文写作、翻译、口试等。

PETS共有五个级别,PETS-5是最高级。通过该级考试的考生,其英语水平基本满足在国外攻读非英语专业硕士研究生或从事学术研究工作或在国外从事专业和管理工作的需要。试题由笔试试卷和口试试卷组成。笔试试卷(140分钟)分四部分:听力、英语知识运用、阅读理解和写作。口试试卷(15分钟)分三节考查考生的口语交际能力。本文中采用教育部考试中心2006年发行的全国英语等级第五级考试大纲中的样题为目标试题进行研究。

(二)试题联系评估等级量表(Item Linking Rating Form)

美国教育考试服务中心2004年的研究报证明了通过试题联系评估等级量表(Item Linking Rating Form)用来收集基于内容的证据,进行有效的语言水平考试效度研究的可行性。该量表把语言能力按其表现形式分为若干微技能,主要采用专家评价方法,对试卷题目和各个微技能之间的相关性作出判断,从而确定试题在内容方面对英语语言水平测试的效度,是本文采用的主要工具。

(三)实施过程

专家评判是收集基于内容的效度证据的主要方法之一,来自北京师范大学和北京外国语大学的36名外国语言学及应用语言学专业硕士研究生应邀对目标试题进行了评价。所有参与人员都有十年以上英语学习和两年以上英语教学经验,熟悉英语测试领域的相关理论知识。中国著名英语测试学专家邹申认为,“专家”并不是学衔意义上的专家,而是“有较丰富的相关领域的知识或经验的专业工作者”[9]。本研究参与评判人员符合此要求,他们的评判是可靠的。本次共发出量表36套,收回36套,其中用于数据分析的有效量表30套。

四、数据分析

把有效量表的数据输入SPSS11.0可以得到每个试题和某一语言技能中所描述的微技能的相关系数的评判平均数,该平均数反映试题和这种语言技能或微技能的相关程度。下表中黑体部分平均数等于或大于1.50(≥1.50),代表的相关程度为基本相关。相关程度平均数反映该目标试卷的测试理论根据,即该试题测试了什么样的语言知识和技能。单元格中所标注的就是考生可以通过该目标测试所展示出来的语言水平知识和技能。

表中每行显示了目标试卷中某个试题所测试的语言技能的数量,每列显示的是成功测试某项技能的试题的数量,整个表格反映了目标试卷中各个试题和欲测技能之间的相关关系。

(注:表中黑体部分≥1.50)

从表一中可以看出,所有的听力试题至少与2项语言技能相关;10项听力技能中有7项至少和一个测试试题相关。其中第一项(理解事实性信息和细节)和第六项(理解主要观点和支持性信息)在所有的听力试题中得到体现。

听力没有测试到的语言技能有:第二项(理解说话人口头指示的任务及其期限);第九项(理解语言各交际功能之间的差异,如提议、建议、指点或警告等)和第十项(识别说话者的态度信号,如语调、幽默和讽刺等)。

(注:表中黑体部分≥1.50)

从表二中可以看出,所有的阅读试题至少与1项语言技能相关;11项阅读技能中有8项至少和一个测试试题相关。其中第一项(通过跳读或略读的方式,找出并理解文章中明确陈述的信息)在所有的阅读试题中得到体现。

阅读部分未能体现的阅读技能包括;第二项(找出并理解表格、图表等非叙述性材料中的信息);第三项(根据上下文确定单词的意思);第五项(阅读并理解和课堂练习或考试有关的书面指令)。

表三表明PETS-5的写作部分可以充分测试所有相关写作技能。

从表四中可以看出,口语部分测试了全部9项相关语言技能,其中第二项(评价性常规口语表达)、第四项(意义协商:使用话语加工策略评价交际的有效性,并根据实际情况做出必要的调整)和第六项(话语轮交替:理解每个说话人应该什么时候说,说多长时间)分别在两项口语任务中体现,而另外6项技能则在所有口语任务中均得到了很好的体现。

六、讨论

综上所述,全国英语等级考试第五级的听力和阅读部分每个试题都测试了某一项听力技能,但从整体上来看,阅读和听力试题不能涵盖所有的相关语言技能。而写作部分和口语部分的试题则几乎测试并涵盖了所有的相关技能。也就是说,从考试内容看,PETS-5的听力和阅读部分的试题不能够成功测试出所有的听力和阅读能力,试题的代表性也不够充分;而写作和口语部分的试题则能够反映考生应有的写作和口语水平。

另外,试卷中的第二部分是英语知识运用,其目的在于“不仅考查考生对连贯性和一致性等语段特征的辨识能力,还考查考生对用于一定语境中规范的语言成分的掌握,这些规范的语言成分主要是词汇和语法结构”。这一部分内容特殊,属于语言知识的考查,是构成语言实际运用能力的基础,不适合用上述工具进行分析评判。笔者曾就此问题请教于教育部考试中心PETS考试体系的设计者和相关专家,鉴于英语在中国作为外语学习(EFL)的社会环境和中国特有的学习文化,笔者认为对此问题的讨论当另作研究。

本文是对语言水平测试效度研究的一个初步尝试,在整个试验过程中还存在着很多这样那样的问题。期待着在以后的研究中能够不断改进,促进测试研究的科学化和规范化。

参考文献:

[1]AERA,APA,& NCME.Standards for Educational and Psychological Testing[M].Washington,DC:AERA,1999:9.

[2]Rosenfeld,M.,Oltman,P.K. & Sheppard,K.Investigating the validity of TOEFL:A feasibility study using content and criterion-related strategies[J/OL].2008.08.10.http://省略/Media/Research/pdf/RM-04-03.pdf.

[3]教育部考试中心.PETS-5考试大纲[M].北京:高等教育出版社,2006.

[4]孙晓敏,张厚粲.效度概念演进及其新发展[J].心理科学,2000,(1):234-235.

[5]Lado,R.Language Testing[M].New York:McGraw-Hill,1961:321.

[6]Messick,S.Validity[A].In R.L.Linn(ed.).Educational Measurement(3rd edition)[C].New York:Macmillan,1989:13.

技能测试论文例3

正式的语言测试起源于中国东汉时期的科举考试,但现代意义上的语言测试却于20世纪中叶诞生于英美等发达国家。20世纪60年代,外语测试作为一门新的学科从外语教学中独立出来,作为语言学、教育与心理测量学、计算机技术等的交叉学科,半个世纪以来,国外大批语言学家在语言测试领域取得了卓越的成就。中国的高考和大学英语考试(CET)虽有数百万考生规模,但在研究方面仍落后于英美等发达国家。至今,以美国ETS开发的TOEFL考试和英国剑桥大学考试委员会主办的IELTS考试为代表的西方国家研究水平仍执全球之牛耳。虽然近些年,国内学者越来越重视外语测试的研究,国内专业期刊如《语言测试》、《语言评估季刊》、《外语测试与教学》等相继出版,但学者们大多关注于测试的开发实践,而对测试理论与实践的研究较少。李筱菊[2](P441-447)按新科技对语言测试的影响把语言测试的发展分为计算机前语言测试和计算机后语言测试。计算机后语言测试又分为五代,第一代称为计算机化语言测试:考试实施开始使用计算机;第二代称为调适性语言测试:考试实施中 使用调适性编程,即计算机会根据考生的做题情况调整试题的难易度;第三代称为多媒体语言测试:应用多媒体技术建立多维度情景,创造真实化交际情境;第四代称为连续性语言测试:测试性质从静态转变为动态,关注测试个人化,注重受试者的学习过程和个人情况;第五代称为智能化语言测试:测试情景化、互动化、智能化。正是在这样的背景下,《现代语言测试与评估丛书》在曾用强博导的主编下应运而生。

2.简介

本书作者认为计算机技术的发展对语料库与语语言测试的发展产生了巨大的影响,得益于计算机技术的普及和进步,机读语料库及其研究和应用开始日益兴奋;对于语言测试,计算机平台带来了巨大的考试变革;语料库对语言测试的发展也提出了新的要求和预期。此书着眼点是计算机技术、语料库和语言测试三者的结合,讨论范围限于计算机和语言测试的交叉点、语料库本身和技术方法在语言测试中的应用接口,以及这三者的综合应用。文中先分别讨论了计算机技术和语料库各自对语言测试的影响和作用,然后探讨这两者的综合应用,最后介绍计算机技术和语料库在语言测试中的具体应用实例:广东高考计算机化英语听说考试的开发和应用,以及基于语义连贯性的计算机自动作文评分系统开发和应用。本书由五个章节和一个附录组成。

第1章旨在指出本书的写作目的和要点。这一章节首先澄清了书中所涉及的主要概念:语言测试主要是指对中国外语学习者所学外语能力的测量和评估;计算机技术的概念包括软件、硬件和网络;语料库主要指现代机读语料库,这类语料库能够在计算机平台上存储和查询。本书的写作目的是为了让读者了解计算机和语料库对语言测试的帮助和作用,同时也介绍这些新技术方法可能存在的局限性,而不是说服读者在语言测试中应用计算机技术和语料库方法,也不是声称基于计算机和语料库的语言测试能够优于传统的笔纸测试。计算机化语言测试的优点包括时间节省、信息收集、数据存储、心理测量、多媒体化和标准化;受到的一些制约因素有:专家匮乏、技术限制和实施障碍。本章节的要点则是对语言测试和计算机之间的相互关系展开论述,同时也对语言测试和语料库的发展进行回顾。

第2章则具体阐述了不同形式的计算机化语言测试,包括听说读写四种主要考试形式在计算机平台上的实现。在本章节中,作者重申了计算机化语言测试的质量评价标准和传统的笔纸考试一样,由效度和信度组成。作者认为即使是一个有较好效度的传统笔纸考试,照搬到计算机平台,其效度也可能发生变化。导致出现这种现象的原因可能是受试者的计算机应用水平差。对于测试的信度而言,计算机化语言测试存在的主要问题是:1)在自适应测试的环境,如何保证受试者重复测试时所接收到的试题具有相同的难度和区分度等标准,而且产生的结果一致;2)考试系统本身(硬件和软件)的稳定性;3)考试的功能是否独立于外部环境,即考试在各种不同的外部环境中都正常使用,而不受地理位置、背景噪声、光线等因素的影响。

第3章从学习者语料库和母语者语料库两个方面介绍语料库在计算机化语言测试中的具体应用。作者先根据语料库的语料来源进行了分类:学习者语料库和母语语料库。前者是收集目标语学习者在学习过程中对目标语使用的记录,后者是目标语的母语者在目标语使用中的记录,这两种语料库的目的和功能不同,并且语料库数据来源也不同。

学习者语料库的主要数据来源是各种不同的语言测试,即采用考试中受试者的语言输出来组织和编辑完成,可随着类似考试的不断进行,不断扩充。从语料库的建设而言,学习者在语言测试环境下产生的语言使用成为语料数据的一个关键来源。反过来,学习者语料库对语言测试的发展也变得越来越重要。这种重要性体现在语言测试的设计、开发和评估等各个方面。母语者语料库的数据来源主要是英语母语国家的广播电视节目和出版物等。在此节中,作者介绍了目前最大型的三个英语母语语料库(英国国家语料库、美国国家语料库、澳大利亚国家语料库)的建立、发展和应用。通过查询英语母语语料库可以较为便捷地了解到某一个词或者词组在英语母语者中使用时的用法和特征。作者同意孔文和邹申(2007)的看法,即母语语料库可以用于试题开发制作、语言测试设计和自动评分系统开发。

第4章讨论了计算机技术和语料库在语言测试中的综合应用,提供计算机技术和语料库在语言测试中的综合应用实例,介绍广东高考计算机化英语听说考试和计算机自动作文评分系统的开发和应用。

高考计算机化英语听说考试的考试时间为30分钟,包含三个部分:模仿朗读、角色扮演和故事复述。评分方式为计算机辅助网上评卷方式,各个部分的评分侧重点不同,但都分三个档次给分。模仿朗读题考查语音语调、语速和内容;角色扮演考查语言和信息;口头作文考查内容、语言、流利度和语音。评分过程要求双评,如果两位评卷老师的成绩相差5分以上,就会有第三位评卷老师加入。每位评卷老师只负责一个部分的评分工作。作者认为这样的考试在考试组织、评分体制和受试者感受方面都有优势:能有效控制试题的安全保密性;能实现“一题多评”,使评分更加公平、合理;能让受试者更加容易把控自身情绪;有利于实现听说任务的公平性。在总结前人的研究后,作者发现涉及模仿朗读和角色扮演这两部分的研究还是空白,并提出这两部分有很多值得深入研究,如模仿朗读的反拨效应、模仿朗读材料的选取,以及角色扮演中对话场景选取和素材的裁剪等。

在计算机自动作文评系统的开发和应用这一节当中,作者先简要回顾了主流计算机自动作文评分系统(PEG、IEA、e-rater)中的连续性分析,然后解释向心理论的主要框架并介绍其在二语写作测量中的应用。向心理论的核心思想是在一个语篇片段中,每个语句都有语义中心,通过追溯各个语句中语义中心的变动可以了解该语篇片段的连续性。向心理论的语句中心分别是:前瞻中心、回指中心、优选中心。基于这三类中心之间的相互关系,向心理论框架中语句中心的过渡类型分四类:延续过渡、保持过渡、流畅转换过渡、非流畅转换过渡。

到底计算机和语料库的应用前景如何呢?在接下来的第5章作者试图回答此问题。在本章中,作者先回顾和展望了计算机和语料库在语言测试中的发展方向,然后对计算机和语料库发展在语言测试领域里的新要求和期望进行了讨论。从宏观角度来看,语言测试的发展不断受到科技发展进步的影响。新技术本身不能够保证考试质量的提升,而是结合相关理论,恰当地应用才能够产生所期望的结果。新技术的应用须着眼于通过测试来了解受试者对于目标语言的使用能力,而不是受试者能够多大程度上适应和应用这类新技术。新技术的应用更不应是导致受试者在测试中成绩起伏的原因,在使用时要结合教学和测试群体和环境的实际情况,尽量避免应用新技术导致测试本身结构效度降低的情况。但是,在语言测试中采用新技术的目的除了提高信度和效度外,也要考虑节约成本和提高工作效率。在此章节中,作者也认同李筱菊老师提出的观点:语言测试是在信度、效度和实施条件三者间的动态平衡,并提出从长远的角度看,语言测试的发展将更加倚重于新技术,在实现提高信度和效度的同时弱化具体测试环境和条件对测试本身的限制和所不希望的影响。

最后在附录中,本书提供了计算机自动作文评分系统开发和应用中各种统计模型的计算结果。

3.特色

本书的最大特色是紧跟新时代社会科技的发展,把计算机技术、语料库、语言测试三者完美地结合在一起讨论。从语言的听、说、读、写四个技能的测试入手结合计算机技术的发展展开讨论。

在计算机辅助听力测试方面,作者提出听力理解考试的设计和开发需考虑三方面因素的影响:多媒体的参与度、任务形式、综合难度。在口语语篇环境中,影响听力理解的因素有语速、口音、音调、停顿、文体特征、受试者自身的背景知识等。在总结多方学者(如:Song,2012; Ginther,2002; Ockey,2007; Coniam,2001; In’nami & Koizumi,2009; Hoven,1999等)在机辅听力测试方面的研究成果后认为我们不应简单地支持或反对多媒体化的听力测试,而应依据实际测试的用途和目的来设计计算机化听力测试试题。

在口语测试方面,作者把口语能力解释为信息口头表达能力,这种能力包含对信息能够实现语义层面的表述(语义完整性)和对信息表达的恰当性(语用完整性)。由于影响口语流利度的因素包括:社会环境、生理的语言生成系统和心理因素,因此,作者认为在口语考试中无法测量到全面的口语能力,而只能测量到口语能力中的一部分。影响受试者表现的因素还有:受试者的个体差异、任务特点、交际者/话语对象、评分员和量表。作者介绍了IELTS和TOEFL的口语考试中测试的侧重点和考查内容,目前的机辅口语考试评分还是以人工评分为主。由于技术原因,计算机自动评分还没有大规模应用,还只是在实验和探索阶段。目前计算机平台的口语测试发展有一个重要特点:尝试引入自动评分系统,以期实现减少口语考试中评分员因素对考试效度和信度的负面影响。作者认同目前计算机自动评分技术的应用并不成熟的观点,计算机对自动口语语义识别还无法做到精确判读,所以无法用于涉及语义的口语测试题型。

对于阅读测试,虽然与机辅考试相比,受试者在笔纸考试中可以很方便地前后浏览和更改答案,但是从总体上来看,传统考试和计算机平台在文本呈现方式上没有本质的区别。作者例举多项研究(如Moore, Morton & Price, 2012; Sawaki, 2001)证明机辅阅读测试和传统阅读测试具有相同的结构效度和预测效度,而且计算机平台还可以让受试者在回答问题的过程中更加便捷而节约答题时间,也更易于老师使用形成性评估,更加便捷地观测学生的阅读结果数据。计算机阅读测试在效度和信度上与传统的笔纸考试拥有基本的对等性,但计算机阅读习惯和传统的纸张阅读有所不同,对此,作者提出计算机平台阅读测试要精心设计用户界面,使其方便阅读。对于不习惯计算机屏幕阅读的群体,提供笔纸考试的选择。

在讨论写作测试时,作者把计算机辅助写作教学和测试放在一起讨论。在对比不同学者对机辅写作测试和笔纸写作测试的观点时,作者较赞同MacArthur(1988)、Bangert Drowns(1993)、Lee(2004)、Li(2006)等学者的观点,即计算机写作能够让受试者写出更好质量的作文,当然前提是他们能熟练地使用计算机。对于作文自动评分的讨论,作者对比了PEG、IEA和e-rater的各自特点后提出尽管这三个系统在人机对比中的评分都达到了一个非常高的准确水平(r0.85),但都基于相同的工作流程:样本训练―统计模型生成―作文评分,而且这三个系统在自动评分时都缺乏对语义的分析和诊断。由此可见,到目前为止,作文自动评分系统更加适合于课堂教学的辅助活动,在大规模考试中替代人工评分员还是不太适宜。

本书的另一大特色是从计算机和语料库与语言测试形成的互动关系角度出发,探讨了把计算机和语料库引入语言测试之后随之产生的新概念和认识,同时还注意到了新技术促使语言测试中出现的新测试形式和方法。新的概念和认识则是对李筱菊老师[2](P451-456)提出的语言测试“消亡”论的详细解读,并明确认同在新技术发展应用的时代背景下,传统意义上的语言测试是必将消失的。在利用新技术所带来的便捷时,作者也提出了需要考虑的现实问题,如计算机设备有可能新旧不一,所使用的操作系统的兼容性问题等。

技能测试论文例4

中图分类号:G642.3 文献标志码:A 文章编号:1674-9324(2016)45-0201-02

一、《机械工程测试技术》课程概述

《机械工程测试技术》是各高等院校机械、自动化专业等工程类专业开设的一门重要专业基础性课程,是机械、电子、信息、力学、数学等学科的交叉学科。本课程主要通过讨论信号的描述和分析方法,传感器、常用信号调理电路和记录、显示仪器的工作原理以及测试装置基本特性的评价方法和不失真测试条件等方面的知识,要求学生深刻理解有关测试技术的基本理论、使用测试仪器对不同参数进行测量和分析的方法和手段、动态测试所需要的基本理论、基本知识和基本技能,对机械工程中常见的被测物理量能比较正确的选用检测装置并完成检测任务从而为进一步研究和处理工程测试技术问题打好基础。本文希望通过该门课程教学难点解析与探讨,不断激发学生的学习欲望、增强学生的动手能力与创新能力,引导学生较好地理解和掌握,培养机械工程类的专业人才。

二、《机械工程测试技术》课程的特点

《机械工程测试技术》综合了传感器技术、计算机技术、机械原理、信号分析与处理技术等技术理论,涉及机械工程领域中的非电量电测技术和其他测试技术等知识,是工业生产与科学研究不可或缺的重要技术手段,《机械工程测试技术》强调理论联系实际、突出工程技术应用,简单的理论知识记忆和掌握并不能完成该课程的教学任务,它只是课程开设的主要教学目标之一。学生在课堂教学中掌握的信号分析、数据处理、传感器技术、测试系统方面的理论知识,在专业课程体系中起到的是承上启下的知识衔接作用,是培养学生的工程实践能力、综合素质及创新能力的基础。

三、《机械工程测试技术》难点

1.课程内容具有抽象性,不易理解。《机械工程测试技术》是工程类专业中综合性很强的一门专业基础课程,内容涉及大量的数学知识,课程中有关信处理的部分涉及《概率论与数理统计》和《高等数学》等课程、有关测试装置的动态特性部分涉及《线性代数》和《机械控制工程》等课程,有关振动测试的部分有与《机械振动》等课程的内容有关联。因此,《机械工程测试技术》涉及到大量的较为抽象的高等数学知识,而对来数学基础相对薄弱的工科学生来说如何将抽象的数学知识运用到机械工程测试技术的实践当中,成为学生学习该门课程的一个难点。

2.课程涵盖学科较为广泛,对相关课程的理论知识要求较高。《机械工程测试技术》课程知识范围广,包括机械、电子、信息、力学、数学等多门学科,尤其前面测试信号分析理论部分,涉及到较多以前所学的高等数学知识,特别是积分变换知识,这就要求学生一方面要不断地掌握高等数学、数学分析的内容,另一方面又要不断吸收全新测试技术知识,假如不能充分利用已学过的基础知识并做到与新知识融会贯通,很容易造成各科知识内容的衔接不太顺畅,导致学生长期无法理解课程内容,影响机械工程测试技术课程的教学效果。

3.教学内容与机械工程测试技术的发展存在脱节。随着现代科学技术的不断快速发展,以及与国外相关领域交流的不断加强,机械工程测试技术课程所属的研究领域技术也在快速的更新与发展。但现在高校机械工程测试技术课程教学的内容还停留在以前的教学内容之上,比较陈旧,无法跟上技术实际发展的水平。就譬如在机械工程测试技术课程中的传感器技术、测试方法及测量装置等教学内容方面,都远远落后于当前社会生产实践以及相关技术发展的要求。

4.实验性教学的缺失。机械工程测试技术的实验教学当中存在着参差不齐的现象,各个学校之间也存在着一定的差距。许多学校该门课程受制于实验条件状况,许多复杂的测试实验无法完成,造成学生在理解一些较为复杂的课程的时候,由于只有理论的概念,而无法直观的参与实验,在理解这面课程的时候就存在着一定的困难。而一些较为简单的实验的教学效果来看也不是很理想,着一方面与客观的实验条件限制有关,另一方面也与学生难以理解此门课程而选择主观放弃的思想有关。

四、改进课程教学的措施研讨

1.合理安排课程的教学内容,突出重点教学内容。《机械工程测试技术》在实际的教学过程当中,可以不按照教材内容安排的顺利,打破教材之间的界限,例如可以不拘泥于传统教学,打乱书本上介绍各种类型传感器的顺序,以基本物理量的测量为授课主线,分别介绍位移的测量、振动测量、压力测量、温度测量、应变及力的测量等机械工程中常见物理量测量所采用的主要传感器及其工作原理,不再按照现有单列章节的方式去介绍,从实践教学中优化教材的内容与结构,将教学内容融会贯通,各部分知识点衔接有序,循序渐进地结合起来,将知识的学习和掌握按照螺旋式上升的方向进行融合,可以达到让学生在了解传感器相关知识的同时也知道主要作用,提高学生理论理解与实践理解的能力。

2.采用启发讨论式教学模式。在《机械工程测试技术》课程的教学过程当中,可以采用难点问题启发讨论的模式,对于机械工程测试技术课程中的难点问题,鼓励学生大胆发言,集体讨论,在这个过程当中,老师对扮演的角色不是一个解答者,而是引导者的作用,引导学生对提出的难点问题进行思考,收集相关的资料,调查研究,指导学生研究发放,最终对学生提出的难点进行解决,这样可以让学生真正的理解难点,掌握相关知识。

3.讲板书教学与多媒体教学相结合。作为一门比较抽象的课程,机械工程测试技术课程也要借鉴多媒体将枯燥的文字内容转化成图片传达给学生,使用图片记忆的方式帮助学生加强对知识的记忆。其次,可以通过软件设计模拟动态测试,将动态测试过程形象化,使学生建立起测试与系统的感官认识;再次,还能够通过多媒体技术,将该领域最新的国内外研究成果、知名研究学者、授课教师、本学院及本学校的科研成果介绍给学生,通过这种教学手段,增加了学生对本土科研成果的了解,激发学生的学习热情。

4.改革试验教学环节。实验是机械工程测试技术教学内容的重要组成部分。目前,随着信息技术与传感器技术的飞速发展,传统的实践教学模式已经不能适应社会对机械工程教学发展的要求,现在必须对试验内容进行富有创造性建设意义的课程改革。在试验内容上要增强试验的工程性、可操作性和现实性。在试验方法上,要根据实验室的条件,引导学生开展自行设计性实验,充分发挥学生的主动能动性,发挥学生的学习潜能,培养学生创新探索能力,让学生在解决实际问题的实践中提高分析问题解决问题的应变能力和创造能力。

5.利用科研项目提高学生的动手能力。所谓实践出真知,在剖析《机械工程测试技术》教学难点上可以采用项目实例的方法提高学生的理解力,以真实发生的实际案例,讲解在其中所运用到的《机械工程测试技术》课程当中涉及到的如何测试系统的静态、动态特性、安防测试传感器、设计测试系统等等有关方面的知识。

五、结束语

《机械工程测试技术》是一门理论性和实践性都很强的课程,而且涉及到的相关学科的知识十分庞杂,在教学的过程当中存在着不少的疑难杂症,导致不少学生反映该课程晦涩难懂,课程内容犹如天书,严重影响教学效果,既定的课程目标和教学任务也很难在教学中达到预期的效果。本文试图通过对《机械工程测试技术》课程教学难点的分析,提出了一些在实际教学工作中总结出的经验性的解决方法,希望对《机械工程测试技术》这门课程今后的教学改进有所裨益,广大《机械工程测试技术》教员能够以此来参考提高教学效果,激发学生的学习兴趣,让学生能够自觉地学习和钻研理论和实践。

参考文献:

[1]梁健.“机械工程测试技术”课程教学难点突破[J].广东工业大学学报:社会科学版,2009,(5).

技能测试论文例5

评价中心技术,也称情景模拟法,模拟现实的工作环境,采用多种评价技术和手段测试被试者的心理反应和行为反应,进而测量被试者的管理能力和潜能的测评方法。评价中心具有效度高、信息量大、针对性强、客观公正等特点,广泛应用于企业中高层管理人员的测评。20世纪50年代美国电话电报公司首先使用评价中心技术,目前评价中心广泛应用于政府部门、企事业单位、军队及其他组织中。

一、评价中心主要技术

评价中心有广义和狭义之分。广义的评价中心包括心理测验、面试技术、情景模拟等。我们通常使用的是狭义的评价中心,即情景模拟技术主要包括公文筐处理、无领导小组讨论、角色扮演法、管理游戏等。

1、公文筐处理。它具有高信度和高效度的测评技术。测试中,将涉及财务、人事管理、市场营销、公司制度、客户关系等工作中需要处理的各种公文放入公文筐中,被试者以管理者身份,模拟公司真实环境,按照规定的条件,对各种公文进行处理形成公文处理报告,对被试者的计划、组织、分析、决策等能力进行综合评价。

2、无领导小组讨论。被试者被编成若干工作小组,讨论专业设计的管理活动中遇到的各种问题,小组成员自主分工,合力完成指定的任务。通过对被试者在讨论中展现的分析能力、应变能力、表达能力、团队合作能力、执行力等能力进行综合评价,挖掘组织需要的人才。

3、角色扮演法。模拟现实人际关系情境,被试者扮演指定的角色处理专业设计的棘手的人际关系矛盾和人际冲突,根据被试者在不同情境中的表现,评价被试者是否符合组织中工作岗位需求,主要用于测试被试者的人际关系技巧、控制情绪能力、处理问题能力等。

4、管理游戏。它是以完成指定工作任务为基础的标准化模拟活动,分配每名小组成员指定的任务,共同完成任务,根据被试者的表现来评价被试者的实际管理能力。

二、 评价中心技术在人力资源管理中的应用

面对日益激烈的竞争,作为人力资源测评的重要工具,评价中心在企业的人力资源管理中有着广泛的应用。

1、在招聘中的应用。招聘为企业输送优秀的人才,评价中心作为一种综合性高效度的测试工具,在招聘环节发挥重要作用。评价中心通过模拟企业现实工作环境,根据企业自身需要,利用不同的技术测试被试者的不同能力。公文筐处理测试被试者的计划、分析、判断宏观能力,安排无领导小组讨论可以观察被试者的语言表达、团队合作能力。角色扮演考察被试者自控能力、随机应变能力。管理游戏测试被试者实际管理能力。通过测试被试者的行为、能力、技能,筛选出优秀的人才。

2、在录用和晋升中的应用。应用评价中心测试被试者的各方面能力后,根据企业岗位任职要求,将不同的员工安排到合适的岗位上,尽可能发挥员工最大作用。当企业出现职位空缺,需要对候选人的表现进行全面评估,根据现在岗位表现结合应用评价中心对候选人的测试预测在新岗位的表现,尽可能人岗匹配。

3、在培训与开发中的应用。随着知识经济时代的到来,企业对员工要求越来越高,评价中心采用不同技术测试被试者的各种特质数据,例如霍兰德职业倾向测验,根据数据进行分析,得出员工综合分析报告,了解被试者的特长及劣势,进行针对性的培训与开发,因材施教,根据培训前后员工表现评估培训效果。

4、在职业生涯管理中的应用。依托评价中心可以分析员工各方面能力,从而针对性的制定员工职业生涯规划。人岗匹配,充分发挥员工的能力特长,选择模板,因材施教,扬长补短,在学习型组织的基础上不断提高员工的能力,职业生涯遵循科学的职业规划发展。

三、 评价中心技术的特点及发展前景

1、评价中心的特点。评价中心的优点主要表现为(1)综合性。评价中心采用多种技术从不同角度测试被试者的多项指标。(2)测评形式和内容灵活性。评价中心有多种测评技术从不同角度测试被试者,例如无领导小组讨论以小组讨论形式,公文筐处理以办公模拟形式。(3)相对标准化。评价中心各种方法有标准的评分规则和测评指标,多个评分员对被试者表现进行综合评价,最后形成科学的分析报告。(4)内容效度和表面效度高。评价中心模拟现实工作环境,按照客观的评价指标和评分标准,综合分析被试者各方面能力,因此评价中心具有高效度的特点。

评价中心在应用中也会出现一些问题,主要有(1)主观性比较强,评价中心依靠评价人员的主要判断,结果是主观性较强。(2)标准化程度低,情景模拟制定标准化程度低。(3)实施成本高,评价中心耗时长,设计模拟场景难,成本高。(4)对评价者要求高,评为担任重要角色,自身要求较高素质和能力。

实施评价中心的几个关键注意问题:(1)首先做好工作分析,科学分析工作岗位胜任能力要求,工作岗位需要哪些能力,在运用评价中心技术对被试者进行测评是否适合工作岗位。(2)根据工作分析结果得到需要测试的指标后,选用合适的评价中心技术针对性的测试关键指标,尽可能选用多种评价中心技术测评,得到科学的分析结果。(3)选用合格的测评师,对测评师要求很高,能够严格控制测评的时间进度和成本,对测评师进行专业培训。

2、评价中心的发展前景。(1)趋向电子化。为了降低成本和减少耗时,计算机多媒体技术应用于评价中心技术开发,企业开发计算机情景模拟测试,情境更加逼真、测试更加复杂,目前以开始传播应用。(2)趋向非正式化。评价中心倾向使用耗时少的评价技术,评价中心不断开发新技术,评价中心技术越来越非正式化,与传统评分员商讨得出结果不同,现在测试结果由电脑整合倾向非正式化。(3)重视心理测试。评价中心将行为测试与心理测试结合起来全方位评价被试者,得到更科学的测试结果。

评价中心技术的客观、多样、科学性赋予其高效度的特性,因而能广泛与用于各种人力资源管理职能。组织在很多方面使用评价中心,包括组织的招聘与录用、培训与开发、职业生涯规划。随着评价中心技术的不断发展完善,评价中心在越来越多的领域展现出广阔的应用前景。(作者单位:华中师范大学管理学院)



参考文献:

技能测试论文例6

一、测谎技术的涵义

测谎技术,即犯罪心理测试技术,学名CPS(Computerized Polygraph System)多道心理测试技术,是专门技术人员按照一定规则,借助一定仪器测量被测试人在回答规定问题过程中各项生理参量(如血压、脉搏、呼吸等)的变化,通过设备定量分析确定被测试人当时的心理状态,进而判断其在回答某一涉案问题时是否说谎的鉴别活动。

我们认为,一个人的内在人格是可测的,所谓人格是学者们用以描述和解释人的心理特征和行为倾向的概念。测谎的科学依据就在于心理刺激与生理反应的伴生关系。经科学研究表明,人在说谎时会不由自主地产生一定的心理压力,引发一系列诸如心跳加速、血压不稳、呼吸急促、语调紧张等异常生理反应。它们只受人体植物神经系统的制约,而不受大脑皮层意识控制。

二、测谎结论的地位

关于测谎结论的证据能力,1999年9月10日最高人民检察院的《关于CPS多道心理测试鉴定结论能否作为诉讼证据使用问题的批复》中指出,“CPS多道心理测试鉴定结论与刑事诉讼法规定的鉴定结论不同,不属于刑事诉讼法规定的证据种类。人民检察院办理案件,可以使用CPS多道心理测试鉴定结论帮助审查、判断证据,但不能将CPS多道心理测试鉴定结论作为证据使用。”

测谎结论并不绝对可靠,其准确程度与测试人资质、被测试人个人情况、测试时间地点等都有莫大关系,因此测谎结论不得直接用以证明案件事实,只能以辅助证据的形式出现,帮助审查证据的可靠性。

三、对案件主观方面的辅助判断

当前犯罪形势严峻,国内制造、贩卖手段不断翻新,边境走私、运输状况日益猖獗,对此若不采取新的方法提高办案效率,就很难有效遏制愈演愈烈的犯罪态势,对社会的政治稳定、经济增长及文化发展造成威胁,危及人类的身心健康。因此,将测谎技术运用于查明犯罪主观要件的问题上其前景广阔。

案件中经常出现行为人否认明知行为对象是的情况,利用测谎技术能够在一定程度上帮助认定行为人主观心理情况,为甄别嫌疑人供述的可靠程度、确定或排除嫌疑人提供参考,通过测谎获得的相关线索很可能成为案件的突破口,据此为办案人员查获更多证据,以便形成完整的证据链作出贡献。[4]

以上,在案件主观方面认定过程中使用测谎技术,具有其可行性与必要性,利用此技术可以更好地解决那些实践中棘手的主观明知认定难问题,对实际工作的展开起到积极的促进作用。目前该项技术的具体规则制度建设正在完善,司法部研制的《中国罪犯心理测试个性分测验》已于2000年上半年正式出台并在全国推广应用。

四、具体测试方法

(一)紧张峰测试法(The Peak of Tension)

测试人在某一范围内设定一系列问题,将想要获知的、有关案件某个情节的关键问题混入其中,若被测试人确实知道,那么当被问及此目标问题时,便会出现一个心理压力高峰。

(二)犯罪情景测试法(Guilty Knowledge Technique)

使用前提是有关犯罪事实或情节已被测试人掌握,且除了犯罪人也知道外一般人无法了解。在此基础上测试被测试人是否知道此事,进而确定嫌犯或排除无辜。

(三)准绳问题测试法(Control Question Test)

准绳问题,即测试人已知的,涉及被测试人切身且与测试想要获知的内容无关的问题。基本假设认为,面对不同问题,知道的人会产生感情上的刺激,诱绪波动。清白的人对准绳问题的关注更多,相反犯罪人则对与案情相关的目标问题反应更大。两相对比,从而判断其是否有可能为作案人。

五、结语

我国目前将测谎技术主要应用于辅助侦查环节,作为一种获取案件信息的手段,它只是做到尽力还原行为人主观心理,并不具有100%的准确率,因此仅靠测谎结论并不足以将犯罪嫌疑人确认为犯罪人。但无论如何不可否认的是它对案件主观方面的认定有所裨益,从这一点上来说,不失为一种有意义的尝试。

参考文献:

[1] 武伯欣.中国犯罪心理测试技术理论论纲[J].中国人民公安大学学报,2003,(2).

[2] 刘立霞.从许霆案和刘涌案看人格与人身危险性[J].河北法学,2009,(2).

[3] 王真瑱.测谎结论在刑事诉讼中的运用[J].法制与经济,2009,(7).

[4] 温新,张占伟,王宁.浅析测谎技术在犯罪案件侦查中的运用[J].黑龙江省政法管理干部学院学报,2011,(1).

技能测试论文例7

中图分类号:G642 文献标识码:A

Deviation of Theory and Practice in Software Testing Courses

ZHAO Yiding, ZHANG Xiguang

(Institute of Computer, Zhongyuan Institute of Technology, Zhengzhou, He'nan 450007)

Abstract Software testing is a practical strong curriculum, teaching software testing for a common phenomenon, summed up the gaps in software testing theory and engineering practice at teaching. More disjointed place, these deviations theory and practice prevalent in many colleges and universities, training misleading effects software testing professionals. Software testing course system needs careful reforms.

Key words teaching reform; software testing; combine theory with practice

1 不切实际地夸大自动化测试的效果

对于自动测试工具,网上有很多技术资料,其中不少是开发厂商推出的宣传信息,包含了夸张水分。部分老师对软件测试自动化的讲授理论过于理想,学生对自动化测试工具的期望往往过高。甚至有一些软件测试大赛,就以指定的自动测试工具的操作使用作为比赛的主要评分内容,但参赛学生抱怨TA工具本身不能解决实际问题,引起争议。其实,自动化测试工具本身的使用价值是很有限的,在很多实际测试项目中不实用。对那种不稳定、开发周期很短、一次性的软件等,自动测试TA工具往往不适合。自动测试工具在功能测试中的价值是回归测试,自动工具不能灵活发现更多的新问题。教学中需提醒学生对网上一些相关资料辩证地理解。

2 不少教材过于理论化

很多测试工程师认为当前不少软件测试教材过于偏重理论,教材中包含了一些不实用的甚至与实践脱节的理论,尤其是一些只适合特定类型项目的测试技术理论被不分适用条件地讲述。比如我们看到很多教材中强调“软件测试占软件开发总工作量的40%、总成本的30%~50%”,其实这句话只符合部分项目的特点,与实践中的多数项目情况不符,真实的测试项目实践需要考虑质量、工期、成本等多方面的约束。又比如一些老师过于推崇白盒测试而轻视黑盒测试,但事实上实践中很多真实测试项目中主要采用黑盒测试方法,甚至一些专职的测试工程师工作多年几乎不用白盒测试方法(白盒测试方法对于程序员自测较多采用),白盒测试方法在功能测试、系统测试中等几乎不用。笔者通过对数十个高校在校学生的软件测试的课程设计文档的观察,发现在学校中测试文档的写作容易走形式,普遍理论空洞、实用性差。这些过于偏重理论的教材容易降低学生学习的兴趣,更容易误导学生的实践。没有有效地与实际项目结合,导致学生学习主要为了考试分数,而毕业找工作时才发现没有真正的软件测试能力。

3 对于微软的经验理论没有强调实践中的适用条件

通过对常用教材分析,发现很多教材偏重于微软的技术理论和经验,偏重于基于瀑布模型的开发过程的测试,微软的技术主要针对通用型软件,不一定适用于不同特点的具体项目。

而实践中实际项目复杂多样,通用型软件项目只占少数,多数属于需求定制型。很多开发过程本身没有采用瀑布模型,无法采用被教材重点推广的V模型等。这就要求学生对微软技术的适用条件辩证地理解。

4 一些概念没有经过行业统一规范

软件测试课程发展时间短,课本中的一些概念没有统一行业规范。比如功能测试的范围比较模糊,有的教材中把安装测试、兼容测试、界面测试等都划归到功能测试中,但有的教材把它们从功能测试中独立出来;性能测试概念的外延也百家争鸣,有的认为它是一个大概念与功能测试并列,但有的把它定义为和压力测试互不包含;在V模型中软件过程质量保证与软件测试岗位的工作范畴是基本相同的,而普通软件公司中两者有明显的区别,前者是管理岗位,后者仅是技术岗位、主要是事后检查(不包括需求分析、总体设计、详细设计等的审查);很多教材把检查代码是否符合规范作为单元测试的工作内容之一,但在很多开发公司中检查代码是否符合规范不属于测试岗位工作内容。在软件测试技术中,像这样的概念术语模糊的现象还较多,容易导致学生在实践中的混乱、困惑。建议相关部门尽快给出审慎的规范。

5 一些集成测试过程理论的适用性存在问题

教材中经典的渐增集成测试方法包括自顶向下、自底向上、三明治方式等,这几种集成测试方法理论(下转第64页)(上接第56页)上虽较为严谨,但其测试过程没有考虑与开发过程的关联协调。实际项目中往往不允许这几种渐增集成测试方法的实施。开发人员往往希望已完成的模块在单元测试(开发人员自测)之后及早参与集成测试,并且给测试的实施时间很短。这就要求渐增集成测试的过程要和实际的开发动态进展协调起来。如果采用书本上的自顶向下集成测试方法,需要先集成顶层的模块,测试它们与所驱动的模块之间的交互接口关系,但其它非顶层模块可能先于这个顶层模块完成,却要等到顶层模块集成测试完成之后才能被集成测试,这显然是这些渐增集成测试方法的使用障碍。方法虽好但有苛刻的适用条件,但绝大多数教材并不涉及这些方法的适用条件,容易误导学生实践中生搬硬套。

6 教学实践及建议

6.1 教学中加强案例教学法及项目驱动教学法

笔者从2005年开始在软件测试教学中尝试案例教学法、项目驱动教学法,要求学生边听课边做具体测试项目,学生分组以项目为主线、教师为实践向导、学生为实践的主体,相对于传统的课堂教学,深感案例教学法、项目驱动教学法显著地增强了学生软件测试技术的实践能力。按照“学习-实践-反馈-修改提高”的原理引导学生修改完善,提高项目阶段成果的质量。通过案例教学法及项目驱动教学法,使得理论教学与真实项目实践无缝衔接。

6.2 应对软件测试教材进行标准审查

软件测试课程体系发展时间短,教材良莠不齐,一些概念的定义也没有全行业规范,尤其是概念定义的内涵外延不完全统一、多数教材中没有对不通用的技术方法的适用条件加以说明等。建议行业中加强统一规范。

6.3 教师引导学生开阔技术理论视野

比如推荐参考资料、引导网上检索信息等。还有其它方法,比如笔者曾经建立了QQ 群,联系到北京、上海、苏州、杭州、郑州等地公司的部分专职测试人员加入QQ 群,抽出每个教学班较好的学生代表加入(QQ 群几年下来已增加到近千人,由于QQ 群人数限制,暂不能让所有学生加入),也会有已经毕业的从事专职测试岗位的学生在群中提一些实践问题,有长期工程实践经验的老师都会认真提出建议,这样在校学生在学习过程中已经对不同商业公司测试岗位的技术情况有了较多了解,在校的理论学习与规范公司的软件测试实践无逢衔接,开阔了理论视野。

参考文献

[1] 刘勃,刘玉,钟国辉等.基于真实项目的实践教学体系探索[J].高等工程教育研究,2012(1):80-83.

技能测试论文例8

中图分类号:TP271 文献标识码:A 文章编号:1671-7597(2014)04-0037-01

科学技术在不断的发展,人类已经步入了信息化时代。目前,各个领域中都运用到了计算机技术,计算机教育也不例外。作为计算机教学中的一个重要的环节,计算机考试目前已经摒弃使用传统的测评方法,也就是纯人工的阅卷方法,使用计算机考试自动化测评。计算机考试自动化测评是一个新领域,目前的应用也比较广。使用该测评方法不仅节省了人力和物力,而且工作效率高,在公正性方面也就具有一定的优势。因此,计算机考试自动化测评已经成为一个研究热点。

1 计算机辅助测评概述

1.1 计算机辅助测评的特点

计算机辅助测评的一个新领域就是计算机考试自动化测评。而英国则是计算机辅助测评的发源地,早在20世纪90年代国外关于计算机辅助测评的研究就已经兴起,比如:有关机构连续召开了五届计算机辅助测评会议。但是,国内的研究比较落后一些,成果也不是很丰富。

计算机辅助测评指的是在教育评价和教育测试中使用计算机技术,来完成对学习者技能和知识的测试。计算机辅助测评具有以下几个特点:1)评价属于重复性的工作;2)针对评价可以提供比较确切的定义;3)以较快的速度提供反馈。因此,作为一种比较理想的工具,计算机辅助测评可以说是一次深刻的变革,无论是在评价方法、评价内容还是在评价形式上。

1.2 计算机辅助测评的分类

关于计算机辅助测评的分类不是很明确,因此显得比较混乱,这和分类标准没有得到明确具有很大的关系。笔者在分析后,得出以下分类体系:1)传递测评内容的手段:基于WEB的在线测评、基于试卷的(Paper-Based)测评以及基于计算机的(Computer-Based)测评;2)测评内容:对技能水平的测评、对知识水平的测评;3)理论依据:基于项目反应理论的测评、基于经典测试理论的测评;4)测评题型:使用非客观题的测评、使用客观题的测评。

2 计算机考试自动化测评的理论基础及其应用的一般原则

目前,CAA的一个重要的研究领域是计算机考试自动化测评(CTAA)。CTAA的本质在对学习者谢绝评价时,将计算机技术引入到其中,这样评价的准确性和效率都会得到提高。

2.1 理论基础

项目反应理论是计算机考试自动化测评的理论基础,此外也使用到了非线性概率模型。

项目反应理论的主要观点是:被测试者在测试的过程中会受到心理物质的支配,因此该物质和测评结果之间存在一种关系,这种关系我们可以用“项目反应特性曲线”来表示。目前,关于项目特征曲线的数学函数比较多,但是使用比较广,获得广泛认可的是单线逻辑斯蒂型,其是由伯恩鲍姆提出的。单线逻辑斯蒂型的表述方式是:,其中:a,b,c属于标识项目的质量参数,而字母Q则表示被试的能力特质。该理论可以对经典测试理论的缺点进行克服,但是也存在一些弊端,比如对高质量试题的依赖度比较强。

2.2 一般原则

能力和技术的测评一般离不开一定的情境。一般情况下,如果让被测试者处于实际情境下去完成指定的任务,那么考核的可信度就比较好。但是,实际情况下只能在模拟的环境下操作和进行,这与以下因素有着很大的关系:评判难度、实现代价以及安全性等。

得到足够的信息是对考生进行准确评价的一个基础和前提,这个过程中涉及到操作结果信息和操作进程信息。假如结果可以百分之百的反映操作是不是正确,那么只要获取结果信息。否则,获取过程信息就需要依靠监测操作过程体积自动跟踪。和真实的情境对比,如果处于模拟情境中时,获得信息就会比较容易简单和容易,但是,要求行为、外观和过程和真实环境接近是比较困难的。

在获取到有关的信息后名,需要进行以下操作:分析、归类以及预处理,之后,需要和标准答案进行匹配和比较,这样就可以做出综合评价。匹配不全是精确的,因此在大多数情况下需要使用和最大近似匹配的办法。

2.3 计算机考试自动化测评的一般模型

技能的一个重要的特点就是实践性。因此,无论是技能在实践中涉及到的各个实体还是相互作用都要进行考察。

系统建模包括两个步骤:1)理论建模。对技能自动测评的信息加工过程进行深入细致的分析。而测评系统主要包括以下几个部分:交互过程信息的形式化表示、评价部件、相关知识库的建造、交互过程信息的获取;2)行为建模。行为建模主要是构建虚拟仿真环境,该环境的交互性比较强。

技能测评的类型不同,那么在获取交互过程信息的技术方面就具有很大的差异性。由于技能测评环境的建立基础是仿真系统,因此当我们需要获取交互信息时就具有一定的困难。因此,在真实系统下的技能测评,需要做的工作是:开发获取交互过程信息的部件,并将这些部件放到目前的系统之中,因此难度也是比较大的。而仿真系统是开发者从测评的需要出发而研制的,那么系统中的所有操作都可以被系统监测和记录,因此在对交互过程信息进行获取时就没有难度。

3 C语言程序设计自动测评系统分析与设计

3.1 系统需求分析

我们从课程考核的要求出发,发现C语言程序的考察内容主要有以下几个方面:指针、结构、基本语句、数据类型和运算、数组的定义和使用、函数、循环结构程序设计、文件操作等。在测试的题型上,我们可以选择判断、选择以及填空等。对于考生答案和标准答案,需要使用特定的字段将其保存到试题库和系统的标准答案库之中。

3.2 系统功能要求分析

系统模块结构见图1。

关于语言程序设计自动测评系统实现关键技术。程序测评中的软件测试技术程序测评中的软件测试技术有:静态测试、动态测试、黑盒测试与白盒测试。

4 结束语

笔者从计算机辅助测评概述、计算机考试自动化测评的理论基础及其应用的一般原则、C语言程序设计自动测评系统分析与设计三个方面出发,对计算机语言程序设计自动测评系统进行了分析和探讨,希望对大家有所帮助。

技能测试论文例9

一、研究背景

当今随着网络技术和计算机的迅猛发展,在教育行业信息化技术的应用与发展成为技工学校日常教学的趋势。在技工学校技能考证和技能竞赛理论试题日常教学方面的教学评价是教学过程中一个重要环节,涉及到反馈调节、诊断指导、强化激励、教学提升、目标导向五大功能作用。技校理论试题传统评测方式有机试和笔试两种,在日常模拟考试教学评价中只能孤立的获得学生知识点学习效果,很难横向和纵向分析评价学生和知识点之间联系,把握下一步讲解和训练重点。为了有效提高学生考证通过率和技能竞赛理论试题分数,克服技校学生畏惧理论试题学习枯燥和害怕考试丢分的情况。利用现有已成熟的云计算交互式动态学习评测系统,将技校理论试题纳入云评测进行分析和评量,及时反馈技能考证和技能竞赛理论试题的学生学习掌握程度,调整教师教学预案,另外学生自身也可以通过评测系统了解自己的学习状况,针对薄弱知识点复习巩固。

二、目的和意义

基于云计算的学习评测系统是一个让教师和学生借助网络进行诊断和评价的平台,学生可对理论试题模拟测验进行自我检测,教师可借助平台对教学活动进行反馈和指导。该系统包括诊断和评价两大部分,为学生理论试题学习建立成长记录档案,可根据不同知识点设置进行具体系统反馈分析,也能对学生理论试题模拟测验进行科学的统计分析、智能诊断。在学生学习过程中掌握大量有效一手资料,从而为教师后续指导明确方向,帮助学生及时发现理论知识点存在的缺陷,诊断他们在知识、技能和方法上的不足,对他们补缺补差并给出下一步学习改建建议和提升计划。

云计算机学习评测系统优点是:一、在评测一个单元和一个章节知识点可以进行及时评量,课堂上就能得到反馈教学质量,实时矫正技能理论知识点教学方法和策略,可提高课堂教学效率。二、在评测整个科目知识点时,可以课后评量,反馈技能理论知识点掌握程度,编制行之有效的指导学习方案,明确日后教学培训方向,可对个别学生查漏补缺。

三、 诊断依据的原始数据收集与处理

利用云计算学习评测系统产生学习诊断力报告,能方便解决技能考证理论题中学生学习现状的考评与测量,该评测系统输入的数据有诸多形式,不仅能输入IRS即时反馈系统的理论题作答数据,而且对于传统的纸质试卷理论题、电脑划卡、网络在线理论试题测验等等作答数据,都可以进行作答数据搜集与云计算处理并产生学习诊断力报告。

其中IRS即时反馈系统对于技校技能考证和技能竞赛理论题作答训练,能在上课训练时就即时、 快速、省力且自动化地产生一份关键学习力诊断报告。该评测系统也能对学习进行诊断分析,将学生理论试题考试成绩进行落点分析,通过学生得分百分比以及注意系数不同落点可以评测诊断出学生学习方面不足及题所在,方便有效掌握每个学生学习状况,然后针对不同学生学习状况,教师制订行之有效的培训指导方案并予以个别辅导。

1、诊断分析学生技能考试学习能力

如下图所示,纵轴是得分率,越往上得分率越高;横轴是数值,初始值由0到1,中间值是0.5,稳定度数值越小稳定度就越高:

A区:此区域内的落点水平属于稳定的高分区域。此区域越往左上角,得分越高且越稳定。表明技能考证理论试题基础题得分高,此区域内理论试题不用重复做和讲解,学生掌握程度较好,可以不作为复习训练重点。

B区:此区域内理论试题落点水平尚属稳定,但试题得分通过率居中偏上,在平时训练的时候此区域理论题编为一组,适度训练但不用教师过多讲解。

C区:此区域内理论试题落点水平稳定但得分偏低。此区域内理论试题编为一组教师进行重点讲解,学生要加多训练次数,此组试题是提高技能训练考证水平关键。通过训练逐步让学生在此区域内试题落点过渡到A区域内。

A’区:此区域内试题落点水平不稳定但得分率较高,对于此区域内试题提醒学生做题要细心,不能粗心大意,题目自己会做不用教师用过多时间去讲解知识点。

B’区:此区域内试题落点水平不稳定且得分率居中偏上,此类试题偶尔粗心大意没读懂题意,做题时心理准备不充分,在平时训练过程中提醒学生看清题意,教师不用花过多时间讲解知识点,学生平时训练时做好心理辅导,做题时不要有太大压力和心理负担。

C’区:此区域内试题落点水平不稳定且得分率偏低,此类试题教师要花时间进行知识点讲解,在平时训练时加大训练力度,通过不同题目题意变换强化知识点训练力度,教师引导学生逐步过渡到落点A区,阶段性实时监控分析学生技能考证题目落点区域。

2、知识点测试雷达分布图

如下图所示(语文试题知识点为例),灰色覆盖区域为技能考证理论题知识点分布区域,灰色区域越往外分布,表明该班学生对该知识点掌握的越好,学生得分率就越高;反之,如果灰色覆盖区域分布越靠近雷达的中心圆点,表明学生该知识点掌握得就越差,学生得分率就越低,教师要对这些知识点查漏补缺,多花力气进行充分讲解和重点训练,逐步引导知识点蓝色覆盖区域过渡到往外分布。

3、小题得分明细分析

如下图所示,对于答对百分比很高而答错百分比很低的题目就不用做过多的讲解和训练,比如第3题和第2题;如果答对百分比很低答错百分比很高的小题相同知识点和类似题目要重点讲解和训练,平时多做同类练习巩固该知识点,比如第4题。

4、诊断分析学生个人学习报告

如下图所示(语文试题为例),汇聚学生个人诊断分析报告。从上面学习表现比较图可看出该生成绩落点属稳定区域,该生需要表扬和鼓励,在将来学习中建议加强概念也有所提及。从下面知识点表现雷达图(浅蓝色为全班表现、浅褐色为该同学表现、深褐色为颜色叠加区域)可以看出,该同学大部分知识点技能掌握表现情况优于全班,但有6个知识点技能掌握情况弱于全班表现,日后学习过程中努力方向有明确提及,例如右边需努力的题号和小心题号也列出来了。

四、 传统教学模式与引入云计算学习评测系统模式比较

表一比较了传统教学模式与引入云计算学习评测系统教学模式师生互动,生生互动时能否记录学习历程,学习表现能否现场自动诊断分析。在技校技能考证课堂上,教师重心到底放在理论题还是实操题上,一般视学生学习情况而定,但是技校学生普遍对技能考证和技能竞赛的理论试题感到厌倦,学习概念定义枯燥无味,相反对实操题兴趣怏然,那么如何提高技校学生理论试题得分率,让大多数技校学生顺利拿到职业技能证书,参加技能竞赛学生不输在理论题上。由此我们比较传统教学模式与引入云计算评测系统模式在提高学习兴趣和技能考试理论题成绩方面进行对比。

表二是验班级引入云计算学习评测系统前,学生在做技能考证理论题时全班成绩达到及格线人数不到一半,整体成绩与其他班级相差30分。引入云计算学习评测系统后,教师在技能考证和技能竞赛理论题讲解训练时师生之间,以及生生之间产生良好互动,有效激发学生的学习兴趣,学习效果明显提升,全班及格率提高到60%,低分率降低到20%,班级整体成绩与其他班级差距缩小了20分差距。

五、 总结

重点研究了云计算学习评测系统诊断依据的原始数据收集与处理,该平台产生的数据的解读与现有技能考证之间的联系,即如何用该平台产生的数据去提高在文化课中的教学效率,切实提高学生职业技能考证通过率,比较了引入云计算学习评测系统后教学模式与传统教学模式优劣。由于篇幅所限,下一步研究重点是引入云计算评测系统的互动教学模式在技校文化课教学中如何具体应用。

参 考 文 献

技能测试论文例10

1.引言

《英语课程标准》(2011年版)指出:英语课程资源包括英语教材及有利于发展学生综合语言运用能力的其他教学材料、直观教具和实物、多媒体软件、广播影视节目、网络资源、报纸杂志及图书馆、班级、学校教学设施和教学环境创设等;计算机和网络技术为学生个性化学习和自主学习创造了有利条件,为学生提供了适应信息时代需要的新的学习模式。通过计算机和互联网络,学生根据自己的需要选择学习内容和学习方式。信息化时代下的教育方式也发生巨大的变化,为人格和能力的提升提供进一步的发展空间,同时也带来人才测评理论与方式的重大转换。

2.“人机对话”自动化考试的界定及其相关理论

2.1 “人机对话”自动化考试的界定

为了实现英语考试评价信息化,提高江苏省中考英语听力和口语测试评价信度及评价工作效率,江苏省自2009年在中考英语中实行省级统一命题、测试、评价为一体的听力、口语合二为一的“人机对话”自动化考试。该测试总分30分,其中听力测试20分,涉及的题型有:图片型对话理解、短对话理解、长对话理解、完成信息记录表和短文理解。口语测试总分10分,涉及的题型有:短文朗读、情景问答和话题简述。该部分的测试成绩直接记入中考英语总分(英语中考总分130分,其中卷面笔试100分,人机对话测试30分)。

“人机对话”自动化考试是借助计算机及网络技术对考试进行管理的一种测试形式。它是根据考试设计的需求,有针对性地进行命题、组卷,并完成试题呈现、接受答案、计分、数据分析及结果解释等一系列任务。学生在进行人机对话测试过程中,每人单独使用一台电脑并且戴着配有语音输入功能话筒的耳麦,整个测试过程不介入任何人为因素。考试时,电脑扮演考官的角色,考生的所有问题和指令都由电脑发出,考生根据从耳麦中听到的要求或电脑屏幕上看到的试题指令和要求进行听力和口语测试,电脑自动将考生在考试中的答案和语音信息进行保存和录音。

笔者认为,“人机对话”自动化测试彰显了《英语课程标准》提倡的新型教学理念:现代外语教育注重语言学习的过程,强调语言学习的实践性,主张学生在语境中接触、体验和理解真实语言,并在此基础上学习和运用语言;要使学生尽可能通过不同渠道、以不同形式学习真实、鲜活、实用的英语,直接体验语言和运用语言。

2.2“人机对话”自动化考试的相关理论

认识心理学理论。心理学和计算机相结合,在认识心理学的理论背景下产生人工智能这一全新的领域。人工智能用信息加工的观点解释人的心理过程,使行为主义心理学进一步发展。它借用信息论、控制论、计算机、仿生学等新兴的学科理论,将人才测评置于更前沿、更科学、更稳定的领域。认识心理学理论在“人机对话”测评中的应用,更新了测试的方式,拓宽了测评的视野,完善了评价手段,是对实证主义测评范式的扬弃。所有这些,都为“人机对话”自动化考试作为一种测评方式的转向提供了坚实的理论基础。

非智力理论。斯腾伯格指出人的智力有三种类型:合成智力,即在一个有结构的和定义完好的上下文中解释信息的能力;经验智力,即从不同角度看待问题,从变化的情景中解释信息及解决实际问题的能力;情景智力,即适应变化环境的能力及操纵谈判系统的能力。信息时代的人才测评发展越来越注重对非智力因素的测评。非智力理论为“人机对话”自动化考试提供了理论支持:一般的测评方法只能在简单的文字、图片上假设情景,局限于合成智力及经验智力的测评,而人机对话则使非智力因素的再现和测试成为可能,使得人才测评具备更广的维度、更富层次性、更有针对性。

人机交互作用理论。“人机对话”自动化考试中的测评主体和客体能够相互学习,这在很大程度上得益于人机交互作用。人机对话的一个重要特点是利用人机交互作用的沉浸性,根据测评客体的反应不断学习和选择不同的模拟情景,有针对性地施加测试项目。仿真、实时、主动型的计算机三维动态图像、声音,使得测试成为动态的交互作用,为测评客体提供测试语言的逼真情景。通过与计算机交互测试中体现的形象性、简易性、安全性、科学性、经济性、实效性已凸显其测试的优越性。

3.“人机对话”自动化考试对英语教学的新启发

3.1 语言技能――“人机对话”自动化考试测试的基础

语言技能是语言运用能力的重要组成部分,主要包括听、说、读、写等方面的技能及这些技能的综合运用。这四种技能密切相关,相互渗透,互为基础,又呈螺旋式提高。根据认知理论,听、读是信息输入过程,是领会和理解别人表达的意思,是从外部言语到内部言语的内化过程;说、写是教学对象对输入的信息内化后的产出性活动,是用言语表达自己的思想,从内部言语到外部言语的过程。

笔者认为,在英语教学中,我们要注重语言技能培养的整体性。从语言信息输入的层面上,我们可以扩展学生的阅读材料。比如,教师可以结合教学进度补充和教材相关联的、难度稍大的课外阅读材料,并且可以设计相关阅读题型帮助学生理解以便及时反馈学生对补充材料的理解情况。教师还可以利用早读和兴趣小组活动时间引导和鼓励学生跟读磁带、模仿朗读等方式促成学生的有效输入。在语言信息输出的层面上,我们可以鼓励学生复述课文和对阅读材料进行缩写和改写等。比如,对比较熟悉的阅读课文,可以采取当堂的口头复述形式检测学生的信息输出情况;教师还可以让学生进行课后写作的方式提高学生信息输出的有效性。

3.2 语言知识―― “人机对话”自动化考试测试的源泉

学生在义务教育阶段应该学习和掌握的英语语言基础知识包括语音、词汇、语法及用于表达常见话题和功能的语言形式等。语音是语言的基本组成要素,学生对语音知识的理解和运用直接影响他们的听力水平。因为语音中的连读、弱化、失去爆破、语音浊化等发音规则会使单词的独立发音有别于具体的语音群中的发音。除了语音知识外,词汇量将直接影响学生的听力理解水平。如果学生的词汇数量和理解能力无法达到基本的教学交际要求,就会在客观上形成听力障碍,影响听力效果。同时,语法、固定用法和搭配等知识的不足会造成听力和口语表达上的困难。比如,习惯用法“I can’t agree with you more.”看似是否定的句子,其实表达的是十分肯定的含义。

笔者认为,教师首先要鼓励学生积极地开口讲英语。比如,在每天的英文值日报告中增加天气情况汇报、新闻简述和热点关注等栏目,为学生提供在公共场合说英语的机会。其次,教师可以创设情境,真正提高学生在情境中使用语言的能力。比如,教师可以设计超市购物、医院看病、图书馆借书等场景,让学生分角色扮演,从而达到实际运用语言的能力。

3.3 情感态度―― “人机对话”自动化考试测试的保障

情感态度是指兴趣、动机、自信、意志和合作精神等影响学生学习过程和学习效果的相关因素及在学习过程中逐渐形成的祖国意识和国际视野。心理学研究表明,情感因素在语言学习中起着越来越重要的作用。Krashen的情感过滤假设(Affective Hypothesis)认为,如果学生上课时心情紧张,他们的情感因素就会形成一个“过滤器”,阻挡语言的输入。 所以学生在听力、口语测试时,如果一直处在紧张的情绪状态,“过滤器”就会影响学生接收声音信号及语言信息,并且还会影响对这些信息进行有效解码的过程。

诚然,学生在“人机对话”自动化考试测试中出现一定程度的紧张和焦虑,这是一种相当普遍的心理现象,但是过于紧张和焦虑将给整个测试过程产生负面影响。笔者认为,教师在教学过程中要设计新颖的课堂活动内容,激发学生的学习兴趣;通过榜样激励等方式明确他们的学习目标;组织小组合作等形式提高学生的凝聚力,磨炼他们的意志,形成合作精神;通过小组竞赛等形式,增强他们的学习自信心。

3.4 学习策略―― “人机对话”自动化考试测试的战略

学习策略指学生为了有效地学习和使用英语而采取的各种行动和步骤及指导这些行动和步骤的信念。在听力测试中,预测技能是学生应该掌握的一项重要技能。所谓预测技能指听者利用已有的知识、经验结合现有信息对听力内容进行联想、推理未知信息的能力。因此,一个人预测信息的能力越强,其听力就越强。

为此,在听力训练中教师应重点进行技巧点拨讲解。比如,在该题干“What is the woman probably going to do this afternoon?”中,教师可以提醒学生重点在听的过程中注意如下两点:把握时间“this afternoon”;重点听女声内容。此外,教师还可以提高学生的学习技巧,比如当题干变为“What is the man doing now?”时,我们就要对重点听力内容进行调整:注意时间“now”;重点听男声内容,从而不但帮助学生学到听力的技巧,而且帮助学生提高能力。

3.5 文化意识―― “人机对话”自动化考试测试的内涵

语言是文化的一部分,因此,语言不能脱离产生它的文化而独立存在。G. Brown(1997)认为听力理解是一个极其复杂的过程,它涉及语言、认知、文化、社会知识等各种因素。对于英语学习的基础阶段而言,跨文化意识的培养尤其重要。

比如,图1、图2这道听力试题和文字稿,不但要求学生结合自身的英语基本技能听懂对话内容,对学生的跨文化意识也有一定的要求,即要求学生熟悉一些西方国家的代表性建筑或特有文化。这充分体现了《英语课程标准》倡导的英语课程具有工具性和人文性的双重性质,要求教师不但要从词汇、语法、情景等角度讲清楚字、词、句的正确使用,而且要在教学过程中渗透跨文化意识教育,开阔学生的视野,丰富他们的生活经历,增强他们的爱国主义精神,发展他们的创新能力,促成他们形成良好的品格和正确的人生观与价值观。

图1 听力测试模拟试题

图2 对应试题的文字稿

4.结语

“人机对话”自动化考试不仅是外语考试形式的一次革新,而且是信息技术与英语学科教学整合的一种尝试,更是促进中学英语教学变革、引领信息化时代英语教学的航标。新时代的教师要在课堂教学中做有心人,培养自己敏锐的洞察力和灵活、即兴的调控能力,最大化地优化课堂;在学习和实践过程中不断地总结和反思,以不断提高课堂教学中生成动态教学资源捕捉的灵敏度和运用的科学性、实践性及实效性。

参考文献:

[1]G.Brown.Assessing student learning in higher education,1997.