测验考试总结模板(10篇)

期刊在线咨询服务，发表咨询：400-888-9411 订阅咨询：400-888-1571股权代码(211862)

杂志分类

首页学术杂志科普订阅 SCI期刊发表指导期刊咨询文秘服务论著出书出版社

首页 > 精品范文 > 测验考试总结

测验考试总结模板(10篇)

时间：2023-03-10 15:05:32

测验考试总结

测验考试总结例1

主要包括：

1．内容结构分析：基本概念和化学原理、元素化合物知识、有机化学知识、化学计算、化学实验等方面的内容比例乃至每一方面的二级结构分析。

2．目标水平结构分析：按照考试大纲所列水平（通常分为知道、理解、应用、综合运用等）种类，分析它们的组成比例并且作内容—水平双向交叉分析。

3．题型结构分析：各类题型的比例分析。

4．分数结构分析：内容—分数和水平—分数的双向交叉分析。

5．难度和时限结构分析：对难度测验作难度分布描述，对速度测验作时限分布描述。

6．试卷特点及横向、纵向比较：就试卷是否符合考试（教学）大纲规定、是否反映化学学科特点和内在联系、符合学生实际水平、合理性、适宜性以及其他特点作出描述和判断。横向比较可以在学校—学校或地区—地区间进行，纵向比较可以在不同学年间进行。

进行结构分析时，分析者要对测验各项目逐一分析和作出判断，因而结构分析带有较强的主观色彩。分析者对项目的判断跟编制、设计者不一致的情况经常会发生，对于比较复杂的综合题尤其是这样。为此可以把试卷结构分析结果跟编制试卷的结构设计进行比较。

除了难度结构分析跟答卷情况有关，只有在考试实施之后才能进行外，其他各项分析跟答卷情况无关，在考试实施之前就可以进行，属于试卷的“静态”分析。

二、答卷情况描述

主要包括：

1．成绩分布情况描述：列出频数分布表或频数分布图。

2．统计量描述：列出平均分、标准差、优分率和低分率以及某些因素间的相关系数等数据，还可以进一步作各内容跟其平均得分率、标准差、优分率和低分率的双向交叉分析，各水平层次跟其平均得分率、标准差、优分率和低分率的双向交叉分析，以便从中发现问题。

3．分布形态判断：判断总体分布是正态还是偏态或其它形态。

4．由样本统计量推测总体参数（总体平均成绩、总体标准差等）。

三、试题及解答情况分析

1．题目的内容、水平分析：逐一分析各题的内容、水平和考核意图。

2．题目的难度、区分度、灵敏度、识别度和题目反应分布：具体方法参见文后所附题目分析部分。

四、试卷质量分析

1．试卷的信度分析和效度分析。参见文后所附“试卷的信度分析和效度分析。”

2．整卷难度分析。

3．试卷质量评价：就考试目的和试卷内容、结构、形式的合理性、适宜性、有效性和可行性等对试卷作出全面评价。

五、教学分析和教学建议

从得分、失分情况以及某些部分之间的比较、分析，发现教师、学生以及命题等方面的成功与不足之处，并针对存在问题提出改进意见。

为了使试卷分析全面、可靠和有效地发挥应有作用，试卷分析工作应实行教师分析和学生自我分析结合、“动态”分析和“静态”分析结合、定性分析和定量分析结合，在认真分析的基础上，简明、扼要、有重点地写出试卷分析报告。

附：题目和试卷的统计分析方法

一、常模参照性测验的题目分析

常模参照性测验题目的分析工作，主要是对测验结果进行统计分析，估计题目的难度、区分度，分析答案是否适宜等。

1．难度分析

所谓题目难度是指某一题目的难易程度，通常用答对率P来表示。

一般说来，题目的P值以0.2～0.8为宜。也有人用不通过率Q来表示难度。它们的计算方法如下表所示：

*X高为高分组的该题得分总和，X低为低分组的该题得分总和，H、L分别为该题的最高、最低得分。

P值无等距性，无法对试题之间的难度差异作精确的比较，也不能用于计算平均难度。为了对各题难度作比较，通常要把P转换成标准难度，使之等距化。

值越大，题目难度越大；=13时，题目难度为中等。

运用下表可以方便地由P值直接查得对应的值：

2．区分度分析

题目区分度是指某一题目对被测水平的区分能力。若某题目能使水平较高的被测得较高分、使水平较低的被测得较低分，该题就有较高的区分度。

区分度分析可以采用极端分组法，或者采用相关法。相关法比较复杂，这里从略，不作介绍。在极端分组法中，从总体中分出高分组和低分组（比例均为25％～33％且数值相同），然后计算区分指数D作为区分度的指标，如下表所示：

除了计算方法以外，还可以采用弗拉南根查表法：根据占总人数27%的高分组的答对率和占总体人数27％的低分组的答对率，从专门的表（附表5）中查得题目的区分度。

一般说来，当D＜0.20时，题目的区分度太低，必须淘汰或者加以修改；当D≥0.40时，题目的区分度非常好；通常题目的区分度指数D在0.2～0.4之间。题目难度跟题目区分度之间有着一定的联系。难度太大或者太小，都可能使区分度变小；只有难度适中时，才可能有较高的区分度。

3．题目反应分布分析

对于多重选择题等可能有多种答题情况（题目反应）的题型来说，仅仅作难度分析和区分度分析是不够的，还需要分析题目反应分布情况，检查它是否跟预期的反应分布模式符合，从而发现需要修改之处。题目的难度和区分度也可以从反应分布中得到反映。进行题目反应分布分析，先要制作题目反应分布表。下面是该表的示例，表中还列出了有关的分析和判断：

*为答对人数

二、目标参照性测验的题目分析

目标参照性测验题目试测后的分析工作主要是作灵敏度分析和识别度分析，有时也要作题目反应分布分析。

1.灵敏度分析所谓灵敏度是指题目能灵敏地反映教学作用的能力，通常用目标教学前后被测总体的通过率之差来估计。

设目标教学前、后通过试题的被测人数分别为R1、R2，被测总体人数为N，则试题对教学的灵敏度指数S可按下式计算：

当S＞0时，试题有效，S越大，试题对教学作用的感受越灵敏；当S≤0时，需要研究是否由教学不当而引起，如非教学不当引起，则可认为试题质量不佳。

2.识别度分析

题目识别度是指某试题能有效地识别达标者的能力，通常用合格者通过本题的百分比跟不合格者通过本题的百分比之差来估计。

设P1和P2分别为合格者和不合格者的本题通过率，则

识别度指标D=P1-P2

识别度指标的最大值为1.0，当D≤0时，该题无预期的识别能力。

题目识别度还可以用被测是否合格跟是否通过本题的φ相关系数来表示。设题目在总人数为N的被测总体中的试测结果如下表所示：

所得φ相关系数需进行检验，方法是：按下式算出φx2

x2=Nφ2

的，其犯错误可能性为0.05。

3．题目反应分布分析

目标参照性测验的题目反应分布分析方法跟常模参照性测验的分析方法相似。通过分析不但可以发现题目中存在的问题，还可以了解被测的错误类型及其分布，具有学习诊断作用。

三、试卷的信度分析

信度表示测量的一致性、稳定性和测量结果的可靠性。测量时的随机误差越小，测量结果就越接近真实值，其信度就越高；样本统计量越是接近总体参数，其信度也越高。

信度常用信度系数rxx表示，其值在0～1之间。若rxx=0，表明实得分数完全由偶然误差决定；若rxx=1，表明实得分数完全不受偶然误差的影响。一般说来，化学学业成绩测验的信度应在0.90以上，甚至达到0.95。

由于Sr和SR难于直接测得，所以rxx通常借助于某些特别方法进行计算。

（一）常模参照测验信度的计算

常模参照测验的信度系数可以用再测法、等价测验法和两半法等方法求得，所得信度系数意义略有不同，分别表示测量的再测稳定性、等价测量稳定性和内在一致性，故又分别称为稳定性系数、等价性系数和内部一致性系数。在化学教学测量中，常用下列方法计算内部一致性系数。

1．两半法，即在一次施测后，把试题分为对等、可比的两半，其内容、预测难度、总分和题数都大致相同；计分时把各被测的两半实得总分分开统计，计算两半间的积差相关系数；

式中，x、y分别为某被测实得的两半总分，N为被测总数。

再将rhh代入下式校正，即可得整卷的信度系数rxx。

采用这一校正公式时，两半的平均数、标准差、项目的组间相关、分布的形态和内容都应相近。否则，整个测验的信度估计rxx将有误差。此时可改用下式计算rxx：

式中，Sa、Sb分别为两半分数的标准差，St为整个测验总分方差，Sd为两半分数之差的标准差。

2．克龙巴赫法

方差。

影响测验信度的因素主要有：

（1）测验长度：测验越长，题量越大，信度越高。

（2）试题难度：当各题难度和平均难度为中等（P=0.25～0.75）时，有利于提高测验的信度。

（3）样本（或总体）大小：样本（或总体）越大，分数分布越广，信度越高。

（4）测验内容的复杂性：测验内容同质性高，信度也高；反之，内容越庞杂，信度就越低。

（5）施测条件的标准化，有利于减小随机误差的影响。

（6）评分的客观性。

（二）目标参照测验信度的计算

复本法：以等价的两份测验对同一被测群体施测，设测验结果的分布情况如下表所示：

四、试卷的效度分析

效度表示测量跟测量目的符合的程度，是测量准确性和有效性的指标。跟测验目的无关的因素影响越小，测验的有效性即效度就越高。

（一）常模参照测验的效标关联效度

在确定常模参照测验的效度时，通常以另一比较符合测量目的的测量结果作为检测效度的参照标准（即效标）。设被测总数为N，x和y分别为被测i的本次测得成绩和效标成绩，则

若已将成绩转换成Z标准分，则

rxy＞0时，说明两者相关（正相关），rxy值越大相关程度也越大；rxy=1时表示测量完全反映测量的目的；rxy=0时，表明两组分数完全不相关（零相关）测量结果跟测量目的无关；rxy＜0时为负相关，表明一测量得分高者另一测量得分低，测量结果跟测量目的完全相反。一般情况下，化学学业成绩测验的效度应在0.4～0.7之间

系统误差和随机误差跟实得分数方差比值的大小影响着效度的高低，要提高效度，就必须：

（1）提高测验的信度，减小随机误差的影响。

（2）施测标准化、评分标准化、采用适宜的分数合成方法，减少与测验的目的无关的因素，尽量降低系统误差的影响。题文难于理解、数学计算过于复杂等，均会降低测验的效度。

（3）提高命题质量。试题太少、偏、怪，覆盖面小、编排不当、过难过易等，都会影响效度。

（4）增大样本容量、使之具有较好的代表性。

（5）选择可靠（信度高）、符合测量目的的测验作效标。

效度系数也可以视具体情况改用二列相关系数或者点二列相关系数、φ相关系数等来表示。

（二）目标参照测验的效度

目标参照测验要求测量结果的变异最好为零，故不能用变异量来表示其效度。此时，可以通过内容适宜性来确定其效度。

五、试卷难度分析

测验考试总结例2

中学化学试卷的质量分析是中学化学教学评价的重要内容，高质量的中学化学试卷分析对提高中学化学教学质量和提高化学试题的命题质量具有特别重要的意义。同时，也是教育主管部门、教育研究部门获取教育教学质量信息、提出改进教学建议的重要途径。

一、中学化学试卷的质量分析存在误区

据笔者调查了解，目前教师、学校，甚至市、县教育研究部门的学科测验质量分析，仅仅是对学生考试成绩的情况分析，也就是考试结果分析。这对于了解学生学习情况，鉴别学生学业成绩、为改进教学、提高教学质量提供反馈信息是非常重要的。但这种分析是建立在学科测验（试卷）本身是没有任何质量问题的测量工具基础之上的，严格讲这只能称为被试的质量分析，而不能称为试卷的质量分析。特别是使用没有经过标准化的教师自编学科测验时，在没有对试卷这一测量工具的质量进行有效的分析评价之前，对测试结果的分析是没有意义的。

学科测验质量分析的方法包括定性分析和定量分析。从认识论角度讲，人们对事物、现象的认识首先获得一定的质的认识，然后在此基础上进一步去考察量，以求对事物的质有更清晰、更准确的把握，这就是认识的深化与精细化。也就是说，定量分析的目的是为了精确地、深入地对事物、现象的质的认识，这就要求必须正确理解、评价、解释、运用在定量分析中所使用的各种统计指标。但据笔者调查了解，在目前的对非标准化学科测验的质量分析中，定性分析较多，定量分析较少。定性分析往往缺乏足够的依据，而在一些简单的定量分析之后，相关指标的评价标准界定不明确，相关指标的解释、理解不全面，指标的运用不充分。

二、对试卷的基本情况的分析

这项工作主要是分析试题范围及知识点，试题性质、题型及数量以及有关命题依据等方面的内容。

1试题范围及知识点

是否是在化学教材及课程标准要求的范围内，覆盖面如何。试题内容是否源于课本，并根据学生生活背景知识适当拓宽加深，有无难题、偏题、怪题及超过课标要求的拔高。试题跨度是否注意到适当增加学科内或者学科间知识的交叉渗透，体现综合性特征。试题是否科学合理、比例是否恰当。文字、图像、图表、数据等信息资源是否准确。试题陈述是否科学准确、表达是否清晰，备选答案是否明确。试题之间是否具备独立性，即相互间有无提示现象。试题是否注意到与社会实际和学生生活实际的联系，注重对学生能力的考查。

2试题性质、题型及数量

试题按性质分为客观性试题和主观性试题。那么试卷中客观性试题和主观性试题各为多少道，分别为多少分。在目前，试题按题型（除高三模拟题外）一般分为选择题（单选或多选）、填空题、简答题、实验探究与设计题、计算题等种类。试题数量指选择题的备选答案数、填空题空格数、实验探究与设计和计算题得分点数、回答要点数，以及教材、课程标准和考试要点要求的知识涉及程度、知识点覆盖面（%）。

3命题依据

是否依据教材及课程标准；是否对基础知识、主干知识和基本能力的测试；是否关注探究过程和方法、联系实际选取素材，这对“教”和“学”具有导向作用。

三、试卷的统计数据

中学化学试卷的统计数据，可以按题型与按每道小题，进行全样本分析或抽样分析（随机抽样分析，样本容量适中）除了要统计最高分、最低分、平均分、优良率、及格率、错误率、得分率外，更主要的是要做好学生典型错误或创新解答统计及原因分析。在此只谈一下选择题的试题作答率的统计分析。

试题作答率是以全体受试学生中，每一个选项的作答人数占总人数的百分比值。每一选项的作答率，可以作为筛选或进一步修改不恰当的试题、以及分析学生作答情形之用，藉以了解学生是否有一些错误或迷失概念。

选择题的结构是由两部分组成：包括题干与选项，题干就是问题本身；选项包括一个正确选项（最佳答案）和三个诱答选项。正确选项必须要能吸引较多具备该评量能力的受试者去选择；而诱答选项则应具似真实性或合理性，会吸引较多不具备该评量能力者或是概念不正确者去选择。选项的设计与选择题题目的难易程度有密切关系。如某一试题有4个选项，正确选项A作答率为0.89，选项B作答率为0.11，显示该选项具有诱答力，有约11%的学生有此错误概念；选项C及选项D作答率为0，显示该选项不具有诱答力，或受试者没有此错误概念，可考虑修改此选项。

四、测试题目的质量分析

任何测验都是由若干测验题目构成的。非标准化测验的质量分析，首先应该是对组成测验的各个测验题目进行质量分析，只有保证了构成测验的所有试题的质量达到规定的标准，才能保证一个测验的整体质量。测验题目质量分析的目的，首先是为了鉴定测验题目，并为进一步修改测验试题提供有效的依据，前述的选择题作答率统计就属于此；其次，有助于提高老师编制测验的技能和技巧，有助于建立测验题库；当然，最为重要的还是为了保证一个测验的信度和效度。测验题目的质量分析主要包括题目的难度分析和区分度分析。

（一）、难度分析

难度又称难易度、难度系数（P）是试题对学生知识和能力水平的适合程度的指标，是一个相对概念，难度的高低与被试者的水平直接相关。难度的取值范围为0≤P≤1，P值愈大，表示该试题愈容易，愈多数学生答对该试题；P值愈小，表示该试题愈困难，愈少数学生答对该试题。

1难度的计算

对于二分法记分的客观试题，通常以答对或通过该题目人数的百分比来表示难度：P＝R/N（P：题目难度；N：全体被试人数；R：答对或通过该题目的人数）。

当被试人数较多时，可采用极端分组法，即先将被试按测验总分从高到低排列，取总分最高的27%被试为高分组，总分最低的27%被试为低分组，分别计算高分组和低分组的通过率，然后再求题目的难度：P＝(PH＋PL)/N（PH、PL分别表示高分组和低分组的通过率）。

主观题的难度一般用参加测试考生在该题的平均得分与该题分值之比，即P＝X/K（X表示所有考生在该题的平均得分，K表示该得分值）。

试卷的平均难度：P＝∑Pi/N（Pi代表每道题的难度值，N代表试卷的题目总数）。也可用P＝∑PiWi/W表示（Pi代表每道题目的难度值，Wi代表每道题目的分值，W代表试卷的总分值）。还可以用P＝X/W表示（X为总平均分，W代表试卷的总分值，P代表试卷的平均难度）。

当被试人数较多时，也可采用极端分组法计算难度：P＝(XH＋XL－2NL)/2N(H－L)（XH、XL分别为高分组、低分组的总分；H、L分别为最高分、最低分；N为总人数的25%）。

2难度分析

难度分析的主要目的是为了鉴定、筛选和修改题目。题目的难度水平通常取决于测验的目的、题目的形式以及测验的性质。一般情况下，测验的平均难度要适中，应在0.50左右；如果测验是为了了解被试在某方面知识、技能的掌握情况，可以不必过多地考虑试题的难度。

难度对于测验的影响，首先表现在测验分数的分布形态上。若测验题目的难度普遍较大，则分数呈正偏态分布；若测验题目难度普遍较小，则分数呈负偏态分布；只有当测验题目的难度适中时，分数分布才呈近似正态分布。其次表现在测验分数的离散程度上。太难或太易的测验题目，都会导致测验分数相对地集中在低分端或高分端，离散程度较小；当难度适中时，分数分布范围大，离散程度较大。这是用标准差σ来表示的，因篇幅关系，在此不加赘述。

只有当分数的分布范围较大时，测验的信度才可能较高，反之信度较低。可见，测验题目的难度以集中在0.50左右为最佳，以集中在两极端为最差。在非标准化学科测验中，组成测验的各试题的难度系数应当以0.50为均值（各个试题难度均匀分布在0.2～0.8之间为好），这样有利于最大程度区分不同程度学生，使试题产生区分学生的最大效果，分数将呈正态分布，但允许有少量的高难度和低难度的测验题目。

（二）、区分度分析

试题区分度又称区分度指数（D），是衡量试题对不同知识和能力水平考生的鉴别程度的指标。具有良好区分度的测验，实际水平高的该得高分，实际水平低的该得低分，它是评价试题质量、筛选试题的主要指标和依据。

1区分度计算

鉴别指数法。对于二分法记分的客观性试题，从总分分布的两端各选择27%的被试组成高分组和低分组，分别计算高分组和低分组的通过率，二者之差就是鉴别指数：D＝PH－PL。

主观题的区分度，一般从总分分布的两端各选择27%的被试组成高分组和低分组，分别计算各组总分和测验最高分、最低分。再按下面公式计算：D＝(XH－XL)/N(H－L)（公式中各符号含义与难度计算时相同）。

其它复杂的计算，在此从略。

2区分度分析

如果一个题目的测试结果使水平高的考生答对（得高分），而水平低的考生答错（得低分），它的区分就很强。鉴别指数是鉴别题目测量有效性的指标，鉴别指数越高，题目越有效。一般认为，鉴别指数在0.40以上的为很好；鉴别指数在0.30～0.39的为良好，修改会更好；鉴别指数在0.20～0.29的为尚可，仍需修改；鉴别指数在0.19以下的为差，必须淘汰。

任何一种测验，其所有的测验题目，都应该具有良好以上的区分度。否则，将无法保证测验的有效性。

五、测验的质量分析

当由若干质量达到要求的测试题目构成一个测验时，还必须对整个测验的可靠性和有效性进行技术鉴定，这就是通常所说的试卷分析。试卷分析最根本的含义是指对试卷的质量进行系统的分析，目的是评价作为鉴别学业成绩的测量工具的质量。对于标准化测验来说，有一整套完整而成熟的质量技术分析指标。非标准化测验在测验结束后，也可以通过抽样的方法，借助这些指标来进行试卷的质量分析，也就是要明确一个测验的信度和效度。

（一）信度分析

信度是指测验结果的稳定性、一致性和可靠性的指标。信度是测量过程中随机误差大小的反映，如果信度低，则随机误差大，测验的结果就会与真分数发生较大的偏差。一个成功的测验必须具有较高的信度，也就是说，只要遵守操作规则，测验的结果就不应该随工具的使用者或使用时间、地点等因素的变化而发生较大变化。

测验信度的种类较多。如反映测验稳定性的重测信度、检验等值性的复本信度以及描述内部一致性的分半信度、同质性信度等。在非标准化学科测验的信度分析中，最适合使用的应该是分半信度。

分半信度是将一个测验分成对等的两半，然后分析同一组被试在两个半份的一致性程度。计算分半信度的关键在于如何将一个测验分成两半，常用的分半方法有完全随机分半、奇偶题目序号分半等。计算分半信度的方法，就是求被试在两个半份测验上得分的相关系数，当然，由于只是半个测验的信度，所以必须进行校正。校正公式为r＝2r0/(1＋r0)（r为信度，r0为两个半卷上分数的相关系数）。

测验信度通常用来解释个人测验分数的意义，也可用来进行两种测验分数的比较分析。测验信度高，说明测验结果比较一致，测量工具具有稳定性、一致性和等值性，被试的能力水平受被试状态和施测环境变化的影响较小；若信度低，则说明测验的随机误差较大，测验结果不可靠。鉴别信度系数的高低，需要对计算的各种相关系数进行显著性检验。

要提高测验的信度，可适当增加测验的长度，并使测验中所有试题的难度系数接近正态分布，并控制在中等水平；必须保证测验题目具有较高的区分度，并尽量使用同质的测验内容题目；另外，还必须强调测验评分的客观性，并提高测验程序的统一性。

（二）效度分析

效度指一个测验实际测量的结果与所要测量的能力水平之间的吻合程度，是测验的有效性或正确性的指标。效度是随机误差和系统误差的综合反映，效度的估计就是多方寻找证据来证明一个测验有效性程度的过程。由于效度是就测量结果达到测量目的的程度而言的，所以测验的效度估计在很大程度是取决于人们对测量目的的解释。常见的解释有三种：一是用测量的内容来说明目的；二是用心理学上某种理论结构来说明目的；三是用实际实效来说明目的。于是，就有内容效度、结构效度和实证效度之分。

在非标准化学科测验的效度分析中，最适合使用的是内容效度。

内容效度指一个测验实际测到的内容与所要测的内容之间的吻合程度，也即试卷内容对于所要考查的课程内容的代表性如何。估计内容效度的核心问题，一是要测的内容范围是否明确，二是在明确的内容范围内题目的取样是否具有代表性。

确定内容效度的方法主要是逻辑分析法。其工作思路是请有关专家对测试题目与原定内容范围的吻合程度作出判断分析，所以又称专家判断法。这需要依据在编制测验时制作的“化学学科双向细目表”。

要提高测验的效度，首先，要精心编制测验试题，避免出现系统误差；其次，要妥善组织测验，控制好随机误差；第三，要合理处理好信度与效度的关系，信度不高的测验不可能具有很高的测验效度。

测验考试总结例3

1 高速公路实验检测现状

现在的公路工程试验检测管理的办法有着一套自己管理规范，在工程施工过程中我们把试验检验可以分为:施工单位自检、监理单位抽检及监督单位抽检，但是始终是存在问题，这样就使检测的力度和要求达不到预想的效果。那到底是什么问题，影响着检验测试的效果呢？

1.1 施工单位自检试验结果准确性、可信度不高。

在三级的质量控制体系中，主要是施工单位的自检比较多，所以施工单位的自检对于整个工程的质量控制就是关键的。那么就需要建立工地的临时实验室，但是这需要大量的资金投入，但是考虑到利益，施工方投入的是少于预算的，这样中间的差值就是施工方的利润。所以施工单位工地临时试验室的各个方面都是达不到相应的要求的，那么临时试验室检测的任何结果的准确性都是没有保证的。

正是因为工地临时试验室的建造是把自身利益作为考虑前提的，所以检测的准确性、结果就会和实际上有差误的，而施工单位给出的检测报告也是会影响完工的验收的，更何况在施工单位赶进度的压力之下，对于施工单位试验室是否能够出具数据真实的报告更是难以预料。

1.2 监理抽检试验缺位

工程的监理制度不断的发展，那么交通行业的工程监理也是在不断的发展，已经逐步的到了职业化的高阶段，

交通行业的工程监理制度,经历了试点起步、全面推广,现已进入规范市场、走职业化发展的提高阶段。在试验检测方面,对于监理的要求是严格的，他们要认真做好职责，对工程的各个过程做好监督，并且严厉的监督施工单位自检的过程，还要加强适当的抽检工作，掌握整个工程的质量。

一旦发现了对工程质量有影响的时候，坚决果断的实施措施并且及时上报处理，从基本开始就消除质量隐患。但是对于监理单位来说,要满足约定的对试验检测的控制工作,就要具有足够的合格的试验监理师。

在当前的质量管理规范中，是要求监理在现场有实验室的，这样才能随时的对工程进行抽检，从而验证施工单位自检的数据准确与否。达到这样的目的是需要场地、设备、人员资源和对实验室科学管理的，但是投入就会加大，而现在的公路工程监理服务费相对偏低,所以多数监理不得不采用外委或直接用施工单位的人员及设备进行抽检试验。这样可以保证数据的准确，但是超出计划的聘请费是不能满足抽检需求的，所以最终都说明监理单位很难保证抽检试验数据的真实性。

2 监督抽检试验不能反映工程现状

就现在的工程检测来看，监督单位对于施工单位的抽检总体频率是不高的，根据统计学的科学依据，样本数量不够，结果也是不准确的。更何况监督部门的抽检也只是对完工的部门，这样对于施工过程中的控制就是没有的，那结果抽检就是事后检查，也就没有了该有的效力。然而在现有的三级质量控制体系中,虽然三个方面各自起到了应有的作用，但是整体质量检测的力度是不够的，还是缺少一个试验检测工作的管理主体。

3 高速公路试验检测管理建议

因为高速公路的建设是很复杂的，规模大、质量要求高、技术性强，在结合现有的行业试验检测的现状，加上已有的质量管理方面的成功案例，总结了以下建议。

3.1成立试验管理组,确保工地临时实验室运行的规范性

一个项目的施工过程中，项目管理处必须要加强对施工单位、监理单位工地实验室运行管理,要把施工单位的自检，监理单位的抽检全部纳入规范的正确轨道上。最好建一个试验管理组，这样就能保证工地临时的实验室可以有规范的工作，而实验管理组是可以委托第三方检测机构建立。

3.2试验管理组成立后,实施如下职责

3.2.1工地临时实验室资质管理,构建工地临时实验室质量体系

监理单位、施工单位的临时试验室的实际能力是要严格考核的，如果检测的项目超出实际的能力要求就需要委托有此能力的第三方，同时还要有第三方的核准。这样就能保证试验的结果的准确、可信、真实。

那么监理试验管理组就可以对工地的实验室进行监督，从而确保人员、仪器等方面的使用情况，对其实行管理，从而保证实验室各个方面和试验水平达到标准。

3.2.2每月及每季度的质量检查

既然建立了试验管理组，它就要对施工单位、监理单位的检测工作具有执行力，要按照计划对他们呢抽检的结果检查，从而达到规范的检测，从而提高现场的检测质量。保证检测的结果，还要实施每月及每季度质量检查包括每月的突击性专项检查、每季度集中性全面检查。

3.2.3工地试验室检测技术管理

工地试验室的工作人员应该掌握各相关部门下达的实验规程、标准、技术规范及有关技术文件,熟练的掌握检测数据的归类，报告总结的各种规定。这样就要求管理组对检测的工作人员进行严格的考核，相关的培训，只有这样才能确保工地试验室给出准确的检测数据。

3.2.4加强与建设单位其他部门的有效沟通,建立检测工作的月报制度

交通建设的工作实践和经验告诉我们,工程质量起始于“源头”,形成于“过程”,终结于“现场”。因此,在施工过程中需加强对“源头、过程、现场”的分析与研究,在总结中找到保证质量的可行方法。那么做好定期的检测，实行工作月报制度就是必要的工作。此项工作可由试验管理组完成,对现场各施工单位的质量检测结果进行有效分析,这样才能对出现的不好环节有利的控制。

4 加强业主抽检,确保工程检测数据的准确可靠

只有总结经验教训才能有所进步，所以正是因为在过去的项目建设中，业主不能得到工程质量的第一手资料，所以质量的检测最终达不到预先的要求。总结这个教训，要提高业主抽检，达到最后检测数据的准确。

在业主抽检实施过程中,由项目管理处相关部门根据项目进展的要求及各检测参数既定的抽检频率,向检测公司提出委托意向,检测公司在接到委托后,组织人员予以实施,并将检测结果及时反馈给项目管理处。检测公司在技术上对项目管理处负责。

5 结语

质量的隐患对于施工工程是影响着公路工程质量的诸多因素中的一个非常重要的原因,所以适时适当的试验检测是十分必要的，那么就必需要把施工过程中的实验检测工作放在重要的位置来考虑，很好的解决这个问题才是需要探讨和分析的。

参考文献

[1]张蒙林,付春玲,王淑清.老集高速公路试验检测质量管理[J].内蒙古公路与运输,2006,(01).

[2]赵月平.浅析公路工程试验检测工作[J].黑龙江交通科技,2005,(03).

测验考试总结例4

中图分类号：G642 文献标识码：A 文章编号：1003-9082（2016）11-0127-01

近些年来，我校将生理学、药理学和病理生理学实验合并成立了机能实验学一门将综合性实验课程。在教学过程中我们引入了慕课（Massive Open Online Courses，MOOCs）教学模式[1]，进行教学探索。在具体实践教学中，我们发现考核在慕课教学中是十分重要的一个环节。

一、考核形式分为线下和在线考核两种形式

线下考核以笔试和操作技能考核相结合的形式进行。共进行三次，每次九十分钟。首先是笔试，试卷构成包括名词解释、单项选择、是非判断题、综合分析题。用时30分钟，满分100分，占期末总成绩的5%。然后进行操作技能考核，每次一位同学进行操作，由两位教师根据评分细则分别评判成绩。满分100分，两位教师评分的平均值就是该同学的最终操作成绩。操作成绩每次占期末总成绩的5%。三次平时测试占期末总成绩的30%。

在期末时，进行一次期末综合技能操作测试。选取一个实验项目，每个同学五分钟进行一步操作，然后下一位同学进行下一步操作，六位同学依次合作，共同完成实验项目。有三位教师同时依据评分细则评判成绩，满分100分。三位教师评分的平均值就是该同学的最终成绩。占期末总成绩的20%。

在线考核通过网络进行。每次实验课结束后开放下一侧实验的测试平台，全部为单项选择题，限时15分钟内完成。学生只有在学习了全部内容后才能登陆测试页面。测试平台于下一次实验课开始前一天关闭。测试结束后不会马上给出正确答案与解析，正确答案与解析会在正式实验结束后给出。每次测试题为10道，满分100分，占期末总成绩5%。共十次测试，总计成绩占期末总成绩的50%。

二、考核内容包括基础知识、操作技能和实验分析能力考核[2]

基础知识考核主要考核学生对实验相关的学科的基础知识的掌握[3]。例如关于哺乳类动脉血压测量与失血性休克这个实验，要求学生具备生理学中的动脉血压的形成与影响因素和病理生理学中休克的知识。这些内容的考核通过线下和线上同时进行，以线上为主。

操作技能考核主要考核学生对实验器材是正确使用和实验操作的技巧的掌握。例如手术剪刀的正确拿持方法和正确的家兔颈部神经识别。这些考核通过线上和线下结合，以线下为主。

实验分析能力考核主要考核学生对实验现象的分析能力。例如对不同因素导致呼吸曲线的变化分析。这些考核主要通过线下考核。

三、考核效果

通过我校慕课教学实践发现，学生学习兴趣高涨，在实验中操作成功率明显上升。学生对实验分析考核特别感兴趣，认为有助于提高他们的实践能力，为成为一名合格的医务工作者奠定良好的基础。

通过成绩分析发现，线上成绩普遍得分率较高，线下成绩相对得分率较低。可能与线上试题侧重于基础知识的考核有关。

测验考试总结例5

青海省体育加试是根据“青海省普通高校体育专业招生体育考试评分标准与办法”中的考试要求与评分标准对考生进行考试。体育加试的径赛项目使用手动计时器对其进行计时，而田赛项目则采用人工测量。体育加试成绩数据是作者从青海省考试管理中心获取，分析青海省2007体育加试基本情况，对青海省体育加试考生进行全面了解，并试图发现体育加试过程中不足之处和存在的问题，为改进和完善我省高考体育测试工作提出一些可行的改进措施。

1研究对象与方法

1.1研究对象

2007 年我省实际参加高考体育测试的考生共 635 人，比去年增加了268人，增长36.6% （报名人数732人，缺考97人）。

1.2研究方法

采用SPSS统计分析对 2007 年青海省体育高考测试数据库中的报考人数、性别及测试成绩等进行统计分析并和近年青海省高考体育测试数据库进行比较。

2结果分析

2.1青海省体育加试考生报考情况分析

2.1.12007年青海省报考体育人数总数为732人，其中女生为 180人，男生为552人，比去年增加了268人，增长36.6%人。改革开放以来，国家经济取得突飞猛进的发展，而全民健身计划的实施，及体育相关娱乐活动的增加，学生课外体育运动的时间也增加了，学生身体素质增强，身体素质较好，使得近年报考体育的人数也逐渐增加。另外，近年来社会竞争越来越激烈，各方面素质要求的逐渐变高，报考体育同样增加了竞争的机会。

2.2青海省体育加试成绩的分布情况

2007年青海省体育加试的办法和往年大概相同，同样是考五个身体素质项目。总分为100 分，每项满分 20 分；女生考试平均总分X=67.56，S = 10.365。男生的平均总分为X=68.9，S =9.672；经t检验p > 0.05 ，这说明青海省体育加试男女生考试的标准是合理的。

五项测试的区分能力一般，因为区分度值在0.27-0.55之间，区分能力最好的是女子原地推铅球D值为0.55，区分能力最差的是男子800M跑的D值为0.27。五项测试的难度在0.15-0.24之间，其难度相对较小，男女难度相对大的是立定跳远，男女P值为0.24，难度最小是女子100M跑和男子原地推铅球。为何如此，笔者觉得：从1986年开始青海省体育高考身体素质考试项目一直就是这五项，多数考生为应付考试，单独在这五项上下苦功夫，导致考试的难度降低，考生身体素质的全面发展在一定程度上受到了限制。体育专业的考生高考时文化课水平要求较低，许多考生看考好学校无望，文化课又还可以就“半路出家”，转为训练体育能让自己考上一个不错的学校。文化素质的提高对体育教育专业考生是极其有利的，可是也有一些弊病，专业素质较差的考生，在专业素质方面是个严峻的考验。

反映考生力量素质的项目是原地推铅球项目，女生为11.32，男生平均得分为11.5，通过t检验进行显著性检验，显著性差异p

反映考生速度耐力的项目是800Μ项目，女生为11.2，男生平均得分为12.63，采用t检验进行显著性检验，显著性差异p

反映考生速度素质的重要项目是100Μ跑项目，女生为12.65，男生平均得分为10.51，通过t检验方法进行显著性检验，显著性差异p

反映考生灵敏素质的重要项目是5Μ三向折回跑项目，男生平均得分为6.87，女生为13.69，通过t检验方法进行显著性检验，显著性差异p

3小结

3.1小结

（1）作为考试评分标准，男女生成绩得分不应该有显著差异，但是同类素质项目男女生在成绩上有显著差异。

（2）速度、力量、耐力和灵敏可以通过五项素质代表各自素质的基本属性和特征，考生的身体素质状况能较全面地反映出来，这些指标作为测试身体素质的是有效的。

（3）考试采用了人工计时和测量，对考试的客观性和精确性有一定影响，而且人工计时和测量要投入较多的时间和人力，重点是有些人为因素不能有效排除，从而使得考试的精确性、科学性和公正性影响较大。

（4）青海省高考体育加试从 1986 年开始将全体考生集中在一个点，从考试总分统计结果表明，成绩的分布基本上呈正态分布。通过t 检验男女生的总成绩平均分不存在显著差异，而男女生的5项素质总分均值和专项成绩均值存在差异。

【参考文献】

测验考试总结例6

中图分类号：G424 文献标识码：A

0 引言

考试，作为教学过程的重要环节，不仅承担了检验学生知识掌握能力的重任，而且彰显着教师的教学效果和教学能力。以往，对于考试功效的认知呈现着重“考试成绩”轻“试卷质量”的偏误，成绩被统计完毕，试卷即寿终正寝，鲜有对试卷本身进行量化分析的教学实验，这不利于教学质量的提高和教学评估的科学化。随着社会科学研究方法的日益科学化和规范化，考试作为教育学研究的重要内容，理应对其进行科学化测度，这不仅能提高试卷的出题质量，检验学生掌握所学知识的真实水平，还能为考核教师教学能力提供重要的指标。教育评价技术方法中教育测量理论就是应用教育统计学方法来实现的，为测评学生能力、分析试卷质量、考核教育效果提供了可资借鉴的分析方法。

试卷本身的科学性体现在诸多方面，如试卷总体成绩分布、试卷难度、区分度、信度和效度等，以上因素影响着一份试卷的质量。本文以泉州市新村小学某年级学生的89份小学语文考试样卷为样本，借助统计学软件SPSS 17.0来施以量化分析，旨在探寻试卷质量的需改进之处，促进教学能力的不断提高。同时希冀教师在学术科研和教学实践过程中更加注重科学统计方法的应用，挖掘有关考试的有价信息，提高自身的综合素质。

1 研究框架及数据处理

一个完整的试卷科学性测度系统包括试卷、成绩、测度和输出四个模块。其中试卷模块、成绩模块和输出模块的建构基于主观判断，难以量化分析，而测度模块须以计量统计分析为支撑。本研究以SPSS 17.0统计分析软件为工具来测度试卷质量，主要围绕测度系统展开，并辅之以试卷题型及分值构建、考试成绩录入和分析结果输出模块，旨在便于统计分析并为提高试卷科学性指出路径。

考生人数应为90，其中1人因故缺考，有效样本数为89。经过客观公正批改，形成实得成绩。教师在对成绩进行汇总时，应该考量成绩汇总用途，如果仅用于考生学习能力测评之目的，则只需统计各被试学生的卷面总成绩；若有意向借助成绩进行试卷质量测度，则须统计各被试考生各小题的实得分，形成数据表。统计成绩一般采用Excel文件，若借助SPSS 17.0软件进行试卷科学性测度，则可以直接将数据输入数据录入分析系统。亦可首先在Excel文件中将数据录入完毕，然后将其导入SPSS 17.0分析软件。

2 试卷科学性测度

试题科学性的客观标准体现在符合教学大纲要求，难度适当，区分优劣能力较强，覆盖面较大，学生考试成绩呈正态分布等诸方面。纵观已有研究成果，鉴别试卷质量优劣的数字指标有“五度”：信度、难度、区分度、效度、覆盖度，但在实际适用中，经常被采用的是“四度一分布”，即信度、难度、区分度、效度及成绩分布。

2.1 建立成绩分布直方图

在教育测量方法中，正态分布是最常见、应用最广的一种重要分布。根据教育统计学的理论，经统计分析（样本数≥30）93%的考试成绩分布状况在直观上呈现为“中间多，两边少，左右基本对称”的特点。判断成绩是否接近正态分布，最直观、最有效的方法是将成绩分布曲线与均值和方差相同的正态分布曲线加以比较。所以一次难度适中信度可靠的考试，客观有效的学生成绩应接近正态分布，且平均分在75分左右，标准差在5～9之间。

利用SPSS得到分数段分布直方图，如图1所示，这89名学生的成绩分布形态基本对称，较接近正态分布。平均分为69.66分，标准差为8.755分，分析结果基本符合数理统计学原理。

2.2 题目难易度分析

难度（Difficulty）是反映试题难易程度的一个指标，它对考试结果有很大的影响，题目的难度值越大，说明该题越容易，反之该题越难。

一般的试卷主要选择难度在0.5左右的试题，如果是选拔性质的考试，应该主要选择难度较高的试题，如果是达标性质的考试，应该选择难度较低的试题，同时为了测试考生的能力差异，试卷中应该加入少量难度较高的题目。总体上说，试卷的难度应该控制在0.3～0.8之间。但是题目的难度系数不能太接近，这样的题目太同质，会降低总分数的区别力。所以一张试卷的平均难度除控制在0.3～0.8之间外，还应使试题的难度适当分散。

根据本次考试的难度统计结果，Q5、Q7、Q17、Q18、Q27题题目较难，Q20题题目偏难，Q11、Q21、Q25、Q30、Q31、Q32、Q33、Q34、Q35、Q36题题目偏易。由于得分便易的题目集中在主观题上，从某种程度上可以反映学生对主观题的把握能力较强。

2.3 题目区分度分析

区分度（Discrimination）是指测验题目对学业水平不同的学生的区分程度或鉴别能力。具有良好区分度的测验，区分度越高，说明试卷区分考生水平差异的能力越强，反之，区分能力就越差。它是测验是否有效的“指示器”，被作为评价试题质量，筛选试题的主要指标与依据。

本文采用一种比较便捷的测度方法，区分客观题与主观题。对于客观题，采用斯皮尔曼（Spearman）等级相关分析法，即求总分与每个试题得分间的相关系数；对于主观题来说，看成是非等间距测度的连续变量，并且样本数大于30，采用皮尔逊（Pearson）相关分析法，即求总分与每个试题得分间的积差相关系数作为试题的区分度。

根据试卷各题的区分度，第4、7、11、12、14、15、18、20、23、25、26、33小题的区分度不够，应被淘汰或作进一步的修改。

2.4 信度分析

信度（Reliability）是指测量方法的质量，即对同一现象进行重复观察是否可以得到相同的资料。具体到试卷信度，是指同一个测验对同一组被试对象，施测两次或两次以上得分的一致程度。信度的高低反映了考试中随机因素影响的大小，一次测试中随机因素影响小，则信度大，随机因素影响大，则信度小。信度也可以用来指示实测值和真值相差的程度，如果实测值与真值相差较小，说明结果的信度较高，反之信度较低，信度值的合理范围为0.5～0.9。在SPSS17.0软件中一般采用科隆巴赫（Cronbach）%Z系数计算测验的内部一致性系数。

本次考试的信度系数为：Alpha=0.576，本次测试的信度较低。

2.5 效度分析

效度（Validity）是指测量准确地反映所需测量概念的程度。表现在考试试卷测度上，是指试卷准确地测量了考试目的欲测内容的多少。具体而言就是覆盖面和权重在多大程度上体现了教学大纲的要求，能否有效检验考试能力水平。效度与信度的区别是：信度反映了考试中随机误差的大小，而效度反映了考试中系统误差的大小。缺乏信度和效度的测量都是不科学的。

效度只有高低之分，没有全部有效和全部无效之分。效度的取值范围在0至1之间。对于一次考试来说，其效度系数一般应在0.4～0.7之间，值越大效度越高。本文采用标准关联效度法（predictive validity），把学生的平时成绩作为效度分析的标准，利用积差相关法求效度。根据计算结果，本次考试的试卷效度为0.593。

3 测度结果及调试路径

3.1 测度结果

根据教育测量理论，本次小学语文考试成绩的分布直方图并未凸显出畸形特征，基本上呈正态分布，单峰且大体对称。通过对题目难易度的计量分析可以看出，只有1题偏难，却有10题偏易，这不利于区分被试者的知识掌握能力的高低。从本次考试成绩的区分度可以看出，共有12道题目的区分度低于0.2，这不利于检验学生真实水平的差异性，需要改进出题质量，提高区分度。本次考试成绩的信度虽然在合理值范围内，但是值接近合理区间的底限，说明试卷测试的题目的一致性程度较低，需要进一步调适试题，提高信度。本次考试的效度居中，考试测量目的预测内容的程度一般。

3.2 调适路径

测验考试总结例7

实验室检验是卫生监督、疾病控制工作的技术支撑，是开展卫生行政执法、疾病预防控制工作的重要基础和手段。实验室质量控制和参加能力验证，不仅能提高检测水平的重要途经，而且可以检查仪器设备的运行状态、标准物质的使用、化学试剂的纯度及实验用水是否符合要求，是对实验室能力进行合理性考核监督，确认和评价。保证检测值溯源到国家标准，有助于增加客户对实验室的信任提高实验室的竞争力，因此能力验证是作为评价实验室和检测机构技术能力的重要手段之一[1]参与实验室室间比对和能力验证活动，接受肓样检测工作能不断提高实验室处理各种样品和应对各种突发性事件的能力和水平。同时实验室质量控制是指分析测试结果的误差控制在允许限量内所采取的控制措施，包括实验室内质量控制和实验室间质量控制两部分内容。为了能及时发现检测仪器、设备、检验方法、人员检测技能、检测环境等随时随机和系统因素对检测质量的影响，及时采取相应的预防和纠正措施，同时考查实验室整体的检测质量，根据质量管理体系和上级主管部门工作要求。本中心每年都要参加质控考核并通过各种形式积极参加实验室能力验证和室间比对工作，同时认真做好实验室内部质量控制工作。

1 参加能力验证结果

①参加省疾病预防控制中心，环境保护部标准样品研究所具体实施的水中重金属元素检测，能力验证计划中铜、铅、镉、铁、锌等②参加省疾病预防控制中心组织，环境保护部标准样品研究所具体实施的水中无机盐检测，氟化物、氯化物、硝酸盐、硫酸盐等项目的能力验证，结果满意。③参加江苏省疾病预防控制中心组织的盐碘实验室质控：2008年，江苏省疾控制中心组织全省碘缺病实验室质量控制网络常规运行考核本中心合格。④2008年，参加江苏省疾病预防控制中心组织的水中总硬度检测室间比对，结果：总硬度考核本中心合格。

2 室内质控结果

①标准盲样考核：氰化物标准盲样考核，考核结果满意。②方法比对：PH标准盲样进行人员比对结果一致，比对结果满意。③仪器比对：用同一型号PH计进行仪器比对，测定样品，结果满意。④按质量控制要求，做好日常检测中平行样品、空白试验、加标回收试验、核查和量值溯源等工作。

3 结果评估

实验室室间比对是目前平价实验室检测能力的重要措施，是检测、校正报告质量控制和改进的有效手段，是计量认真和实验室认可现场评审、监督评审和复评审的重要补充形式[2]本中心按计划有序地进行实验室能力验证、室内质控结果较为满意。这说明，本中心实验室的检测质量是能够得到保证，检测人员的质量控制意识正在不断增强，同时检测水平也不断提高。

4 质量控制工作分析与体会

实验室的实验数据、实验室质量控制、质量保证方面应采取不同的方式进行室内质控（标准品检验、仪器比对、人员比对）实验室的检测质量控制点和检测质量控制计划的实施情况、适用性、有效性进行评价，将有利于实验室检测结果质量的不断提高。在检验过程中，影响结果的因素很多，现将对实验室的检测质量控制工作进行分析。

(1)影响检测结果质量因素：影响的因素有人员、检测仪器、实验材料、方法、检测环境、测量溯源、被检样品和样品处置、制定检测工作和程序等。(2)检测结果的质量保证措施：①实验室技术负责人、质量监督员负责对科室的检测工作各环节进行有效的监督，并识别、记录、报告和分析，使之得以及时纠正。②实验室应当采用统计技术对检测数据和结果进行分析或控制。③根据实验室工作量有计划、有目的通过空白试验、平行样测试、加标回收试验、对保留样品的再测试、工作曲线的核查、实验室人员比对和方法比对等采取质量控制措施。④对质量控制计划的实施情况、适用性、有效性进行评介并总结和平审，使检测结果质量得到不断改进和提高。(3)实验室质控制措施的实施。①内部质量控制：空白试验、平行样测试、加标回收试验、对保留样品的再测试、工作，曲线的核查、实验室人员比对和方法比对等采取质量控制措施。②外部质量控制：参加实验室室间比对或能力验证是实施实验室外部质量控制的措施。与同级或以上有资质的实验室进行比对和参加上级检验机构组织的区域范围内的考核称为实验室室间比对。由权威机构组织的实验室检测能力的考核称为能力验证。

综上所述，实验室管理必须做好以下原则：人员上岗要持证、仪器使用要校正、试剂质量要保证、方法选择要正确、测量溯源要经常、被检样品要均匀。通过实现质量管理的标准化管理，实验室出具的检验检出数据，结果的准确性、有效性和可比性就有保证。

测验考试总结例8

款冬花来源于菊科植物款冬(Tussilago farfara L．)未开放的干燥花蕾[1]，主产于甘肃、河南、山西、陕西、重庆、河北等省[2]。具润肺下气，止咳化痰之功效，用于急、慢性支气管炎，肺结核，新久咳嗽、喘咳痰多、劳嗽咯血等证等症[1，3]。芦丁、槲皮素等黄酮类成分是款冬花的有效化学成分，其他还有倍半萜类、生物碱、挥发油及微量元素等[3，4]，因此本试验采用紫外分光光度法对十二个不同产地的款冬花进行了有效成分-总黄酮的含量测定，采用高效液相色谱法测定了总黄酮中芦丁的含量，为款冬花药材质量的综合评价和制定新的质量标准提供一些参考数据。

1仪器与试药

UV-1100型紫外-可见分光光度仪(上海天美科学仪器有限公司)，Agilent 1200高效液相色谱仪(美国Agilent公司)，KQ-3200E型超声波清洗器（昆山市超声仪器有限公司），芦丁对照品(购自中国药品生物制品检定所)，款冬花不同产地样品见表1。甲醇为色谱纯，水为重蒸水，其他试剂均为分析纯。

2方法与结果

2.1总黄酮的含量测定

2.1.1标准曲线制备对照品溶液制备：精密称取芦丁对照品2.18 mg，置10ml容量瓶中，加甲醇制成浓度为0.218 mg/ml的溶液，作为对照品溶液。

精密吸取芦丁标准溶液0.5ml、1.0ml、2.0 ml、4.0ml、6.0 ml、8.0ml、10.0ml分别置于25ml容量瓶中，各加水至10 ml，加5％亚硝酸钠溶液1.0ml，摇匀，放置6 min，加l0％硝酸铝溶液1.0ml，摇匀，放置6min，加10％氢氧化钠溶液10 ml，再加水至刻度，摇匀，放置15min，以相应的试剂溶液为空白，在513nm波长处测定吸光度，以浓度(X)为横坐标，吸光度值(Y)为纵坐标，得标准曲线方程：Y =O.0117X + 0.0035，r =0.9999，其线性范围为4.36～87.2 µg/ml。

2.1.2 供试品溶液的制备取款冬花样品约1.0g，精密称定，加入20倍量45%乙醇，超声提40min，滤过，滤液置50ml容量瓶中，加入45％乙醇至刻度，摇匀，即得。吸取30µl待测样，按照2.1.1法测定吸光度，计算款冬花总黄酮得率。

2.1.3方法学考察精密度试验： RSD为1.08%。稳定性试验：每15min测定1次吸光度，RSD为2.27%，表明在150min内稳定。重复性试验： RSD为1.56%，说明重复性好。加样回收率试验：平均回收率为101.12 % ,RSD 为2.38%。

2.1.4样品测定取各个产地的款冬花药材1.0g，精密称定，按样品溶液制备方法制备，按

标准曲线制备项下同法操作显色后，测定其吸光度，计算总黄酮含量。结果见表l。

2.2 芦丁的含量测定

2.2.1 色谱条件色谱柱：Welchrom-C18 (250mm×4.6mm，5μm)；流动相：甲醇-0.1%磷酸水（45：55）；检测波长：360 nm；流速：1.0 ml/min；柱温：室温；进样量：10μl。在此色谱条件下，款冬花样品中芦丁与其最相邻组分峰的分离度良好，结果见图1和图2。

2.2.2标准曲线制备精密吸取芦丁对照品溶液2μl、4μl、6μl、8μl、10μl、12μl、20μl，依次注入液相色谱仪，按上述色谱条件测定峰面积积分值，以峰面积S 为横坐标，对照品进样量 X(μg)为纵坐标进行回归分析，得回归方程 S =14534 X -59.694，r =0.9999。结果表明芦丁在0.436～4.360μg 范围内，吸收峰面积与进样量线性关系良好。

2.2.3供试品溶液制备取各产地款冬花样品粉末约0.5 g，精密称定，置具塞锥形瓶中，精密加入甲醇50 ml，称定重量，超声处理30 min，放冷，再称定重量，用甲醇补足减失的重量，摇匀，滤过，取续滤液，即得。

2.2.4方法学考察稳定性试验：RSD为1.24％，表明供试品溶液在24 h内稳定；精密度试验：芦丁峰面积的RSD为0.56％；重复性试验：测定峰面积和芦丁含量的RSD均小于1.17％；加样回收率试验：测得款冬花样品加样回收率范围在98.40％～101.63％，RSD为1.42% 。

2.2.5样品测定：分别取12批不同产地的款冬花供试品，按2.2.3项下制备供试液，在上述色谱条件下测定峰面积，按外标法计算含量。结果见表1。

3讨论

3.1本文对全国主产地的款冬花进行了UV、HPLC的质量考察，采用本文的方法，可有效地控制款冬花的质量。本实验可为款冬花的品质评价、质控标准制定、GAP实施和药材生产提供参考资料。

3.2不同产地总黄酮含量以甘肃灵台县的最高，达15.12% ，陕西榆林次之，购于青海的商品药材含量较低，只有6.43%；芦丁含量在0.22～0.95%，甘肃灵台县款冬花的芦丁含量最高达0.95%，重庆巫溪较低，仅含0.22%。从而证实了甘肃灵台和陕西榆林产为优质药材的名副其实。

3.3从测定结果来看，各产地药材款冬花总黄酮和芦丁含量变化较大；这可能与种植条件、贮存时间、产地生态环境等因素有关，有待于进一步考察。

参考文献

[1]国家药典委员会．中国药典[s]．一部，北京：化学工业出版社，2005：233.

测验考试总结例9

中图分类号：G642.0 文献标志码：A 文章编号：1674-9324（2016）44-0240-02

一、引言

专业实验、实习课在专业课程学习中，能培养学生学会使用一门编程软件、设计一个小系统或一个小程序，并在设计实现中培养学生的创新与动手能力。因此，实验、实习课是测控专业教学的重要环节。

在专业实验教学过程中，一方面存在部分课程，由于实验教学内容选材不当、教学方法单调，使学生的实验、实习课学习兴趣降低，而由于缺乏合适的教材和讲义，使学生的实验难度增加；同时，由于使用单调的教学模式使部分学生产生厌学。另一方面，少数学生对专业实验、实习兴趣不高，在分组实验中（甚至在独立实验中）往往什么都不做，等其他同学完成实验后抄袭实验报告，应付实验考核。如果没有合适的监督、考核方法，就会降低实验课的教学效果，教师得不到良好的反馈和配合，同时也容易使部分学生产生“等、靠、懒”的习惯。

实验课的标准化考试，在设计过程中，可以完善实验考试大纲、考核方法，同时凝练实验课中的教学问题，这样利于发现实验教学内容、方法、模式上的问题，从而有针对性地因材施教和因人施教；而且标准化可以客观评价学生的实验实习情况，遏制“等、靠、懒”的现象。因此，做好实验课标准化考试是提高测控专业实验教学水平迫切需要解决的事情。

在实验实习课的标准化考试中，会出现考试方式选择、考试主观与客观评价结合、考试大纲编写等一些问题，而解决好这些问题是做好标准化考试的关键。本文结合在成都信息工程大学部分实验课考核的一些实践，从标准化考试与现状、考试方式比较分析、考试题库建设、考试软件建设等几个方面进行介绍。

二、标准化考试及现状

标准化考试也称标准化测验（Standardized Test），是指根据统一、规范的标准，对考试的各个环节包括测试目的、命题、施测、评分、计分、分数解释等都按照系统的科学程序组织，从而严格控制了误差的考试。

由于科学技术的发展，特别是计算机的普及，国外考试技术采用了经典测量理论、项目反应理论和概化理论，出现了计算机自适应性测试（CAT）、电子评分员（E-rater）及真实性测试（authentic test）等许多新的测验方式。标准化考试需要解决的问题包括：（1）规范化测控技术与仪器相关课程实验的测试目的、命题、施测、评分、计分、分数解释；（2）建立和完善相关的题库、试题解释、考试标准、网站、测评系统、考核大纲；（3）建设考评软件等。

但是目前的实验考试，一般都存在以下的一些共性问题：（1）编制考试题目困难；（2）较难测量表达、创造能力等；（3）较难测量学生的思维过程；（4）难以避免被试者猜测正确作答之嫌疑；等等。

在考试实践过程中应该避免出现的现象包括：（1）考试答案不仅唯一而且简单；（2）测验只衡量学生认识信息的好坏，忽视综合信息解决问题和独立思考的能力；（3）考试受时间限制，迅捷的思考比深度的思考更容易取得好成绩；（4）注重基本技能，而忽视严密思考和推理能力考核；（5）测验强调对独立知识的考核，对连贯性的知识考核不重视。

三、考试方式的比较分析

（一）智能仪器设计课程

成都信息工程大学测控技术与仪器专业从2002级开始开设《智能仪器设计》课程，它的定位是培养学生进行仪器系统设计不可缺少的环节；课程主要介绍智能仪器的软、硬件设计基础与方法；课程要求是通过课程学习，学生应具备设计常用智能仪器的能力。

目前这个课程的总课时为64学时，其中实验和实习课占32学时。2011年前，这个课程的学时为48学时，其中实验8学时。2012―2014年，这个课程为48课时，实验实习为16课时。

前期（2011年前），这个课程的实验考核方式是上课考勤，课程结束后实物检查，根据完成情况上交实验报告的方式进行考核，成绩评价是结合作业、理论上课考勤来给出，共占30%。

中期（2012年后），这个课程的实验考试方式采用了个人独立考试、现场抽题，每套题3～4个小题，约为30分钟完成。但1次考试只能是7～10个人，成绩评价是独立给出，占40%。这种考试题相对简单，不能看到中间的过程，也不便保存考试记录。

后期（2015年后），这个课程初步进行了标准化试点，采用单机考试方式，并利用录像方式进行现场测控，成绩评价是独立给出，占50%；而这种考试题能看到中间过程，便于监控，能保存中间的考试记录。

比较情况如下表所示。

（二）嵌入式系统设计

嵌入式系统讲述嵌入式系统的基本理论、原理。要求通过课程的学习，学生应会构建Linux系统、编写简单的程序。本课程的知识将为学生今后从事嵌入式系统研究与开发打下坚实的基础。

该门课程总课时为32学时，其中实验课时为16学时。

考试方法分为两部分：一部分是验证性实验，一部分是实验考试。在2012～2013学年下半学期的实验考试中，考试的平均成绩为72分，标准差为9%。在2013～2014学年下半学期的实验考试中，考试的平均成绩为73分，标准差为10%。

（三）讨论

对于标准化考核与一般实验考试相比，存在以下优点：（1）标准化考试考核的是全过程，而一般实验考试考核的是最终结果；（2）标准化考试具有过程的记录，客观性强，一般实验考试的主观性较强；（3）标准化考试是一个积累的过程，考得越多，相关的资源越丰富，便于教学改进；（4）标准化考试最后的工作量小，而一般考试的后期工作量较大。

四、考试题库建设

由于在标准化考试中，可以对过程进行考核，不必人为增加干扰项，而是根据大纲的知识点，结合平时实验或实验项目进行题目设计。因此在考试的时候，容易在以下几方面与大纲重合：（1）试题与教学大纲的要求；（2）试题总量；（3）试题难易度；（4）试题覆盖面。

五、考试软件建设

（一）单机软件

单机软件主要完成屏幕或摄像头录像，实现对考试人员考试过程的全场监视。屏幕或摄像头录像软件由考试人员打开考试习题后自动运行。软件设计主要采用“C#”来实现，利用Windows Media Encoder创建视频、音频捕捉应用，实现编码时效果预览，捕捉编码过程中的事件，等等方法来实现。

（二）网站建设

利用ASP结合SQL server来编写网站，网站包括考生部分和教师部分。教师用于题目的维护，而考生主要是进行考试。在线的基础考试题目是选择题，主要考试题目通过考生下载实现。功能实现过程包括考生根据考试分配的密码登录，下载自己的考题（含单机程序、打开考试习题、将运行单机程序），在线回答几道基础题，上传操作题，微机定时交卷。该软件原型需要在教学实践中进行进一步的探索和完善。

六、结论

标准化考核是全过程考核，有全过程的记录，客观性强，并且容易积累，后期工作量小。在题库建设中，容易根据大纲的知识点进行综合与应用相关的考试题目设计。在软件建设中可以分开用单机和网站软件来实现，技术成熟，可行性强。

测验考试总结例10

从功能特征出发，构建功能模块——故障信息模型，利用该模型提出了基于影响度的样本抽取方法并给出试验抽取流程。此方法依据影响度比率，随机抽取出被测单元的故障样本，达到提高样本集代表性，确保试验结论可信度的目的。最后以某光电测量设备中的时统终端单元为例，利用基于影响度的方法进行样本抽取，比较分析抽取结果证明该方法有效可行。

1.引言

光电测量设备[1]是靶场测控装备的重要组成部分。随着现代控制技术和计算机技术的大量应用，其复杂程度越来越高，带来了故障诊断的困难。测试性[2]是产品能及时、准确地确定其状态（可工作、不可工作或性能下降）并隔离其内部故障的一种设计特性，为了提高设备故障检测与隔离能力，必须开展测试性工作。目前靶场光电测量设备的测试性工作开展较少，特别是如何抽取故障样本来进行故障诊断试验以提高样本集的代表性确保试验结论的可信性，这一问题国内外相关领域还没有很好地解决。

本文针对此种情况，提出了影响度的概念，并利用功能——故障信息模型研究一种基于影响度的样本抽取方法，来满足光电测量设备故障诊断试验的需要。

2.故障诊断中的样本抽取

光电测量设备的故障诊断试验，就是在研制的产品或样机中注入一定数量的故障，用测试性设计规定的测试方法进行故障检测与隔离，按照试验的结果来估计产品的测试性水平，判断其是否达到规定的要求，决定接收或拒收[3]。故障诊断试验过程可以概括为三个环节：故障样本分配与抽取；故障注入演示试验；接收/拒收判断。第一个环节中的故障样本抽取，是指当样本分配结束并确定出各UUT（被测单元）所需样本量后，从各UUT故障模式总集中随机抽取出具体的故障模式，构成该UUT的样本集。光电测量设备的故障模式总集、UUT故障模式总集、UUT的样本集的关系是包含关系，如图1所示。

图1 各故障模式集层次关系

经抽取出的UUT样本集要能较好地代表UUT故障模式总集，这样才能确保故障诊断试验结论的可信性。但不是所有的故障模式都可以被抽取出来作为试验样本，抽取过程必须遵守一定的准则，通过对国内外研究成果的分析，总结出如下几点准则[4]：

（1）所抽取的故障模式，在进行故障注入时不能破坏任何设备；（2）所抽取的故障模式，应具有较高的可注入性和注入准确性；（3）故障注入时，所需要的硬件研制开发方便，简单，通用性强，开销少；（4）所抽取的故障模式，能以较小的费用最大限度地激活测试；（5）所抽取出的样本集，能最大限度地充分覆盖故障模式总集，具有较好的代表性。

样本集的代表性[5]是指所抽取的故障模式构成的集合对故障模式总集特征的覆盖程度，覆盖程度越高代表性越好，越能充分地反映试验对象的测试性水平。

文献[6]提出了基于故障特征模型的样本抽取方法，本文借鉴其思想建立功能模块——故障信息模型，在不违反以上准则的前提下进行样本抽取，下面对功能模块——故障信息模型进行介绍。

3.功能模块——故障信息模型

功能特征是指UUT设计实现的各种功能，一般情况下UUT都具有多种功能，UUT的各种故障模式对其功能都具有不同的影响。建立光电测量设备的功能模块——故障信息模型，首先要提取出与故障诊断试验相关的功能特征，提取时应考虑以下3点因素：

（1）所抽取的试验样本能否考核设备全部故障检测的能力和要求；（2）所抽取的试验样本能否考核设备全部故障隔离的能力和要求；（3）所抽取的试验样本能否激活设备全部设计的测试项目。

从提取的功能特征的角度出发，UUT可以由若干个实现不同功能的模块所组成，所以可以构建如下的模型。

（1）

式中：Fu为UUT各待检测功能模块的集合；fuj为待检测功能模块。UUT的所有故障模式由集合Fm来表示，Fm可通过故障模式影响影响及危害性分析（FMECA）来获得。

（2）

式中：Fm为UUT故障模式总集；fmi为UUT的1个故障模式。则定义功能模块——故障信息模型为：

（3）

式中：RF为功能模块——故障相关矩阵。

（4）

其中aij为UUT的故障模式fmi与待检测功能模块fuj之间的相关性，由0或1表示，当aij=1表明fmi可以导致功能模块fuj发生故障即相关；当aij=0表明fmi不可以导致功能模块fuj发生故障即不相关。公式（4）还可以用下式来表示。

（5）

功能模块相关特征矩阵：将满足公式（5）的RiF定义为故障模式fmi的功能相关特征矩阵。

fuj的等价集合：将满足公式（6）的Efuj定义为关于fuj的等价集合，即Fm对应RFj中元素为1的故障模式，构成关于fuj的等价集合。

（6）

（7）

4.基于影响度的样本抽取方法

4.1 影响度

从以上分析可以得出，当进行试验样本抽取时，从等价集合Efuj中按照等概率的方式进行样本抽取，可以满足第2节中的3点因素，但是这种抽取方式，是在认为等价集合中全部故障模式的影响地位相同的前提下进行的，但实际上每个故障模式所带来的影响都不相同。文献[6]提出按重要程度比率进行样本抽取，解决了等概率抽取的弊端，但是其只单纯考虑重要程度即严酷度这一因素，这样可能会使试验结论的可信度下降，抽取时还应考虑故障扩散强度这一因素。传播型故障[7]是指一种故障率低，但一旦发生则会传播扩散到其它元件，造成很坏影响的故障模式。若对传播型故障的测试性设计不完备，一旦发生而没有正确检测和隔离，给使用方造成的风险将与常见故障风险总和相提并论。在光电测量设备测试性设计之初，会重点对这种传播型故障进行故障检测和故障隔离的设计，确保装备有较高的测试性。故障扩散强度是指故障传播的能力。扩散强度越大，则表示故障通过某线路越容易进行扩散，同时波及的范围也就越大。所以相应地进行样本抽取时，应保证扩散强度高的故障模式较可能地被抽中。综合考虑危害度和故障扩散强度这两个因素，本文提出一种基于影响度的样本抽取方法，来提高试验结论的可信度，下面对影响度进行定义。

影响度：设φi表示某故障模式fmi的影响度，φi等于该故障模式的危害度与故障扩散强度之和，其计算公式如下所示：

（8）

式中：危害度Cmi的计算结果可通过FMECA[8]来获得；Ii的计算结果可通过改进后的单步故障扩散算法[9]来获得。

影响度比率：设某等价集Efuj中的故障模式数为m，fmi为等价集中的某故障模式，，fmi对应的影响度值为φi，则定义fmi的影响度比率为rφi，如公式（9）所示。

（9）

4.2 按影响度比率进行样本抽取的方法

本节给出按影响度比率进行样本抽取的方法[10]。

设分配给等价集合Efuj的试验样本量为z，则在抽取过程fmi被抽中的概率为rφi，既有。抽取时令，其中，并设F（0）=0，从随机数序列{η}中，随机抽取出一个随机数ηj，，并计算出t使其满足如下条件：

（10）

如果满足该条件，就把下标为t的故障模式fmt抽中放入样本集中，便可得到一个样本。之后照此方法继续下一次抽取，反复进行直至从等价集合Efuj中得到z个试验样本，构成样本集Sj。

照此方法求出UUT中每个功能模块等价集合的样本集，并对这些样本集取并集，最终便得到该UUT的样本集：

5.案例分析

下面以某型光电测量设备为例，利用上述方法演示样本抽取过程，并将抽取结果与按重要度即危害度所抽取的结果进行比较分析。该设备由8个单元组成，分别是时统终端单元、主控计算机单元、伺服单元、光纤通信单元、视频存储单元、编码器单元、红外处理单元、调光调焦单元。

因考虑篇幅等问题，这里只具体给出时统终端单元的样本抽取过程。该单元有3个功能模块，如表1所示。

对能导致功能模块发生故障的所有故障模式进行FMECA分析和故障传播过程分析并运用公式（8）、（9）计算每个故障模式的影响度和影响度比率，同时利用文献[6]的思想得出每个故障模式的重要度和重要度比率，其结果如表2所示。

分析以上故障模式的故障树，并收集与功能特征相关的各种信息，按照本文的思想建立功能模块——故障信息模型。其中功能模块——故障相关矩阵RF为：

分析RF中的RFj得到关于Fu的等价集合为：

Efu1={fm1，fm2，fm3}

Efu2={fm4，fm5，fm6}

Efu3={fm7，fm8，fm9}

已知分配给时统单元的样本数为5，该单元的3个功能模块所分配到的样本数分别是2，1，2。按照本文所提出的影响度比率来对3个等价集合进行样本抽取，得到所属的样本集分别为S1={fm1，fm2}、S2={fm6，}、S3={fm7，fm8}，对它们取并集便得到该时统单元的样本集S={fm1，fm2，fm6，fm7，fm8}。之后按照文献[6]中的重要度比率来进行样本抽取得到样本为fm2，fm3，fm5，fm6，fm9。可以看出这两个样本集是不同的，原因是用重要度比率进行抽取只考虑了危害度一个因素，而本文所提出的按影响度比率进行样本抽取，不仅考虑危害度还考虑了故障扩散强度这一因素。通过以上分析可得知在理论上按影响度比率抽到的样本集代表性更好，试验结论可信度更高。

6.结束语

本文介绍了光电测量设备故障诊断中样本抽取的基本概念和抽取原则，构建了功能模块——故障信息模型。考虑危害度和故障扩散强度这两个影响故障诊断的关键因素，提出了影响度的概念。利用功能模块——故障信息模型，研究了一种基于影响度的试验样本抽取方法，并给出了具体的抽取流程。最后以某型光电测量设备的时统终端单元为例，对比按重要度比率的抽取方法，演示了按影响度比率进行样本抽取的操作过程，通过比较两种抽取方法所得到的不同结果，并分析原因可得证基于影响度的试验样本抽取方法能更好地提高样本集的代表性，确保试验结论的可信性。除了功能特征与故障诊断试验相关，结构特征、测试特征也是故障诊断试验的重要特征，但本文只针对功能这一特征构建了模型，在今后的研究中可以针对不同的验证对象，考虑其他两个特征来构建模型。

参考文献

[1]何照才，胡保安.光电测量[M].北京：国防工业出版社，2002.

[2]田仲，石君友.系统测试性设计与验证[M].北京：北京航空航天大学出版社，2003.

[3]GJB2547-1995，装备测试性大纲[S].北京：中国标准出版社，1995.

测验考试总结模板(10篇)

测验考试总结例1

测验考试总结例2

测验考试总结例3

测验考试总结例4

测验考试总结例5

测验考试总结例6

测验考试总结例7

测验考试总结例8

测验考试总结例9

测验考试总结例10

水利工程对水文站水文测验的影响探析

岩矿测试

中国检验检测

社会政策研究

竞争政策研究