统计学的标准差模板(10篇)

时间:2023-08-21 16:56:38

导言:作为写作爱好者,不可错过为您精心挑选的10篇统计学的标准差,它们将为您的写作提供全新的视角,我们衷心期待您的阅读,并希望这些内容能为您提供灵感和参考。

统计学的标准差

篇1

ABSTRACT:fortablewalkingvelocity,amplitudesofpelvicandthoracicrotations,andtheircoordinationwerecomparedbetweenthetwogroups.ResultsComfortablewalkingvelocitywassignificantlyreduced.Therotationalamplitudesofpelvisandthoraxweresomewhatreduced,withsignificantlysmallerintraindividualstandarddeviations.AlsopelvisthoraxRelativeFourierPhasewasalittlesmaller;itsintraindividualstandarddeviationwassignificantlyreducedatvelocities≥1.06m/s.ConclusionThegeneralpatternofgaitkinematicsinpregnantwomenisverysimilartothatofnulligravidae.Pregnantwomenexperienceddifficultiesinrealizingtheharderantiphasepelvisthoraxcoordinationthatwasrequiredathigherwalkingvelocities.

KEYWORDS:pregnantwomen;walking;gait;pelvis;thorax;biomechanics

长期以来,人们一直认为妊娠影响孕妇的步态运动。Foti等研究发现,孕妇步行时跖屈的动量减少,髋关节外展的动量及骨盆的倾斜度均增加,骨盆的倾斜度的改变存在较大的个体差异[1]。Nagy等报道孕妇最舒适的步行速度显著性降低,亦存在较大的个体差异[2]。但Foti等认为这种变化并无统计学意义,并发现怀孕对步长或步周期长无显著性影响[1]。上述研究显示,孕妇的步态发生改变,但研究结果并不一致。大约25%患有妊娠相关骨盆痛的孕妇和5%产后患者需要就诊治疗,重症患者常常出现步行障碍[3]。对正常孕妇运动协调的研究可作为今后研究妊娠相关骨盆痛的步态运动的基础。笔者研究怀孕对步行时水平面上骨盆和胸廓运动协调的影响,以期有助于从生物力学的角度进一步了解妊娠相关骨盆痛患者的步态运动。

1对象与方法

1.1对象选取年龄20~45周岁的健康未孕妇女(对照组)和健康孕妇(孕妇组)作为观察对象。对照组13例,年龄中位数27岁(22~36岁),体质量中位数75kg(45~95kg),身高中位数172cm(157~190cm);孕妇组12例,年龄中位数32岁(30~38岁),体质量中位数76.5kg(67.5~89kg),身高中位数172cm(162~180cm)。

1.2方法

1.2.1仪器步行仪(BiostarGiant,荷兰AlmereBiometrico公司);三维运动捕捉系统(Optotrak,加拿大NDI公司)。

1.2.2方法受试者以不同速度在步行仪上行走。骨盆、胸廓和足部的运动由三维运动捕捉系统光学镜头拍摄记录。2组光学镜头位于受试者的身后。在受试者的胸背部第6胸椎棘突的位置和骶骨两髂后上棘之间各有一轻金属架,用尼龙束带将金属架固定其上,金属架上有3个可发红外光装置,构成一个刚体。为了捕获步行时足跟着地和足趾离地时的瞬间,在每侧足跟和第五跖趾关节处各安装一可发出红外线的装置。实验装置见图1[4]。实验开始时先让受试者在步行仪上行走3~5min,接着步行速度从0.17m/s每间隔1~2min增加0.11m/s,至1.72m/s。步行过程中,测试受试者最舒适步行速度和最大步行速度。每个速度下的数据采集共30s,抽样频率为100Hz。

图1测量步行时胸廓和骨盆运动的实验装置(略)

Fig1Experimentalsetupformeasuringthethoracicandpelvicmovementsduringwalking

1.2.3指标胸廓和骨盆的刚体在空间的运动代表各自的三维运动。设定刚体x、y、z轴的正方向为人体解剖位的前、上、左方位。通过计算xy象限上的反正切角度得出骨盆和胸廓在水平面上旋转角度的时序。骨盆和胸廓的旋转运动幅度(rotationalamplitude,RA)是从各自的运动时序上确定每一个步周期内最大与最小的角度差的绝对值。躯干的旋转运动时序是将骨盆运动时序与胸廓的运动时序相减而生成。在每一速度下对骨盆、胸廓和躯干的所有步周期的RA进行计算,取均值,分别确定为骨盆、胸廓和躯干的RA,并计算各自标准差

应用快速离散傅立叶变换计算公式计算出每个运动时序的连续傅立叶相的时序。骨盆和胸廓的傅立叶相差时序是由胸廓的傅立叶相时序与骨盆的傅立叶相时序相减而产生。运用圆周统计学计算出骨盆和胸廓运动的傅立叶相差(relativefourierphase,RFP)及其个体内标准差。若RFP为0,表示同相协调运动;若RFP为180°,则表示反相协调运动。

1.3统计学处理应用SPSS10.0软件,采用方差检验,P<0.05为差别有统计学意义。

2结果

2.1步行速度正常孕妇的最舒适步行速度中位数1.06m/s(0.72~1.28)m/s,对照组为1.17m/s(0.83~1.50)m/s,2组比较差别有统计学意义(P<0.05)。

2.2骨盆和胸廓RA及其个体内标准差骨盆RA先是随着步行速度的增加(0.94~1.06m/s)而逐渐减小,然后随着步行速度的增加而逐渐增加(图2A)。孕妇组和对照组骨盆RA分别为(9.1±福建医科大学学报2008年5月第42卷第3期吴文华等:正常孕妇步行时骨盆与胸廓水平面的旋转运动3.5)°和(7.7±3.2)°,其速度效应差别有统计学意义(P<0.05)。孕妇骨盆RA的个体内标准差较对照组减少(P<0.05),孕妇组和对照组的值分别为(1.3±0.4)°和(1.6±0.5)°(表1)。

图2对照组和孕妇组在不同步行速度下各部位的旋转运动幅度(略)

Fig2Rotationalamplitudesofthepelvis,thethoraxandthetrunkduringgaitatdifferentwalkingvelocitiesofthecontrolsubjectsandthehealthypregnantwomen

表1各变量的速度效应和组别效应(略)

Tab1Theeffectsofvelocityandgrouponthevariables(repeatedmeasuresANOVAs)

胸廓RA基本维持稳定而变化不大直至步行速度增至0.8m/s时,然后随着步行速度的递增而渐减少(图2B)。经方差检验,速度的效应差别有统计学意义(P<0.05)。孕妇胸廓RA的个体内标准差比对照组减少(P<0.05)。孕妇组和对照组的均值分别为1.2°和1.7°,其速度效应差别有统计学意义(P<0.05)。

躯干RA是随着行步速度的增加而递增的(图2C),孕妇的躯干RA较对照组约小1°,其速度效应有统计学意义(P<0.05),孕妇躯干RA的个体内标准差较对照组小(P<0.05),孕妇组和对照组的值分别为(0.7±0.3)°和(1.0±0.4)°,其速度效应有统计学意义(P<0.05)。在最舒适的步行速度下,孕妇骨盆和躯干RA较对照组小(P<0.05)。

2.3RFP及其个体内标准差

图3对照组和孕妇组在不同步行速度下的傅立叶相差及其个体内的标准差(略)

Fig3Relativefourierphaseanditsintraindividualstandarddeviationbetweentransversepelvicandthoracicrotationsatdifferentwalkingvelocitiesofthecontrolsubjectsandthehealthypregnantwomen

2组RFP均随着速度的增加而增加(图3A),呈一条S形曲线,在速度为0.83,1.17m/s的区域内最为陡峭。孕妇的RFP较对照组小7°。其步行速度效应有统计学的意义(P<0.05)。RFP的个体内的标准差与速度的关系有点不规则(图3B),随着速度的递增而增加,直至速度到达0.94~1.17m/s;接着是一个平台或稍有点下降,在最舒适的步行速度时,达到最高值。孕妇的RFP的个体内标准差较对照组小(P<0.05),其速度效应差别有统计学意义(P<0.05)。

孕妇的孕周数与RFP的个体内标准差相关系数为-0.68,差别有统计学意义(P<0.05)。在最舒适的步行速度下,孕妇的RFP及其个体内标准差均比对照组小(P<0.05)。

3讨论

3.1总体上孕妇的步态运动正常在2组中,速度对RA、骨盆胸廓RFP及其个体内的标准差的影响相似(图2~3),由此得出结论,孕妇的步态运动从总体上讲是正常的。怀孕和行走本身就具有高度的相容性,从进化学的角度而言,这并不难理解[5]。尽管如此,孕妇的最舒适的步行速度明显的下降,RA变小,尤其是在最舒适的速度下骨盆和躯干RA的减少具有显著性差异。他们的个体内标准差减少,具有统计学意义。骨盆和胸廓RFP变小,在最舒适的速度下具有显著性差异,其个体内标准差变小,在快速行走的速度下(≥1.06m/s),这种差别有统计学意义。孕周数与此个体内的标准差呈显著性负相关。孕妇必须适应怀孕的改变,比如体质量的增加。本研究揭示在孕妇身上发生了轻微但是连贯一致的运动学变化,这点与以往文献报道的有所不同[12]。

3.2孕妇骨盆胸廓旋转运动的RFP孕妇选择在低速下步行不能用节约能量的观点来解释,因为当步行速度低于(或高于)最舒适的速度时,须消耗更多的能量[5]。尽管如此,低速行走获得了更多时间来对微扰进行反应[6],这也许是孕妇由于额外的载荷或本体觉受干扰而选择低速行走的原因,目的是为了避免出现快速步行时的运动协调模式。

本研究表明,未怀孕妇女的最舒适步行速度出现在RFP的曲线上的平台起始段,而孕妇最舒适步行速度则是出现在曲线陡坡的半山腰处,此时2组间的RFP的差值为44°。当孕妇快速步行时,RFP值较高,但其变异性很小,这提示了对孕妇而言,完成大的RFP的步态是有困难的,这种现象同样发生在背着负荷的受试者、慢性下腰痛患者、妊娠相关骨盆痛产后的患者[4,78]。出现较小RFP的步态运动可以由许多种不同的限制性因素造成,妊娠便是其中之一。

比较骨盆、胸廓和躯干旋转运动的个体内标准差,他们的平均值分别为1.25°,1.29°和0.66°。如果骨盆和胸廓的旋转运动的控制是相互独立的话;而实际上,它的值小得多。因此,骨盆和胸廓的旋转运动似乎是同时受到控制的,虽然躯干的旋转运动在快速行走的协调方面不是一个“必须的变量”[9],因为躯干的旋转缺乏时间维。显然,RFP是和时间变量有关,它也许是快速步行时的必须变量,以确保快速行走时骨盆的旋转运动必须被胸廓的反向旋转运动所平衡[10]。就孕妇的步态而言,快速行走时骨盆和胸廓的惯性冲量将会增加,这也许是孕妇无法实现大的RFP步态运动的原因。

3.3孕妇步态运动的变异性自从Bernstein引入了“探索变异性”以来,对运动的变异性研究渐渐兴起。运动的变异性常常被认为是具有功能性,才有可能有灵活性、适应性;然而变异性会消耗能量及增加损伤的可能性,因此变异性的功能性必须看是针对何种情形而言[1114]。

一个较为奇怪的现象是骨盆与胸廓间的RFP的个体内的变异的最大值在非常靠近最舒适步行速度的地方出现。Masani等人发现地面作用力的变异在最舒适步行速度时最小[15],也许在最舒适的速度下,身体重心的垂直运动是必须的变量,而在水平面上的骨盆和胸廓间的RFP在快速步行时则变成是必须的变量。撇开RFP的变异性是如何发挥作用的,在怀孕期间,尤其在怀孕晚期,RFP的变异性是如何在最舒适步行速度下增加并且在快速行走时减少有待于进一步研究。

笔者认为,正常孕妇的步态运动学特征与未怀孕的妇女相似。尽管如此,2组间存在着许多细微的差别。孕妇的最舒适步行速度较对照组显著性下降。骨盆、胸廓和躯干的RA较对照组小。他们的个体内的标准差则较对照组低。在最舒适步行速度下,骨盆和躯干的RA较对照组小。孕妇组的RFP较对照组小,在速度≥1.06m/s,个体内的标准差呈显著性减少,尤其是在怀孕晚期表现更为明显。

【参考文献】

[1]FotiT,DavidsJR,BagleyA.Abiomechanicalanalysisofgaitduringpregnancy[J].JBoneJointSurgAm,2000,82(5):625632.

[2]NagyLE,KingJC.Energyexpenditureofpregnantwomenatrestorwalkingselfpaced[J].AmJClinNutr,1983,38(3):369376.

[3]WuWH,MeijerOG,UegakiK,etal.Pregnancyrelatedpelvicgirdlepain(PPP),I:Terminology,clinicalpresentation,andprevalence[J].EurSpineJ,2004,13(7):575589.

[4]WuW,MeijerOG,JuttePC,etal.Gaitinpatientswithpregnancyrelatedpaininthepelvis:Anemphasisonthecoordinationoftransversepelvicandthoracicrotations[J].ClinBiomech,2002,17(910):678686.

[5]McNeillAlexanderR.Energeticsandoptimizationofhumanwalkingandrunning:the2000RaymondPearlmemoriallecture[J].AmJHumanBiol,2002,14(5):641648.

[6]MakiBE,McIlroyWE.Theroleoflimbmovementsinmaintaininguprightstance:the"changeinsupport"strategy[J].PhysTher,1997,77(5):488507.

[7]LaFiandraM,WagenaarRC,HoltKG,etal.Howdoloadcarriageandwalkingspeedinfluencetrunkcoordinationandstrideparameters[J].JBiomech,2003,36(1):8795.

[8]LamothCJ,MeijerOG,WuismanPI,etal.Pelvisthoraxcoordinationinthetransverseplaneduringwalkinginpersonswithnonspecificlowbackpain[J].Spine,2002,27(4):E9299.

[9]Gel''''fandIM,TsetlinML.Theprincipleofnonlocalsearchinautomaticoptimizationsystems[J].SovietPhysicsDoklady,1961,6(3):192194.

[10]LamothCJ,BeekPJ,MeijerOG.Pelvisthoraxcoordinationinthetransverseplaneduringgait[J].GaitPosture,2002,16(2):101114.

[11]BongaardtR,MeijerOG.Bernstein''''stheoryofmovementbehavior:historicaldevelopmentandcontemporaryrelevance[J].JMotBehav,2000,32(1):5771.

[12]HeiderscheitBC.Movementvariabilityasaclinicalmeasureforlocomotion[J].JApplBiomech,2000,16:419427.

篇2

股市技术分析方法概述

股市的分析通常包括基本面分析和技术分析方法。股市基本面分析是从国家的政策和公司的发展等角度对股市运行的趋势进行预测。投资者通过深入分析这些基本面信息能有效的把握股市的长期趋势并选择相应的股票买入和卖出。股市技术分析则是以股票价格作为主要研究对象,以预测股价波动趋势为主要目的,通过数学中的统计学理论计算和分析相应的股市评测指标并通过这些指标及其相应的图表对股市及其单个的股票价格趋势进行预测的方法。投资者通过对股市进行深入的技术分析能较有效的确定股市的趋势以及买入和卖出股票的时间。股市技术分析的重点是分析股票的价格、成交量、时间以及股票价格波动的幅度。 股市技术分析中最经典的方法是道氏理论、江恩理论和波浪理论。

道氏理论最初由美国人查尔斯・道提出,通过实践的检验它成为预测市场趋势的晴雨表,同时成为股市技术分析方法的开创者。道氏理论是一种技术理论,它是根据价格模式的研究,推测未来价格行为的一种方法。道氏理论认为股票会随市场的趋势同向变化以反映市场趋势和状况。股票的变化表现为三种趋势:主要趋势、中期趋势及短期趋势[1]。由于其对股市运用趋势良好的把握,因此,今天道氏理论仍然运用在股市分析中。道氏理论由于认为对数据的统计与前期数据存在较大的偏差才能对趋势的变化进行确定,因而其预测的结果存在滞后性。

江恩理论最初由投资大师威廉・江恩提出,它通过对数学、几何学、宗教、天文学的综合运用,建立起独特分析方法和测市理论并结合其在股票和期货市场上的骄人成绩和宝贵经验总结而来。江恩理论主要包括江恩时间法则,江恩价格法则和江恩线等。江恩理论认为股票、期货市场里也存在着宇宙中的自然规则,市场的价格运行趋势不是杂乱的,而是可通过数学方法预测的。它的实质就是在看似无序的市场中建立严格的交易秩序,并以此来发现何时价格会发生回调和将回调到什么价位[2]。

美国证券分析家拉尔夫・.纳尔逊・.艾略特通过对股市指标描述的技术图形的分析发现股市存在13种形态和波浪,并认为其在股市上会重复出现,以此为依据通过技术图形中波浪数量和结构的研究实现对股市运行趋势的预测。他认为股市运行的过程呈现一种周期性的变化,每一周期包含5个上升浪和3个下跌浪。艾略特波浪理论认为股市运行的周期有长短之分,长的达到上百年,短的仅仅以小时计,同时其将股市运行的周期按时间长短分为九大类,九大类结构中不论周期的长短每一周期均由8个波浪构成。

目前的股市技术分析方法被大多数投资者采用,成为买入和卖出股票的重要参考依据。但一旦大多数投资者都采用这些相同的方法时,结果往往适得其反。并且机构投资者往往通过这些技术分析方法逆向操作,迷惑和欺骗投资者。因此,如果避开这些传统的方法分析股市的趋势效果往往更好。

标准差

标准差是整个测量数据标准值与其平均数离差平方的算术平均数的平方根。它反映的是测量的数据中偏离平均值的个体多少的离散程度。标准差越大说明数据偏离平均值越多。标准差越大也可以认为数据越不稳定。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接均值。

基于标准差的股市趋势分析

标准差表示的是数据集中的个体偏离标准差的多少,标准差越大说明偏离平均值的数据越多。当股市发生趋势性变化时,将有越来越多的指标所代表的数据偏离原来数据集合的平均值,因此,采用标准差能对股市趋势进行预测。在采用标准差预测股市趋势前有两个问题要解决。首先,股市每一天的指标数据对预测股市的贡献是不一样的,越是近期的指标数据越能代表当时股市的趋势。其次,指标数据尤其是股票的价格包括每天的最高价,最低价,开盘价和收盘价庄家是可以操纵的,如果直接拿来分析结果往往会存在较大的误差。与股价相比成交量往往更接近真实的情况,因此要结合成交量来分析股价。第一个问题可以对指标数据施以权重来解决,根据指标数据不同的时间给予不同的权重,越是近期的数据权重越大,从而能对趋势的预测有指引作用。股市中的各种价格常常带有欺骗性,因此可以把成交量作为权重计算一个带有权重的价格,为更加真实的反映实际情况,每天成交量的计算时间不可太长,如可取10分钟,15分钟,30分钟等。

采用标准差的股市趋势分析方法具体步骤如下:

(1)设10分钟内的某股票成交的最高价为 ,成交的最低价为 ,则认为这10分钟内股票的价格为 。

设这1 0分钟内的该股票成交量 为,则这10分钟内该股票的价格为

(2)设该股票全天成交量为M,以10分钟为一个时间段全天的交易分为p个时间段,该股票全天的价格为 ,则

(3)对N天的股票价格进行分析,设每天股票价格的权重为 ,越是近期的价格权重的值越大,N天的股票平均价格为μ,则该股票的标准差为σ

(4)对股市中股票的标准差进行分析,确定标准差σ的阈值,当标准差σ超过阈值时可确定股票的趋势正发生变化。

实验分析

为确定本方法的有效性,本文采用了深万科股票作为研究对象,时间区间为2015年11月至2016年8月,下图1为深万科的股价走势,图2为万科股票日标准差。

篇3

0 引言

高等学校英语应用能力考试是高职高专公共英语唯一的全国性考试,其前身是普通高等专科英语考试,是国家为检测和提高普通高等专科英语课程教学质量而建立的,1997年开始试运行,1998年正式投入使用,距今已有16年。高等学校英语应用能力考试现已被高职院校普遍采用作为评价师生教学效果的手段。考试的结果通常以考试成绩暨分数体现。在高职公共英语课程教学研究中,对考试成绩进行统计分析已有涉及,但更多的也只涉及到某一方面,如求出平均分。这些分析不能准确全面的反映学生的考试情况,也就不能公正对师生的教学效果进行评价,这就需要我们对考试成绩科学的统计分析。本文将使用统计学中的集中量数、差异量数及标准分对我校学生高等学校英语应用能力考试测试成绩进行统计分析,以期通过学生的测试成绩来全面科学的了解测试结果,给教师的教学效果和学生的学习效果做出公正的评价。

1 集中量数

集中量数是代表一组数据典型水平或集中趋势的量(王孝玲,2001)。它主要有两个作用:第一,它是一组数据的代表值,用来表示这组数据的典型情况。第二,组间的集中量数是可以比较的,通过比较可以判断组间数据的差别。集中量数主要三种形式,它们分别是平均数、中数和众数。平均数是教师对考试成绩普遍采用的一种统计分析方法。平均数最严密也最易于理解,因此应用也最广。但平均数存在着很多的不足,比如:平均数的典型性容易受极端数据的影响。如果一个班的分数之间差距很大,有的分数很高有的分数很低,这种情况下算出的平均数就不具有典型性。基于此,我们需要采用其它的统计方法,这就是中数和众数。中数又名中位数,是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。众数是一组数据中出现次数最多的数。通过平均数、中数和众数的三者结合,可以为我们的考试成绩提供更全面的信息。

表1

从表1我们可以看出供电1和供电2两个班的高等学校英语应用能力考试成绩平均分都是73。如果仅从平均分这个角度来比较两个班的考试成绩,我们就会得出两个班的考试成绩的集中趋势的量是一样的。但我们通过统计分析发现供电1和供电2考试成绩的中数和众数是不一样的。之前我们讲了,平均数是容易受极端数据的影响,但是中数是不会受到极端数据的影响。从表1我们可以看出供电1有两位学生的考试成绩低于45,属于极端数据,所以此组的集中趋势的量应该用中数来表示即76,供电2组的集中趋势的量可以用平均数来表示即73。

相对而言,平均数、中数和众数是三个较为常见的集中量数,都能在一定程度上反映数据的集中趋势,所以具有内在的关联性。当平均数、中数和众数三者相等时,这组数据即成正态分布,数据的次数分布图就会完全对称,三个数数轴上重合为一点。当平均数、中数和众数三者不相等时,具体地说,当平均数>中数>众数,叫作正偏态。当考试成绩出现正偏态时,说明试题太难。当平均数

2 差异量数

描述一组数据的特征仅用集中量数是不够的。我们在研究一组数据的特征时,不但要了解其典型的情况,而且还要了解特殊情况(韩宝成,2000)。例如在比较同一个年级的几个教学班高等学校英语应用能力考试成绩时,只比较集中量数是不够的,还要对它们的分散程度进行比较。在统计学中,我们用差异量数来描述数据分散程度。常用的差异量数包括标准差和全距。标准差是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的分散程度。标准差的公式如下:

σ=■

表2

从表2中我们可以看出这10个班的高等学校英语应用能力考试成绩平均分比较接近。特别是应电1和供电2,应电2和计算1。它们的平均分依次差0.01、0.18。从平分来看应电1和供电2不分伯仲,应电2要比计算1要稍微好点。但从标准差来看供电2的分散程度要比应电1的小,说明供电2的考试成绩相对集中,故供电2的成绩要比应电1的成绩好。从全距来看,应电1的全距是49,而供电2的全距是36,这也说明供电2的考试成绩相对集中。应电2和计算1的情况也类似。

平均数在一组数据中典型性程度高低也取决于这组数据的标准差和全距,如果标准差和全距小,说平均数的典型性程度高,反之则小。

3 标准分

考生在考试后,按照评分标准对其作答反应直接评出来的分数,叫原始分。原始分反映 了考生答对题目的个数,或作答正确的程度。但是,原始分一般不能直接反映出考生间差异 状况,不能刻划出考生相互比较后所处的地位。标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。标准分是以标准差为单位来表示某一分数与平均数的差。标准分的公式是Z=(X-X_bar)/S,式中X为原始分数,X_bar为原始分的平均数,S为原始分的标准差。

表3

将原始分转换成标准分之后,我们就可以很直观的看出某个学生的考试成绩在整个班级中所处的位置。

把原始分转换成标准分之后,标准分成了一个抽象的数据,不受原测量单位的影响(李跃平,2003)。这样我们就可以将某个学生在不同时间参加的考试进比较,不同科目之间的成绩也可以用来进行比较,这是原始分所不能的。

4 结束语

通过把学生的高等学校英语应用能力考试成绩进行统计分析,算出反映数据集中趋势的集中量数、反映数据分散程度的差异量数以及标准分,才能是考试成绩客观全面的反映师生的教学情况,帮助师生改进教学,实现既定教学目标。

【参考文献】

篇4

[中图分类号]O 212 [文献标识码]A [文章编号]1005-6432(2013)10-0023-011

1 引 言

在科学实验中,测量可分为常量测量和变量测量两大类。物理量的变化量远小于测量仪器误差范围的测量称为常量测量(又称经典测量、基础测量),其核心理论是误差理论[1-3],误差理论的基本单元是误差元(测量值减真值)。测量仪器误差范围远小于物理量的变化量的测量称为变量测量(又称统计测量),其核心理论是数理统计理论(概率论是其理论基础),数理统计理论的基本单元是偏差元(又称离差元,测量值减数学期望)。标准差(standard deviation,又称标准偏差、均方差,其英文缩写词为SD,此术语1893年由卡尔·皮尔逊首创)是用来衡量一组测量数据的离散程度的统计量,它反映了随机变量的取值与其数学期望的偏离程度。经典测量学只能处理常量测量问题,而当今频域界的频率稳定度测量(常用阿伦方差表示)则属于变量测量。

等精度测量(equally accurate measurement)是指在测量条件(包括测量仪器的准确度、观测者的技术水平、环境条件影响及测量方法等)不变的情况下,对某一被测物理量所进行多次测量的一种方法。在实际测量工作中,由相同设备、相同人员、相同环境和相同方法所获得的各测量值可视为是等精度测量值。文献[4]介绍了流量计量中的计量学基本原则——等精度传递理论。

在测量实践中,有时为了获得准确度更高的测量结果,往往要求在不同的测量环境条件下,使用不同的测量仪器,选用不同的测量者和不同的测量次数,采用不同的测量方法进行对比测量,这种测量方法称为不等精度测量(unequally accurate measurement)。不等精度测量的不确定度应采用加权方式计算[5-6]。

若无特别说明,本文中所涉及的测量均指等精度测量。

2 误差的种类和应用

误差公理认为误差自始至终存在于一切科学实验和测量之中,是不可避免的,即误差无处不在,真值是不可知的。在实际应用工作中,可用约定真值或相对真值来代替理论概念中的理想真值。约定真值一般包括约定值、指定值和最佳估计值三种类型。

测量误差最基本的表示方法有如下三种:①绝对误差=测量值-真值,绝对误差通常简称为误差(即真误差);②相对误差=绝对误差/真值≈绝对误差/测量值;③引用误差=示值误差/测量范围上限(或全量程)。残差(又称剩余误差)=测量值-估计值,残差可认为是真误差的估计值。绝对误差和相对误差通常用于单值点测量误差的表示,而对于具有连续刻度和多档量程的测量仪器的误差则通常采用引用误差来表示。

按误差的特点和性质可将其分为粗大误差(parasitic error)、系统误差(systematic error)和随机误差(random error)三大类。可消除的粗大误差(又称过失误差,没有规律可循)应予全部剔除,系统误差(又称规律误差、理论误差或方法误差,一个定值或服从函数规律)反映测量的正确度(correctness),随机误差(旧称偶然误差、不定误差,服从统计规律,大多数服从正态分布规律)反映测量的精密度(precision),测量的准确度(accuracy,又译为精确度)则是用综合误差(即测量不确定度)来衡量的,有时也用极限误差来衡量测量的准确度。逐项获得测量的系统误差和随机误差,采用误差合成的方法(各系统误差绝对值相加得系统误差范围,各随机误差均方根合成则得随机误差范围。系统误差范围加随机误差范围可得综合误差范围)合成综合误差,它表征了测量结果与真值的不一致程度。

泛指性的“精度”一词常被用作“精确度(即准确度)”或“精密度”的替代词,因其并无明确和严格的科学定义,故在学术论文中应慎用或弃用。

下面简要介绍一下随机误差所遵循的一些基本统计规律,首先需要介绍中心极限定理:

当测量次数n无限增大时,在真误差序列中,若比某真误差绝对值大的误差和比其绝对值小的误差出现的概率相等,则称该真误差为或然误差(probable error,又称概率误差,它在衡量射击精密度时尤其显得重要),记作ρ。

作为精密度的评定指标,中误差最为常用,因为它反映了真误差分布的离散程度。

通常以2倍或3倍的中误差作为随机误差的极限误差(limit error),其置信概率分别是9544%(2σ准则)和9973%(3σ准则)。如果某个误差超过了极限误差,就可以认为它是粗大误差而被剔除,其相应的测量值应舍弃不用。

对于某个测量值,通常采用相对中误差(即中误差和测量值之比,又称相对标准差)配合中误差来衡量,它能更全面地表达测量值的好坏。

英国物理学家、化学家和数学家瑞利勋爵(Lord Rayleigh,1842—1919)以严谨、广博和精深而著称,他善于利用简单的设备做实验而能获得十分精确的数据。他因对气体密度的精确研究并因此参与发现稀有气体(旧称惰性气体)氩而荣获1904年诺贝尔物理学奖。1892年瑞利在研究氮气时发现[7]:从液态空气中分馏出来的氮,其密度为12572 kg/m3,而用化学方法直接从亚硝酸铵中得到的氮,其密度则为12508 kg/m3(现在的最权威数据125046 kg/m3是基于0 ℃和01 MPa时),前者比后者大05117%,因实验中已排除了粗大误差的可能,这一差异已远远超出随机误差的正常范围(现在通过t检验准则可以判定当时瑞利测得的空气中氮的密度数据是存在系统误差的)。英国物理化学家和放射化学家拉姆赛(Sir William Ramsay,1852—1916,1904年诺贝尔化学奖获得者)注意到这个问题并要求与瑞利合作对此问题展开共同研究,最终他们利用光谱分析法于1894年8月13日发现了第一种稀有气体─氩(Ar)。氩元素的发现是科学家们注意测量结果中的微小误差(实际上是系统误差)而取得重大科学发现的经典范例,是名副其实的“第三位小数”的胜利[8]。随后,其他稀有气体氦(He,1895年3月)、氪(Kr,1898年5月)、氖(Ne,1898年6月)、氙(Xe,1898年7月)、氡(Rn,1899年,继钋Po、镭Ra和锕Ac之后第4个被发现的天然放射性元素)陆续被拉姆赛等人所发现,稀有气体的发现完善和发展了俄国化学家门捷列夫(1834—1907)的元素周期表(1869年)。

3 统计量的概率分布类型

离散型统计量服从的概率分布类型主要有:①退化分布(又称单点分布);②伯努利(瑞士数学家,Jocob Bernoulli,1654—1705)分布(又称两点分布);③二项分布:包括超几何分布(又衍生出负超几何分布)、β-二项分布和离散均匀分布;④泊松分布:包括帕斯卡(法国数学家和物理学家,Blaise Pascal,1623—1662)分布(又称负二项分布)和几何分布;⑤对数分布等。

随机误差大多服从正态分布或标准正态分布,服从正态分布的随机误差具有单峰性、对称性、有界性和抵偿性。正态分布是随机误差遵循的最普遍的一种分布规律,但不是唯一的分布规律。随机误差服从的常见非正态分布(又称偏态分布)主要有:①均匀分布(又称矩形分布、等概率分布);②伽马分布(Γ-分布):包括指数分布(两个相互独立且都服从指数分布的随机变量之和服从广义指数分布)、厄兰(丹麦数学家和统计学家,Agner Krarup Erlang,1878—1929)分布和τ-分布(χ2-分布是其特例)等特例;③χ-分布:包括反射正态分布、瑞利分布和麦克斯韦(英国物理学家和数学家,James Clerk Maxwell,1831—1879)分布等特例,广义瑞利分布又称莱斯(美国通信理论专家,Stephen " Steve" Oswald Rice,1907—1986)分布(Rice distribution or Rician distribution),当v=0时莱斯分布退化为瑞利分布;④贝塔分布(B-分布);⑤F-分布:1934年美国数学家和统计学家斯内德克(George Waddel Snedecor,1881—1974)首创,为彰显英国统计学家和遗传学家费歇尔(Sir Ronald Aylmer Fisher,1890—1962,方差分析的发明者)的贡献,后来以其名字命名;⑥t-分布(又称学生氏分布):1908年由英格兰统计学家戈塞特(William Sealy Gosset,1876—1937)首创,因他以Student为笔名而得名;⑦对数正态分布;⑧极值分布:包括重指数分布和威布尔(瑞典数学家,Ernst Hjalmar Waloddi Weibull,1887—1979)─格涅坚科分布(参见本文第73节“极差法”)等;⑨柯西(法国数学家,Augustin Louis Cauchy,1789—1857)分布;⑩辛普森(英国数学家,Tomas Simpson,1710—1761)分布(又称三角形分布)等。此外还有反正弦分布、截尾正态分布、双峰正态分布、梯形分布、直角分布、椭圆分布和双三角分布等。多维概率分布则主要有:①多项分布;②均匀分布;③n(n≥2)维正态分布等。

因彼得斯公式法、极差法、最大误差法、最大残差法和最大方差法均只给出了正态分布下的标准差估计的系数因子,故它们一般不适用于非正态分布时的情形。

4 统计推断

统计推断是指根据随机性的观测数据(样本)以及问题的条件和假设(模型),对未知事物作出的、以概率形式表述的推断。统计推断是由样本的信息来推测总体(又称母体)性能的一种方法,它是数理统计学的主要任务,其理论和方法构成数理统计学的主要内容。统计推断分为参数估计和假设检验两大类问题。参数估计是假设检验的前提,没有参数估计,也就无法完成假设检验。

41 参数估计

运用从总体独立抽取的随机样本对总体分布中的未知参数做出估计,称为数理统计学上的参数估计,它是统计推断的一种基本方法。参数估计方法主要分为点估计法(根据样本构造一个统计量,用以对总体参数进行估计)和区间估计法(又称范围估计法,主要是根据置信度求置信区间)两大类。点估计构造统计量(估计量)的常用方法有:①顺序统计量法(又称次序统计量法):主要包括最大顺序统计量法和最小顺序统计量法两种。②贝叶斯法(又称贝叶斯公式、逆概率公式、事后概率公式或原因概率公式):1763年英国统计学家贝叶斯(Thomas Bayes,1702—1761)在其遗作《论有关机遇问题的求解》一文中首先提出。③最小二乘估计法(又称最小平方估计法):它可使残差的平方和为最小,1795年德国数学家、天文学家和物理学家高斯(Johann Carl Friedrich Gauss,1777—1855)首先提出其方法,1806年法国数学家勒让德(Adrien-Marie Legendre,1752—1833)首先用公式表示出最小二乘原理,1900年由俄国数学家马尔科夫(Andrey Andreyevich Markov,1856—1922)加以发展。④矩估计法(又称矩法估计、数字特征法):以样本矩的某一函数代替总体矩的同一函数来构造估计量的方法称为矩估计法,1894年英国数学家和统计学家卡尔·皮尔逊(Karl Pearson,1857—1936,被誉为“现代统计学之父”)首先提出。一个样本可确定一个经验分布函数,由这个经验分布函数可确定样本的各阶矩。称统计量S=1nni=1Xi为子样一阶原点矩(简称一阶矩,即子样均值);称统计量Sk=1nni=1Xki为子样k阶矩;称统计量S=1nni=1(Xi-)2为子样二阶中心矩(即子样方差);称统计量Sk=1nni=1(Xi-)k为子样k阶中心矩。⑤最小χ2法:χ2检验由卡尔·皮尔逊于1900年首先提出,故χ2统计量又称皮尔逊公式。⑥最大似然估计法(maximum likelihood estimation method,又称极大似然估计法):一种重要而普遍的统计量估计方法,其基本思想始于1821年高斯提出的误差理论,1912—1922年英国统计学家和遗传学家费歇尔首先将其应用于参数估计并证明了它的一些性质[9-10],其后他在工作中加以发展并使其臻于完善[11]。该估计方法在统计推断中无须有关事前概率的信息,克服了贝叶斯法(Bayes estimation method)的致命弱点,是统计学史上的一大突破。标准差σ的最大似然估计值是=1nni=1(xi-)2=1nni=1v2i, 其中=1nni=1xi。与最大似然估计法相类似的统计估计方法还有极小极大后验估计法、最小风险法和极小化极大熵法等。

常用于衡量点估计法是否优良的五大准则是:无偏性[12]、有效性、一致性(又称相合性)[13]、渐近性和充分性。无偏估计和一致估计(又称相合估计、相容估计)都属于优良点估计法。衡量区间估计法的优良准则有一致最精确准则、一致最精确无偏性准则和平均长度最短准则等。如果把参数估计用于统计决策,还可采用统计决策理论中的优良准则(如容许性准则、最小化最大准则、贝叶斯准则和最优同变性准则等)。

标准差的现代统计估计方法通常可将其归纳为一般估计方法和稳健估计(robust estimation,又称抗差估计)方法两大类[14]。一般估计方法(均属标准不确定度分量的A类评定方法)主要包括贝塞尔公式法、彼得斯公式法、极差法、最大误差法、最大残差法、较差法和最大方差法等,其中贝塞尔公式法最为常用,极差法、彼得斯公式法和最大残差法次之,最大误差法特别适用于比较特殊的场合(如一次性破坏实验等),较差法和最大方差法的应用场合则相对较少。稳健估计方法基本上可分为三类:M估计(经典最大似然估计法的推广,称为广义最大似然估计法)、L估计(即顺序统计量线性组合估计)和R估计(即秩估计,来源于秩统计检验)。

估计量的数学期望等于被估计参数,则称其为无偏估计,否则就是有偏估计。无偏估计的系统误差为零,其误差用随机误差来衡量;有偏估计的误差则用系统误差和随机误差的合成(即综合误差)来衡量。如今,随着计算机的日益普及和各类数学统计软件(包括专用数学统计软件,如SPSS、SAS和BMDP等)的广泛应用,数据计算繁琐一些已无技术障碍可言。实验测量数据的获得都要付出一定的人力、物力和财力,追求其准确可靠才是其最高目标,因此有偏估计的系统误差应尽可能地予以剔除。对于无偏估计来说,其统计量的方差越小则越好(表示其精密度和有效性越高)。

42 假设检验

假设检验(又称显著性经验、统计检验)一般分为参数检验(适用于总体分布形式已知的情形)和总体分布类型检验(又称分布拟合检验)两大类。参数检验方法主要有u检验法(又称z检验法,即正态分布检验法)、t检验法、χ2检验法(又称皮尔逊检验法)和F检验法(又称费歇尔检验法)等;总体分布类型检验方法主要有概率纸法(包括正态概率纸、对数正态概率纸、威布尔概率纸和二项概率纸等)和χ2检验法(适用于任意分布)等。在正态性检验法中,以夏皮罗(美国统计学家,Samuel Sanford Shapiro,1930—)─威尔克(加拿大统计学家,Martin Bradbury Wilk,19221218—)检验法(1965年,又称W检验,适用于样本数n≤50时的情形)[15]、达戈斯提诺(美国生物统计学家,Ralph BDAgostino, Jr,19290331—20010818)检验法(1971年,又称D检验,一种比较精确的正态检验法)[16]和夏皮罗─弗朗西亚(Shapiro-Francia)检验法(1972年,又称W′检验,适用于样本数50 两个样本是否来自于同分布总体的假设检验方法主要有符号检验法和秩和检验法等。

当未知总体标准差σ时,判别粗大误差的准则(即异常数据取舍的检验方法)主要有:①格拉布斯准则:1950年由美国统计学家格拉布斯(Frank Ephraim Grubbs,1913—2000)首创[18],并于1969年加以发展[19];②狄克逊准则(又称Q检验准则):1950年由美国统计学家狄克逊(Wilfred Joseph Dixon,1915—2008)首创[20],并于1951年和1953年加以改进[21-23];③偏度─峰度检验准则:偏度检验法适用于单侧情形,峰度检验法则适用于双侧情形[24];④罗曼诺夫斯基准则(又称t检验准则、3S检验准则):前苏联数理统计学家、塔什干数学学派创始人罗曼诺夫斯基(Vsevelod Ivanovich Romanovsky,1879—1954)首创,其检验效果最好[25];⑤3σ准则:仅早期采用,只适用于大样本数时的情形,因其理论上欠严谨且样本数n

估计标准差s=1n-2ni=1(y-)2主要应用于回归分析和假设检验中[34]。

5 测量不确定度

测量不确定度(measurement uncertainty,简称不确定度)是测量结果带有的一个非负参数,用以表征合理地赋予被测量值的分散性。它是说明测量水平的主要指标,是表示测量质量的重要依据。不确定度越小,测量结果的质量就越高,使用价值就越大。“不确定度”一词起源于1927年德国理论物理学家和哲学家海森堡(Werner Karl Heisenberg,1901—1976,1932年度诺贝尔物理学奖获得者)在量子力学中提出的不确定度关系,即著名的测不准原理(uncertainty principle)。自国际计量委员会CIPM(法文Comité International des Poids et Mesures)授权国际计量局BIPM(法文Bureau International des Poids et Mesures)于1980年10月提出《实验不确定度表示建议书INC-1》(1992年被纳入国际标准ISO 10012,1997年和2003年分别予以修订,中国国家标准GB/T 19022—2003等同采用ISO 10012 ∶ 2003[35])以后,经过30多年的研究和发展,现代不确定度理论现已形成较为完整的理论体系。

根据2008年版《测量不确定度表示指南》(GUM=Guide to the Expression of Uncertainty in Measurement)中的规定:不确定度可以用测量结果的标准差(即标准不确定度,它具有可传播性。当一个测量结果用于下一个测量时,其不确定度可作为下一个测量结果不确定度的分量,这就是不确定度的可传播性)表示,也可以用标准差的倍数或说明其置信水平区间的半宽度(即扩展不确定度expanded uncertainty,曾译为延伸不确定度、伸展不确定度)表示。无论采用哪种方法,都需要获得标准差的数值。

不确定度一般由若干分量组成,其中一些分量可根据一系列测量值的统计分布,按不确定度的A类评定方法进行评定(标准不确定度基于统计方法所进行的评定称为A类评定,又称统计不确定度),并用实验标准差(即有限次测量时总体标准差的估计值,又称样本标准差、子样标准差,主要应用于抽样推断和假设检验中)和自由度表征(必要时应给出其协方差)。而另一些分量则可根据经验或其他信息假设的概率分布,按不确定度的B类评定方法进行评定[标准不确定度基于非统计方法(技术规范、实践经验和科学知识等)所进行的评定称为B类评定,又称非统计不确定度],也用实验标准差表征(必要时应给出其协方差),一般情况下可以不给出其自由度。

贝塞尔公式法和极差法是两种主要的标准不确定度分量的A类评定方法[36-43],其中文献[39]给出的结论是:①当A类评定不确定度分量不是合成标准不确定度中唯一占优势的分量时,则无论测量次数多少(笔者注:因合成时采用方差相加的方法),(修正前)贝塞尔公式法优于极差法。②当A类评定不确定度分量是合成标准不确定度中唯一占优势的分量时,则两种方法的优劣与测量次数有关:当测量次数n10”则更为准确),(修正前)贝塞尔公式法优于极差法。

标准不确定度分量的B类评定方法主要有倍数法、正态分布法、均匀分布法(修约误差、修约前的被修约值、数字仪表的量化误差等均服从此类分布)、反正弦分布法、二点分布法、梯形分布法、三角分布法和投影分布法等[44-46],它更多的是依赖于经验的积累和判断。B类评定方法常应用于计量基准标准、仪器研制和在无法对比测量的情况下。

不确定度报告应该包括测量模型、估计值、测量模型中与各个量相关联的测量不确定度、协方差、所用的概率密度函数的类型、自由度、测量不确定度的评定类型和包含因子等。

在实际应用工作中,有效数字的正确取位十分重要,但这个问题却往往被忽视。测量结果总是以数字形式出现的,而能准确反映测量结果的是其有效数字。有效数字的末位数总是由下一位数进位或舍去而得来的,这就是数字修约。有效数字的定义是:一个数的修约误差不大于其末位数的半个单位,则该数的左边第一个非零数字起至右边最末一位数字都是其有效数字。不确定度的有效数字只能取1位或2位[47-49]。

6 自由度

自由度(degrees of freedom)的定义是:在方差的计算中,和的项数减去对和的限制数[36,50]。自由度反映了实验标准差的可信赖程度,自由度越大,实验标准差的可信赖程度就越高。由于不确定度是用标准差来表征的,故自由度可用于衡量不确定度评定的质量,它也是计算扩展不确定度的依据。当对标准差σ取A类评定的标准不确定度s的值时,不确定度的自由度计算公式为[46]:

式(6-1)是自由度估计值的计算公式(此估计值与理论值相比偏小,随着样本数n的增大,其估计值越来越接近于理论实际值),其中D(X)/E(X)为统计量X的相对标准差,u(x)为被测量x的标准不确定度,u[u(x)]为标准不确定度u(x)的标准不确定度。显然,自由度与标准不确定度的相对标准不确定度有关,即自由度与不确定度的不确定度有关,或者说自由度是一种二阶不确定度。

不确定度是测量结果的一个参数,而自由度则是不确定度的一个参数,它表征了所给不确定度的可信赖程度。算术平均值标准差的自由度和单次测量标准差的自由度是相同的。

自由度具有尺度变换下的不变性(即随机变量乘以非零常数,其自由度不变)。对于合并样本标准差,其自由度为各组自由度之和,即v=m(n-1)。当用测量所得的n组数据按最小二乘法拟合的校准曲线确定t个被测量值时,其自由度v=n-t;若t个被测量值之间另有r个约束条件,则其自由度v=n-t-r。

各种估计总体标准差方法的自由度如下表所示。

每个不确定度都对应着一个自由度,按A类评定的标准不确定度分量的自由度就是实验标准差的自由度。合成标准不确定度uc(y)的自由度称为有效自由度veff,它说明了评定uc(y)的可信赖程度,veff越大,表示评定的uc(y)越可信赖。一般情况下,按B类评定的标准不确定度分量可以不给出其自由度。但在以下情况时需要计算有效自由度veff:①当需要评定扩展不确定度Up为求得包含因子kp时;②当用户为了解所评定的不确定度的可信赖程度而提出此要求时。

7 标准不确定度的A类评定方法

标准差是评定测量结果精密度的一个极其重要的参数,关于各种估计总体标准差统计方法的精密度分析,前人已多有研究[52-56],但都缺乏深度和广度,其系统性和准确性也不够(有时甚至出现一些差错和遗漏,详见下文中的相关描述)。下面笔者将详细阐述各种估计总体标准差统计方法的由来和原理,严谨推导出其标准差系数的计算公式,力图以科学、严谨和求实的态度,分别对其系统地做出全面而准确的评介、对比和分析。

71 贝塞尔公式法

贝塞尔公式法(Bessel formula method)[57-63]是一种最为常见的估计总体标准差的统计方法。根据nj, k=1j≠kδjδk=0来推导贝塞尔公式长期以来被一些学者所认同,现已证明其为伪证[64-65]。笔者现根据误差理论、概率论和数理统计学中的基础知识,从误差和标准差的本质和作用入手,利用数学期望和方差公式,采用算术平均值的标准差来推导出贝塞尔公式。

n次测量值的算术平均值为:=1nni=1xi

算术平均值是μ的一致最小方差无偏估计,且不存在比它一致性更好的其他估计量。

德国天文学家和数学家贝塞尔(Friedrich Wilhelm Bessel,17840722—18460317)是天体测量学的奠基人之一,以其专著《天文学基础》(1818年)为标志发展了实验天文学,他重新订正布拉德雷(英国天文学家,James Bradley,1693—1762)星表并编制基本星表(后人加以扩充后成为《波恩巡天星表》),测定恒星视差(1838年)并预言暗伴星的存在,导出修正子午环安装误差的贝塞尔公式[即式(71-4)],导出用于天文计算的内插法贝塞尔公式(此式中的系数被称为贝塞尔系数),编制大气折射表并导出大气折射公式。首创贝塞尔岁首(又称贝塞尔年首)、贝塞尔假年(又称贝塞尔年)、贝塞尔日数(又称贝塞尔星数)和贝塞尔要素等概念,沿用至今。其研究成果还有贝塞尔方程(1817—1824,一类二阶常微分方程)、贝塞尔不等式(1828年)和贝塞尔地球椭球体(1841年)等。1938年2月24日发现的国际编号为1552(1938DE)号的小行星后被命名为“贝塞尔星(Bessel)”,这是对他最好的纪念和褒奖。

贝塞尔方程两个独立的解分别称为第一类贝塞尔函数Jn(x)和第二类贝塞尔函数Yn(x),Hn(x)=Jn(x)±iYn(x)则称为第三类贝塞尔函数,其中第二类贝塞尔函数又称为诺伊曼(Carl Gottfried Neumann,1832—1925)函数或韦伯(Heinrich Martin Weber,1842—1913)函数,第三类贝塞尔函数又称为汉克尔(Hermann Hankel,1839—1873)函数。诺伊曼、韦伯和汉克尔均为德国数学家。

在规范化的常规测量中,若在重复性条件下对被测量X作n次测量,并且有m组这样的测量结果,由于各组之间的测量条件可能会稍有不同,因此不能直接用贝塞尔公式对总共m×n个测量值计算其实验标准差,而必须计算其合并样本标准差(又称组合实验标准差)[77],即:

上式中,xjk是第j组第k次测量值,j是第j组n个测量值的算术平均值。

当各组所包含的测量次数不完全相同时,则应采用方差的加权平均值,权重(即自由度)为(nj-1),此时的合并样本标准差为:

上式中,nj是第j组的测量次数,s2j是第j组nj个测量值的样本方差。

在一些常规的日常校准或检定工作中,采用合并样本标准差往往会取得良好的效果[79-81]。

以下选用最为常用的修正前后贝塞尔公式法作为其他各种估计总体标准差统计方法的比较基准。

参考文献:

[1]费业泰误差理论与数据处理[M].北京:机械工业出版社, 2000(第4版).

[2]冯师颜误差理论与实验数据处理[M].北京:科学出版社, 1964

[3]周秀银误差理论与实验数据处理[M].北京:北京航空学院出版社, 1986

[4]贾克军,石军广,贾文轩,等等精度传递理论在流量计量中的应用[J].工业计量, 2012,22(4):9-11

[5]魏诺,史彭,张伯乾,等非等精度测量不确定度表示两种方法的比较[J].高校实验室工作研究, 1999(2):35-36

[6]彭靖不等精度直接测量不确定度的评定[J].中国计量, 2003,8(3):58-59

[7]郭奕玲,沈慧君诺贝尔物理学奖(1901—2010)[M].北京:清华大学出版社, 2012

[8]杨正一氩元素发现的启迪[J].西安石油学院学报, 1989,4(4):89-93

[9]RAFisherOn an absolute criterion for fitting frequency curves[J].Messenger of Mathematics, 1912,41∶155-160

[10]RAFisherOn the mathematical foundations of theoretical statistics[J].Philosophical Transactions of the Royal Society of London, Series A, 1922,222∶309-368

[11]RAFisherTheory of statistical estimation[J].Mathematical Proceedings of the Cambridge Philosophical Society, 1925,22(5):700-725

[12]孙翠先,步金芳正态总体方差和标准差的无偏估计[J].唐山学院学报, 2012,25(3):5-6,9

[13]盛骤,谢式千,潘承毅概率论与数理统计[M].北京:高等教育出版社, 2001(第3版).

[14]林洪桦测量误差与不确定度评估[M].北京:机械工业出版社, 2010

[15]SSShapiro, MBWilkAn analysis of variance test for normality(complete samples)[J].Biometrika, 1965,52(3/4):591-611

[16]RBDAgostinoAn omnibus test of normality for moderate and large size samples[J].Biometrika, 1971,58(2):341-348

[17]SSShapiro, RSFranciaAn approximate analysis of variance test for normality[J].Journal of American Statistical Association, 1972,67(337):215-216

[18]Frank EGrubbsSample criteria for testing outlying observations[J].Annals of Mathematical Statistics, 1950,21(1):27-58

[19]Frank EGrubbsProcedures for detecting outlying observations in samples[J].Technometrics, 1969,11(1):1-21

[20]WJDixonAnalysis of extreme values[J].The Annals of Mathematical Statistics, 1950,21(4):488-506

[21]WJDixonRatios involving extreme values[J].The Annals of Mathematical Statistics, 1951,22(1):68-78

[22]Robert BDean, WJDixonSimplified statistics for small numbers of observations[J].Analytical Chemistry, 1951,23(4):636-638

[23]WJDixonProcessing data for outliers[J].Biometrics, 1953,9(1):74-89

[24]田禹基于偏度和峰度的正态性检验[D].上海:上海交通大学硕士学位论文, 2012

[25]王文周未知σ,t检验法剔除异常值最好[J].四川工业学院学报, 2000,19(3):84-86

[26]张敏,袁辉拉依达(РайTа)准则与异常值剔除[J].郑州工业大学学报, 1997,18(1):84-88

[27]王承双3σ准则与测量次数n的关系[J].长沙电力学院学报(自然科学版), 1996,11(1):73-74

[28]William ChauvenetA manual of spherical and practical astronomy VolII(Theory and use of astronomical instruments)[M].Philadelphia:JBLippincott & Co, London:Trübner & Co, 1863

[29]王玺,罗旭微机在化学分析逸出值检验中的应用[J].沈阳药学院学报, 1991,8(1):52-57

[30]吴拥政重标极差法及其应用[J].统计与决策, 2004(8):23-24

[31]KRNairThe distribution of the extreme deviate from the sample mean and its studentized form[J].Biometrika, 1948,35(1/2):118-144

[32]吕恕正态样本异常Nair检验统计量的近似分布[J].东北师大学报(自然科学版), 1990,22(3):41-45

[33]GB/T 4883—2008, 数据的统计处理和解释——正态样本离群值的判断和处理[S].

[34]邹传忠关于标准差三种表现形式的应用[J].江西煤炭科技, 2004(2):66

[35]GB/T 19022—2003, 测量管理体系——测量过程和测量设备的要求[S].

[36]全国法制计量管理计量技术委员会JJF105911—2011,测量不确定度评定与表示[S].

[37]柳历波测量不确定度的A类评定的几个问题[J].上海计量测试, 2009,36(4):27-28

[38]林洪桦测量不确定度评定应基于误差理论[J].自动化与信息工程, 2011,33(4):1-4,12

[39]倪育才测量不确定度理解与应用(二):极差法和贝塞尔法之间的比较[J].中国计量, 2004,9(8):78-79

[40]巫业山测量不确定度A类评定的两种方法:贝塞尔法和极差法[J].衡器, 2011,40(4):23-24

[41]李慎安测量不确定度表达百问[M].北京:中国计量出版社, 2001

[42]耿维明测量误差与不确定度评定[M].北京:中国质检出版社, 2011

[43]罗刚不确定度A类评定及不确定度B类评定的探讨[J].计量与测试技术, 2007,34(12):42-43

[44]刘智敏,刘风不确定度的B类评定方法[J].中国计量学院学报, 1995,6(2):51-57

[45]刘智敏不确定度原理[M].北京:中国计量出版社, 1993

[46]王中宇,刘智敏,夏新涛,等测量误差与不确定度评定[M].北京:科学出版社, 2008

[47]张少伟有效数字的正确取位[J].电力标准化与计量, 1997(3):38,45

[48]李谦关于测量不确定度的有效位数和修约间隔[J].电力标准化与计量, 1998(1):4,19

[49]李谦数字修约间隔和修约规则[J].电力标准化与计量, 1998(2):5-7

[50]李维明测量不确定度自由度的评定方法及一般取值范围的探讨[J].工业计量, 2007,17(5):52-53

[51]山内二郎統計数値表(Statistical Tables and Formulas with Computer Applications, JSA-1972)[M].東京:日本規格協会JSA(Japanese Standards Association), 1972

[52]王正向标准偏差估值之极限分布及其应用[J].数学的实践与认识, 1983,13(1):20-33

[53]徐扬光关于总体标准偏差σ的估计精度分析[J].中国质量管理, 1983(2):19-21,31,18

[54]黄景祥几种标准差估计方法的精密度比较和评价[J].中国计量学院学报, 1995,6(S1):93-97

[55]周富臣,孙玉莲总体标准差σ的五种估计及估计精密度[J].计量技术, 2006(12):60-64

[56]周富臣标准偏差的六种估计及其精密度[J].上海计量测试, 2007,34(1):10-13

[57]陈树祥,朱洪海,杭雪珍正确认识贝塞尔公式[J].计量与测试技术, 2003,30(1)32,37

[58]庄正辉,吴先球,陈浩贝塞尔公式的推导及其物理意义探讨[J].大学物理实验, 2010,23(4):80-82

[59]林景星贝塞尔公式计算实验标准差的探讨[J].上海计量测试, 2011,38(2):44-45

[60]朱洪海关于随机误差标准差的几点思考[J].盐城工学院学报, 2001,14(4):20-21,28

[61]谷秀娥关于标准误差和标准偏差的讨论[J].大学物理实验, 2006,19(3):66-67,101

[62]邓永和中误差贝塞尔公式的推导[J].大地测量与地球动力学, 2009,29(3):128-130

[63]邓永和中误差贝塞尔公式推导的进一步研究[J].铁道勘察, 2009(5):8-9

[64]朱洪海对贝塞尔公式证法的探讨[J].计量与测试技术, 2001,28(6):8-9

[65]马美娟贝塞尔公式推导的再研究[J].佳木斯大学学报(自然科学版), 2011,29(2):290-291,295

[66]张本良贝塞尔公式用于估算函数误差的论证及其使用范围[J].武汉工学院学报, 1992,14(4):56-61

[67]朱安远用彼得斯公式估计总体标准差的误差分析[J].中国市场(物流版), 2012,19(19):28-31

[68][波兰]M费史概率论及数理统计[M].王福保,译.上海:上海科学技术出版社,1962

[69]周概容概率论与数理统计[M].北京:高等教育出版社, 1984

[70]张世英,刘智敏测量实践的数据处理[M].北京:科学出版社, 1977

[71]何永政质量检验不确定度与应用数理统计[M].北京:中国计量出版社, 2009

[72]樊顺厚正态分布的子样标准差过低估计了总体标准差[J].纺织基础科学学报, 1994,7(3):242-244

[73]樊顺厚,刘树琪子样标准差过低估计总体标准差[J].纺织高校基础科学学报, 1996,9(1):27-42

[74]黄景祥标准偏差的无偏估计及贝塞尔公式修正系数的简便计算[J].计量技术, 1990(6):36-38

[75]何克明贝塞尔公式修正系数的准确简便计算[J].计量技术, 2000(12):49

[76]王文周标准偏差的标准偏差有多大相对误差[J].四川工业学院学报, 2002,21(1):86-88

[77]倪育才实用测量不确定度评定[M].北京:中国计量出版社, 2009(第3版).

[78]陈成仁,刘智敏,王永泉实验标准(偏)差和平均值实验标准(偏)差意义解析[J].中国计量, 2010,15(1):96-98

[79]朱安远线性传感器静态性能指标的计算[J].冶金计量, 1990(4):32-35

篇5

一、《统计学原理》简介

《统计学原理》是一门集搜集、整理和分析统计数据于一身的方法论科学,它主要用来研究数据的内在数量的规律性。进行统计分析的基础是获得统计的数据,而数据的收集与分析之间有一个必不可少的环节就是对统计数据的整理,统计学的核心内容就是统计数据的分析。

《统计学原理》的基础是统计学科在各个领域中的普遍应用,它的出发点是要解决实际的问题,统计方法论的实际效用是它的侧重点,把定量分析与定性分析有机的结合起来。它把理论和实践相联系,这样对学生在实际工作中的实际操作能力有促进作用。

《统计学原理》主要包括:统计学的研究对象和方法、统计学的基本范畴、统计调查的意义、统计调查的方法、统计整理的内容、统计分组、统计分布、统计表、总量指标、相对指标、变异指标、综合指标的应用、样本和总体、抽样估计的方法、假设检验方法、相关图表和相关系数、回归分析、综合指数和平均指数、指数数列等等。

二、《统计学原理》与计算机科学相结合的必然趋势

在科技高速发展的现今社会,信息化是主要的趋势,自然而然信息化的需求也就越来越突出,对于人们来说,通常都要对大量的数据进行收集,并且还要对所收集的数据进行仔细的分析,分析过后还要对一些有价值的数据进行提取,提取过后再做出正确的决策。《统计学原理》就是一门对怎样合理的进行数据收集、整理以及分析并进行研究的学科,在人们制定一些决策时,都要把它作为主要的依据。那么,对于现代统计方法来说,它和现代信息处理技术是分不开的,随着计算机运行能力的不断提高,对于大规模统计调查的数据的处理来说,就会显得更加的精确以及方便快捷。所以,《统计学原理》越来越不可能脱离计算机技术,当然,计算机技术的应用的深入,也同样不能离开《统计学原理》的发展以及完善。对计算机技术进行充分利用,并通过计算机软件将统计方法中比较复杂的计算构成进行简便化,统计输出的结果就一目了然了,这样,统计方法的普及就会显得非常容易了。所以,在对这门学科进行学习时,不但要把统计方法学好,还要会对商品化统计软件进行充分的利用,对计算机信息系统开发的一些基本思想以及计算机基本程序的设计要进行掌握,除此之外,还要学会通过编程来把具体单位的统计模型进行实现,从而把统计决策支持系统建立起来。

总的来说,把《统计学原理》和计算机以及信息相结合起来这是一个时展的产物,是一个必然的趋势。只有正确的把《统计学原理》与计算机有机结合起来,才能使统计摆脱传统的复杂计算,从而变得越来越简便,越来越科学化。

三、《统计学原理》在教学过程中的应用--以相关系数的计算为例

(一)利用基本公式计算相关系数促进理解推导过程

对于相关系数的基本公式来说,就是要把方差标准化消除具体单位,从而转化为统一量纲的相对数,这样,对不同单位的资料进行对比就方便了许多。在利用基本公式计算相关系数时,需要对两个变量的标准分进行计算,手工计算繁琐费事,在excel中可以轻松实现。

那么,在Excel中能够实现数据标准化的就是STANDARDIZE函数,它是返回平均值是mean,标准差是standard-dev的分布的正态化数值,计算标准分是以平均数和标准差为基础的。对于STANDARDIZE函数来说,它需要对平均数和标准差进行输入,可以利用AVERAGE函数来对平均数进行求解,求标准差是用STDEVP来实现的。下面以某省近几年的城镇居民家庭可支配收入和消费性支出为例,来对操作过程进行演示。在Excel表格中点B10单元格,输入AVERAGE(B3:B9),这样就求出了可支配收入的平均数为9966。点B11,输入STDEVP(B3:B9),这样就求出了标准差为2404。选择与原始数据同样数目的单元格(D3:D9),用STANDARDIZE函数,根据具体要求对参数进行输入,x输入(B3:B9),mean参数就是要求输入平均数,直接点击B10引用即可,standar_dev参数是要求输入标准差,则点击B11进行引用。按F2进行数组操作,然后按shift+ctrl+enter,就对可支配收入进行了标准化,数据显示在(D3:D9)。对消费性支出做同样的操作,在(E3:E9)输出标准化数据。对两个变量进行标准化后,需要计算两个变量标准分的乘积。选择F3单元格,输入“=D3*E3”,点击回车键就得到了第一个乘积,然后下拉单元格并进行复制,就在(F3:F9)得到了所有的乘积。最后对这些乘积的平均数进行计算,选择F10,利用AVERAGE函数求出平均数为0.999615,这个就是遵循基本公式,按照步骤求出的积差相关系数r。

按照上面的这些步骤对相关系数进行求解后,为保险起见,最好利用excel中的其他方法再次计算相关系数,是各种方法进行相互的验证,这样也方便对各种计算公式的推导过程进行理解。可以直接在工具菜单下的数据分析功能中选择相关系数项进行计算,这种方法也就是大多数统计实验课程采用的方法。excel中的correl函数是直接利用计算相关系数,而与correl函数不同的是,pearson函数直接用简捷公式求相关系数。这三种计算方法与上面利用基本公式的计算出的结果是相同的。

在利用实际数据计算相关系数之前,要先让学生对经济学中消费和收入的相关理论进行回顾;计算后再加以总结,宏观经济学认为消费支出与可支配收入存在函数关系,上面的计算的相关系数近似等于1,这就说明了两者存在线形相关的密切程度是十分大的,也就是对这一理论的成立进行了证明。这一步骤有助于引导学生利用统计学验证经济理论,也对统计学的实用性进行了充分的证明。

(二)验证回归直线斜率与相关系数的关系促进理解几何意义

对可支配收入和消费性支出两个变量的原始数据进行标准化,这样就得到两组消除了量纲的数据,那么根据这两组数据来画出最优拟合直线,那么,表示相关系数的就是直线的斜率,这也就是相关系数的几何意义。回归直线可以按照最小二乘法,通过原始数据来得出,直线斜率b就表示了消费性支出随支配性支出的变化程度。相关系数r作为标准化数据的斜率,只要乘以一个数字就可以还原为原始数据的斜率b。我们同样可以用excel函数SLOPE来对两个斜率进行求解,然后加以验证。对于上面的计算,我们还可以继续,就是点击G3,输入函数SLOPE(E3:E9,D3:D9),得到标准化数据的斜率0.999615,这得到的就是相关系数。点击G4,输入函数SLOPE(C3:C9,B3:B9),得到原始数据的斜率0.617952,此斜率表示可支配性收入每增加一元则消费性支出就增加0.62元。在G5输入“=C11/B11”,得到的数值0.61819。可以在G7单元格输入“=G3*G5”验证b和r之间的推算关系是成立的。

四、结语

总之,学习《统计学原理》不单单能使人们的思维方式从主观向客观进行改变,而且对于提高人的综合分析能力也有十分重要的帮助,并且具体行为也能变得客观正确。所以,对于人们来说,学好这门课程是十分重要的,只有学好了这门课程,才能在众多领域进行更好更正确的应用。

参考文献

篇6

将2012年8月至2013年8月在我院接受治疗的39例患者作为研究对象,所有患者均自愿参加本次实验。患者中男19例,女20例。年龄41~81岁,平均年龄(53.26±3.28)岁。首次接受根治性放疗的患者39例,患者的病灶部位有胸下段、胸中段以及胸上段三处。其中病灶位于胸下段的患者有5例,病灶位于胸中段的患者有13例,病灶位于胸上段的患者有21例。

1.2摆位误差测量方法

建立坐标系,规定x轴为患者的左、右方向,y轴为患者的胸、背方向,z轴为患者头、脚方向,其中患者的右方向、头方向以及后方向为坐标系的正方向。以顺时针沿x轴以及z轴旋转的方向为正方向,逆时针方向为负方向,利用图像引导、以CT模拟定位图像作为参考图像,以颈椎和胸椎的椎体作为参考标志,将CBCT扫描重建后的图像与CT模拟定位的图像,在图像引导下在线进行自动配准和人工配准,获得误差数值。

1.3设备

23EX直线加速器(瓦里安公司),机载图像引导系统,机载锥形束CT,热塑面膜(戈瑞公司)。

1.4数据处理

计量资料使用均数±标准差(x-±s)表示,使用t检验计量资料,采用SPSS16.0统计学软件对个体随机误差、个体系统误差进行正态性检验。利用配对t检验比较相关指标的差异,P<0.05,数据间差异具有统计学意义。

2结果

2.1摆位误差

在放疗时,对所有患者均采用热塑面膜进行固定,重复模拟定位,利用三维激光灯,按物理计划要求摆位后,对患者进行CBCT扫描,每个患者每周1次CBCT扫描,各扫描5次,共计195次。所有患者的随机误差以及个体系统误差均服从正态分布。

2.2CTV和PTV之间的间隙值

所有患者在x轴、y轴以及z轴上平移的个体系统误差的标准差分别是3.01、3.51、1.86mm;在x、y以及z轴上个体随机误差的标准差为1.61、2.11、1.16mm。根据公式(Mptv=2.5×系统误差的标准差+0.7×随机误差的标准差),计算CTV和PTV之间的间隙值。其中x轴、y轴以及z轴上CTV和PTV之间的间隙值分别是8.65、10.25、5.46mm。

篇7

笔者长期担任《社会统计学》教学,发现大部分学生为文科生,数学基础差,课程负担重,如何增强学生利用所学统计学知识,解决实际生活尤其是走出校园参加工作后学以致用是当前课程教学改革的重点和难点。

一、当前社会统计学教学存在的问题

(一)教学内容的针对性不强

一本高质量的《社会统计学》教材,既需要像数理统计一样,讲清讲透基础统计学原理和知识,又要明晰研究内容和研究对象,阐释清楚与其他应用统计学的区别。而当前的《社会统计学》主流教材,都存在侧重于其中一方,能够做到两方面兼顾得很好的教材几乎没有。如目前高校使用量较大的教材有卢淑华的《社会统计学》,偏重于数理统计的理论推导,蒋萍的《社会统计学》尽管对研究对象有清晰的定位,但是需要学生具有一定的数理基础。目前的统计学教学中一般采用理论讲解为主的教学模式,教师主要依托教材,对与统计学相关理论和方法逐一进行介绍,对涉及到的公式和定理进行推导。因此,当前社会统计学最需要解决的问题就是尽快编撰一本如何将统计学知识运用到具体的社会问题研究或者实践中去的优秀教材。

(二)教师的水平参差不齐

目前不少院校的社会统计学教师队伍主要来源于两块,一是外聘数理统计学的教师教授《社会统计学》课程,这些老师上课更多的偏重理论讲解和推导,让学生掌握比较扎实的基础统计学知识。由于他们对社会学、社会工作等文科专业不熟悉,课堂讲解中不能结合专业领域内的社会调查和案例来分析讲解。导致学生学习起来压力大,觉得枯燥无味,在面对社会现象时不知道怎么利用所学统计学知识分析和阐释社会现象。二是社会学专业背景老师讲授《社会统计学》,这些老师由于没有系统接受过数理统计学的训练,对于统计学的数理部分往往一知半解或者干脆略过,教学中更多的偏重例题分析和软件的使用。

(三)学生的学习态度不端正

学习社会统计学的学生多为文科生,在进入大学前,就是因为对数学等学科的害怕才选择报考文科专业。而统计学需要一定的概率论和微积分等数学基础,所以学生一看到社会统计学中涉及的数学知识就头疼,认为自己很难学好,产生先入为主的畏难心理,对自身的学习能力信心不足,缺乏动力,提不起兴趣,部分学生甚至在遇到困难时主动放弃统计学的学习。学生认识不到社会统计学与其它应用统计学相比,有其自身特点:研究对象为人类行为、政治文化等社会现象;所需具备的数理知识要求相对较低,更侧重于对统计结果的理解和解释;社会统计中收集到的资料,往往很多是低层次的变量,如定类、定序变量。因此,定类、定序变量统计分析在社会统计学中占有很大的比重,讨论变量之间的关系,如列联表、列联强度,相关关系的测量是学习的重点。

二、以就业为导向的《社会统计学》教学改进措施

(一)统计思维改进法

1、统计无用论向统计实用论的转变

社会统计学作为一门定量分析工具,是社会科学科学性的实现工具,尤其是随着中外学术交流的加强和规范化,近些年高级统计学的发展,统计学在社会科学的发展中扮演着越来越重要的角色。学好统计学对于本科生考研或者将来从事学术研究,都是必不可少的知识,尤其是社会学、社会工作、公共管理等专业的考研,社会统计学是必考科目,也是导师特别看重的学生必备能力之一。二是社会统计学作为一门实用性很强的工具,现在很多企业、调查公司等在招聘的时候非常看重应聘者统计学的知识和能力,熟练掌握和应用EXCEL、SPSS、STATA、SAS等统计分析软件,可以极大增加就业机会和就业筹码。

2、教学过程中的定量思维与定性思维的结合

社会统计学作为定量分析工具,需要学生具有较强的数学分析思维和逻辑思维,所以统计学中有大量的公式和推导过程。作为教师,在教授过程中在讲清楚原理和推导过程的同时,需要根据文科学生的特点,用定性的话语和思维解释清楚来龙去脉。

例如对于标准分的理解,卢淑华是这样解释的:“标准分Z的意义在于它是以均值为基点,以标准差σ为量度单位,计算x取值距离标准差的距离,以便进行不同的μ和σ之间进行比较。”不同的变量一般有不同的均值和标准差,统计上,不同的均值和标准差是不能互相比较的。例如甲乙两名学生在两个不同的班级考了同一门《社会统计学》课程,他们的成绩如下:甲同学考了80分,乙同学考了90分。已知甲班《社会统计学》的平均成绩是70分,标准差是10分;乙班《社会统计学》的平均成绩是70分,标准差是20分。请问甲乙同学在本班中谁的成绩更好?通过标准分计算,两者的标准分都是1,说明两名同学在班级的成绩排名是一样的。经过定性的案例分析讲解,学生就能明白为什么曾经一度在高考中引入标准分的原因了,以使不同考区的学生以相对公平的分数被录取。

3、数理思维向理解思维的转变

实质上,学习统计学的过程,就是学习统计思维的过程,而不只是公式的简单套用和通常的数字计算。统计学有严格的前提假设和适用变量层次,是一门量化分析工具,我们在实际运用中,不能为了分析或者所谓的科学性而滥用统计方法,用统计数字代替科学推理,犯了社会学家邓肯(Duncan)所说的统计至上主义(statisticism)。统计数字会撒谎,正如桑普拉斯所说:“统计未必能够揭示真实,有时候还可能成为假象的帮凶。”因此对于统计学的学习,除了养成良好的统计思维外,还需要我们具有扎实的理论基础,规范的社会调查研究方法和对统计方法的甄别使用和统计结果的合理解释。社会统计学课程的学习更看重的是学以致用,用所学知识科学的分析和解释社会中的现象。正如我们学会游泳前不一定要了解动力学的知识,会使用计算机不一定要先懂得编程一样,理解计算机的输入和输出结果比知道计算机如何计算重要得多。

例如学生对于假设检验的原理很难理解,我们可以通过举例让学生理解假设检验的思路。在航天火箭发射前,没有任何人能够事先证明火箭发射是安全的,人们最多只能说,用现有手段没有发现问题。但是,只要发现一个影响安全发射的问题,那就不能发射。这说明,企图肯定什么事情很难,而否定却要相对容易得多。物理学以及其他科学都是在否定中发展的,这也是假设检验背后的哲学。假定原假设火箭发射是安全的,即使通过研究假设也无法否定原假设,也不能说明原假设是正确的,就像用一两个仪器没有发现火箭有问题还远不能证明火箭是安全的,但是只要在原假设成立的前提下,出现了小概率事件,我们就认为原假设不成立,那么航天火箭就不能发射。

(二)统计应用推动法

1、开展课外调查活动

引入以“提出问题―分析问题―提出假设―验证假设”为流程的基于问题的学习方法(Problem Based Learning,PBL)来开展课外调研活动。组织学生以小组为单位,选择和确定实践课题,成立以6―7人为一组的若干个项目小组,并选出各组组长。当然,研究课题可以是学生日常生活中所关心的问题,如大学生校园恋爱观的调查、大学生消费行为调查、学习时间调查、学习成绩调查、课余活动、生活习惯、自媒体使用情况调查;也可以是社会生活中的热门现象,如独生子女价值观、二孩生育行为、观念,贫困人口认定与帮扶等调查。让学生通过利用所学的社会调查研究方法,科学选题、做好研究设计、设计问卷、选择合适的抽样调查方法、收集资料、利用统计软件分析数据,撰写调查报告来学习和使用统计学知识分析和解释社会现象。这样不仅可以有效解决由于实训基地、实习经费的限制所带来的不便,而且这种调查贴近学生生活,容易入手,易于激发其兴趣,并且有助于加深对统计学原理的理解,明白统计学就在身边,与我们的生活息息相关。

2、使用统计软件法

有针对性的将Excel、SPSS、STATA,SAS等统计应用软件作为社会统计学课程的实训内容。在课堂讲授时,可以教会学生使用Excel函数、Excel图表与图形以及Excel数据透视表来处理常用的统计数据。有条件的话可以安排在计算机房上课或者安排一定量的学时让学生在计算机房上机操作SPSS等软件,培养学生运用统计软件搜集、整理、分析统计数据的能力。

3、加强社会统计学的实习实践

与当地的政府部门、市场调研公司、市场咨询公司、专业的调查机构、相关企业建立协作和参与机制。让学生学会如何开展调查、如何获取资料、如果统计分析资料,所获取的统计分析数据是如何指导工厂、企业等单位的生产运作的。例如:学生通过参与公司的市场调查,了解公司的产品是如何定位顾客、细分市场的;参观地方政府统计部门的日常统计和上报统计报表,了解政府统计是如何进行的;学生参与各社区或者街道的贫困人口统计、人口普查等调查。

(三)统计课程革新法

1、建立完善的社会研究课程体系

社会研究课程体系是指教授学生如何在理论的指导下通过各种科学的方法进行调查与创新性研究的一系列课程。主要包括“社会调查研究方法”、“社会统计学”、“SPSS统计软件应用”等课程。尽管目前各高校都开设了这几门课程,但在实际教学过程中,一般都是分学期开设,由不同的老师授课,导致有些内容重复,例如抽样调查,在“社会调查研究方法”、“社会统计学”中都会涉及,理论学习和实践脱节,例如“社会统计学”、“SPSS统计软件应用”分别在不同学期开设。建议高校开设课程进行改革,由固定的老师来讲授社会统计研究课程体系,将“社会统计学”、“SPSS统计软件应用”整合为一门课程,并合理设置理论学习和实践教学的课时。

2、建立社会统计学案例库,试题库

篇8

中图分类号:R544.1 文献标识码:A 文章编号:1672-3791(2015)03(b)-0232-01

高血压属于很多心脑血管疾病的一个重要原因以及一个非常重要的危险因素,在高血压患者血压升高的过程中,也升高了有关方面的血压变异性特点,而变异发生的程度和心脑血管疾病发生的概率有着一定的相关联系。所以说对于高血压患者进行血压降低的时候,也应当注重进行血压变异性的降低。替米沙坦氢氯噻嗪胶囊可以说是一种复方制剂,也是一种对于高血压来说非常有效的药物,其联合用药的过程中能够产生与剂量有着明显关系的作用,而且没有比较大的不良反应。在2012年6月~2013年6月之间,该研究者通过有关资料观察了替米沙坦氢氯噻嗪对于血压变异性所产生的一系列的影响,现报道如下。

1 资料与方法

1.1 临床资料

对于门诊原发性的高血压患者资料进行收集,都符合有关防治指南之中的收缩压标准以及舒张压标准。在排除继发性高血压、严重心脑血管病、甲状腺功能亢进以及恶性肿瘤等疾病之后。一切患者都停止服用药物,并在接受洗脱之后进入到试验当中。实验有着相应的入选标准。

其中有158位病人纳入到了研究的过程中,包括93位男性,65位女性,年龄在42~70岁之间,这些人都经过了相应的安慰药治疗,也就是洗脱的过程,在之前通过血压监测仪对于其血压进行检测,并依照夜间收缩率的下降进行分配。

1.2 治疗方法

所有患者都进行ABPM治疗,在进行洗脱阶段之后,清晨空腹进行替米沙坦氢氯噻嗪胶囊的服用,如果说DBP的含量小于某种标准的话,则维持原剂量,不然的话则增加一倍剂量,服药时间一共有8周左右。

1.3 观察指标

对于全部患者的性别、年龄以及吸烟、冠心病、糖尿病等病史进行一定的了解,并对一切患者进行生物化学常规检查,对于空腹血糖以及肾功能和肝功能等方面进行一系列的检查,并对于数据进行记录。

在治疗前后进行ABPM的检测:患者全部不准喝酒,每天吸烟的数量控制在5支以内,每天服用的食盐少于6g,对于脂肪摄入进行控制。在治疗之前以及之后8周的时间之中进行ABPM的检测,并采用美国的进口血压监测仪进行动态的监测。监测方法为,在患者左上臂处绑上袖带,以24小时为周期进行检测,白天每半小时进行一次测量,有效检测次数应当占据测试次数的80%以上,如果说指标超越某个值的话,也就判定为无效数据,需要重新进行测量,统计项目是:第一,在24小时之内的平均舒张压以及收缩压;第二,在白天平均的收缩压和舒张压;第三,在夜间平均的收缩压以及舒张压;第四,在24小时内收缩压以及舒张压的标准差;第五,在白天收缩压以及舒张压的标准差;第六,在夜晚收缩压以及舒张压的标准差。依照上述时段的参数能够得到很多重要的信息内容。

1.4 统计方法

利用正规的统计软件展开相应的数据分析,所有的数据表示方法都是比较规范的,在组间进行的比较都采用t进行检验,两组治疗前后利用配对t展开相应的检验,其数据有着相应的统计学意义。

2 结果

2.1 比较两组患者全身因素

相对于勺形高血压组来说,另一组的患者有着较高的缺血性脑血管病以及冠心病的历史,但是高血压的疾病历程相对来说比较长,不过在吸烟以及糖尿病史等方面来说,两组之间的差异并不具有统计学方面的意义,对于一些数据分析来看,两组之间的血脂以及血糖水平也没有相应的统计学意义。

2.2 比较两组患者血压变异性

相对于非勺形高血压组来说,另一组在治疗前24小时,白天以及夜间DBP以及SBP的标准差都出现了降低的情况。相对于治疗之前来说,两组治疗之后24小时,白天以及夜间的DBP以及SBP标准差出现降低,不过两组之间的差异并不具有统计学方面的意义。

3 讨论

在这些年来,国内外对于流行病学的研究以及讨论结果表示,高血压患者之中,心脑血管疾病发展以及发生的一项非常重要的因素就是血压的变异性,其所具有的预测作用比平均血压要大得多。血压变异性指的就是在某个时间段之内,血压展开波动的范围,反映了血压跟随血管的节律以及反应性展开的变化,通常有一定的表示方法,也是在均值之外一个独立的指标。所以说,治疗高血压,并不需要将24小时之内的血压值降低,还应当在这段时间之中,平稳持久的进行降低,这样一来才可以更好地防止高血压伤害心脏和大脑等器官,并且能够进一步减少心脑血管事件的出现,避免给人体造成各种各样的危害或者说其他方面的危险情况。

篇9

一、引言

当今社会,科学技术日益革新,统计思想逐步成熟,统计工具也被应用于统计领域,该领域也随之得到延伸和发展。而所谓的统计学其主要的内容是通过对数据的收集、统计、整理分析、数据处理等方法,从而更加深入的发掘数据存在的内部规律,以达到更科学、更合理的解释客观事物的目的,加深对该事物的认知。在具体工作和现实生活中,很多客观规律的分析及归纳是运用统计的方法实现的,通用的操作方法如下:首先需要在分析之前对客观事物进行研究和设计,了解该事物的基本特点;其次针对该事物进行抽样调查,调查的范围要全面;再次利用相应的统计软件和数学思想,建立相应的数学模型,对抽样的结果进行统计分析,让数据呈现一定规律;最后便是根据统计分析的结果作出结论性成果,以便能更加深入的研究及分析客观事物存在的内在规律和普遍性原则等。统计学被应用的领域广泛,本文主要针对统计学在财务方面进行研究。

二、统计学应用于财务方面的意义

(一)将统计学应用于财务,能满足企业和行业对产值、资金等方面的计算需求。行业或企业财务数据极为庞大,运用统计方法进行财务统计,便于反应企业或行业的劳动成果和产能产效,为国家统计国内生产总值、人均GDP等提供数据支撑。

(二)将统计学应用于财务,可以帮助企业或个人进行负债核算、资金流核算等,提供基础数据。运用统计学进行财务统计,既可以作为分析企业经济实力的标准,又可以将统计的数据作为核算资产负债的数据来源。

(三)将统计学应用于财务,可以用于研究分析个人、企业、国家三者之间的利益分配关系,通过统计学研究出的普遍性规律来制定符合大多数人需求的收入分配制度,从而达到合理调整利益关系的目的。

三、如何合理运用统计学解决财务管理问题

(一)利用统计学方法进行财务的收益与风险计算财务管理的过程中,经常需要计算财务收益与风险,而对应在统计学中即为算数平均值与标准差的计算。比如,企业在运营过程中,需要计算期望现金流量,往往在现实运营过程中,存在诸多影响未来现金流量的不可控因素,因此计算出的未来的资金流量存在很大的不确定性,但如果采用单一的现金流量,在一定程度上可以保证现金流量的确定性,却不能全面的反应企业的资金运营情况。在这种大背景下,可结合统计学方法,如期望现金流量法,计算未来的现金流量,能提高计算的准确性,取得较好的效果。此外,在企业财务管理的过程中,需要运用到许多基于统计学的财务预算方法,如在预测资金需求量的情况下,可以运用回归法预测、平滑法预测等。当今,基于统计学原理,已经形成了很多专业的财务预算方法,如:预计资产负债表法、线性回归法等,这些方法的运用,加快了财务管理的效率,为财务人员处理庞大的财务数据提供了方法。

(二)利用统计学方法进行审计统计抽样抽样调查是统计学常用的统计方法,而审计抽样,则是抽样调查在财务应用的体现,主要是指审计人员在审计时,审查主体数据量比较庞大,因此仅抽取部分样本进行审查分析,通过分析抽取样本的审查结果,从而大致推断出总体的审查结果,这也是我国财务审查的主要方法之一。统计抽样之前需要先进行假设检验,即在抽样调查之前需要确定抽样规模、范围、基本参数等,之后还需对选取的样本进行初步审核。若在实际审查的过程中,抽取的样本不能满足审查要求,还可对样本的规模进行逐步扩大,以达到抽样结果的特征与总体情况基本相符的目的。在审查的最后,根据样本的审计结果进行推导,从而得出基本符合总体特征的结论。在实际的审计过程中,抽样的方法有很多,如货币单位抽样、变量抽样等。而在选择抽样方法时,审计人员应该根据审计的目标、效率及审查总体的特征合理选择,以达到审查的最终目的。

四、统计方法在财务管理中的应用

当今社会,统计学方法被大量应用于财务管理的各个方面,其最终目的在于提高财务管理的效率,分析财务活动的合理性,为财务活动的预测、决策、控制等提供科学依据。本文从收益率的预测、概率图的运用、数据的准确性及数据变异系数的分析四个方面着手,对统计学在财务方面的应用进行研究分析。

(一)预测未来收益率,提高企业收益。一个企业在实际运营过程中,能很好的把控未来的发展状态及收益情况,是企业发展的重要途径。利用合适的统计学方法可以实现利用已有的数据预测未来一段时间的数据。对应到企业中去,即运用统计学的方法,对企业现有的资源进行统计分析,预测未来一段时间内的收益情况,从而根据预测的收益率指定相应的实施方案,从而达到提高企业收益的目的。

(二)利用概率分布图,进行数据分析及投资决策。在具体的财务管理过程中,可利用统计学方法对已有数据进行处理,并根据需求绘制相应的概率分布图,那么各种数据的变化规律便一目了然,以便于决策者根据其变化规律进行投资或运营。比如在计算企业未来收益率时,可以根据现有的数据进行统计分析并绘制出一条概率与结果近似关系的连续性曲线,并根据该曲线推导出未来的收益率,从而进行投资决策。概率图有两个最主要的特点:概率分布图越集中,则其预期结果越趋向于实际结果,则其风险越小,投资回报率越高。当所得到的概率分布图越集中时,则说明实际结果越有可能接近预期值;反之,概率分布图越稀疏,则实际结果与实际结果的差距越大,风险也越大。

(三)利用标准差,确保数据的准确度。在财务的实际管理过程中,经常需要确定数据的准确程度,而财务人员通常是是利用统计学中的标准差的大小来判断所得到数据的精确程度。计算标准差的步骤如下:第一,根据现有的数据进行预测,得出收益的预测值;第二,将收益率的预测值和实际值相减,得到离差值;第三,计算概率分布方差,即将离差值求平方,并将得出的平方值与预测值相乘,再将这些乘积相加;第四,对方差进行开方计算,得到标准差。

(四)运用数据变异系数,度量单位收益风险。变异系数是标准差与平均数的比值,主要是用来衡量数据的变异程度,即用于度量单位收益下的所面临的风险。这种单位收益的风险判断为企业的决策提供了有效的借鉴。因为变异系数既能计算风险还可以反映企业收益,因此在企业的财务管理中被大量应用。

五、结论

企业或行业的财务管理过程中会面临大量的数据处理,合理利用统计学方法进行数据的统计及分析,对简化数据处理,提升数据准确度、精确度,甚至对于财务决策等各方面均有所助益,因此,将统计学方法引入财务管理具有非常重要的意义。

【参考文献】

[1]李金昌.关于统计思想若干问题的探讨[J].统计研究.2006,(3).

篇10

传统的仅凭卷面分数和平均分数评估学生学习成绩和教师教学效果的方法,带有片面性。因此,诸如由学生各科卷面总分排名来评定奖学金,确定毕业分配时的优先分配政策,由主观制定的卷面分数段的比例大小和仅由平均分数的高低评估教师效果的好坏,是不合理的,本文给出一种新的评估体系供大家参考。

一、平均分数体现整体水平

1、某班某学科的平均分数

x1=

2、求N个班某学科的平均分数应“加权”

x=

其中x表示加权平均数,ki表示第i班总人数,xi表第i班平均分数。

二、标准差反映平衡程度

除了解体现整体水平的平均分数外,还应了解每个人的分数离班平均分数的偏差大小。因此可以利用数理统计中的标准差计算公式

δ=

(其中x为卷面分数,x为平均分数,N为全班总人数)。例如,甲乙两班同一科的平均分数都是81.5分,标准差依次为9.2和10.3,从而知甲班比乙班要稳定些,发展平衡些。

三、“标准分”取代卷面分来评估每个学生学习成绩的总体水平

在评先、评优和奖学金中,常要比较学生成绩的优劣。例如:某班数学卷面平均分数为:x1=69.4,标准差为δ1=8.5。语文卷面平均分数为:x2=87.6,标准差为δ2=10.5。学生张某数学60分,语文94分。王某数学83分,语文68分,按传统的方法认为:张总分154比王151分多,因此张优先于王。这种评估是不合理的,原因是各科之间的卷面分数的参照点(零点)与单位都不同,不能相加求和来互相比较。

在现代的体育统计和有关统计文献中,都采用“标准分”(符号意义同上),即学生的成绩 与班平均分之差比标准差。这样能统一尺度,具有合理的可比性。如张和王的成绩可以合理的评估如下(表1):

表1

(注:习惯用正分,故一般取T=10Z+50,T分大约在20至80之间。它是把Z分扩大10倍,又往后平移50,消除了负数。)结果张两科总标准分95次于王97.3,与卷面分数结论相反,标准分反映学生在全体考分中的相对位置,故又称相对分。至于不同班级、不同学科的总分,由于试卷有难易之分等因素,更应采用标准分。

四、考试分数合理分布的评估依据

怎样评价一班的考试分数的分布是否合理,依据是什么?以前有关文献都认为:卷面分X是正态随机变量X~N(x,δ2),标准分Z服从标准正态分布Z~N(0,1)。但都没有加以论证或进行实际的统计分析。因此有些提法不尽妥当:因为样本平均分数x与样本标准差δ均为统计量,是随机变量,而正态分布的两个参数都是常数;如果X是随机变量,X~N(μ,δ12),X1,X2,∧XN是来自总体X的样本,则x是μ的无偏估计。δ是δ1的极大似然估计,一般地其观察值x≠μ,δ≠δ1,所以X~N(x,δ2)的提法不妥。而且也推不出Z~N(0,1)(证略)。

但是,通过多年来对我校各个教学环节情况比较正常的教学班的考试分数的统计分析发现标准分Z是近似服从标准正态分布的(有文献曾认为或假设Z近似地服从标准正态分布的说法)。由数理统计学可知:随机过程可以用族中的典型样本函数来表征。因此我们可以把Z近似地看作服从标准正态分布的随机变量,从而以标准正态分布作为评估学生考试分数合理分布的依据,根据“3δ”原则换算出标准分的合理分布评估依据:分段比例和累计比例。

转贴于

(1)分段比例:

T≤20的比例为0.0013

40<T≤60的比例为0.6826

30<T≤70的比例为0.9544

20<T≤80的比例为0.9974

T>80的比例为0.0013

(2)累计比例:

T≤30的比例为0.0228

T≤40的比例为0.1587

T≤50的比例为0.5000

T≤60的比例为0.8413

T≤70的比例为0.9772

T≤80的比例为0.9987

记:│(取T≤20的人数/总人数)-0.0013│=A1

│(取T>80的人数/总人数)-0.0013│=A2

│(取40<T≤80的人数/总人数)-0.6826│=A3

│(取30<T≤70的人数/总人数)-0.9544│=A4

│(取20<T≤80的人数/总人数)-0.9774│=A5

则ΣAi=A1+A2+A3+A4+A5的值越小说明说明分布越合理。并在记分册中增加“平均分”,“标准差”,“标准分T”三栏,以方便教学管理部门进行评估。

五、统计分析实例

以我校2005级会计一班数学成绩为例见表得知(见表2,表3),是基本符合标准正态分布的。同时发现,越是成绩好的学生,各科卷面总分和标准总分排名基本相同,且各科成绩越平衡;越是各科成绩不平衡的,卷面总分与标准总分排名就相差较大(如第3,24,26学号),由此说明由标准分来评估学生学习成绩的总体水平是合理的科学的。

表2:分段比例对照

表3:累计比例对照

六、总结

通过以上讨论和计算,可以得出以下结论:

1、在没转换成标准分之前,各科的分数是不能比较的。

2、用原始分高出平均分多少来衡量各科,也是很不科学的。

3、一旦转换成标准分,不但上述比较变得科学易行,而且各次考试之间也是应该比较的。如Z后次–Z前次=进步幅度。

4、平均分反映整体水平;标准差反映班级整体发展平衡程度;标准分反映学生个体各科发展的平衡程度。

4、分段比例和累计比例是学生成绩合理分布的评估依据。

5、统计数据与理论数据之差A1,A2,A3,A4,A5之和ΣAi是刻划合理分布程度的依据。

6、任何一次大型考试,不但要公布“平均分”,而且要公布“标准差”。这两个参数都是十分重要的。这样,各校,各班,个人在这个大系统中的地位都可以很容易的算出。

七、结束语

教学效果的评估,是“终端评估”,是教学管理的重要环节,它的合理性和准确度不但体现在变定性评估为定量评估,而且还依赖于教学“过程评估”的合理性。如试卷的难易程度,评卷的准确性与公正性,还有学生平时成绩的评定,考场纪律等。这都需要长期摸索和认真细致的统计分析。多年来,我们本着以抓“过程”保“终端”,以抓“终端”促“过程”的原则,在抓教学效果的评估的同时,在试卷评分方面也进行了一些改革和尝试,如运用美国数学教授T·L·Saaty提出的“层次分析法”和湖南农大的“加权评分法”,收到了一定的效果。

参考文献: