期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

期刊咨询 杂志订阅 购物车(0)

数据分析统计学方法模板(10篇)

时间:2023-08-12 09:04:31

数据分析统计学方法

数据分析统计学方法例1

1.定量资源

对于定量资料,应根据所采用的设计类型、资料所具备的条件和分析目的,选用合适的统计分析方法,不应盲目套用t检验和单因索方差分析;

2.定性资源

对于定性资料,应根据所采用的设计类型、定性变量的性质和频数所具备的条件以及分析目的,选用合适的统计分析方法,不应盲目套用X-检验;

3.回归分析

对于回归分析,应结合专业知识和散布图,选用合适的回归类型,不应盲目套用简单直线回归分析,对具有重复实验数据的回归分析资料,不应简单化处理;

数据分析统计学方法例2

统计学如何为数据挖掘服务,这是在“数据挖掘”飞速发展的今天,统计工作者必须回答的一个问题,我国厦门大学的朱建平教授提出:“统计学应该随时关注数据分析,哪里有数据,哪里就应该有统计分析。”统计学是搜集、展示、分析和解释数据的学科,它拥有非常深厚的理论基础,并在社会生活的各个领域发挥着巨大的作用。近代统计学方法与信息处理的关系日益密切,作为信息处理的一个基本工具,统计学方法将发挥越来越重要的作用。

数据挖掘是近十几年里发展起来的一门崭新的学科,由于它与统计学都关心从数据中发现某种结构,因而从数据挖掘诞生之日起,就与统计学有了千丝万缕的联系。

一、统计学与数据挖掘的涵义

统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察的系统数据,进行量化的分析、总结,进行推断和预测,为相关决策提供依据和参考;它分为描述统计和推断统计。描述统计包括对客观现象的度量、调查方案的设计,对所收集的数据资料进行加工整理、综合概括,通过图示、列表等方式进行分析和描述。推断统计是在搜集、整理监测样本数据的基础上,对有关总体做出推断,其特点是根据随机性的观测样本数据以及问题的条件和假定,对未知事务做出以概率形式表述的推断。

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的,人们事先不知道的,但又具有潜在价值的信息和知识(模型或规则)的过程。这个定义包括以下含义:数据源必然是真实的、大量的、含噪声的;发现的知识可接受、可理解、可运用,并不要求发现放之四海皆准的知识,仅支持特定的发现问题。它能高度自动化的分析原有数据,做出目的性推理,从中挖掘出潜在的模式,从而帮助决策者调整策略,做出正确的决策。它融数据库技术、人工智能技术、数理统计技术和可视化技术为一体,是一个多学科相互交叉又融合所形成的一个新兴的具有广泛应用前景的研究领域。

二、统计学与数据挖掘的联系

(一)数据挖掘虽不同于统计分析,但许多挖掘技术又来源于统计分析,数据挖掘中有许多工作可以由统计方法来完成。比如预言算法(回归)、抽样、基于经验的设计等。

(二)数据挖掘不是为了替代传统的统计分析技术,相反,数据挖掘是统计分析方法的扩展和延伸。大多数的统计分析技术都基于完善的数学理论和高超的技巧,其预测的准确程度还是令人满意的,但对于使用者的知识要求比较高。而随着计算机能力的不断发展,数据挖掘可以利用相对简单和固定程序完成同样的功能。

(三)数据挖掘技术的出现为统计学提供了一个崭新的应用领域,也对统计学的理论研究提出了挑战。数据挖掘技术有相当大的比重是由高等统计学中的多变量分析所支撑。

(四)统计学与数据挖掘的结合日益紧密。数学是传统意义上统计学方法的首要工具,而计算机和网络为代表的信息技术,正逐渐成为统计学应用的首要工具。随着数据源的不断膨胀和数据结构的日益复杂,单纯依靠数据挖掘技术,已渐露力不从心之态,而统计学的同步发展,正不断充实、完善着数据挖掘技术。因此,随着信息化水平的提高,统计学与数据挖掘的应用平台渐趋统一。

三、预测性挖掘中常用的统计学方法

数据挖掘中应用的统计学预测性方法主要有判别分析和回归分析。其中,判别分析用于对离散型目标变量的预测,而回归分析则主要用于对连续性目标变量的预测。

数据分析统计学方法例3

在市场经济体制发展下,对市场的调查主要是通过数据统计分析来完成的,随着市场调查范围的扩大,书记统计分析法的应用也越来越广泛。已经受到社会各界的重视与关注。因此,需要保证统计分析工作的科学、合理,确保数据信息的可靠与准确,这样才能达到市场调查的目的。发挥数据统计的实质作用。

一、数据统计分析的概述

1.数据统计分析的含义

数据统计分析是市场调查过程中常常使用的一种方法。是指在具体的统计工作中,通过数据资料及其相关资料反映一些国民经济及社会现象。或者通过对某一特定区域某一具体指标进行统计,通过数据分析,反映该区域的经济发展状况。数据统计分析,能够较清晰的反映所调查区域或者指标的发展情况,能够根据这种反映出来的实际情况作出相应的决策以及对策。对经济发展、社会发展具有重要作用。

2.数据分析统计法的特点

其一,具有系统性。市场调查工作内容复杂,需要各个环节紧密配合,是一种系统性工作,不只是对单一项目的调查分析,要有完善的实施计划,科学合理地进行统计。其二,具有科学性。在实际调查中,要讲求统计方法,保证数据的真实性,可靠性和严谨性,科学收集、整理、分析数据信息。避免出现错误,导致统计分析结果出现偏差。其三,有针对性。在市场调查中,有根据不同的调查项目,采用不同的统计方法,根据实际情况,进行有效的数据分析统计,不能一概而论,有针对性地有区别地进行统计分析。其四,具有实用性。数据统计分析主要的目的是为人们决策提供有价值的参考,通过对数据的科学分析,做出合理的决策,来解决市场经济中的发展问题,从而促进经济的更好更快发展。因此,数据统计分析具有现实的实用性。其五,具有发展性。由于社会是不断发展的,市场经济也是不断发展的,因此,数据统计分析要适应时展的需要,不断改革不断创新,发挥更大的作用,因此具有一定的发展性。

二、数据统计分析法的主要类别

数据统计分析法在市场调查实际应用中具有不同的类别,一般主要有两种:

1.数量关系分析方法

这种统计方法主要是以统计学到理论知识为基础,对社会市场各方面的情况进行调查,以数据的形式展现出来,能够有效反映各个事物之间的联系。

数量关系方分析法有很多种,常用的主要有对比分析法、结构分析法和相关分析法。

2.逻辑思维方法

逻辑思维是人们常常用到的一种思维方式,可以有效地对事物形成一个具有逻辑性的认识。同时也包括对事物一定的判断及辨别能力。数据统计分析工作要求以发展的眼光看问题,从事物的变化、发展中观察问题,通过事物之间的相互联系分析问题,所以在这个过程中,逻辑思维方法对数据统计分析起到了积极的促进作用。在实际调查活动中,两种方法要紧密结合,根据不同的情况,共同使用,这样对数据的分析才更加精准,起到的实际作用才越大。

三、数据统计分析具体方法

1.描述统计分析

描述统计是指运用制表和分类,图形以及概括性数据来描述数据的集中趋势、离散趋势、偏离等。这种统计方法在市场调查中常常用到,通过对数据的收集、整理以及分析处理,对所调查对象做一个整体性的描述。其中常用的方法有均值法、最小邻居法、剔除法等。数据分析清晰明了,能够更加直观地反映某一具体调查内容,有利于正确决策的制定。

2.推论统计分析

在市场调查中,通过收集数据,并且对数据进行科学分析,在此基础上,还要对整体数据分析情况进行合理的推断,从而得出某一实质性的结论。这就是推论统计分析。这种分析方法要求人们对数之间联系进行更进一步的分析,在实际调查中,影响数据调查对象发展的因素很多,需要经过实际分析,分辨出哪些因素是事物发展的主导因素,抓住主要方面进行分析。因此对调查对象的研究更加深刻,更加详细,能够从整体上把握调查对象。从而更有利于解决实际问题。

3.时间序列统计分析

这是一种动态的数据统计分析方法,通过研究随机数据序列的规律,进行实际分析,从而解决实际问题。时间序列统计分析一般有四种要素组成。即:季节变动,循环波动,趋势以及不规则波动。通过对这四种要素的掌握,利用指数平滑法和移动平均滤波法进行科学的统计分析,得出准确的结论,满足人们的实际需要。

4.多元化统计分析法

这是一种综合性的统计分析法。分析对象与指标可以是多个,在市场调查研究中,各个调查部分之间存在着某种显著地差异性,多元化统计分析可以根据不同的部分特征进行综合、全面的分析,并且具有系统性和科学性。在调查实际活动中,要根据市场调查的不同事物,不同指标,不同特性科学选择不同的统计分析方式,确定调查样本的范围的大小,设计类型,以及相关联的不同因素。最后确定统计分析的类型,做好统计计算工作。多元化统计方法要根据调查的实际情况,已统计理论知识为基础,灵活运用。达到最终的调查目的,为经济发展所做的决策提供可靠依据。

结论

综上所述,社会主义市场经济的发展,社会的不断进步,离不开对市场的调查研究。而在市场调查中,运用正确的数据统计分析法具有重要意义。统计工作的要求就是要保证数据的真实、可靠、准确。只有这样才能够获得科学的数据分析结果,才有利于正确决策的制定。

参考文献:

数据分析统计学方法例4

关键词:

宏观经济统计分析;统计方法;关键问题

从概念上来看,宏观经济统计分析是建立在经济学、统计学知识体系基础上,以统计知识为核心,围绕经济学知识进行研究和分析。在我国社会主义市场经济体制下,宏观经济统计分析的内容也经历了几个不同发展阶段。在以计划经济为主时期,宏观经济统计分析主要运用计量经济学知识,利用数理统计和模型分析,来完成对国民经济运行系统的优化和平衡。同时,借助于政府统计系统,从国民经济运行相关数据分析中,对计划执行情况进行研究,改进下一阶段计划经济重大问题。这一时期的计划经济为宏观经济统计分析提供了基础数据,但是,对于统筹兼顾、优化管理为主体的计划经济管理思想是一以贯之的。从我国统计学发展历程来看,对于宏观经济统计分析的内容,概况的讲,主要是围绕国民经济主要经济指标来展开,如利用国民经济账户、投入产出、资金流量表、国际收支平衡表等,从各个核心部门、核心指标、核心统计体系中来分析国家、产业的发展状况,减少经济危机的发生。改革开放以后,我国宏观经济统计分析,借鉴了马克思社会再生产、计划经济管理理论,同时借鉴了国民经济核算体系理论思想,完善了我国国民经济综合平衡统计方法,逐步实现了财政、信贷、外汇、物资的四大平衡。在以信息社会、大数据时代为特征的第三阶段,宏观经济统计分析将实际问题作为研究重点,特别是经济学与现实问题的关联,大数据环境下数据的可比性,统计分析方法的科学性和实效性等。

一、宏观经济统计与宏观经济统计分析概念研究

我国国民经济统计主要依托国民经济核算体系,包括经济循环理论下的宏观经济统计指标体系,以及各类标准、统计分类等内容。宏观经济统计,从概念上理解为从宏观上来探讨经济运行过程及结果的统计测度理论和方法。从统计范围来看,主要从经济活动中来获取统计数据,包括各类经济活动的信息整理、也包括各类统计部门设计的用于统计实际数量的调查资料。统计学是依据统计学理论,运用统计学方法来对各类经济信息进行统计分析,如利用抽样调查来进行统计分析,以实现对样本总量的推断;在获取相关统计数据内容时,常用的统计方法有分类法、关联统计法、变化率统计法、总量统计法、结构统计法等。信息化社会的发展,特别是基于网络技术的电子商务平台的建设,使宏观经济统计分析的独立性和地位更趋重要。概括来讲,经济统计分析从统计方式、统计数据上来全面认识经济获得,并从有效分析中提升经济发展水平.宏观统计数据的测度方式及搜集方法,与传统的调查方法,如普查、抽样调查、统计报表相类似,在现代经济统计中,增加了软统计内容,如抽样问卷、心理量表等。宏观经济统计分析是建立在宏观经济统计基础上,利用统计学理论和方法,以实证经济分析来处理统计结果。从概念上来看,广义的宏观经济统计分析包括的经济活动较多,不仅有重要的宏观经济指标内容,还有其他与国民经济管理相关的统计分析。微观来讲,宏观经济统计分析主要从经济问题的统计分析研究中,来构建统计分析模型,并从统计分析变量或指标中探析统计数据所反映的结果。

二、宏观经济统计分析体系研究

1.宏观经济统计分析内容

宏观经济统计分析体系包括宏观经济学目标、宏观经济管理目标和宏观经济统计目标三项内容,对于宏观经济学目标,主要从宏观经济统计分析对象,如社会总供给、总需求等建立均衡统计分析,从国民收入分配统计分析中来构建各项统计指标,如产业结构统计分析、经济周期统计分析、知识经济发展与创新统计分析、消费-投资需求分析、通货膨胀统计分析等等。宏观经济管理目标主要从宏观经济运行体制及组织结构上,围绕国家经济社会重大战略开展统计分析。如创新型国家经济战略、科教兴国战略、财政政策、货币政策、城镇化区域发展战略、可持续发展战略等等。宏观经济统计目标主要从国家统计、部门统计、行业统计、区域统计等层次化统计数据基础上来开发,围绕社会创新、政府管理、科学研究等内容展开统计方法创新。

2.宏观经济统计分析问题

宏观经济统计分析是政府统计工作的重要内容,一方面归结为制度化的统计分析工作,另一方面表现为专题型或问题型统计分析工作。在制度化统计分析工作中,围绕政府统计调查指标体系,从宏观经济运行过程及结果中来搜集数量特征、数量关系,并从宏观经济运行情况综合表现上来剖析主要问题和成功之处;对于各项宏观经济政策措施的执行情况进行跟踪,对执行效果进行对照分析,并从存在问题中来提出应对建议。如国家统计局和各下属统计单位,每年要对上一年度的统计工作进行汇报,以经济分析白皮书形式进行综合。制度化宏观经济分析工作,能够从社会生产、市场供需、收入分配、金融市场化、国际收支等多方面进行呈现,既有动态指标,也有近期、中长期发展趋向分析。宏观经济专题统计分析具有灵活性和变化性,主要是围绕不同时期的经济工作,从经济问题中来展开针对性调查统计分析。其特点表现在:一是对所研究的问题或专题具有较深的研究;二是多采用多重调查方法来实现对专题问题的全面分析,如抽样调查、软实力调查、问卷调查等的综合使用;三是运用现代信息技术来提升统计分析能力,特别是用网络化平台技术来弥补传统调查方法的不足,改善数据质量等。

三、宏观经济统计分析方法研究

宏观经济统计分析方法具有多样性,针对不同问题,有搜集数据、整理数据方法,也有针对经济问题的分析方法,还有基于统计描述和探索性数据分析方法。总的来看,对于宏观经济统计分析工作,多种方法的综合运用有助于提升宏观经济统计分析的科学性和有效性。对于宏观经济统计分析,不同领域所涉及的统计方法具有交叉性。但对于宏观经济分析中动态经济分析、静态经济分析、比较动态经济分析、比较静态经济分析方法所反映的经济学问题,能够从全面质量管理方法中体现目标、过程、方法、绩效、因素等统计描述信息,改善统计分析的应用实效性。主要常用的方法有因素分析法、指数分析法、弹性分析法、时间序列分析法、应用回归分析法和多元统计分析法等。对于不同经济变量体系的描述,根据经济运行过程及数量特征,从所选定的指标变量上来进行估计,包括推算、核算和估算等方法。描述性统计分析方法是基于统计分析应用,从构建基本逻辑架构中来分析客观存在的相关变量之间的关系;由于经济活动中各经济关系之间存在动态性,需要从经济分析的聚类、因子分析等方法中,运用分层回归、分位回归以及协整分析方法来转换,以促进对各项分析指标体系进行综合评价和反映。同样道理,在宏观经济统计分析方法研究中,面对大量微观性数据,如何发挥统计变量测度及过程变量特征分析优势?实践中常用统计系统描述方法,将系统分类及归纳至分位、分层、立体、动态的复杂系统中,从探索各关系变量及因素之间关系上来进行描述性分析。如在人口普查以及经济普查中,对于各类模拟系统方法的运用,主要从各因素的顺序识别和组内方差缩小、组间方差扩大上来实现动态过程的科学推断,提升核心主体的统计分析精度。

四、宏观经济统计分析的趋向研究

从宏观经济统计分析的应用来看,当前社会环境下面对更多挑战,其主要研究方向有以下几点:一是做好对国家经济社会发展管理的重要决策导向研究,特别是在信息技术快速发展背景下,从海量数据分析中来挖掘科学的信息资源,来优化和辅助市场化竞争、产业竞争及区域、国际间的竞争需要。哈佛大学加里·金(GaryKing)提出“信息革命背景下,对于海量数据资源的统计分析,将席卷商业界、学术界和政界”。建立在大数据基础上的精细化测量行为研究,从经济领域、商业领域来拓宽延伸,以促进社会发展;二是顺应大数据时代的发展机遇,在中国特色社会主义市场经济转型关键期,从协同政府、行业、经济、社会发展关系的角度,以政府公共数据共享平台建设来完善社会发展科学管理水平,从中长期发展政策分析中来进行科学谋划和实施。对于统计信息平台中的活动、业务、行政记录、财务信息等资料,要按照统计数据的统一化要求进行科学转换,增强宏观经济统计分析的决策科学化能力;三是强化创新型国家建设统计分析工作,围绕国家创新能力、国家创新体系建设发展要求,从国家科技政策制订,到各项经济统计工作的实施,都应扎实推进宏观经济统计分析在经济建设中的核心和驱动地位;四是构建高端化的产业结构统计分析模型,围绕我国全面转型过渡期的产业结构现状资料,从构建“三高一低”产业结构高端化统计目标入手,加大对信息化金融产业的创新,延长产业价值链,增强产业辐射及带动作用,优化产业结构向高端化进程转移;五是注重金融统计分析,完善我国金融管理体系,提升金融管理效率。在建设金融服务业与其他产业的协同发展上,发挥统计手段来全面跟踪和优化我国货币政策服务环境,挖掘金融数据,加大金融风险监测和防范;六是注重宏观经济空间统计分析,依托大数据时代数据集中化平台,为宏观经济统计分析创造有利环境,实现大数据的共享、合作和协同发展,真正实现大数据的整体效益。

参考文献:

[1]赵彦云,周芳.试论大数据时代中国政府统计改革发展新模式[J].教学与研究,2014(01).

数据分析统计学方法例5

作者简介:李金昌,男,50岁,浙江义乌人。浙江财经大学校长,统计学教授,博士生导师。研究方向为经济统计学,统计理论与方法,抽样技术,政府统计等。

最近两年,统计学界对大数据问题所进行的理论探讨逐渐增多,视角也各有千秋,引起了一些共鸣。围绕大数据问题,由统计学、计算机科学、人工智能、数学等学科共同支撑的数据科学开始形成。但大数据毕竟是一个新课题,因此远未达到对其有一个系统完整的认识,仍然需要从不同的方面加以研究,其中有一个重要但又容易被忽视的问题,即统计测度问题,值得去探讨。

一、什么是统计测度

汉语上,测度是指猜测、揣度、估计。数学上,测度是一个函数,它对一个给定集合的某些子集指定一个数,这个数可以比作大小、体积、概率等等。通俗地说,测度把每个集合映射到非负实数来规定这个集合的大小:空集的测度是0;集合变大时测度至少不会减小(因为要加上变大的部分的测度,而它是非负的)。

除了数学角度的测度论,查阅国内文献资料,带有测度这个词汇的文献不少,但专门针对统计测度(或测度)内涵的讨论几乎没有。一些对社会经济现象进行分析测度的文献,例如新型工业化进程测度、货币流动性测度、全面小康社会发展进程测度、收入分配公平性测度、技术效率测度、人力资本测度、金融风险测度、产业关联测度等等,所做的测度都是再测度,均不对测度本身进行讨论。查阅国外文献资料(关键词:measurement),也同样存在这样的问题,只能收集到一些比较零散的表述。LudwikFinkelstein(1975)[1]认为,在我们对事物或现象进行描述时,测度可以被定义为对现实世界中某一现象的个体属性或特征进行量化的过程。JamesT.Townsend和F.GregoryAshby(1984)[2]认为,如果按照极端的观点,那么统计分析中的基本测度理论的含义仍然是存在争议的。LudwikFinkelstein(2003)[3]指出,测度在那些原来尚未得到卓有成效或广泛应用的领域,也已取得了明显的进步,社会、政治、经济和行为科学正在更大程度地利用定量技术;测度是现代思维的一种实际有效的工具,是我们借以描述世界的一种方法。GiovanniBattistaRossi(2007)[4]认为,用以表示测度结果的,是数字或者数字符号。LucaMari(2013)[5]认为,测度的基础特征是被公认为世界上获取并正式表达信息的基本方法,这让它成为一种跨学科的工具。LudwikFinkelstein(2014)[6]指出,在自然科学技术中,测度的重要性不可否认,它是科学调查和发现必不可少的工具,它可将宇宙中的复杂现象用精确、简洁和普遍的数学语言来描述。

那么,到底什么是统计测度呢?目前没有一个统一的定义。本文认为,统计测度具有不同于测度的意义,并且大大超越数学上的界定,即它具有数学定义的一般属性,但又不受制于函数表现形式,因为统计测度所要面对的是现实世界,实际问题要比理论上可以定义的问题复杂得多。按照我们的理解,统计测度就是用一定的符号和数字,用一定的形式和载体,对所研究的现象或事物的特征进行量化反映,表现为可用于统计分析的数据的过程。它应该具有这样一些属性:以实际现象为测度对象,测度结果具有实际意义;以量化为目的,把信息转化为数量,提供人们容易理解的定量结论;个体特征的测度符合形成总体定量结论的要求,同时能够体现个体差异。可以发现,统计测度需要借用数学工具,但更重要的是对具体测度现象本质特征的认识和掌握。

统计测度可以从若干不同角度进行分类。邱东教授(2012)[7]曾在“宏观测度的边界悖律及其意义”一文中,从边界的角度对宏观测度进行了分类:一是因事物本身可测度性而形成的边界,即本体论意义上的测度边界;再一是由人的认知能力而形成的边界,即认识论意义上的测度边界;第三则是由统计相关性偏好和投入约束而形成的边界,即操作意义上的测度边界。这三条测度边界,应该以本体论意义的测度边界最大,认识论意义的测度边界次之,而操作意义的测度边界最小。这样的分类,对于我们正确理解统计测度的内涵很有帮助。受此启发,笔者认为统计测度还可以有如下分类:

1.从测度的实现形式看,可以分为原始测度和再测度。原始测度也可以称为直接测度,它通过对测度对象进行直接测度来获取数据,例如清点库存物品数量、丈量作物播种面积、观察培育细菌数目、检测药物成分等获得的数据,以及各种登记、记录的原始数据等等。再测度也称为间接测度,它以其他已知的测度数据为基础去计算、推算或预测所需的未知数据,例如根据GDP和人口数测度人均GDP、根据人口普查分年龄人口数据测度老龄化系数和社会负担系数、根据相关指标数据测度CPI的变化等等。复杂的再测度则需要借助相应的统计模型作为工具,因为它实际上是对相关变量之间的关系进行定量反映。从两者关系上看,原始测度是基础,是根本,没有科学的原始测度就不会有可靠的再测度;再测度则是测度功能提升的必然要求,以解决原始测度不能解决的问题。

2.从测度的计量方式看,可以分为自然测度、物理测度、化学测度、时间测度和价值测度。自然测度是利用现象的自然属性所进行的一种统计测度,例如人口规模、企业数量等的测度,采用自然计量单位;物理测度是利用现象的物理属性所进行的一种统计测度,例如公路长度、作物播种面积、天然气产量等的测度,采用物理计量单位;化学测度是利用现象的化学属性所进行的一种统计测度,例如医学、生物学中化学合成物的成分结构测度,采用百分数、千分数或特定标识为计量单位;时间测度是利用现象的时间属性所进行的一种统计测度,例如劳动用工、闲暇时间等测度,采用时间计量单位;价值测度是利用现象的价值属性所进行的一种统计测度,例如劳动报酬、经济活动成果等测度,采用货币计量单位。在这些测度计量方式中,价值测度因最具有综合功能而应用最为广泛。

3.从测度的方法看,可以分为计数测度、测量测度、实验测度、定义测度和模型测度。计数测度是一种通过观测计数来获得数据的方法,最为简单,一般用于自然测度或时间测度;测量测度是一种根据物理或化学规制对现象进行测量、测算来获得数据的方法,一般用于物理测度或化学测度;实验测度是一种按照科学实验原理、通过观察实验对象在既定条件下的反应来获得数据的方法,一般与测量测度相结合,用于获取科学研究数据;定义测度也可以称之为指标测度,是一种通过探究现象的本质特征和活动规律、归纳出表现其数量特征的范畴、给出统计指标定义(包括内容、口径、计算方法和表现形式等)来获取数据的方法,最常用于价值测度,也用于其他形式的测度。可以说,定义测度方法应用最为广泛,但也最为困难。模型测度是一种根据现象与现象之间的内在联系关系、或者现象自身的发展变化规律,通过建立一定的方程模型来获取数据的方法。前面三种统计测度方法基本上都属于直接测度,定义测度既可能是直接测度、也可能是间接测度,而模型测度都属于间接测度方法。

4.从测度的维度看,可以分为单一测度与多维测度。单一测度是指采用单一的方式方法对所研究现象或事物进行单一角度的测度,获得单一的数据。多维测度是指对所研究现象或事物进行多角度的测度,测度过程中可能需要采用多种测度方法和计量方式,例如多指标综合评价就需要借助统计指标体系对评价对象进行多角度的测度。显然,单一测度是多维测度的基础。

二、统计测度是统计学的立足之本

首先,从统计学的发展历史看,是统计测度使统计学破茧而出。为什么主流观点认为政治算术是统计学的起源而不是国势学?正是因为威廉·配第首次采用统计测度的方式进行了国家实力的统计分析和有关推算,得出了令人信服的结论。威廉·配第在1693年出版的《政治算术》[8]中写道“因为和只使用比较级或最高级的词汇以及单纯作思维的论证相反,我却采用了这样的方法(作为我很久以来就想建立的政治算术的一个范例),即用数字、重量和尺度的词汇来表达我自己想说的问题,只进行能诉诸人们的感官的论证和考察在性质上有可见的根据的原因”,这一观点在统计学的发展过程中产生了非常重要的影响。他的这段话虽然没有出现测度一词,但却道出了测度的本质,即让事物变得明白、变得有根据,因为“数字、重量和尺度”就是测度、就是根据,用“数字、重量和尺度的词汇来表达想说的问题”就是一种测度的思想,尽管测度的方式方法还很简单。相反,国势学虽然提出了归纳法这一统计学的基本方法并首创了统计学一词,但由于没有采用统计测度的方式进行国势问题的研究而难以修成正果。正如邱东教授[7]所说:“在配第之前,统计学的研究对象虽然是国家的态势,但它在方法论上只是定性言说。一个国家的财富总量在本体论意义上是可以测度的。然而只是到了配第时期,人类才想到了要测度它,并发明了如何测度的基本方法。政治算术,即开创期的经济统计学,实现了从无到有的转变,大大扩展了宏观测度的认识论边界,因而才具有了统计学范式创新的革命性意义。”同样,格朗特的《关于死亡表的自然观察和政治观察》也是人口统计测度方面的经典之作,无论是原始测度还是再测度,都给后人留下了宝贵的财富。之后,统计学就是沿着如何更加科学、准确测度世界这一主线而发展的。笔者曾在“从政治算术到大数据分析”一文[9],对数据的变化与统计分析方法的发展进行了粗浅的归纳,其主题实际上就是统计测度问题。

其次,从统计学的研究对象上看,统计测度是体现统计学数量性特征的前提条件。统计学的研究对象是现象的数量方面,或者说统计学是关于如何收集和分析数据的科学。统计数据从何而来?从统计测度中来。数据不同于数字,数字是统计测度的符号,数据是统计测度的结果,这也正是统计学区别于数学之处。所以说,数据的本质问题就是统计测度问题,故此统计测度是统计学的基本问题。这里重点讨论两个问题:一是统计测度与统计指标的关系,二是统计测度面临的新问题。关于第一个问题,本文认为统计测度与统计指标是一个事物的两个方面,这个事物就是数据。统计指标法是统计学的基本方法之一,尽管前面对统计测度从方式方法上进行了分类,但从广义上说所有统计测度都是定义测度,都表现为指标。也就是说,任何统计测度———不论是直接测度还是间接测度,最终目的是获得能够让人明白的数据,而表现数据的最主要形式就是统计指标,其他表现数据的形式都是派生出来的。所以,统计测度就是根据所设定的统计指标去获得所需的数据。关于第二个问题,与后文所要论及的大数据有关,就是定性测度问题。在统计学中,数据可以分为两类———定性数据与定量数据,其中定性数据又包括定类数据与定序数据两种,它们属于非结构化或半结构化数据。相应地,统计测度也可分为定性测度与定量测度。很显然,只有定性测度与定量测度方法得到同步发展,统计学才能更加完善。总体上看,定量数据的统计测度已经比较完善,但定性数据的统计测度还有很多问题尚待解决,难点就在于测度的切入点———如何提取有效的信息、如何最终转化为统计指标。尽管关于定性数据分析的论著已经不少,但还没有从理论方法上建立起定性数据统计测度的体系,因此统计学在这方面的任务依然很重。

第三,从统计学的永恒主题看,通过科学的数据分析、得出有效的结论是其不变的追求,而数据分析过程就是综合的统计测度过程。获得数据的目的是为了发现隐含其中的有价值的信息,即发现数据背后的数据,让数据再生数据,从而满足人们认识事物、掌握规律、科学决策的需要。除了总量、结构等基本信息外,更重要的是通过数据分析来呈现现象的变化规律与相互关系。不难发现,这种数据分析的过程,就是不断进行各种统计测度的过程,所以最终的统计分析结果实际上就是各环节、各方面的各种类型的统计测度的叠加结果,或者说是统计测度不断放大的过程。大量针对社会经济现象进行分析研究的文献(不论是否冠以“测度”两字),只要有数据分析,都是如此。可以说,统计测度贯穿于统计数据分析的全过程。但是,为什么很多统计数据分析并没有得出有效的结论呢?本文认为原因就出在统计测度上,尤其是没有首先解决好原始统计测度问题。应该说,围绕数据分析已经建立起一整套比较完整的统计方法体系,很多方法也都身经百战、行之有效,但一旦原始统计测度有问题、数据不准确或不真实,那么任何方法都只是摆设。仔细研读很多所谓的实证分析文献,其重点均在于构建什么样的模型或运用什么样的方法,虽然有的文献也必须要讨论选择什么样的变量(指标)这个问题,但并不是系统地从测度的角度进行阐述,因此所用的模型越来越复杂,但所得的结论却离实际情况越来越远。学界总是有这样一种观念:变量越多、符号越新奇、模型越复杂的文章才越有水平,似乎这样分析所得的结论才越可靠。殊不知,不以科学可靠的原始统计测度为基础,任何数据分析都会成为无源之水、无本之木,所得的结论也只是更精确的错误而已。本文认为,任何脱离科学统计测度的统计分析都是毫无意义的,充其量是一种数字游戏而已。应该树立这样一种观念:科学的统计数据分析首先取决于科学的统计测度,而不是首先取决于什么样的分析模型,虽然模型也很重要。这也再一次证明,统计测度问题是统计学的根本问题。其实,归根结底看,在统计数据分析过程中,每一步分析都以前一步的测度为原始测度,每一步所用的方法都是统计测度方法,因此所有的统计分析方法都是统计测度方法。甚至可以说,统计学方法体系就是统计测度方法体系。

当然,在实际的统计分析中,统计测度往往遇到一些困难,即有些指标数据由于各种原因无法获得,这就不得不采用替代这种途径。例如,绿色GDP核算的概念已经提出很多年,但为什么还没有哪个国家真正公布绿色GDP数据,原因就是自然资源价值、生态环境价值等的统计测度目前还面临着很大的困难,其背后存在着一系列有待进一步研究和解决的理论与实践问题,因此不少学者进行了替代测度的探讨。这一方面说明统计测度的重要性,另一方面说明统计测度替代的无奈性。但是,替代测度必须遵守相应的规则与逻辑,要经得起推敲。有的文献明明知道有关变量无法测度、有关数据无法获得,却随意地、不符合逻辑地进行所谓的替代,结果是最后的结论不知替代成什么样了,很难理解它的意义。关于替代测度的有效性问题,邱东教授[7]已有精辟的论述,在此不再展开讨论。

三、统计测度是数据科学的基础

笼统地讲,数据科学就是以大数据为研究对象的科学,需要多学科交叉融合、共同支撑。由于大数据是快速增长的复杂数据,因此大数据分析仅有统计思维与统计分析方法是不够的,还需要强大的数据处理能力与计算能力。只有把统计思维、统计方法与计算技术结合起来,才有可能真正挖掘出大数据中的有价值信息。本文认为统计思维、统计方法与计算技术相结合的基础就是科学的统计测度。

首先,大数据技术不能自行解决其计算和分析应从何处着手的问题。现代信息技术与互联网、物联网技术的快速发展,使人类进入大数据时代,也有人说进入到数联网时代,这意味着我们一方面被各种越来越多、越来越复杂的数据所包围,另一方面又被数据中巨大的信息价值所吸引,想从中挖掘出可供决策之用的信息。如何挖掘大数据?人们已经进行了艰苦的探索,发展了很多专门的方法技术,并已尝到了不少甜头,但远未达到充分利用大数据中有效信息的目的,因为已有的大数据分析研究主要集中于计算机科学与技术、软件工程、计算数学等领域,重点是计算能力与算法研究,而很少从统计学的角度进行有针对的探讨,还没有真正进入数据分析的深层。这里面实际上忽略了最基础的统计测度问题。如果说,计算技术的发展能够解决数据储存与计算的能力问题,算法模型的改进能够解决大数据分析的综合能力问题,那么它们仍然不能解决对谁进行计算与分析的问题,也即从何处着手的问题。无论是传统的结构型数据,还是现在的包含大量非结构型数据的大数据,要对它们进行分析都必须找到正确的切入口,即分析的基本元素是什么,或者说需要测度什么。当然,还有如何测度的问题。然后,才能进行分组、综合和构建模型,否则大数据分析不会达到人们的预期。

其次,大数据之所以催生数据科学,就是为了通过多学科交叉融合来共同解决大数据分析中存在的问题,其中包括统计测度问题,这一点对于非结构化数据尤为突出。实际上,大数据的本质就是非结构化数据,一是体量大、比重高(超过95%),二是变化快、形式多,三是内容杂、不确定。通过各种社交网络、自媒体、富媒体,以及人机对话和机器感应记录等产生的各种非结构化数据,例如各种文字、各种表情符号、各种声音、各种图像,到底表示什么?综合在一起能体现什么规律?如何综合各种信息?存在着大量有待研究的问题。其实,文字的长短、用词、表达形式(叙述式、议论式、散文式、诗歌式,等)甚至字体大小与颜色,表情类型与偏好,声音高低、频率与情绪,图像颜色等等,都是有特定意义的,即在特定环境条件下的反应。所以,一句话或一段声音的意义并非文字本身的意思,一个表情符号的意义并非符号表征的意思,一个图像的意义并非图像内容与色彩本身的意思,因为背后有太多的未知。人们浏览检索各种信息的习惯、收看与回复邮件等信息的习惯、参与信息网络的习惯、购物习惯与支付习惯等等,也是如此。更何况,同样的网络词汇在不同的时间代表着不同的语义。这背后隐藏着的是人们的行为与社会关系,既具有个性又具有共性,极其复杂。所以对这样的数据进行分析,首先绝非是计算问题,也不是用什么模型问题,而首先是从何处着手、如何选取关键词、如何选定关联词、可以用什么样的指标来综合、可以用什么样的表式来表现等问题,一句话就是统计测度问题。非结构化数据的统计测度将主要是定义测度,这些问题不解决,分析模型也是难以构建的,或者难以得出令人信服的结论。

例如,关于《红楼梦》前80回与后40回是否同一作者的争论,韦博成[10]进行了综合性的比较研究并提出了自己的观点,他指出已有美国威斯康辛大学华裔学者陈炳藻教授(1980)[11]、我国华东师范大学陈大康教授(1987年)[12]和复旦大学李贤平教授(1987年)[13]等学者从统计学的角度进行过专门的研究,但却得出了不同的结论:陈炳藻教授认为前80回与后40回均是曹雪芹所著;陈大康教授认为前80回与后40回为不同人所著;李贤平教授认为前80回是曹雪芹根据《石头记》增删而成,后40回是曹雪芹亲友搜集整理原稿加工补写而成。此外,还有其他一些学者进行过类似的研究,也有一些不同的结论。为什么都通过提取关联词和统计的方法却得出不同的结论?原因就在于用以分析的关联词不同,即统计测度的切入点不同,当然也有统计方法上的差异,但前者是根本。至少存在几个统计测度上的问题:提取单一维度的关联词还是多维度的关联词?提取什么类型的关联词(例如:关联词是名词、形容词还是动词;是花卉、树木、饮食、医药还是诗词)?这些关联词可以综合为什么样的指标?等等。由此可见,原始统计测度代表着数据分析的方向。

相比《红楼梦》,大数据分析要复杂得多、困难得多。所以,数据科学除了需要数学、统计学、计算机科学与技术、人工智能等学科的交叉融合外,还需要与行为科学、语言学、社会学、经济学等学科相结合,以便能很好地解决作为数据分析之前提的统计测度问题。

第三,数据科学将进一步拓展统计测度的边界,并提出更高的要求。伴随着人类认识世界的范围的不断拓展,统计测度的范围也不断扩大,从自然现象统计测度到人口现象、经济现象统计测度,再到社会现象、环境现象、政治现象等统计测度,几乎已经渗透到了所有可以想象到的领域。相应地,统计数据分析也从少量数据的分析进入到了大数据分析。大数据的复杂性、不确定性和涌现性(王元卓等,2013)[14],意味着统计测度的内容大大增加,原来一些不能测度的数据被纳入到了统计测度的范围,按照邱东教授的说法就是统计测度的边界大大扩展了。统计测度边界的扩大,必须以统计测度能力的提升为前提,即要求统计学借助现代信息技术进一步提升处理和分析数据的能力———对大数据“化繁为简”、“变厚为薄”的能力,这就必须以科学准确的大数据统计测度为前提,既改变统计思维,又创新统计分析方法,其中就包括统计测度思维、统计测度方法与统计测度标准。面对大量繁杂的数据,如果没有更好的统计测度思路与方法,包括个体标志定义方法、最小数据细胞分组与聚类方法、关联词含义的时间影响计量方法、定性测度指标筛选方法、再测度路径与方法、大数据统计测度评价标准等,那么统计学在数据科学发展过程中就难以发挥应有的作用,数据科学也将裹足不前。这就是统计学迈向数据科学的重要挑战之一。

综上所述,统计测度的基础性问题从统计学延伸到了数据科学,是两者的共同基础,并且对于数据科学而言显得更为重要。大数据的复杂性、不确定性和涌现性导致了统计测度的难度猛增,亟需建立面向大数据分析的统计测度理论与方法。要通过研究大数据的复杂性、不确定性和涌现性特征的基本因素,以及这些因素之间的内在联系、外在指标和测度方法,进而研究基于先进计算技术的大数据度量模型,构建寻找面向计算的数据内核或者数据边界的基本方法。总之,建立有效易行的数据表示方法,即科学的统计测度方法,是数据科学必须解决的基础问题之一。

四、创新与完善大数据统计测度方法

如前所述,统计学研究对象已经从结构化数据延伸到了包括非结构化数据在内的一切数据,统计测度边界得到了大大的扩展。按照邱东教授[7]曾经引用过的海德格尔的话:“界限并不表示某一事物的发展到此为止,而是像希腊人所认知的那样,界限是某种事物开始展现的地方”,预示着统计学在数据科学发展阶段的新起点已经展现在我们面前。新的统计测度边界催生统计测度方法的创新,统计测度方法的创新促进统计测度边界的拓展,两者相辅相成,共同推动统计学与数据科学的发展。为此,我们要系统梳理统计测度方法的发展历程,面对大数据提出的新挑战,大胆探索统计测度的新思路、新理论和新方法,为数据科学奠定坚实的统计学基础。为此提出如下几点建议:

首先,要紧密结合现象的本质去探求更科学的统计测度方法。本质决定一切,既然统计测度的目的是获得客观反映现象本质的数据,那么深入到现象本质、认识和掌握现象的本质,是科学统计测度的关键,也是探求新的统计方法的出发点。换句话说,科学的统计测度方法能够体现出数据的真正意义。例如,要探求社交网络数据的统计分析和测度方法,就必须了解社交网络的产生背景、构成要素、表现形式与基本特征,既要研究它的共性问题,又要研究它的个性问题与差异性,同时还要研究它的变化趋势。只有这样,才能掌握社交网络数据的构成要件或元素,才能建立起科学的、能有效体现社交网络数据意义的统计测度方法。再如,要分析研究电子商务数据,也必须先弄清楚什么是电子商务,尤其是弄清楚它与传统的商业模式有什么不同(包括物流、资金流与信息流)、有哪些新生事物(包括时空特征、法律监管)等等,否则统计测度无从下手或者抓不住要害。同时,作为一个新的研究领域,数据科学的理论基础将与计算机科学、统计学、人工智能、数学、社会科学等有关,离不开对相关学科领域知识与研究方法的借鉴,因此对相关领域的知识与研究方法的学习十分重要。否则,就会严重扭曲统计测度方法,胡乱设置测度标志,这需要引起高度关注。

其次,要紧密结合大数据的特点去创新统计测度方法。大数据的特点是复杂性、不确定性和涌现性并存,构成了多维的数据空间,里面蕴藏着丰富的信息资源,这是传统的统计数据不可比拟的。那么该从何处进入这样的数据空间?怎么进去?又怎么出来?这归根结底还是统计测度方法问题。因此,在开展大数据分析之前,首先要研究大数据的基础性问题,包括大数据的内在机理(包括大数据的演化与传播机制、生命周期),数据科学与社会学、经济学、行为科学等之间的互动机制,以及大数据的结构与效能的规律性等等,为创新统计测度方法提供导向。本文认为,再复杂的数据也有共性,再不确定的数据也有规律,再涌现的数据也有轨迹。网络大数据背后的网络平均路径长度、度分布、聚集系数、核数、介数等具有共性的特征与参数,是开展复杂网络数据分析的基础(李国杰、程学旗,2012)[15];大数据在时空维度上的分布形式、内在结构、动态变化和相关联的规律,是找到大数据分析切入口、进而简化大数据表征的前提;大数据的涌现性轨迹(包括模式涌现性、行为涌现性和智慧涌现性),是研究更多的社会网络模型和理解网络瓦解失效原因,理解人们网络行为涌现特征(例如人们发邮件数量的时间分布特征),以及探求大量自发个体语义融合连接形成有特定意义的通用语义之过程的路径(靳小龙等,2013)[16]。也就是说,这些共性、规律和轨迹就是统计测度的主要依据,也是重点内容。发展和创新能够准确发现大数据的共性、规律和轨迹的定量方法,其实就是发展和创新大数据统计测度方法。

数据分析统计学方法例6

中图分类号:O13;F224 文献识别码:A 文章编号:1001-828X(2016)030-000-01

引言

数学学科重视逻辑思维能力,具有高度的抽象性,被广泛应用于社会生活的各个方面,如工程学、经济学等等。数学学科中的统计方法对经济学具有重要意义,对于现代企业来说,经济上决策的制定实施都需要应用数学的统计方法。因此,应当对数学统计在现代经济与管理领域的应用进行具体分析,以帮助企业提高经营效率,从而促进我国经济的发展。

一、数学统计法对于现代经济与管理领域的意义

1.解决复杂问题

现代经济和管理领域问题需要严密精确的计算,而数学统计最大的特c是逻辑缜密。把数学统计的方法应用于现代经济和管理领域,可以有效解决复杂问题。数学方法和经济学和管理领域密切相关,衍生出数理经济学、产权经济学等多门专业学科,说明统计方法在现代经济中已经得到了广泛应用[1]。

2.进行科学决策

企业对经济管理领域活动进行评估,需要从定性分析发展为定量分析,这一分析过程需要应用数学统计的方法。在制定决策时,企业应用数学统计方法,来进行精确的分析决策,可以有效提高企业决议的科学性,避免造成资金财力的损失。在决策之后,企业对自身的发展状况有了准确认识,可以进一步提出发展规划,促进企业蓬勃发展。

3.分析现论

数学统计方法是分析经济管理理论的重要工具。经济学的数据比较繁杂,把统计方法和现代经济管理理论相结合,可以化难为易,解决深奥的数学问题。近年来,人们尝试用统计方法进行数量关系分析,对质和量的判定都精准无误,为分析理论提供了非常有效的渠道和途径。

4.指导经营活动

事物的发展会经历一个从量变到质变的过程,经济与管理领域的问题也不例外。因此,经济与管理领域问题中的定性分析和定量分析具有重要意义。数学统计方法通过数量关系分析经济要素之间的关系,对经济理论进行分析之后,企业制定相应的发展策略,指导经营活动。

二、数学统计法在现代经济与管理领域的应用问题

1.我国市场经济体系存在弊端

运用数学统计的方法来解决经济与管理领域问题,有几个具体步骤。首先,要取出数学变量,建立相关模型。模型的建立需要对具体经济现象进行分析,同时要遵循相应的经济理论[2]。企业在经济运行过程中,需要建立宏观的经济模型,这就要求数学统计法对宏观的运行机制进行分析。只有保证宏观经济运行机制描述的客观性,以及宏观经济行为分析的科学性,才能确保数学统计法的顺利实施。但是目前我国的社会主义市场积极体系还不完善,许多基础的理论问题没有得到解决,导致数学方法无法在经济学领域中有效应用。

2.目前数据统计水平相对较低

数据对事物的描述具有重要作用,而经济统计数据指的是对经济事物和与经济有关的对象进行描述。经济统计数据的准确与否将直接影响到分析经济管理问题的结果。数据统计法的对象便是数据,如果经济统计数据出现了问题,数据统计法也将失去效用。目前我国数据统计水平相对较低,可用数据口径不一,无法整合到一起满足解决问题的需要。随着我国经济的不断发展,经济数据越来越繁杂,整理工作越来越困难,极大影响了我国的数据统计水平。

3.对数学统计的认识存在问题

数学统计方法的目的是化难为易,高效地解决经济与管理领域问题。在使用过程中,要注意方法使用的科学性和合理性。但是在当下企业,一些经济分析师为了炫耀自己的才华,盲目使用数学统计方法,认为只有应用这种方法才能提升工作水平。这种认识是错误的,极不利于企业的良性发展[3]。部分分析人员没有掌握数学统计方法的基本原理,在解决问题时难免出现纰漏,造成经济事故。

三、数学统计法在现代经济与管理领域的应用策略

1.健全社会主义市场经济体系

就上文分析的具体问题,将数学统计法应用于现代经济和管理领域,首先应当健全我国的社会主义市场经济体系。国家应该挖掘社会主义市场经济的发展规律,优化产业结构,使更多企业加入到市场的良性竞争中,提升自己的竞争实力[4]。企业在经济管理领域应用数学统计法的过程中,应当总结市场经济的发展经验,完善相关理论,从而进行科学分析,制定相应的发展对策。现代企业在良性竞争中发展,反之又能促进社会主义市场经济体系的完善。

2.建立经济数据网络收集平台

经济数据是进行数据统计的重要因素,只有保证经济数据的科学可靠,数据收集的及时有效,数据范围的广泛完备,才能使数据统计有效进行。因此,必须建立一个专门收集数据的网络平台,实现资源共享,提高数据处理的效率。我国经济数据的收集工作一般由经济部门完成,经济统计部门应该建立一套较为完备的数据统计体系,对应该收集的数据进行核实,对新兴的数据进行采集。同时,经济统计部门要加大调查力度,确保信息来源的全面性。最后,还应该调动相关部门积极配合,实现数据的顺利收集。

3.科学合理应用数学统计方法

运用数学统计方法分析经济问题,目的是把复杂的经济问题简单化,促进问题的解决。因此,企业经济部门人员应当科学合理地应用数学统计方法。经济问题的定量分析通常依据数学统计方法,但是定性分析拥有自己的专门方法。工作人员在具体的应用中要合理分析,选择最适合的方法[5]。

四、结论

数学统计在现代经济管理领域具有重要作用,企业应当重视应用数学统计法,精确分析相关问题,制定出相应的发展方案,从而促进自身的快速发展。目前数学统计法的应用还存在一些问题,政府、企业和社会如果能全力配合,寻找有效策略,就能促进我国市场经济的良好发展。

参考文献:

数据分析统计学方法例7

在十年新课程实践的基础上,我国的《数学课程标准(2011年版)》对统计领域做了进一步修订、完善。首先,《标准(2011年版)》将核心词“统计观念”改成了“数据分析观念”,以进一步明晰和强调“数据分析是统计的核心”,并重新阐述了其内涵:“了解在现实生活中有许多问题应当先做调查研究,收集数据,通过分析做出判断,体会数据中是蕴涵着信息的;了解对于同样的数据可以有多种分析的方法,需要根据问题的背景选择合适的方法;通过数据分析体验随机性,一方面对于同样的事情每次收集到的数据可能不同,另一方面只要有足够的数据就可能从中发现规律。”从修订后的表述中可以看出,《标准(2011年版)》仍将统计意识(即数据分析意识)放在首位,修订又进一步明晰了统计的两个核心目标:通过数据分析用合适的方法提取信息、通过数据分析体会随机性,期望通过统计学习帮助学生形成运用数据分析问题的思维方式。其次,《标准(2011年版)》在“统计”的内容结构方面做了较大调整,第一学段主要鼓励学生运用自己的方式(包括文字、图画、表格等)呈现整理数据的结果,不要求学生学习“正规”的统计图以及平均数(这些内容移入了第二学段)。统计量的教学也进行了调整,只在第二学段学习平均数,中位数、众数等内容移入了第三学段。

数据分析观念的形成是一个长期的过程,数学教学应经常让学生置身于实际情境中,经历收集数据、整理和描述数据、分析数据的统计活动全过程,引导学生思考“怎样收集数据”“怎样整理和描述数据”“如何根据问题的背景选择数据分析的方法”“从数据分析中能得到什么信息和解决什么问题”等,增强学生数据收集的意识,掌握一些基本的数据分析的方法,体验数据的随机性,发展数据分析观念。

一、引导学生积极参与数据收集和分析活动,发展学生的数据分析意识,使学生逐步养成用数据分析问题的思维习惯

学生“数据分析观念”的形成,首先是要形成通过数据来分析问题的意识和习惯,也就是当遇到有关问题时能想到调查研究,通过收集数据和分析数据解决问题。教学中,要设计一些基于实际生活的统计活动,创设含有数学问题的实际情境,激发学生真正投入到统计活动的全过程中,使学生能够通过收集数据、整理数据、分析数据解决问题或做出决策,在活动中获得数据分析的亲身体验,逐步形成用数据分析问题的思维习惯。例如,有一个班要过一次集体生日,班主任和同学商量“集体生日安排在几月份”,后来决定“哪个月过生日的同学最多,就把集体生日放在那个月”。接着引导学生收集数据、整理数据,最后组织学生分析获得的数据,并做出决策,确定“集体生日安排在几月份”。这样,通过调查统计活动,学生确定了集体生日的时间,解决了实际问题,并充分体会了统计在决策中的作用。再如,班级里要选择两位运动员参加校运会的投篮比赛,也可以引导学生用收集几位候选运动员的有关数据的方法,通过数据分析做出决策。

类似上面调查统计的活动还可以设计很多,如“搞体育比赛前,调查同学们最喜欢的体育运动”“开联欢会前,调查同学们最喜欢的水果”“统计水果店一周卖出各类水果的情况,为下一周的进货提供依据”“调查最爱收看的电视节目”“调查一年级同学掉牙情况”“调查学校教师使用的交通工具”“统计一个家庭一周丢弃的垃圾袋的数量”“统计学校门口的车流量”等。这样的活动贴近学生的生活实际,具有较强的可操作性,使学生在一次次经历数据收集与分析的活动中,积累统计活动经验,逐步体会到生活中充满着大量的数据,很多问题的解决可以先做调查研究、收集数据,再通过分析做出合理决策,逐步树立从数据收集与分析的角度思考问题的意识。另外,教师还可以引导学生经常记录、逐步积累一些与自己密切相关的基本数据,如“每天上学的时间”“每天写作业的时间”“吃一餐饭的时间”等,以便在需要的时候利用数据进行决策,也有利于学生的数据分析意识的形成。

二、引导学生学习掌握收集、整理、描述和分析数据的基本方法,学会根据问题背景用合适的方法从数据中提取信息,并根据信息做出合理决策或推断

运用统计分析和解决问题的过程一般包括下面三个步骤:根据收集数据的目的,决定收集数据的方法并收集数据;根据需要整理数据,并用一定的方式描述数据;分析数据,并做出合理决策或推断。在这个过程中,学生能否掌握一些收集、整理、描述和分析数据的基本方法,并根据问题的背景选择合适的方法非常关键。

(一)引导学生学习掌握基本的收集、整理、描述和分析数据的方法

常用的收集数据方法包括测量、调查、实验等直接获得数据的方法,也包括查阅资料等间接获得数据的方法。《标准(2011年版)》在第一学段提出“了解调查、测量等收集数据的简单方法”,在第二学段提出“会根据实际问题设计简单的调查表,能选择适当的方法(如调查、试验、测量)收集数据”“能从报纸杂志、电视等媒体中,有意识地获得一些数据信息”。

在收集数据以后,需要对看起来杂乱无序的数据进行必要的整理,然后运用统计图、统计表等方式表示出来,再进行数据分析,为做出决策和推断提供依据。整理数据的方式主要有分类、排序、分组、计数(包括用画“正”字等多种方式记录)、编码等;描述数据的主要方式有文字、图画、统计图、统计表以及刻画数据特征的统计量等。《标准(2011年版)》在第一学段提出“能用自己的方式(文字、图画、表格等)呈现整理数据的结果”, 在第二学段提出“认识条形统计图、扇形统计图、折线统计图,能用条形统计图、折线统计图直观、有效地表示数据”“体会平均数的作用,能计算平均数,能用自己的语言解释其实际意义”。分析数据主要指根据数据做出判断、推断、预测、决策等,并能根据数据分析解决生活中的实际问题,《标准(2011年版)》在第一学段提出“通过对数据的简单分析,体会运用数据进行表达与交流的作用,感受数据蕴涵信息”, 在第二学段提出“能解释统计结果,根据结果做出简单的判断和预测,并能进行交流”。

教学中,要引导学生经历收集、整理、描述和分析数据的全过程,并对收集数据、整理数据、描述数据和分析数据的方法进行指导。其中,收集数据主要是让学生对一些基本的收集数据的方法有比较丰富的体验;整理数据主要是让学生体验每种整理方法的作用并会做出选择;描述数据,第一学段要鼓励学生尝试用自己的方式进行描述数据,第二学段的统计图教学,要注重让学生体会各种统计图的特点,能根据实际问题选择合适的统计图来描述数据。统计量的教学,主要是要关注“平均数”实际意义的教学(见下面的案例);分析数据的教学,关键是教师要设计一些引导性问题,引导学生结合数据思考分析和判断、预测等,并通过讨论、交流,学会一些分析数据的基本方法。

案例1:“平均数”教学片段

“平均数”教学时,在初步教学平均数的概念后,教师又先后出示了下列几个问题,引导学生结合具体问题体会平均数的实际意义。

1.下面图中的虚线表示第四小组投球平均每人投中的个数。想一想,你认为哪幅图的表示是正确的?说说你的观点和理由。

2.出示一位运动员体操决赛中的得分情况。

(1)你知道计分员是如何确定他的最后得分的?为什么要用这几个得分的平均数来代表他的最后得分?

(2)为什么要去掉一个最高分和一个最低分?

(3)你先估计一下这个运动员的平均得分,再算一算,比一比。

3.出示:光明小学教师的平均年龄是40岁。

(1)“平均年龄40岁”你怎么理解?

(2)如果想让该校老师的平均年龄降下来,有什么办法呢?

4.情境辨别。

读一读下面的几段话,你认为有道理吗?请发表你的看法,并简要说明理由。

情境一:小明班同学的平均身高是135厘米,所以他的身高一定是135厘米。

情境二:小明班同学的平均身高是135厘米,小强班同学的平均身高是132厘米,所以小明要比小强高。

情境三:一个游泳池的平均水深是120厘米,小林身高125厘米,他在这个游泳池游泳肯定不会有什么危险。

平均数是一种反映一组数据集中趋势的统计量,是描述数据的重要统计指标之一,理解平均数的统计意义是教学的关键。在上述教学片段中,教师设计了丰富的情境,引导学生通过辨析讨论,体会“平均数肯定在最大数与最小数之间”“平均数有时会受极端数据影响”“平均数是一个特征数,并不是所有数都是这个数”等特点,进一步理解平均数的实际意义。这样的教学,有助于学生今后理解用平均数表示的数据的特征,并且在进行数据分析时能想到用平均数刻画数据。

(二)引导学生根据问题背景选用合适的方法进行数据的整理、描述和分析,有效地从数据中提取信息

数据分析是一个复杂的思维过程。特别是对于不同的问题背景,学生要会选择不同的收集、整理、描述和分析数据的方法,即使是同一组数据,也可以有不同的整理和描述数据的方法。教学中,教师要启发学生根据问题的具体情况选择合理的方法,在不断修正自己想法的过程中掌握数据分析的方法。

案例2:你准备用什么方法收集下列数据?

①同学们最喜欢的体育运动。

②学校教师使用的交通工具。

③全班同学立定跳远情况。

④统计学校门口的车流量。

⑤不同的球在同一高度落下时的反弹高度。

⑥2000年以来的四届奥运会中国获奖牌情况。

通过思考和讨论,引导学生体会如何根据问题背景的不同,选择不同的收集数据的方法。如上述案例中的①②可以用调查的方法;③可以用测量的方法;④可以用观察记录的方法;⑤可以用实验的方法;⑥可以用查阅资料的方法。

案例3:“数据的整理与分析”教学片段。

教师呈现一个班级学生的身高记录单,并先后提出三个问题,引导学生选择不同的方法整理数据、分析数据。

呈现问题1:从这组数据中你了解到哪些信息?可以用什么数据描述这个班身高的整体情况?

学生通过分析数据、讨论,得出了以下信息:这个班中最高的人的身高是158厘米,最矮的人的身高是130厘米,这两人的身高相差28厘米。这个班的平均身高约是142厘米。

呈现问题2:开运动会时,如果要选10名身高比较接近的同学参加鲜花队,你认为该如何整理数据,然后做出选择呢?

学生通过分析数据、讨论,确定可以用“排序”的方法整理数据,教师利用excel直接进行“排序”,然后引导学生选择10名身高比较接近的同学,在交流中体会“排序”整理数据的作用。

158? 155 154 154 153 148 148 147 146 145 145 144 143 142 142 141 140 140 139 139 138 138 138? 137 136? 136? 135 135 134 132 131 130

呈现问题3:服装厂要为这个班的同学做校服,要做多少种型号的校服呢?怎么整理数据呢?

学生通过分析数据、讨论,提出了三种做服装的方法,第一种是每个厘米数为一种型号;第二种是每10厘米一个型号,共三个型号:130 ~139,140 ~149,150 ~159; 第三种是每5厘米一个型号,共六个型号:130 ~134, 135~139,140 ~144, 145~149, 150~154,155~159。教师引导学生讨论这三种方法的合理性及各自的优缺点,体会“分组整理”数据的价值。然后,引导学生用第三种方法进行分组整理,如下表:

在“分组整理”得出数据后,教师再引导学生思考讨论:

(1)这个班同学身高在哪个范围内的人数最多?

(2)根据统计数据,服装厂要做几种型号的校服?每种型号要做多少套?一共要做多少套校服呢?

(3)整理后的数据和原始数据记录单相比,有哪些优点?

通过上述三个问题的讨论,学生经历了整理数据、描述数据、分析数据并解决问题的过程,了解了对于同样的数据可以有排序、分组整理等多种整理的方法,能根据问题的背景选择合适的方法,初步学会了对原始数据进行分组整理的方法,体会分组整理能使原来繁多的数据简化、有序化,进一步增强了用统计的方法解决实际问题的意识。

三、引导学生在数据收集和分析中体会数据的随机性,学会全面客观地认识数据

(一)引导学生体会数据的随机性

《标准(2011年版)》强调通过数据分析使学生体会数据的随机性,其内涵包括两个方面:一方面对于同样的事情每次收集到的数据可能不同,另一方面只要有足够的数据就可能从中发现规律。

教学中,要选择合适的问题,引导学生在经历统计的过程中体会数据的随机性。如在关于“校门口早晨、中午、傍晚三个时间段中,哪个时间段汽车流量最大”的统计活动中,教师引导学生在用一定的方式统计和记录每天三个时间段的车流量情况。学生在开展这一统计活动时需要考虑如何收集数据、用什么方式整理和描述数据,能从这些数据中得到怎样的结论,需要观察记录多少天等。在记录一周数据的基础上,教师引导学生对七天中每个时段车流量的情况进行分析,在数据分析中体会数据的随机性,也就是对于“哪个时间段的车流量大”的统计分析中,可以体会到“每天收集到的数据有所不同(如有的日子早晨车流量最大,有的日子傍晚车流量最大,甚至个别日子中午车流量最大等),但从七天的数据中可以发现一些规律(如总体上每天早晨、傍晚的车流量大,每天中午的车流量比较小等)”。如果七天的数据还不足以支持规律的发现,可以引导学生再统计一周,然后再进行数据分析。

数据分析统计学方法例8

数理统计在数学史上是一门新兴的数学分支科学,它主要是运用概率论的知识对一些随机现象和随机规律进行深入分析,建立系统的数学模型,针对不同的实际问题预测和判断现象发生的概率或者掌握规律的内在本质。目前,随着社会经济的飞速发展,各个行业针对数据建立数学模型,预测和判断数据模型的数据分析越来越依赖于数理统计的方法,本文从以下几个角度阐述这方面的研究。

一、数理统计在数据分析中的背景介绍

数理统计大约形成于公元前,我国古代就注重统计。如:殷商时期就开始统计户口;春秋时期统计兵马数量,考察军队实力;明清时期绘制了详细的户口与土地书籍与图集等,这些都是数理统计科学在我国古代统计工作中最为实际的应用。

相对于中国,西方的数理统计起源更为遥远。举世闻名的金字塔的建造就需要大量的数据统计和分析工作,包括建筑人数、建筑用地、建筑材料等的数据分析统计。近代西方的数理统计工作已经越来越成熟,无论是银行、保险、审计等金融行业还是矿产、重金属、电信等基础重工业,无论是教育、培训、多媒体行业还是零售、餐饮、建材等生活行业,都需要大量的数据来构造模型预测行业发展与消费需求,可以说数理统计方法基本上已经成为了目前数据分析工作中一种非常重要的方法。

二、数理统计和数据分析的特征

数理统计的特点:它主要是构筑在随机出现的现象或者随机试验的基础上,结合了数学概率论的相关知识建立数学模型,通过模型预测未知现象,了解规律的本质。

数据分析的特点:数据分析是利用已有的数据处理方法和数据分析软件针对所收集的数据进行验证其正确性,提取有利数据,建立数据结构模型,解决实际问题的过程。

三、数理统计在数据分析中的应用

由于数据分析是根据不同的行业不同的领域及其消费人群来处理,但是随着互联网行业的迅猛发展,人们在数据分析过程中对于参数设计、方差分析及其大数定律的应用也相对较广泛,尤其是依据数学知识结合数学软件进行数据处理和分析尤为实用,因此数理统计在数据分析中的应用呈现了多样化。

首先,大数定律是概率论与数理统计这门数学学科中最为经典的定律,将大数定律应用于复杂数据分析中,总是能够体会到“拨开云雾见月明”的豁然开朗,也能够在众多繁杂、无规律的数据中提取到实用数据。例如:在聚美优品网站的化妆品销售中,为了改善和制订更加高效的营销策略,营销总监安排数据分析工程师针对一个季度的化妆品销售数据来做出模型的预测,如果工程师能够将大数定律应用在数据分析中,将化妆品不同时段、不同年龄层次消费者的消费数据额进行分类与算,在此基础上应用概率论中的大数定律一定会建出比较好的数学模型。

其次,数理统计中概率分布及其一些重要的分布求法对于数据分析是非常有帮助的,这是由于概率分布能够很明确地看出研究对象在所要求范围内的状态分布和情况分布,这是一种非常有效的统计分析手段之一。例如:在生产液晶电视机的电视工厂,针对电视机的寿命以及维修率需要做出一定的统计分析,这个时候通过将已经出厂的电视机的型号分类统计分析,利用数理统计的知识做出一个概率分布,往往能够更直观地表现出所要求的状态和结果。

最后,数理统计中的分析方法在数据分析中广泛使用,如回归分析法、方差分析法以及各种假设检验的方法。通过这些方法的应用,在数据分析过程中能够更加显著明确地分析出已确定的数据所给出的信息,提取出行业所需要的相关资料,为行业的正常发展做出正确的指导和有效的评估预测。例如:在企业管理中,数据分析和数据统计特别重要,如果能够将产品的开发、市场的调研数据以及产品的质量检测运用数理统计中的回归分析法和方差分析法进行分析,能够得到准确数据模型,为企业管理者做出正确评价提供理论依据。

总之,伴随着互联网不断深入到各行各业,我们不难发现数理统计在数据分析中的重要作用,如果能够将数理统计的知识有效应用数据分析和数据建模过程中,人们能够迅速而快速得到近似精确的结果,为行业的发展提供有效的数据预测和数据论证。希望本文的论述能够给从事数据分析的工作人员带来些许帮助,也希望广大读者提出相关的意见。

数据分析统计学方法例9

统计是研究“数据”的,“数据”和我们平时说的“数”不同,数据是有实际背景的。数据包括数,又不仅仅指数。史宁中教授指出,数据是信息的载体,这个载体包括数,也包括言语、信号、图像,凡是能够承载事物信息的东西,都构成数据。

人们进行统计活动都是有目的的,并不是为了统计而统计。通过对统计数据进行分析,帮助人们进行判断、预测或决策,从而让人们体会到数据中蕴含的信息,这就是数据分析的意义。

这节课中,教师精心安排与现实生活联系紧密的统计内容,呈现丰富的背景,让学生充分感受“数据”是说明问题的有力“证据”,充分感受数据分析不仅是有意思的,更是有意义的。

课堂教学伊始,教师没有平铺直叙,而是组织学生将对春季降水量的感受和经验与数学中的问题联系起来,从“春雨贵如油”“好雨知时节”引出他们对两张折线统计图的辨析。“春雨贵如油”,这是针对北方的春季降雨而言的,春天降水量不大,雨水显得很珍贵;而对于南方来说,春天的降水量要比北方大一些。学生利用经验想象数据,继而出示两张图,学生很自然地将表格中的图像等数据进行对比分析,即用数据来阐释经验,做出判断。

呈现6~18岁男女生平均身高统计图,贴近学生的生活,帮助学生发现数据中蕴含的信息,从数据角度了解学生时期身高变化的特点,有生活味又有数学味。通过对常州、悉尼各月平均气温统计图的分析,了解南半球、北半球的气温情况,判断暑假去澳大利亚旅游带什么样的衣服,问题既是现实的又是有趣的。学生提供建议,必须用数据“说话”。对不锈钢保温杯和陶瓷保温杯的保温效果做出判断,根据数据进行分析,判断是科学的、有说服力的。

全课呈现了不同的统计内容,有“大事”,有“小事”,但每一次的分析,都紧扣数据,感受数据分析的意义,体现统计活动的价值,从而激发学生学习统计知识的兴趣,发展他们的数据分析观念。

二、注重数据分析的方法

传统数学主要根据假设和规定的原则进行计算或推理,而数据分析的方法,却主要采用归纳来推理。著名数理统计学家陈希孺先生认为,统计方法是一种归纳性质的方法,统计推断是一种归纳推断。统计学的研究方法是基于归纳,而传统数学是基于演绎。我们要认识到,归纳推理得出的结论具有随机性,与代数、几何等通过演绎推理得到的结论不同。结论的随机性,并不说明数据分析的方法有问题,而这正是通过数据分析方法得到的统计结果的特性。

在这节课中,教师设计的统计内容,在由数据分析方法得到某些结论时,注意体现数据分析方法的特性。

如,我国男女生平均身高的统计图,这里呈现的数据是根据样本推断出来的,体现了局部推断整体的数据分析方法。把上课班级具体的学生身高与之对照,会有“出入”,教师在学生出现疑义时要给予适度引导:即从总的方面看有其规律性,但要承认例外个案的存在。

再如,暑假去澳大利亚旅游问题,教师首先呈现2002年常州、悉尼各月平均气温统计图,从中引导学生发现:悉尼的气温变化趋势和常州正好相反。教师追问:是因为2002年特别冷吗?再出示从1858年到2002年这145年间悉尼市各月平均气温统计图,学生在对照比较2002年与这145年的数据的过程中,深切体会到了“归纳”的思想,并认识到:对今年的气温情况做出预测,仅看去年的情况,是有一定的随机性和偶然性的,因为每年收集到的数据可能是不同的,所以要将过去的情况综合起来看。天气预报,在一定程度上就是基于对过去积累的气象数据的分析研读,发现数据中隐藏的规律,从而预测将来的天气变化情况。这里,学生对“归纳”的体验特别深刻,正是源自教师的精心设计。

又如,北京奥运会的举办时间,在考虑天气因素时,呈现2003、2004、2005、2006年8月份的降水量统计图,在数据的基础上形成预测与推论,让学生体会到数据分析的预测和决策作用。呈现第25~30届奥运会中国和美国获得金牌情况的统计表,通过分析近6届奥运会上中国与美国所获得金牌的数量,预测下一届奥运会上中国可能获得的金牌数量,这也很好地体现了数据分析方法的特性。即,不能简单地从中国前几届奥运会金牌数量总体呈上升趋势,就断定下一届奥运会金牌数还会上升。

从这节课的教学中,可以看到教师对数据分析方法准确而深刻的认识,进而在教学过程中精妙表达与清晰传递。统计教学“教什么”,是值得我们深入研究的。

三、经历数据分析的过程

数据分析观念,是一种需要在亲身经历的过程中培养出来的对一组数据的“领悟”,是由一组数据所想到的、所推测到的以及在此基础上对于统计独特的思维方法和应用价值的认识。经历数据分析的过程,要围绕“数据”做文章,遇到问题“想数据”,分析问题“用数据”,让学生在看数据时有需求、有目的、有过程、有体会。

哪幅图是北京各月降水量统计图?哪幅图是常州各月降水量统计图?学生并不是盲目地猜测,而是依据对俗语“春雨贵如油”“好雨知时节”的理解,并调度自己的经验,将春季的降水量与其他季节的降水量进行比较,把两张降水量统计图联系起来观察。由此,引导学生对两幅单式折线统计图的数据进行辨别、分析。辨别的过程,也就是对表格中的数据进行分析的过程。教师又通过呈现一连串的需要对单式折线统计图中的数据进行分析比较才能作答的问题,让学生在感到麻烦、困难的过程中体会到单式折线统计图的不足,他们会联系单式条形统计图与复式条形统计图的学习经历寻思“合并”单式折线统计图。这也就产生了学习复式折线统计图的需求,促进学生主动领悟复式折线统计图的特点,明确其使用的情境。

在分析6~12岁男女生平均身高统计图的基础上,让学生预测12岁之后男女生身高变化的情况。这里,教师关注的是让学生体会并理解后面的两条“折线”发生怎样的变化,需要再调查数据、分析数据才能做出判断。之后,对两条“折线”的比较与解读充分体现了复式折线统计图的特点,让学生体悟到数据有助于分析问题。

买哪一种保温杯,教师提出问题:不锈钢保温杯和陶瓷保温杯,哪一种保温效果好一些?教师先让学生联系自己的“经验”说一说,继而出示有关数据的统计表。在此基础上,呈现复式折线统计图,让学生更直观地“看出”哪种保温杯保温效果更好。

不同的统计对象,教师一次又一次让学生面临具体的问题,通过问题引领,运用数据去分析、解释。“数据”是学生发现、提出、分析、解决问题的好伙伴。数据分析观念,是在与数据接触的过程中培养出来的。

这节课,加强了对图、表的分析解读,适当淡化了有关统计图、表的制作,但也不是不要制作。在合并北京、常州各月降水量的统计图时,教师完整地演示复式折线统计图的制作过程,以第一幅图为标准,再描点、注数、连线,并在学生对图例、线条表示方法、统计图的名称等方面提出修改建议的过程中完善了他们对复式折线统计图的认识。而在呈现12~18岁男女生平均身高统计表之后,教师放手让学生根据统计表制作统计图。我们要认识到,制作统计图表,是整个统计活动的中间环节,是作为工具为最终的判断、预测、决策服务的。适当的画图,有助于学生认识图,读懂数据表达的信息。制作图表的过程,也是认识数据的过程。

数据分析统计学方法例10

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)13-0054-02

大数据时代给社会经济发展带来了机遇和挑战,社会各行各业对数据分析需求大幅上升,需要借助数据分析实现数据的增值,挖掘数据背后的潜在价值,为其经营管理决策、投资决策提供智力支持。随着社会经济发展对具有数据管理和数据分析能力的应用创新型经济管理人才的需求逐渐攀升,也引发了对高校经管类专业学生能力的更高要求。面对纷繁复杂的社会经济环境,经管类专业学生必须能够广泛应用定量分析技术,能够从海量数据中获取有效数据,运用科学的方法从这些数据中提取出有用信息,建立相应的模型,作出最优决策。

统计学是培养经管类专业学生定量分析能力的一门重要课程,是众多高等院校经管类专业的专业基础必修课,是以后深入学习相关定量方法类课程(诸如计量经济学、管理运筹学、市场调查与预测等)的基础。因此,统计学课程体系设置是否合理,将直接影响到学生获取有效数据和分析数据应用能力的培养,进而影响学生定量分析能力的培养。

一、经管类专业统计学课程体系存在的问题

1.课程教学定位模糊。我国高等院校经管类专业统计学教学中的最大弊端在于一直按照前苏联划分方式将其归类为一门偏重于简单数据整理课程,而将相应的统计分析所采用方法和理论归为数理统计,因此在教学中不重视对后者的学习。然而,西方发达国家的统计学课程是同时包括这两个部分内容的,尤其是后一个部分内容是定量分析的重要基础。因此,在传统统计学教学定位下,学生只认识了基本理论与概念,却掌握不了处理和分析数据的能力,这与经管类专业应用型人才培养目标相背离,难以适应大数据时代社会各领域对经济管理人才素质的新需求。

2.课程体系有待完善,与经管类专业融合不够。目前,大多数高等院校经管类专业统计学课程设置只涉及理论统计学这一领域,未将统计分析方法与相关经管类专业知识有机结合。在这样的课程体系安排下,学生虽然掌握了统计基本理论和方法,但难以体会到统计在本专业学习中的应用价值,当面临现实的经济、管理问题却无能为力,不会运用所学统计方法,结合专业知识对实际问题进行定量分析。这种状况与经管类人才定量分析能力培养目的相违背,难以实现具有创新能力的经管类人才的培养目标。

因此,如能结合经管类专业特点,对统计学的课程体系进行优化建设,势必能够培养出具有定量分析技能,满足社会需求和企业需求,符合大数据时代人才素质要求的经济管理人才。

二、大数据时代经管类专业统计学课程体系构建

1.明确课程教学定位。目前,统计学教学中偏重于统计学基本概念、基本模型和基本方法的理论知识学习,系统性较强,有利于学生全面了解统计学的知识体系,但是对统计思维能力的培养和统计方法的应用重视不够,这不仅会让学生望而生畏,从而失去学习的主动性与积极性,更为重要的是学生不能够学以致用,在自己本专业深入学习过程中不会运用统计学知识来解决实际的经济管理问题,而在教与学中出现的这些问题源头在于教学定位不够准确。因此,本文提出新的课程教学定位:以应用创新型人才培养为导向,提高经管类专业学生定量分析能力为目标,结合经济学科和管理学科的特点,通过统计学的理论教学、案例分析、课程设计、实验(践)等教学环节,培养学生统计思维能力和统计应用能力,具备运用统计学理论与方法,研究社会经济管理领域有关数据收集、整理、分析等解决实际问题的综合能力,以适应大数据时代对经济管理人才的新需求。

2.课程体系优化建设。根据新的教学定位,统计学课程体系优化建设的基本思路:一是课程体系设置要强调基础知识、注重灵活应用、突出定量分析的教学理念和教学目标;二是课程结构上,突出专业针对性,强调统计学科和经济学科、管理学科的有机结合,使课程特色化;三是建立实践教学体系,加强学生实践能力的锻炼,为学生提供综合素质和能力提高的实训平台;四是将统计分析软件的运用融入到课程体系之中,加强统计分析软件的技能培养。

因此,本文将运用模块化系统集成思想,根据经济与管理类各专业的要求,提出按专业分模块,按模块分层次,按层次定内容的改革方案,构建“课程体系课程子系统课程模块具体内容”的递阶控制结构模型,具体如图1所示。

在统计学课程体系优化建设中,我们运用系统科学的方法构建出模块化、层次化集成的课程体系在整体功能上达到了最佳状态。

课程基础子系统是统计学理论基础和统计思维培养阶段,由统计学基本原理和基本理论构成,体现了“厚基础”的功能。课程应用子系统和课程案例子系统是统计分析能力训练阶段,首先结合认知性案例模块系统介绍统计分析方法,让经管类专业学生了解统计分析方法的基本原理,其次进一步结合专业特色案例模块和统计分析软件模块,通过分专业教学方式,使不同专业学生能够体会到统计学在本专业中的应用,增强学生的学习兴趣,体现了“强能力”的功能。课程实践子系统是统计应用能力实践阶段,是培养大数据时代应用型经管人才的重要环节。课程实践主要包括课堂实践和实验室模拟,课外实践主要包括社会实践活动、实训实习和相关竞赛,通过课程实践和课外实践两大平台训练学生运用所学统计调查、统计整理和统计分析等知识解决实际问题的综合能力。课程选修子系统是统计应用能力扩展阶段,该阶段在学生掌握统计学相关知识的基础上,通过选修统计预测与统计决策两大模块,进一步培养学生的定量分析能力。

三、结束语

大数据时代经管类专业统计学课程体系构建,应注重强化基础理论,突出知识的实用性和创新性,做到统计知识与实例分析相结合,与软件应用相结合,理论教学与实践教学相结合,与实际应用相结合。根据经管类各专业特色,以“知识+能力+应用”模式进行模块化、层次化课程体系设置,从本质上提升学生的数据素养和信息素养,提高解决实际问题的定量分析能力,以适应大数据时代对人才素质的新需求,使具有数据管理和数据分析能力的经济管理人才在就业市场上更具有竞争力。

参考文献:

[1]孙根年.课程体系优化的系统观及系统方法[J].高等教育研究,2001,(2).

[2]曾五一,肖红中、庞皓,朱建平.经济管理类统计学专业教学体系的改革与创新[J].统计研究,2012,(2).

[3]姚寿福.经济管理类本科专业统计学课程教学改革思考[J].高等教育研究(成都),2012,(3).