期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

期刊咨询 杂志订阅 购物车(0)

简述数据通信的特点模板(10篇)

时间:2024-02-21 14:45:29

简述数据通信的特点

简述数据通信的特点例1

数据流图

与用例的不足

在采用结构化方法的软件需求分析中,常用的主要工具为数据流图。而在面向对象方法中则使用USE-CASE,即“用例”。在信息系统的需求分析中,这两种方法都存在一些不足。

数据流图以数据流为基础进行需求分析,但信息系统的实际情况则是以业务过程为基本单位来完成用户业务过程中的信息处理工作,这也是信息系统自身的需求。在结构化方法中,进行数据流分析之后,仍然需要进行业务过程的归并和划分,形成程序模块。这里的程序模块就是完成一个或多个信息处理过程的软件单元。使用数据流图的分析方法其实是走了弯路的,而且,数据的数量及其结构的复杂程度远大于对数据的处理。使用数据流图进行分析,图形一般都比较复杂,使我们不能很快抓住问题的关键。

另外,大多数信息系统实际上就是数据库应用系统。一个信息处理过程的数据调用和存储,总是建立在数据库的基础之上。分析一个信息处理过程的数据输入和输出都是以数据库为源头或终点。使用描述数据输入、输出和处理过程的IPO图进行需求分析,对数据需求的分析局限在相应的过程之中,对数据的分析会更加简单、清晰、便捷。

面向对象方法中使用的USE-CASE,即使用案例( 简称“用例” ),是对过程的描述,但USE-CASE对过程的描述不够充分。一个信息处理过程必然有数据的输入输出,在执行多个过程时必然有一定的顺序,顺序可以是先、后或同时(即并发),USE-CASE对这些都没有描述。因此,USE-CASE并不是对过程的完整描述。USE-CASE主要用于指导软件开发,而用来和信息系统最终用户――管理者的交流却不够流畅,而IPO图则能够较好地解决上述问题。

何谓IPO图

附图是一个简单过程的图例。图中两端是描述输入、输出的图形,图中间是描述过程处理或活动的图形。位于图中间的矩形方框分为三部分,上部是过程的编号或名称,中部是过程处理或活动的描述,下部则是过程的执行者(可以是某个角色、个人或部门)。

过程的输入、输出通常称为过程数据。过程本身则称为过程体,有时也简称过程。对多个过程执行的先后顺序的描述则称为过程流。

另外,IPO图中一般还有用来描述输入、输出和过程流方向的箭头及配套的文字说明。

一个过程可以包含多个处理或活动,因此过程可以分解为多个较小的过程(子过程)。这些子过程有一定的执行顺序,对这种顺序的描述也称为过程流。通常,也将一组有一定执行顺序的过程称为流程。

IPO图也可以描述多个过程的输入、输出和过程流,此时,过程可以分为多个子过程,子过程仍然可能包含多个处理或活动,仍可以继续向下分解。反过来,子过程也可以向上聚集或简化,成为具有更多处理或活动的较大过程。

从上述定义可以看出,IPO图对过程的描述完整、清晰、简洁、准确。实际上,IPO图对过程的描述可简可繁、收放自如: 既可以层层分解直到最底层,又可以聚集、简化直到最顶层。由于IPO图的这些特点,它在信息系统的需求分析中可以很好地发挥作用。

用IPO图进行

需求分析和设计

IPO图可以描述任何过程(流程)。在信息系统的需求分析中,我们可以使用IPO图作为建模工具,既用它描述业务过程也用它描述与之对应的信息处理过程。同样,在进行信息系统的总体设计(概要设计)时,我们仍然可以使用IPO图来描述信息系统应用软件的信息处理过程。于是,IPO图就成了信息系统中业务需求分析、软件需求分析和概要设计的统一建模工具。由于建模工具的统一,消除了业务需求分析与软件需求分析、分析与设计之间的鸿沟,使业务需求分析、软件需求分析和概要设计三个阶段平滑过渡。

建模工具的改变涉及到对信息系统分析思路的根本转变。以往的结构化方法使用数据流图作为需求分析的主要建模工具,是把分析的基点放在数据流。使用IPO图作为建模工具,则是将分析的基点放在过程: 业务过程和与之对应的信息处理过程。

UML的USE-CASE就是把分析基点放在过程,但USE-CASE对过程的描述不够完整、清晰,它只描述了过程体,而没有同时描述相应的过程数据和过程流,因而在和业务人员的交流中不够流畅,IPO图则能很好地克服这个缺点。另外,IPO图有效地突出了过程可以分解和聚集的特性,使之能够在系统构建时发挥更大的作用。

虽然数据是信息系统的基础和根本,但由于数据库的成熟和发展,把数据“流”作为信息系统需求分析的基点已经不合时宜。相反,随着信息系统不断扩大的趋势(比如全面信息化系统),把信息处理过程作为需求分析的单位和基点则更为有利。我们只需考虑过程内的数据输入输出和处理,过程之外只考虑其他过程与本过程之间的关联,从而使问题简化。

另外,每一个信息处理过程除了从外界获取和向外输出数据之外,主要是从数据库获取数据,并将所有经过处理的数据存入数据库。数据库成为数据流的集散地和数据管理的最好场所。不将数据流作为分析的基点,而是将数据流局限在信息处理过程之内、把过程作为系统分析的基点,将简化分析设计过程,有利于大型信息系统的分析与设计。

用IPO图来建模

IPO图所描述的信息处理过程包括了过程数据、过程体和过程流,正好与信息系统应用软件中的程序“模块”相对应。实际上,在信息系统中一个程序模块就是一个或一组信息处理过程。这样,信息系统分析设计的全过程,从业务过程(业务流程)到信息处理过程和程序模块都可以用IPO图来进行描述。

系统、子系统、模块之间也是一个向下分解和向上聚集的过程。系统、子系统和程序模块,只有大小和规模的差别,在本质上是相同的。所以,信息系统分析与设计全过程都可以使用IPO图作为建模工具。

为一个组织建立信息系统,首先要分析组织目标,进而确定应用系统的目标和范围。按照所确定的应用系统目标和范围对原有业务流程进行信息化优化和重构(BPR),然后进行应用系统的软件需求分析和设计。从对原有业务流程描述到信息化优化和重构(BPR)开始,就可以使用IPO图,直到软件需求分析和概要设计,包括模块设计和数据结构设计。整个过程是一个对IPO图不断细化、精化的多次迭代过程。

总体而言,使用IPO图为信息系统建模有以下优点:

1. 图形和图例简单,易于绘制和学习;

2. 由于对业务过程的描述完整、准确,IPO图和用户交流方便、自然、没有障碍;

简述数据通信的特点例2

中图分类号:TP335 文献标识码:A 文章编号:1007-9599 (2010) 03-0004-02

Space Modeling of Tourism Information

Dong Yanbing1,Ma Li2

(1.Northern Industrial University,Beijing 100041,China;2.Beijing Industry and Trade Technicians College,Beijing 102206,China)

Abstract:This paper analyzes the idea of modeling spatial data the composition of tourism information, models, and storage methods proposed to vector raster data structure describing the integration of spatial information,research-based relational database space information is stored ,and on this basis,to extend the predicate-based description of spatial data access interface.And in a relational database on the tourism industry and spatial data modeling.

Keywords:Spatial modeling;Spatial data model;Data storage

一定区域内社会经济客体的空间活动及其相互之间的关系都会形成一种空间态势,而空间结构则是人类经济活动作用于一定地域范围所形成的组织形式,反映了区域经济系统中各个系统、各个要素之间的空间组织关系,包括诸要素在空间中的相互位置、相互关联、相互作用、聚集程度和聚集规模以及地区间的相对平衡关系等。

旅游作为一种社会经济现象,其发生、发展也是以空间系统为物质载体的,旅游空间结构不仅仅是旅游活动的空间状态,而且体现了旅游活动的空间属性和相互关系。旅游业规划过程中一个最需要解决的重要问题就是按照旅游者的市场需求,结合旅游资源的分布特点,有效组织合理的空间结构和旅游线路。因此我们有必要对旅游业所特有的空间属性进行分析,进而对旅游行业信息进行空间数据挖掘,得出相关规则,指导旅游业的规划与发展。

一、旅游信息的空间属性

(一)旅游线路的空间属性

我们把可以把旅游行为的实现简单描述为图1所示的结构:

图1旅游行为的实现

旅游行为是人们在某个地域进行旅游和游玩的过程,旅游的实现是通过旅游者的空间移动来实现的。我们可以用一个坐标点表示旅游者所到达的一个景区、一个城市。用一条线来描述旅游者途径的旅游线路。

旅游者在进行区域旅游活动时,不同个体在使用旅游地的空间行为选择上具有很大的差异性,下面给出了依据假日旅游预报系统总结出的几种旅游行为空间模式:如图2所示:

1.单一目的地旅游:旅游者的大部分旅游活动集中在一个目的地。

2.线型旅游:旅游者选择使用一条线路上的多个旅游目的地,但存在主次之分,主要选择使用的目的地只有一个。

3.基营式旅游:旅游者在访问主要目的地的同时也选择访问其他几个目的地,但往往以主体目的地作为大本营。

4.环型旅游:旅游者在既定的目标区域内环旅游好几个目的地,相当于游览线路空间。

5.链式旅游:旅游者以客源地为中心进行的链式游览。

(二)旅游资源的空间属性

旅游区的旅游资源状况和城市的旅游功能决定了两者在旅游空间结构中的重要作用,它们是旅游产业在空间布局中的极点和核心,是区域内旅游吸引物的聚集中心,也是旅游产品的核心,各旅游区和旅游城市之间通过旅游线路紧密地联系在一起,形成一个复杂的旅游网络系统。因此,从全国范围的宏观层次上看,我国旅游产业的空间布局明显地呈现出以旅游区和旅游城市为中心,以旅游线路(旅游交通)为网络连接的点网状分布态势。

1.以旅游景区为中心的产业布局

旅游产业是以为旅游者提供旅游产品和旅游服务为主的综合服务的企业和行业的集合体,包括旅游区(景点)、旅行社、旅游饭店、旅游交通以及为旅游者的旅游活动提供服务与支撑的旅游关联产业。这些功能不同、层次不同的行业部门在一定的地域范围内聚集在一起,共同服务于相似的旅游消费者。旅游者旅游的主要目的是为了寻求一种内心的体验和心灵的愉悦,这就决定了这些行业和部门在旅游产业中地位的不同。其中,旅游区(景点)在旅游产业中处于核心地位,旅游景区景色的优美程度和吸引力的大小,往往是旅游者来此旅游的原始动力。其次才是为旅游者的旅游活动提供配套服务的旅行社旅游饭店等中介机构和相关产业,旅游产业内部各组成部分功能作用的不同导致其在空间布局上的不同。呈现出明显的核心―边缘特征,即旅游产业的空间布局常常以旅游区(景点)为中心,其或边缘分布着旅行社、旅游饭店、旅游交通、旅游商品经营以及众多的旅游相关产业。从宏观的角度来看,这众多的以旅游区为中心包含的旅游中介机构和旅游相关产业在内的旅游产业集群被旅游交通线路连接在一起,呈现出显著的点网状分布特点。

2.旅游城市为中心的产业布局

作为旅游目的地,城市为旅游产业的发展奠定了稳定的市场客源基础,同时城市发达的经济、社会、文化水平以及资金、技术、信息等条件又为旅游产业的发展奠定了雄厚的物质基础。因此,在现代旅游产业的发展中,以城市为中心的旅游产业占有至关重要的地位。旅游产业的空间布局常常以旅游城市为核心而产生和发展。在空间上,城市是旅游产业布局的极点和核心,其则星罗棋布般地分布着下一级旅游区和旅游吸引物聚集体,众多的以旅游城市为中心的旅游产业集群通过各种旅游交通线路紧密地连接在一起,使宏观上的旅游产业布局亦呈现出一定的点网状分布的特点。

二、空间数据组成

数据和空间属性的集合称为空间数据。空间数据的属性包括空间特征和非空间特征两部分,非空间特征又由时间特征和属性特征组成。“属性、时间、空间”是任何空间数据所必需的三要素,缺少任何其中一个都不能称为空间数据,或至少是不完整的空间数据。

其中:

(一)空间特征:用以描述事物或现象的地理位置以及空间相互关系。

(二)时间特征:用以描述事物或现象随时间的变化。

(三)属性特征:用以描述事物或现象的特征。

三、空间数据模型

空间数据模型是考虑用户需求的共性,用统一的语言描述和综合、集成各用户视图。其基本任务是,确定所感兴趣的现象和基本特征,描述实体间的相互关系,从而确定空间数据库的信息内容。空间数据模型主要有:

(一)矢量模型

空间实体(GEO)抽象为由平面上的点(Point)、线(Line)、面(Pgon)所表征的空间目标所组成,GEO={POINT,LINE,PGON)。

图2矢量数据模型

(二)栅格模型

在栅格数据模型中,一个点就是一个像元,线由一串彼此相连的像元构成,而面则是由一堆彼此相连的像元组成。每一个栅格像元记录着不同的属性,这些像元大小是一致的。像元通常是正方形,有时也用到矩形、六边形和等边三角形。像元的位置由纵横坐标决定,每个像元的空间坐标并不一定要直接记录,因为像元记录的顺序己经隐含了空间坐标。

对于栅格数据模型:

点实体:表示一个像元

线实体:表示一定方向上连接成串的相邻像元集合

面实体:表示聚集在一起的相邻像元集合

四、矢量栅格一体化数据模型

栅格结构和矢量结构在表示空间数据上可以是同样有效的,但是为了更好的描述空间实体,需要同时使用两种数据结构,因此我们将矢量数据和鸥袷据进行一体化。

采用填满线状目标路径和填充面状目标的表达方法作为一体化数据结构的基础,每个线状目标一方面要记录原始取样点,另一方面记录路径通过的鸥瘛C扛雒孀茨勘暌环矫婕锹妓的多边形周边外,还包括中间的栅格。这样,对于点、线、面状目标来说,一方面采用面向目标的描述方法,使之保持矢量的特征,另一方面通过空间填充建立了位置和地物的联系,使之保持鸥竦男灾,这就是一体化数据模型。

五、空间数据存储

广义的空间数据包括在任何坐标系统中能够被索引到的数据。这个在空间坐标系统能够被索引的过程实际就是数据的分类和编码,建立数据与空间坐标的关联,建立空间特征部分和非空间特征部分的联系。

(一)空间数据分类

分类是将具有共同的属性的事物或现象归并在一起,而把不同属性的事物或现象分开的过程。

(二)空间数据编码

编码是用一个或一组有序的易被计算机或人识别与处理的符号,是空间特征数据和非空间特征数据关联的表示码。

(三)空间数据存储

空间数据存储主要解决的问题是空间特征和非空间特征两部分的关联,空间数据存储方式的主要有:

1.文件格式存储

空间数据包含空间特征和非空间特征,其中空间特征信息描述空间是特定的地理位置及其形状,非空间特征信息描述相应空间实体有关的应用信息。文件管理将空间数据存放在自行定义的空间数据结构及其操纵工具的一个或多个文件中。空间信息和非空间特征信息通过标识码建立联系。

采用文件管理的优点是结构灵活、操作简便、地图显示速度快,可以任意定义文件格式及其操纵工具,管理各种数据。这种方式的缺点在于难以适应大批量数据处理,非空间特征信息数据管理功能较弱,文件管理不利于数据的共享。

2.基于关系型数据库的存储

关系模型能够以简单、灵活的方式表达各种实体及其相互关系,其数据描述具有一致性和独立性。关系模型具有严密的数学基础和操作代数基础,具有一定的演绎功能。

六、旅游空间信息在关系数据库中的建模

大部分现有的数据库管理系统(DBMS)无法管理空间数据或者管理空间数据是低效、难以适用的。DBMS通常作为存放商业和财会数据的简单而有效的仓库,贮存在这些庞数据库中的数据结构比较简单,通常包括数字、姓名、地址和产品描述等信息。传统DBMS能够胜任此类信息的查询,它会利用索引来缩小搜索范围,但传统的索引无法处理多维坐标数据的排序问题,例如“列出大连市周围方圆50公里以内的旅游景点”这样一个相对简单的查询会难住数据库。要处理这个查询,数据库就必须把旅游景点地址映射到一个能够计算和比较距离的适当参照系统中,然后数据库扫描整个旅游景点列表,计算其地址与大连市中心的距离,如果距离小于50公里,则保存该旅游景点名称。这个过程牵涉到二维坐标,无法利用索引来缩小搜索范围。

七、小结

本文以建模的思想分析了旅游信息空间数据的组成、模型以及存储方式,提出了以矢量栅格一体化的数据结构描述空间信息,研究了基于RDBMS的空间信息的存储方式,并在此基础上扩展了基于谓词描述的空间数据访问接口,并在关系数据库中对旅游行业的空间数据进行了建模。

参考文献:

[1]杜军平,郭文生,尹怡欣.中国旅游目的地营销系统的设计.2005年中国智能自动化学术会议.中南大学学报专刊,2005,8

[2]杜军平,郭文生,尹怡欣.中国旅游目的地营销系统平台的研究.中国人工智能学会第11届全国学术年会论文集.北京邮电大学出版社,2005,788-79

简述数据通信的特点例3

中国分类号:G250.76 文献标识码:A 文章编号:1674-098X(2013)01(a)-0-03

随着计算机和互联网的普及,来自档案馆、图书馆、博物馆及其他机构的各种数字档案资源如档案、手稿、照片、古籍、个人论文日益增多,大量的电子档案给传统的文件管理方式和理念带来了不小的冲击,如何利用信息技术实现电子档案的科学管理也成为档案界的研究热点。随着元数据技术的发展和应用,利用元数据实现对电子档案的有序管理已逐渐为档案界所接受[1]。

来自于不同软件系统的电子档案常常具有不同的著录格式,它们互不兼容,从而导致不同数据库之间根本无法互相访问和检索,对普通的档案馆来说难以实现无障碍的利用与共享。目前,大多数的研究项目对于分布、异构的数字档案资源只是提供基于互联网的网络链接与检索共享,尚未实现元数据级的互操作,因此无法提供专业化的深度增值服务[2]。解决这一问题的途径之一就是实现元数据的互操作和格式转换。该文将探讨EAD与DC这两种目前应用最为普遍的元数据之间的映射,具备较大的实用意义。

1 DC元数据与EAD

1.1 DC元数据及特点

DC(Dublin Core)即都柏林核心元数据,是目前网络信息资源组织最为通用的元数据格式。DC最早由美国OCLC发起研究,是“用该元素集描述任何网络信息资源,并足够简单以至任何作者无需专门培训即可创建自己文件”的元数据。它由15个基本元素组成,分为三个广为认可的大类,内容描述类包括题名、主题或关键词、资源描述、来源、语种、相关资源和时空范围。知识产权类包括责任者、出版者、其他责任者及权限。外形描述类是指对资源外形特征信息的描述,包括日期、资源类型、资源形式和资源标识。

DC的特点包括以下几方面。

简易性:只有15个元素,而且通俗

易懂;

通用性:不针对某个特定的学科或领域,支持对任何内容的资源进行描述。增加了跨学科的语义互操作性的可能;

可重复性:其所有元素都是可重复的,解决了多著者与多出版者等重复元素的著录问题;

可扩展性:它允许资料以地区性规范出现,并保持元数据的一些特性,以便日后有扩充的余地;

可修饰性:对于需要详细著录的资料,引进了DC修饰词。它遵循向上兼容原则,在范围上对未修饰词的语义进行限定,在深度上对未修饰词的语义进行延伸。

1.2 EAD及其特点

EAD的全称是Electronic Archival Description,即电子档案著录,主要用于著录档案和手稿资源,包括文该文档、电子文档、可视材料和声音记录。它开发于1993年加州伯克利大学的一个研究项目。它是以通用标准语言(SGML)和扩展标记语言(XML)文件类型定义(DTD)的形式存在的[3]。EAD元素集定义有3个层次:EAD头标,著录档案的产生、修订、出版、发行等信息;前事项,著录档案题名页内容;档案著录,是对档案内容及其相关信息的具体描述,包括文件内容、上下关系及增补信息等。

经过多年的研究和发展,EAD受到了档案界和图书馆界的普遍拥护,是美国档案协会的成员们以及一些欧洲国家的档案馆主要使用的元数据,也已成为在世界范围内获得广泛应用的电子档案著录标准。这是由于EAD具有以下特点。

使用了标准通用置标语言(SGML),SGML是电子文献处理与交换的国际标准,用EAD著录的电子档案可以提供网上的信息共享和检索。

不依赖于任何的硬件和软件平台,不需经过任何的转化,在Unix操作系统、Microsoft Windows和Macintosh等环境下都可以很好地被识别。

具有伸缩性,同一部文献既可选用一些简单的标识符著录,也可以选用复杂的等级化的标识符著录。

使用EAD既可以形成新检索工具,也可将已有的检索工具转化为EAD的编码的机读格式。转化时可能要稍作改动或重排,但不需要大量的编辑。

检索功能强。EAD以查询语言(QL)为基础,除了具有一般的检索功能,如布尔检索、截词检索、近似检索以外,还可以在目录中查找单个款目和离散的数

据项。

应用范围广,EAD既可用于手稿,也可用于技术革新、艺术与雕塑、医学、工业等领域的科学资料。

1.3 DC与EAD的比较分析

不难看出,DC和EAD的结构都简单灵活,具有很强的可兼容性、可扩展性和可互操作性,这些特性都使得这两种元数据得到越来越多国家的重视并被广泛应用。对在著录和信息揭示深度上看,DC对资源主题的揭示过于简单,对著录对象的描述深度不够,不能进行专指度较高的检索;EAD则著录详尽,适用范围广泛,检索途径多样[4]。

综观DC与EAD的结构特点和应用性能不难发现,DC的最大特征就是简化的语法系统和有限的元素数量,因此它更具有简易性和亲和力,适用于广泛的资源描述和利用群体;EAD则更为专业化,适合档案专业背景,提供了详尽的资源描述和更多的检索入口,更适用于资源的深度描述和特定学科领域内的深入交流[5]。

2 DC元数据与EAD的映射

2.1 DC与EAD映射表

该文给出DC与EAD的映射表如表1。

2.2 建立映射规则

建立了以上映射表并不能直接完成DC与EAD的映射与转换,仍需针对两种元数据的多种差异建立映射规则,从而使转换完成得更为完整准确。

2.2.1 解决结构上的差异

在映射表中多个元素均为一一对应,但由于两种元数据的结构差异,就产生了源元数据和目标元数据元素间的一对多、多对一或无对应关系的情况出现,如DC的责任者和其他责任者两元素与EAD来源元素的对应为多对一关系,DC的来源、相关资源和版权管理等元素在EAD中则找不到与其相对应的元素。针对这些情况,映射规则必须规定在什么情况下将进行相应转换、如何转换,对无对应关系的元素如何进行转换处理,等等。

2.2.2 解决应用上的差异

由于DC和EAD的结构均灵活多变,存在多种必备和可选元素、可重复与不可重复元素、有无子元素等多种情况。此时映射规则须针对具体情况,做出恰当的规定,如明确规定源元数据必备元素的范围、确定源元数据多个重复元素的可选择性、对一方元数据中子元素缺少对应元素时如何处理,等等。

2.2.3 解决语义上的差异

针对二者语义、数据类型和形式、取值范围不一致等情况做出明确规定,尽量消除差异,确保转换的规范统一。

3 存在问题及解决办法

通过理论研究和多个国家的转换实验,我们发现对DC和EAD进行转换的主要困难还是在于EAD的复杂结构与DC元数据过于简单的矛盾,表现为将EAD转化为DC之后,难以在同一个全宗的档案资料之间重新建立链接,或者难以对由不同数据库收藏的、由同一个人或机构产生的资料之间重建链接;有时会丢失原EAD记录中的上下文信息,或者转换后的著录不够清晰,甚至出现错误指示等[6]。

以上问题的解决措施有以下几方面。

3.1 制订基于DC的电子档案元数据规范

元数据规范(也称元数据标准)是描述某类资源的具体对象时所有规则的集合。一般包括完整描述一个具体对象时所需要的数据项集合、各数据项的语义定义、著录规则和计算机应用时的语法规定。

通过制订针对电子档案的元数据规范,我们可以解决DC诸如对著录对象的描述深度不够、不能进行专指度较高的检索、与原EAD文件结构的对应不够准确等方面的不足。制订能够描述或标识电子档案内容、属性、外观特征及层次结构的描述元数据规范和管理元数据规范,从元素、语法、句法等方面对检索属性集做出规定,在保证数据质量和检索效果的基础上做好检索点设置,提高转换后文件对原文件相互联系的反映准确程度,有效表示转换后文件的可选项等等,确保转换后的元数据质量。

3.2 善用DC修饰词

由于简单DC的15个元素只限于描述信息的单一层次,而EAD是具有等级结构,特别是在EAD内容描述部分的从属部分(dsc)中,可从c01到c12多次重复,并且这些从属部分之间存在密切关联,要靠简单的DC元素来充分表达档案描述之间复杂的层级关系确有一定难度,但是,通过引入适当DC修饰词的复杂DC将能弥补这一缺憾。

目前DCMI(Dublin Core Metadata Initiative,都柏林核心元数据计划)确立了两类修饰词,即元素修饰词和编码体系修饰词[7]。随着各类团体遵从dumb-down(向上兼容)原则提出更多的修饰词,在经过DCMI应用委员会审核批准后推荐给大家使用,由此逐渐形成一个修饰词的大家族。相信不久的将来,通过档案工作者的不懈努力,针对档案专业领域的修饰词也会应运而生,通过多个修饰词的分级复用会较好地解决以上

问题。

3.3 确定DC为我国数字档案馆界的元数据标准

目前EAD在我国的应用仅限台湾,大陆还只处于理论研究阶段[8];而中文DC的研究与开发则已经从早年的实验阶段步入实用阶段,已设计并制订了期刊论文、电子图书、古籍、家谱和地方志等多种元数据规范,而且使用范围日趋广泛,逐渐为越来越多的图书馆所采用。

数字图书馆的成功范例为数字档案馆做出了榜样。希望我国档案界尽早确立DC为行业元数据标准,加强数字档案馆建设中元数据利用的一致性,少走弯路,尽早实现中文档案信息资源的共建和共享,提高我国档案界的自动化和标准化水平。

参考文献

[1] 张正强.论中国电子档案著录标准化的发展方向[J].图书情报知识,2004(5):35-38.

[2] 何小菁.数字档案馆元数据编制研究[J].图书情报工作,2004(5):93-95.

[3] 宋雪雁.档案元数据(EAD)著录原则探析[J].档案学通讯,2009(6):

57-59.

[4] 王萍,宋雪雁.EAD、DC、TEI著录实例及其比较分析[J].图书情报工作,2006(12):79-82.

[5] 王小丽,王芳.国内外数字档案馆元数据标准体系比较研究[J].情报科学,2007(3):382-389.

简述数据通信的特点例4

课程代码:04741

请考生按规定用笔将所有试题的答案涂、写在答题纸上。

选择题部分

注意事项:

1.答题前,考生务必将自己的考试课程名称、姓名、准考证号用黑色字迹的签字笔或钢笔填写在答题纸规定的位置上。

2.每小题选出答案后,用2B铅笔把答题纸上对应题目的答案标号涂黑。如需改动,用橡皮擦干净后,再选涂其他答案标号。不能答在试题卷上。

一、单项选择题(本大题共24小题,每小题1分,共24分)

在每小题列出的四个备选项中只有一个是符合题目要求的,请将其选出并将“答题纸”的相应代码涂黑。错涂、多涂或未涂均无分。

1.既可作为点—点线路通信子网又可作为广播信道通信子网的拓扑是

A.星形拓扑 B.网状形拓扑

C.树形拓扑 D.总线形拓扑

2.下列机构中,负责因特网RFC技术文件管理的是

A.ITU B.IETF

C.ANSI D.ISO

3.按照网络的交换方式划分的网络类型中不包括

A.电路交换网 B.报文交换网

C.分组交换网 D.虚拟交换网

4.计算机网络各层次结构模型及其协议的集合称为

A.互联参考模型 B.网络概念框架

C.网络体系结构 D.网络结构描述

5.下列关于“面向连接服务”特点的叙述中错误的是

A.传输数据前建立连接 B.每个分组要带目的节点地址

C.收发数据的顺序不变 D.通信协议复杂通信效率不高

6.下列网络协议中提供不可靠的用户数据报传送服务的是

A.ARP B.TCP

C.DNS D.UDP

7.TCP/IP参考模型中负责应用进程之间端—端通信的层次是

A.应用层 B.传输层

C.互连层 D.主机—网络层

8.规定DTE与DCE接口线的信号电平、发送器输出—阻抗的物理层特性属于

A.机械特性 B.电气特性

C.功能特性 D.规程特性

9.蜂窝移动通信系统中的多址接入方法不包括

A.波分多址接入 B.频分多址接入

C.时分多址接入 D.码分多址接入

10.设码元速率为3600Baud,调制电平数为8,则数据传输速率为

A.1200bps B.7200bps

C.10800bps D.14400bps

11.TCP端口号的范围是

A.0~256 B.0~1023

C.0~65535 D.1024~65535

12.对模拟数据进行数字信号编码的最常用方法是

A.相位调制 B.频率调制

C.脉码调制 D.振幅调制

13.ADSL服务采用的多路复用技术属于

A.频分多路复用 B.同步时分多路复用

C.波分多路复用 D.异步时分多路复用

14.下列关于数据交换技术特点的说法中错误的是

A.报文交换不能满足实时通信要求 B.对于猝发式的通信电路交换最为合适

C.数据报方式中目的地要重组报文 D.虚电路方式数据传送前要设置虚电路

15.在广域网中得到广泛应用的网络拓扑结构是

A.环形拓扑 B.星形拓扑

C.网形拓扑 D.总线拓扑

16.HDLC的帧类型中用于差错控制和流量控制的帧是

A.命令帧 B.信息帧

C.无编号帧 D.监控帧

17.既考虑拓扑结构又兼顾网络负载的静态路由算法是

A.最短路由选择算法 B.基于流量路由算法

C.泛射路由选择算法 D.链路状态路由算法

18.在数据通信过程中发现或纠正差错,把差错限制在尽可能小的范围内的技术和方法称为

A.差错控制 B.流量控制

C.链路控制 D.拥塞控制

19.下列关于IP协议基本任务的叙述中错误的是

A.IP不保证服务的可靠性 B.IP提供面向连接的数据报传输机制

C.IP不检查被丢弃的报文 D.在主机资源不足时可能丢弃数据报

20.在TCP/IP网络中,站点发送ARP请求所用的方式是

A.单播 B.组播

C.转播 D.广播

21.下列网络协议中,使用端口号为25的是

A.HTTP B.TELNET

C.SMTP D.GOPHER

22.IEEE802.3MAC帧的前导码中每个字节的比特模式为

A.01111110 B.10101010

C.10000001 D.10101011

23.无线局域网中为实现传输介质共享而采用的协议是

A.CSMA/CA B.F'TP

C.CSMA/CD D.SDP

24.应对网络被动攻击通常采取的手段是

A.检测恢复 B.预防

C.数据加密 D.认证

非选择题部分

注意事项:

用黑色字迹的签字笔或钢笔将答案写在答题纸上,不能答在试题卷上。

二、填空题(本大题共15小题,每小题1分,共15分)

25.在广播式网络中,发送报文分组的目的地址有单播地址、多播地址和________地址。

26.涉及用于协调与差错处理的控制信息的网络协议要素是________。

27.令牌环网上最严重的两种错误是________和数据帧无法撤销。

28.因特网支持的永久组地址224.0.0.1代表________中所有的系统。

29.传输层地址是主机上的某个________使用的端口地址。

30.CSMA协议与ALOHA协议的主要区别是多了一个________机制。

31.若使采用4B/5B编码的FDDI数据传输速率达到100Mbps,则信道的信号速率应达到________。

32.千兆以太网为了确保最小帧长为64字节,同时维持网络直径为200m,采用了数据包分组和________两种技术。

33.TCP协议用于控制数据段是否需要重传的依据是设立________。

34.蓝牙(Blue Tooth)是一种短距离的________技术标准的代称。

35.ATM信元长度为53个字节,其中信元头的长度为________个字节。

36.WAP是一种用在无线通信设备的移动通信技术,其功能类似于因特网上的________协议。

37.TagSwitching技术的基本思想是增强广域网________的路由/转发能力。

38.保护数据不受主动攻击(数据的伪造和变动)的措施称为________技术。

39.交换机可以用来分割LAN、连接不同的LAN或扩展LAN的________。

三、简答题(本大题共4小题,每小题5分,共20分)

40.简述星形网络拓扑结构的优缺点。

41.简述Go-back-N策略的基本原理。

42.简述IP协议(包括主机和网关)对输入数据报的处理过程。

43.简述目前数字签名的基本过程。

四、计算题(本大题共4小题,每小题5分,共20分)

44.已知一个IP数据报中携带了TCP报文,计算该TCP报文中数据段的理论长度。

(要求写出计算过程)

45.已知信道带宽为6KHz、采用四相调制技术,分别计算在不考虑噪声情况下和信噪比为30dB情况下的数据传输速率。(要求写出计算过程)

46.若采用同步时分复用TDM技术,一条带宽1.92Mbps的线路可以复用多少条64Kbps的信道?该线路上1秒钟最多可以传输多少个以太网的数据帧?(要求写出计算过程)

47.在令牌环网中,设传输速率为1Mbps,传播速率为2×108m/s,则该环网接口中的1位延迟相当于多少米电缆?若该令牌环网的电缆长度为10Km、有40个站点,每个站点的接口引入1位延迟,则环网的等效位长度是多少比特?(要求写出计算过程)

五、应用题(本大题共3小题,每小题7分,共21分)

48.说明IPv4地址的组成结构并画出A、B、C三类IP地址的格式,给出它们的表示范围。

49.题49图为拨号用户访问Internet的示意图。请从以下A~K的备选答案中为图中(1)至(6)选择具体的协议。

A. PPP B. SDLC C. HDLC

D. DNS E. IP F. TCP

简述数据通信的特点例5

所谓“图表写作”就是信息转换题,即把图表中的数据信息用文字的方式表达出来。图表作文是一种客观描述题,如同看图作文一般,只需描写你看到的内容,对于图表中没有出现的信息,无需展开自己的想象,进行推断。图表作文考察的就是考生的观察能力和逻辑分析能力,但在这一点上却是大多数考生的难点,其实,对于图表作文的写作,只要掌握了有效的分析方法和写作思路,一点也不难。本篇论文就从文章的三大结构入手,浅谈一下图表写作的相关技巧,希望能给考生们一些启示。

一.引言,即文章的开篇段

在文章的开篇段,考生需要简要的概括图表所传达的主要信息,在这一点上,有一个很简洁的办法,既可以节省时间,又可以准确地表达图表的主要信息,那就是通过改写题目的方法来完成。改写题目的方法主要有三种:改变题目中关键词的位置或词性;用同义词来代替题目中的某些词,例如:关键词;用图表中的其它文字信息来补充说明题目中的信息,如时间,地点,类别等。改写题目过后,考生还可以根据实际情况,适当地加入一些简单的描写内容,如横纵坐标分别代表什么内容。

二.主体,全文的核心内容

此部分是对图表的详细描写。本部分写作的好坏是建立在考生对图表的观察与分析的基础之上。对于各个类型的图表来说,描述不可面面俱到,分析重点应放在图表里的变化、发展、或趋势上等重点信息上。描写时应注意以下这些技巧:第一,在分析时可以用圆圈等符号把重要数据标出来,加以记录。第二,在写之前,要弄懂图表关于什么的。第三,在描写前,要清楚采取何种方法分析图表,即逐一描写每一个信息项,或是根据某种联系把所有描写项目加以分组或归类。第四,描写时最好采取从左到右或从上到下的顺序。第五,写作时不可以表达自己的主观想法,否则会扣分。另外,不同类型的图表都有各自不同的分析思路,图表分为数据类和非数据类图表。

1. 数据类图表。(1)表格。表格中的数字较多,但是数字间的规律性却很强,所以考生可以通过归纳和突出典型数据的思路来分析。把变化趋势或特征相似的几项归为一类,这样就使复杂的数据简单化。至于典型的数据,可以通过横向和纵向两个方面进行比较来获得,同时留意最大或最小的数据。(2)饼状图。它是比较形象和直观的一种图形,此图形反映的是整体与部分的关系,通常以百分数的形式表现出来,所以描写重点是图中的比例构成和最具特点的扇面。描写的时候注意最大或最小的扇面,对于各扇面数据的描写最好以从大到小的顺序来进行。(3)柱状图,又称条形图。通常图表中的横轴表示时间或不同种类,纵轴代表量。柱状图提供的信息量大,但是数字间的对比很明显,故描写时是以对比为核心的。柱状图的描写重点在横纵坐标上的变化和趋势上。描写时通常采用分组描写的方法,然后对不同组的数字进行分析,归纳出总的发展趋势,同时注意落差较大的柱与柱之间的关系。(4)曲线图。曲线图分单一曲线图和多根曲线图。曲线图的横轴通常代表时间,纵轴表示量的变化。单一曲线图的描写及其简单,首先根据曲线的波动情况,把曲线分为几大区间,如上升,下降和保持不变等。然后,按照从左到右的顺序,即时间发展的顺序来描写曲线的发展趋势。在描写的过程中,考生需要注意到曲线的极值(最高点或最低点)。另外,曲线的最后一段即使很短但很重要,因为它预示着未来的发展趋势,这是需要考生在文章最后一部分给与预测的内容。对多根曲线图的写作,考生只需要按照单一曲线图的描写方法逐一的描写每一根曲线即可,但是略有不同的是,要特别注意曲线与曲线的交点,以及同一时间点或同一时间段曲线与曲线之间的差异。曲线图的描写有三要素:趋势,极点和交点。

数据类图表的描写通常根据所提供的时间来确定采用一般现在时或一般过去时。

2. 非数据类的图表。非数据类的图表主要是流程图。流程图是雅思考试的一个难点,因为它不像数据类图形那样有一些固定的词汇,而是随着图表对象的变化而变化,很少出现重复的词汇。不过,这类图表考察的次数不多,所以,考生也无需太过担心。流程图一般是以时间或空间的顺序来表现的,所以,在描写的时候也应按照时间或空间的顺序来描写。流程图的写作需要考生知道以下几点:流程图的写作是以描述为主,描述流程图中出现的所有信息;流程图写作重点是在关键段和过程上,另外,描写全图的时候,段落是比较灵活的,在描写时只要是不同阶段之间的差距明显,就可以以独立的段落出现;流程图的时态比较单一,基本上就是一般现在时;被动语态的使用,可以避免过多主观性的表达。

为了提高本部分的写作水平,考生除了需要知道以上常见图形的描述方法外,考生还应注意几个主要问题:第一,主体部分每一个句子一般有三个组成部分,分别为文字信息,数字信息和比较。注意: 文字信息比数字信息更为重要。文字信息可以让读者了解图表的主要信息,而数字信息只是起辅助作用。第二,语言使用方面,雅思作文强调客观性和准确性,所以应注意减少第一人称的使用,减少非正式的说法。语法方面,考生应尽力避免犯简单的语法错误,如:一个句子不能有两个动词;主谓不一致;不及物动词没有被动语态等。所以,用恰当和丰富的表达解释数据时,将句子写得简洁而不出现语法错误,这是确保作文高分的关键。另外,每种图表虽然表述不同的内容,但是其描写的方法百变不离其宗,所以考生可以熟记40句图表描述的常用句式。第三,文章选用的时态方面,图表作文大部分是使用过去时态的,如果不表中没有出现任何以往的时间,或显示过去的统计数据,那么用一般现在时是比较理想的。另外,如果图表时间跨度较大,可能需要使用多种时态来描写。第四,描写信息时准确使用多样性句式不仅使考生能准确地描述图表所呈现的重要信息外,而且还可以增强文章的可读性,从而,体现考生的语言能力,吸引考官的眼球,赢得他们的好感。第五,所给数据的单位。图表里所给的数字一般是不带单位的,因为数字的单位通常都是在题目中或是图例中给出,所以,描写的过程中为了避免这个错误,考生可以在某一个数字的后面标注出单位以提醒自己。

三.总结段:评论或预测

在总结段中,一般是对总趋势或重要信息的评论或是根据重要信息或趋势做出客观的预测。考生应该注意信息来自图表,那么结论也应通过对比或对照表格中数据的方式来反映某种客观事实,而不能抛开图表任意地发表主观见解或评论。通常来说,作评论的时候,采用一般现在时;做预测的时候,采用将来时(最好避免will这种词,因为这样的语气过于肯定。一般采取 be to do的形式或是be likely to, be predicted to)。

参考文献

[1] 杨福.最新雅思考试写作教程[M]. 北京:国防工业出版社,2007.9

简述数据通信的特点例6

基金项目:河北省科技厅2010年度科研项目(104572117)

中图分类号:F83 文献标识码:A

收录日期:2012年3月13日

一、数据挖掘的相关概念简述

(一)数据挖掘简介。从技术角度看,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中提取隐含在其中的、人们所不知道的但又是潜在有用的信息和知识的过程。简言之,数据挖掘实际上是一种深层次的数据分析方法。

(二)数据挖掘的主要步骤

1、问题定义。数据挖掘是指在大量数据中发现有用的令人感兴趣的信息,因此哪种信息是我们感兴趣的,就成了数据挖掘的首要问题。

2、数据准备。数据准备又可分为三个步骤,即数据选取、数据预处理和数据变换。数据选取的目的是根据用户的需要从原始数据库中抽取一组数据。数据预处理一般包括消除噪声、消除重复记录、完成数据类型的转换等。数据变换的目的是消减数据的维数,即从初始特征中找出真正有用的特征。

3、数据挖掘。根据对问题的定义明确挖掘的任务或目的,如分类、聚类、关联规则发现或序列模式发现等。

4、结果解释和评估。数据挖掘的结果有些是有实际意义的,而有些是没有意义的,或是与实际情况相违背的,这就需要对结果进行评估。

5、分析决策。数据挖掘的最终目的是辅助决策。决策者可以根据数据挖掘的结果,结合实际情况,调整竞争策略等。

总之,以上步骤不是一次完成的,可能其中某些步骤或者全部要反复进行,才有可能达到预期的效果。

二、数据挖掘技术的功能

数据挖掘通过预测未来趋势及行为,做出前瞻的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有以下五类功能:

1、自动预测。数据挖掘技术能够自动在大型数据仓库中寻找到预测性信息。过去需要进行大量手工分析的问题,如今可以迅速直接地由数据本身得出结论。例如,数据挖掘技术能够使用过去有关信用卡促销的数据来寻找未来信用卡消费中能使银行获取最大盈利的客户。

2、分析关联。数据关联是指数据仓库中存在着某类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。分析是否关联的目的是找出数据仓库中隐藏的关联网。有时并不知道数据仓库中数据的关联函数,即使知道也是不确定的,因此由分析数据关联度而生成的规则是具有可信度的,是有价值的知识。

3、划分聚类。数据仓库中的记录可被划分为一系列有意义的子集,即聚类。应用聚类技术可以增强人们对客观现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要包括传统的模式识别方法和数学分类学。聚类技术的核心是,在划分对象时不仅考虑对象之间的距离,还要求划分出的类具有某种内涵描述,从而避免了传统技术的某些片面性。

4、概念描述。概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性描述只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。

5、偏差检测。数据仓库中的数据常有一些异常记录,从数据仓库中检测这些偏差很有意义。偏差往往包含很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是,寻找观测结果与参照值之间有意义的差别。

三、数据挖掘技术在银行业中应用的主要方面

(一)风险管理。数据挖掘在银行业的重要应用之一是风险管理,如信用风险评估。可通过构建信用评级模型,评估贷款申请人或信用卡申请人的风险。对于银行账户的信用评估,可采用直观量化的评分技术。以信用评分为例,通过由数据挖掘模型确定的权重,给每项申请的各指标打分,加总得到该申请人的信用评分情况。银行根据信用评分决定是否接受申请,确定信用额度。通过数据挖掘,还可以侦查异常的信用卡使用情况,确定极端客户的消费行为。通过建立信用欺诈模型,帮助银行发现具有潜在欺诈性的事件,开展欺诈侦查分析,预防和控制资金非法流失。

(二)客户管理。在银行客户管理生命周期的各个阶段都会用到数据挖掘技术。

1、获取客户。发现和开拓新客户对任何一家银行来说都至关重要。通过探索性的数据挖掘方法,如自动探测聚类和购物篮分析,可以用来找出客户数据库中的特征,预测对于银行营销活动的响应率。可以把客户进行聚类分析,让其自然分群,通过对客户的服务收入、风险、成本等相关因素的分析、预测和优化,找到新的可赢利目标客户。

2、保留客户。通过数据挖掘,发现流失客户的特征后,银行可以在具有相似特征的客户未流失之前,采取额外增值服务、特殊待遇和激励忠诚度等措施保留客户。通过数据挖掘技术,可以预测哪些客户将停止使用银行的信用卡,而转用竞争对手的卡。银行可以采取措施来保持这些客户的信任。

数据挖掘技术可以识别导致客户转移的关联因子,用模式找出当前客户中相似的可能转移者,通过孤立点分析法可以发现客户的异常行为,从而使银行避免不必要的客户流失。数据挖掘工具,还可以对大量的客户资料进行分析,建立数据模型,确定客户的交易习惯、交易额度和交易频率,分析客户对某个产品的忠诚程度、持久性等,从而为他们提供个性化定制服务,以提高客户忠诚度。

3、优化客户服务。银行业竞争日益激烈,客户服务的质量是关系到银行发展的重要因素。为客户提供优质和个性化的服务,是取得客户信任的重要手段。如,通过分析客户对产品的应用频率、持续性等指标来判别客户的忠诚度,通过交易数据的详细分析来鉴别哪些是银行希望保持的客户。找到重点客户后,银行就能为客户提供有针对性的服务。

主要参考文献:

简述数据通信的特点例7

0引言

数据挖掘就是从大量的信息数据中发现潜在的规律性内容,进而对数据应用的质量问题进行解决,实现对数据的充分利用。在互联网发展支持下的数据挖掘技术得到了快速的发展,特别是以结构化数据为主的数据挖掘技术。数据挖掘技术被广泛地应用到各个领域,并获得了好的效果。但这种结构化的数据挖掘技术无法对Web数据挖掘的特性进行处理,Web上的HTML文档格式也不规范,导致没有充分挖掘和利用有价值的知识。由此,如何优化传统数据挖掘技术,实现其和Web的结合成为数据挖掘技术研究领域关注的热点。而XML的出现,弥补了Web的不足,成为现阶段互联网数据组织和交换的标准,并逐渐出现在Web上。文章对基于多层次技术的XML数据挖掘进行研究。

1Web数据挖掘的难点

第一,异构数据库的环境。因特网上的信息可以说就是一种数据路,具有大量的数据资源,每个站点的数据源都是异构的,因此,每个站点之间的信息和组织结构不一样,形成了一种异构数据库环境。想要获得和利用这些数据资源需要进行数据挖掘,这种数据挖掘需要对站点的异构数据集成进行研究,同时还要对因特网上的数据查询问题进行解决。第二,半结构化的数据结构。传统的数据库具有数据模型,能够通过这种模型来对特定的数据进行描述。但因特网上的数据较为复杂,没有统一的模型让人进行描述,且自身具有独立性、动态性的特点,存在自述层次,因而是一种半结构化数据。

2XML数据挖掘技术

2.1XML技术概述

XML是由万维网协会设计的一种中介标示性语言,主要被应用在Web中。XML类似于HTML,主要被设计用来描述数据的语言,为数据挖掘提供了一种独立的运行程序,能够实现对数据的共享,并利用计算机通讯将信息传递到多个领域。

2.2XML和HTML的比较

HTML是Web的重要技术要素之一,简单易学,被很多计算机专业人员应用于创建自己的、具有超文本特定的多媒体主页,能够实现网络和普通人的联系,创造出丰富的网页。但其在因特网的应用存在以下几点缺陷:第一,只是对信息的显示方式进行描述,没有对信息内容本身进行描述;第二,需要因特网服务器帮其处理任务工作,加重了网络的负担,降低了网络运行的效率。根据上文对XML技术的概述,可以看出,XML不是一种单纯的标记语言,而是一种定义语言,能够根据需要设定不同的标记语言,突破了HTML固定标记的限制,能够更好地推动Web的发展。

3基于XML数据挖掘框架设计

3.1设计的特点

第一,具有自然、性能良好、个性化设计的系统用户界面;第二,主要应用元搜索引擎页面。这种页面设计的主要思想是首先对用户的查询请求进行预处理,之后向各个搜索引擎发送查询的请求,最后,在经过处理之后向用户反馈检索结果。第三,Web页面的设计充分应用了HITS的算法。第四,利用XML技术对检索的数据进行预处理。主要表现为将数据库中的所有文档形式转化为XML文档形式,之后在数据仓库的应用下实现各种文档的集成。

3.2系统设计的结构

XML数据挖掘系统的结构主要包含用户界面模块、数据预处理模块和数据挖掘模块。第一,用户界面模块主要作为用户和系统交接的端口存在,用户通过这个界面来实现对数据挖掘系统的使用。在这个模块中,用户能够在对数据挖掘之前设定挖掘的参数,之后提出请求、对挖掘成果分析,实现个性化的数据挖掘。第二,数据预处理模块主要是指在对数据检索之后,应用XML技术对检索的数据进行预处理。第三,数据挖掘模块主要是对数据预处理后的模块信息进行挖掘,并将成果展示给用户。

4基于XML技术的Web数据挖掘

4.1数据挖掘方案的选取

基于XML技术的Web数据挖掘主要分为内容上的挖掘和形式上的挖掘两种,其中,内容挖掘主要是针对文档标记的开始和结束之间的文本部分,即对标记值的一种挖掘。具体的内容挖掘方案主要有三种:第一,利用专门的XML数据、半结构数据开发查询的语言,充分开发其查询功能,并将这种语言渗透在应用程序中,从而实现对数据的有限挖掘。这种挖掘方案能够将XML技术和数据挖掘技术进行有效的结合,且具有操作简单的特点。第二,实现对XML文档数据的结构化处理。在处理之后将其映射到现有的关系对象模型中,从而实现对数据的挖掘。第三,将XML文档视为一种文本,采用传统的数据挖局处理技术对数据进行挖掘。

4.2XML技术数据挖掘实现

XML技术的挖掘实现主要利用XQuery实现关联挖掘来进行数据挖掘,且不需要对其文档进行预处理和挖掘后处理,具有操作简单的优势。主要采用两种方式来执行XQuery。第一,使用XhiveNodeIf对象的executeXQuery进行语句的执行,使得集合的每个元素都是对应的对象,并将对象转换成DOM的节点来进行数据的挖掘。第二,利用XhiveXQueryQueryIf对象调用execute进行语句的执行。在这个过程中会涉及对外部参数的使用。

5结语

XML数据挖掘能够有效解决因特网数据挖掘难的问题,实现数据挖掘的简单化操作。XML数据挖掘将不同结构、不容易兼容的数据进行结合,并利用自身的灵活性和延展性将各种应用软件中的数据进行不同描述,从而方便因特网中数据的收集和记录。同时,基于XML数据是自我描述性的,不需要内部的描述处理就能实现数据的交换,为其对数据的处理和应用提供了便利的支持。因此,技术XML技术的数据挖掘成为当今因特网数据挖掘的研究重点,需要有关人员引起足够的重视,进而不断促进该技术对数据挖掘的应用。

作者:袁园 单位:重庆电讯职业学院

参考文献:

[1]卢珊.基于XML技术的Web数据自动挖掘新方法[J].信息技术与信息化,2014,12:141-143

简述数据通信的特点例8

关键词:电子词典;ASP;数据库

1 电子词典系统研究概述

1.1 传统电子词典系统的概述

电子词典的起初是为了方便人们的生活与学习而开发的一种单版机形式的掌上电脑,其主要功能为学习而设计的词汇翻译查找功能,传统意义上的电子词典也分为两类,一类是学生用的只具备查词等很简单功能电子字典,一类是商务人士使用的,具备多种功能的PDA掌上电脑。

当个人PC机发展起来以后,诸多程序师便设计出类似于电子词典的程序来,运行在PC机上,程序的运行需要安装特定的电子词典软件,功能也和掌上电脑词典相类似。

1.2 网络电子词典系统的概述

当网络发展起来后,传统的电子词典虽有其的优势所在,单也难免有不可及的缺点,比如必须购买,或者进行安装等等,现在人们利用网络这一传播速度快,范围广,效率高等特点设计出了基于网络运行的新型在线电子词典,所谓在线电子词典就是随时随地,只要能上网,即可通过网络来实现传统电子词典的诸多功能,比如查词、备忘录、等功能。它的原理就是利用制作好的电子词典页面与数据库在网上,只需通过WEB页面进行访问,便可以非常直观的进行操作。

2 在线电子词典系统分析与设计

2.1 在线电子词典系统的用户需求简介

用户对于电子词典的功能需求最主要的为语言词汇的查找翻译功能,其次有记事本、电话薄、备忘录、日历等一些附加功能。我们基于用户对于电子词典的需求方面分析,主要设计了其语言词汇的查找互译功能。

对于有此类需求的用户群面也非常的广,据最新统计数据表明,目前中国的网民人数已经达到9600万人,接近一个亿的庞大用户群,况且网络是不分国界的,国外用户也可通过本系统进行词汇的查找互译。只要具备上网条件的用户均可无时无地的来使用本系统。

2.2 电子词典系统功能描述

本系统的主要功能概括起来有以下两点

1)在线进行英汉双语词汇的互译。

2)通过后台管理对词汇进行修改、添加、删除。

2.3 系统开发环境简介

系统开发环境为Windows XP pro系统下利用记事本进行ASP源程序的编辑,使用Microsoft Access建立数据库程序,通过ODBC连接数据库,由数据库访问组件ADO(ActiveX Data Objects)完成数据库操作。当数据与程序完备后使用Dreamweaver与Photoshop对程序进行美化修改。最后在IIS 5.0 上测试运行。

3 ASP脚本简介

3.1 ASP脚本简介

ASP是微软公司最新推出的WEB应用开发技术,着重于处理动态网页和WEB数据库的开发,编程灵活、简洁,具有较高的性能,是目前访问WEB数据库的最佳选择。

3.2 ASP访问数据库的原理

ASP是服务器端的脚本执行环境,可用来产生和执行动态的高性能的WEB服务器程序。

当用户使用浏览器请求ASP主页时,WEB服务器响应,调用ASP引擎来执行ASP文件,并解释其中的脚本语言(JScript 或VBScript),通过ODBC连接数据库,由数据库访问组件ADO(ActiveX Data Objects)完成数据库操作,最后ASP生成包含有数据查询结果的HTML主页返回用户端显示。

由于ASP在服务器端运行,运行结果以HTML主页形式返回用户浏览器,因而ASP源程序不会泄密,增加了系统的安全保密性。此外,ASP是面向对象的脚本环境,用户可自行增加ActiveX组件来扩充其功能,拓展应用范围。

3.3 ASP页面的结构

ASP的程序代码简单、通用,文件名由.asp结尾,ASP文件通常由四部分构成:

1)标准的HTML标记:所有的HTML标记均可使用。

2)ASP语法命令:位于标签内的ASP代码。

3)服务器端的include语句:可用#include语句调入其它ASP代码,增强了编程的灵活性。

4)脚本语言:ASP自带JScript和VBScript两种脚本语言,增加了ASP的编程功能,用户也可安装其它脚本语言,如Perl、Rexx等。

3.4 ASP的运行环境

目前ASP可运行在三种环境下:

1)WINDOWS NT server 4.0运行IIS 3.0(Internet Information Server)以上。

2)WINDOWS NT workstation 4.0运行Peer Web Server 3.0以上。

3)WINDOWS 95/98运行PWS(Personal Web Server)。

其中以NT server上的IIS功能最强,提供了对ASP的全面支持,是创建高速、稳定的ASP主页的最佳选择。

3.5 ASP的内建对象

1)Ad Rotator组件:用来按指定计划在同一页上自动轮换显示广告,用于WWW上日益重要的广告服务。

2)Browser Capabilities组件:确定访问WEB站点的用户浏览器的功能数据,包括类型、性能、版本等。

3)Database Access组件:提供ADO (ActiveX Data Objects)来访问支持ODBC的数据库。

4)File Access组件:提供对服务器端文件的读写功能。

5)Content Linking组件:生成WEB页内容列表,并将各页顺序连接,用于制作导航条。

ADO组件主要提供了以下七个对象和四个集合来访问数据库:

1)Connection对象:建立与后台数据库的连接。

2)Command对象:执行SQL指令,访问数据库。

3)Parameters对象和Parameters集合:为Command对象提供数据和参数。

4)RecordSet对象:存放访问数据库后的数据信息,是最经常使用的对象。

5)Field对象和Field集合:提供对RecordSet中当前记录的各个字段进行访问的功能。

6)Property对象和Properties集合:提供有关信息,供Connection、Command、RecordSet、Field对象使用。

7)Error对象和Errors集合:提供访问数据库时的错误信息。

4 Access数据库介绍

Access就是关系数据库开发工具,数据库能汇集各种信息以供查询、存储和检索。Access 的优点在于它能使用数据表示图或自定义窗体收集信息。数据表示图提供了一种类似于 Excel 的电子表格,可以使数据库一目了然。另外,Access允许创建自定义报表用于打印或输出数据库中的信息。Access也提供了数据存储库,可以使用桌面数据库文件把数据库文件置于网络文件服务器,与其他网络用户共享数据库。Access是一种关系数据库工具,关系数据库是已开发的最通用的数据库之一。如上所述,Access作为关系数据库开发具备了许多优点,可以在一个数据包中同时拥有桌面数据库的便利和关系数据库的强大功能。

5 结论

基于ASP制作WEB模式的在线电子词典查词系统的实现,无疑会使传统的掌上办公为主的,向网络化、高效化和信息化转变。可以预计,随着人们对词汇信息量的增加和信息化程度的提高,在线电子电子词典将是未来发展方向。

[参考文献]

简述数据通信的特点例9

1计算机技术在计量检测中应用的必要性

计算机先进技术在计量检测中的应用主要是指以企业为基础通过计算机这个先进的平台,来建立有关计量检测工作的相关数据信息,这样可以方便计量工作的管理和测量的有效开展,将计量检测的相关数据进行共享处理,来提高企业本身的生产和运行效率。关于计算机技术在计量检测中应用的必要性,文章通过三个方面的叙述进行分析。第一个方面是简述计算机先进技术在计量管理水平提高方面的应用分析;第二个方面是简述计算机先进技术在计量管理成本降低方面的应用分析;第三个方面是简述计算机先进技术在计量管理顺利开展方面的应用分析。

1.1计算机先进技术在计量管理水平提高方面的应用分析

相较于传统方式的计量管理工作,计算机先进技术的应用在计量检测管理工作中有很多的帮助,它实现了计量检测工作的自动化和智能化。计量工作的管理人员可以通过计量管理的数据分析和管理方式来进行动态的计量检测结果的掌控,便于计量管理人员随时听取关于计量检测数据的报告,在进行计量检测决策的时候不受人为影响的限制,便于计量检测管理人员进行正确的决策。同时通过计算机的应用,还可以让计量检测的相关实施工作人员查询及分析相关数据,进而让整个计量检测管理的流程和时间都有一个质的提高。

1.2计算机先进技术在计量管理成本降低方面的应用分析

计量检测领域在引进计算机先进技术之后,计量技术的管理人员可以通过计算机提供的相关计量检测数据来分析计量检测内部的信息数据,通过相关的数据分析来进行具体的数据传递,这样就会减少相关的计量检测的管理时间,进而降低计量检测管理的相关成本,最终达到计量检测信息的目的。

1.3计算机先进技术在计量管理顺利开展方面的帮助

在计量检测工作中应用计算机先进技术,可以非常方便的进行计量检测工作的展开。这一点在计量检测管理部门中尤为重要。计量检测管理部门通过计算机的应用可以进行计量检测相关信息数据的共享;可以进行计量检测信息的传递;还可以减少管理人员的信息管理时间。这样就会适当放宽计量检测管理人员的工作时间,还可以让计量管理工作人员有效的进行计量检测方面的创新。

2计算机先进技术在计量检测管理方面的现状

我国计算机起步较之还国外是相对比较晚的,在计量检测中的应用也比较晚,但是我国计算机在计量检测中的应用却较为稳定,关于计算机先进技术在计量检测管理方面的现状,文章主要从两个方面进行分析。第一个方面是简述计算机先进技术在计量检测方面的现状;第二个方面是简述计算机先进技术在计量决策方面的现状。

2.1计算机先进技术在计量检测方面的现状

计量检测中检测工具的维修和检测是一项较为重要的工作。用计算机记录来进行相关的计量检测数据的分析。和传统的检测工具不同,计算机的应用可以将每一种检测工具的历史记录进行更好的检测。还可以节约检测时间,降低企业的检测成本,减少人为的检测误差。

2.2计算机先进技术在计量决策方面的现状

通常情况下,计量检测数据信息是层层上报的进行数据的相关确认,在很大程度上延长了计量检测数据的确认时间。对于数据检测的相关决策者来说,时间是他们正确决策的前提,时间越快,决策者的决策正确率越高;时间越慢,决策者的决策正确率越低。所以一定要注意时间问题,计算机的应用却避免了此类问题的出现。

3计算机先进技术在计量管理方面的应用

计量检测的检测工具通常会随着检测企业规模的增大而增多。在传统形式的计量检测管理中,人的因素是占据主导作用的,很多工作都需要人工去处理和收集,程序的多样和复杂程度就导致了检测计量工作需要很大一部分由人来完成。伴随着计量检测领域计量工作的深入进行,对于计量工作要求也是越来越高,越来越细,这样就无形中增加了相关管理人员的工作量,实践证明,计算机先进技术的引用是提升检测工作的最好方式。文章主要从三个方面进行阐述。第一个方面是简述计算机先进技术在量具台账管理自动化方面的应用。第二个方面是简述计算机先进技术在计量数据方面的应用。第三个方面是简述计算机先进技术在计量工作网络化方面的应用。

3.1计算机先进技术在量具台账管理自动化方面的应用

在计量企业中,这种计量工具和计量数据结果都需要计算机进行管理,这样可以有效的提高信息录入的准确率和减少信息录入的时间,同时计算机的大容量存储就会被社会发挥。计算机的智能化和计算机的自动化都会对量具台账有很大的帮助。

3.2计算机先进技术在计量数据方面的应用

在计量检测中,量值溯源及器具管理的计量相关工作,都需要进行数据分析。计算机的数据录入和分析便于人们日常的检索和查询,计算机信息具有很好的存储功能。

简述数据通信的特点例10

中图分类号:TP393.1 文献标识码:B 文章编号:1009-9166(2010)026(C)-0109-01

一、资源的共享传输

(一)问题简述。计算机局域网的广泛使用,资料的共享和传输就成为绕不开的话题。目前,虽然网上资料的共享和传输的手段很多,如各种硬媒介、网上邻居、网络硬盘等,但都各有局限。而资源共享的目的是既要保证安全又要保证有效的传输和共享文件,同时不占用过多系统资源,不能使主机运行速度明显减慢。因此在资源共享部分采取TCP协议是一种较好的解决方案,TCP是一种面向连接(连接导向)的、可靠的、基于字节流的运输层(Transport layer)通信协议,由IETF的RFC 793说明(specified)。在简化的计算机网络OSI模型中,它完成第四层传输层所指定的功能,UDP是同一层内另一个重要的传输协议。在因特网协议族(Internet protocol suite)中,TCP层是位于IP层之上,应用层之下的中间层。不同主机的应用层之间经常需要可靠的、像管道一样的连接,但是IP层不提供这样的流机制,而是提供不可靠的包交换。

(二)技术特点。1、TCP建立连接之后,通信双方都同时可以进行数据的传输。2、他是全双工的,在保证可靠性上,采用超时重传和捎带确认机制。本系统采用客户与服务端一体的,基于TCP协议设计。系统利用socket进行通信时,在服务器端运行一个socket通信程序。服务器端不停地监听某个端口,等待客户的连接申请,接到申请后建立连接并进行通信,所以,在socket通信方式中,服务器是主动等待连接通信的到来,同时,服务器端的程序可以打开多个线程与多个客户进行通信,还可以通过服务器使各个客户之间进行通信。这种方式比较灵活,适用于一些较复杂的通信,因此服务器端的程序必须始终处于运行状态以监听端口。

二、断点续传

(一)问题简述。有时用户下载文件需要历时数小时,万一线路中断,不具备断点续传的服务器或下载软件就只能从头重传;比较好的服务器或下载软件具有断点续传能力,允许用户从上传下载断线的地方继续传动,这样大大减少了用户的烦恼。断点续传技术的使用可以使用户在网络异常中断或由于其他事件需要中断传输后,能在下一次传输过程中继续下载未完成文件,保证不浪费传输资源,特别是增加大文件传输的抗风险能力。断点续传的理解可以分为两部分:一部分是断点,一部分是续传。

(二)解决方案。1、客户端用CreateFile以OPEN_EXISTING方式打开要下载的文件列表。2、若成功说明有断点文件,则用GetFileSize得到大小作为断点。3、若失败说明文件不存在,则创建一个文件。

三、用户交流

本系统提供简单的用户交流功能,使用户之间能通过简单的文字交流达到互相传递消息的目的。

从需求可知用UDP协议开发此功能是较好的选择,用户数据报协议(UDP)是OSI参考模型中一种无连接的传输层协议,提供面向事务的简单不可靠信息传送服务。是一个简单的面向数据报的传输层协议,IETF RFC 768是UDP的正式规范。UDP协议基本上是IP协议与上层协议的接口。UDP协议适用端口分别运行在同一台设备上的多个应用程序。

与TCP不同,UDP并不提供对IP协议的可靠机制、流控制以及错误恢复功能等。由于UDP比较简单,UDP头包含很少的字节,比TCP负载消耗少。

UDP提供的服务是不可靠的、无连接的服务,UDP适用于无须应答并且通常一次只传送少量数据的情况。由于UDP协议在数据传输过程中无须建立逻辑连接,对数据报也不进行检查,因此UDP具有较好的实时性,效率高。

四、日志记录

提供上传下载,用户交流记录以及流量监控等一系列原始记录。每当发生重要事件时,包括:

(一)软件启动。

(二)软件关闭。

(三)发送或接受LISTCMD命令。

(四)发送或下载文件结束。

(五)发送或接受用户文字。

当发生上述行为时,本系统将自动将相关信息记录到log文件中,方便用户的后续查询和处理。

五、速度控制

为避免文件共享系统占用过多系统资源,因此对于传输速度的控制成为一个必不可少的手段,能根据不同的需求提供不同的文件传输速度安排,速度一般有两种方法。