数据理论论文模板(10篇)

时间:2023-03-22 17:49:23

导言:作为写作爱好者,不可错过为您精心挑选的10篇数据理论论文,它们将为您的写作提供全新的视角,我们衷心期待您的阅读,并希望这些内容能为您提供灵感和参考。

数据理论论文

篇1

数据通常被分为结构化数据、半结构化数据和非结构化数据。相对于传统的以文本为主的结构化数据,网络日志、音频、视频、图片、地理位置信息等半结构化、非结构化数据越来越多。同时,近几年出现的微博、微信等可通过移动互联设备使用的电子交往形式使数据量和数据种类更加复杂化。

(二)价值不高(Value)

价值密度的高低与数据总量的大小成反比。以社会中常见的监控录像为例,一天的监控记录,有用数据可能仅有一二秒。如何将已有的结构化数据、半结构化数据及非结构化数据进行整合、分析,挖掘出更多有价值的信息,并通过强大的计算能力迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。

(三)要求高速处理(Velocity)

这是大数据区分于传统数据挖掘的最显著特征。根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,处理数据的效率就是生命。

二、图书馆大数据的主要来源分析

根据大数据的基本特征,经笔者分析,图书馆知识服务领域的未来大数据的来源主要有RFID射频数据、传感器数据、社交网络和移动互联数据等几个方面。随着图书馆数字技术的不断提高,RFID将不断推广,这将是未来图书馆大数据的主要来源之一;由图书馆中的传感器感知生成的数据,长时间积累后也将产生巨大的数据量;社交网络已广泛应用于社会各个方面,逐步成为人们交往的主要形式,其所产生的数据量远超以往任何一个信息传播媒介,由其生成的数据量是不可估量的;移动互联网及移动互联技术的不断完善,使得图书馆可以灵活获取移动电子设备、人员、资源、用户行为和需求等信息,并对这些信息进行实时分析,从而帮助我们开展有效的智能辅助决策。

三、大数据对图书馆管理的影响和挑战

(一)海量数据处理考验图书馆计算能力

大数据时代背景下,各类数据量迅速增长,数据产生的方式、范围发生前所未有的变化,人们在社会中的各类行为都产生了大量的信息数据,信息数据的组成结构、格式类型、存在形态等都更加复杂。图书馆要对上述复杂的数据进行应用、存储,将具有很强的挑战性,不仅仅涉及云计算、大数量级数据存储等技术问题,还可能促发图书馆服务模式、资源建设模式、管理模式与发展模式的转变。

(二)数据分析方式转变带来的挑战

随着图书馆信息化程度的提高,以互联网信息搜索、查询为基础的知识服务逐渐被更多的图书馆所采用。但不管是简单的信息服务,还是结合了信息检索、组织、分析等高级业务服务,都可归纳为就数据而进行的服务。大数据时代背景下要求图书馆不仅需要通过结构化数据了解客户需求,也需要大量的非结构化数据、半结构化数据去挖掘、预测和分析当前和未来的用户需求,社会大众的需求也将随着不断变化的个性化的高满意度服务出现而对图书馆的服务呈现出明确和迫切的需求。满足用户的需求,提供复杂数据的处理也将成为大数据时代图书馆的发展方向,如何处理好数据分析,将直接影响图书馆的生存与发展。

(三)大数据对图书馆基础设施提出更高的要求

半结构化及非结构化数据的迅速增加,导致数据存储、计算规模越来越大,其成本急剧上升。很多知识服务机构出于成本的考虑将应用由高端服务器转向中低端硬件构成的大规模计算机集群,从而对支持非结构化数据存储及分析的基础设施提出了很高的要求。

四、大数据时代图书馆管理发展方向

(一)探索利用数据分析技术与工具

对图书馆来说,在大数据时代要想在激烈的市场份额竞争中争得一席之地,避免边缘化,开展必要的大数据分析服务显得必不可少。图书馆开展的大数据分析服务业务,主要可以有以下几种:首先是图书馆自身建设所需的大数据分析。这类分析一般以图书馆的现有数据为对象进行分析,如读者的借阅方式、行为爱好等,是一种对现有资源的分析与挖掘;其次是客户即读者所需的大数据分析。这类分析业务类似于当今图书馆为企业等客户群体所做的信息情报参考、竞争情报分析,但也有着很大的区别,如对于分析对象数据的不同、分析手段的不同、分析目的不同等,这类分析业务所依靠的大量数据可能并非图书馆所拥有,从而成为限制该项业务发展的瓶颈,如何解决此类服务的数据问题是突破该瓶颈的关键。麦肯锡的《大数据:创新、竞争和生产力的下一个前沿领域》报告中首次提出了“大数据”的概念,对大数据的分析技术与工具进行了列举,如目前已为广大图书情报研究者所熟知的聚类分析、数据挖掘、网络分析、可视化分析、数据融合与数据集成等,特别是聚类分析、可视化分析与数据挖掘技术。但这些现有的研究目前仅仅只是针对结构化数据和有限数量的关键词进行聚类分析、共现分析等,并不能真正挖掘大量负责数据的存在与表现形态,更不能通过这些分析去预测未来的可能发展趋势。当然,大量网络社交等信息行为产生的大量非结构化数据、半结构化数据也让许多学者开始思考去采集和利用这些信息,如苏玉照等人就认为如果能够采集到Web日志的数据,就能很好地满足发现关联规则、内容分类和用户聚类的需求,从而能提高个性化推荐的精度,进而对定制Web日志的数据模型、过程及方法进行探索。

(二)重视基础设施建设

大数据时代,图书馆的核心竞争力不再仅是文献数据信息的竞争,各类形式的海量数据以及对海量数据的分析、挖掘才是今后图书馆之间竞争的核心因素。因此,要跟上大数据的脚步,必须完善信息收集的基础设施建设,加强各类信息资源的收集将成为图书馆资源建设的大方向。图书馆首先要明白“数据即生命”,解决数据存储问题。大数据时代对于图书馆的数据存储量要求极高。早在2007年,沃尔玛就通过对消费者的购物行为等非结构化数据进行分析,创造了“啤酒与尿布”的经典商业案例。这样的经典案例是通过对海量的多类型数据收集和分析得到的。因此,图书馆要掌握读者用户、馆员乃至社会服务群体等的信息,既要有当前通用的数据记录中的个人身份、借阅记录等结构化数据,还要有存储信息行为、搜索方式、行为痕迹等非传统数据,这些都需要通过基础设施的建设来支持。除此之外,图书馆还必须解决数据计算和数据分析问题。要积极利用“云计算”技术,搭建图书馆的云计算平台,解决图书馆自身海量数据的存储及运算能力与大数据对存储能力的高要求之间的矛盾。

篇2

由于历史文化名城展示与利用涉及到的内容很多,包括历史学、地理学、建筑学、社会学、景观生态学等,与此同时,随着科学技术的进步,先进的数据采集、建筑测绘等软硬件设施已经大量应用于历史文化名城的展示与利用当中,在此过程中产生了数量庞大的数据信息,而大数据能够对这些庞大的数据信息进行快速准确的处理.所谓“大数据”就是指需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产.例如,三维激光扫描技术是一种通过激光反射的原理,将被测量对象通过三维激光扫描系统的处理,构建成一整套的点云数据模型,在此基础上,通过专业的三维软件技术对于被测对象进行逆向的数字化构建,从而能够进行后续的数字化的研究与利用.在此过程中,点云数据会大量涌现,尤其是对于展示与利用真实性要求更高的项目而言,所产生的数据将会无限接近于真实的被测对象,数据会呈现出几何数量级增长.数据量大,能够促进历史文化名城展示与利用在探索方法和研究理念的层面上产生根本性的变革.对于早期的历史文化名城的展示与利用来说,由于受到认知性和数据分析能力的影响,人们就某一处历史文化名城的展示与利用的形式、内容以及方法上,仅仅是能够通过数量有限的样本案例和数据资料,利用较为传统的技术手段进行数据的分析、评估和管理.大数据的应用,能够将大量的历史文化名城的相关信息进行有目的性的筛选和处理,为展示利用的方式、方法在名城中的应用,提供了较为全面和具体的对策措施,提高展示利用实施的精确性.

1.2大数据对多样数据类型的处理

历史文化名城在展示利用时涉及到的数据繁多复杂.单就其中的某一处历史建筑来讲,《历史文化名城、名镇、名村保护条例》对建筑本身的历史档案包括了5项内容:1)建筑艺术特征、历史特征、建设年代及稀有程度;2)建筑的有关技术资料;3)建筑的使用现状和权属变化情况;4)建筑的修缮、装饰装修过程中形成的文字、图纸、图片、影像等资料;5)建筑的测绘信息记录和相关资料.除此之外,还有关于历史沿革、历史事件、地名典故、名人轶事等资料.上述几项内容,基本涵盖了一处历史建筑的历史价值和人文价值,这些详细资料,在历史文化名城的展示利用时会起到举足轻重的作用.在历史文化名城的展示利用的过程中,数据的类型非常多,有图片资料、文字资料、影像资料、图纸资料、点云数据等.在以往展示利用处理数据信息的时候,利用传统的数据处理技术,事先定义好结构化的数据.结构化数据是将对象数据向便于查询、处理的方向抽象的结果.结构化数据即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据.结合到典型场景中更容易理解,比如企业ERP、财务系统;医疗HIS数据库;教育一卡通;政府行政审批;其他核心数据库等.在结构化数据过程中,通常会忽略一些特定条件之下所不必考虑的细节,筛选出有用信息.随着互联网技术、展示利用技术以及测绘技术的快速发展和演进,非结构化的数据大量的出现,难以用结构化来进行表示,在存储记录数据的同时还要储存数据的结构,增大数据存储和处理的难度.相对于结构化数据而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括视频、音频、图片、图像、文档文本等形式.具体到典型的案例中,如医疗影像系统、教育视频点播、视频监控、国土GIS、设计院、文件服务器PDM/FTP)、媒体管理等具体应用资源,这些行业对于存储需求包括数据存储、数据备份以及数据共享等.目前在历史文化名城展示与利用当中,所利用的数据大部分都是非结构化的数据,而这些非结构化的数据将会逐渐成为主流化的数据.随着历史文化名城保护的发展,与展示利用相关的影响因子指标数量上必定会更加的丰富和细化.为了满足历史文化名城展示与利用的目的,在相关数据激增的同时,新的数据类型还会不断出现,很难用一种或是几种规定的模式来描述趋于复杂、多样性的数据形式.而大数据与传统的数据处理方式最大的不同之处就是,它在非结构化数据和信息的方面能够最大限度地将大量历史文化名城展示与利用的相关影响因子指标的细节信息进行数据非结构化,可以减少在数据处理过程当中的数据流失现象,为展示与利用提供更加充分的情报信息与技术支撑.

1.3大数据对数据信息的快速处理

由于科学技术水平的飞速发展和普及,数据越来越庞大,必须有相应的数据处理能力才能够将大量的数据进行充分而有效的利用.历史文化名城的展示与利用发展到今天,展示利用的相关数据除了具有传统属性以外,还具有时效性,通常某些数据的价值会随着时间的推移而迅速降低,能否快速准确地处理这些数据,则是充分体现它们的价值所在,而大数据的特点就在于能够快速、持续、实时的处理数据,从而能够满足相关的需求.在经济发展和大规模建设工程中,经常会忽略历史文化名城的历史文脉的科学展示与利用.有时会单纯地将历史文化名城的展示与利用和社会发展、自然环境及其居民生活割裂对待,这样会恶化居民的生活环境,不利于拉动居民的消费,不利于延续传统的历史文脉,不利于文化产业的发展,不利于创造品牌效应,降低城市的知名度,不利于历史文化名城的可持续发展,对传统风貌会造成严重破坏.在大数据的背景下,为了保护这些稀缺的展示利用资源,使得名城保护能够可持续发展,大数据就需要对名城的相关数据进行快速处理,及时快速的提出有效、合理的保护措施.

2大数据在历史文化名城展示利用中数据处理的应用

2.1在历史文化名城空间数据上的应用

在《历史文化名城、名镇、名村保护条例》中提到,历史文化名城、名镇、名村应当整体保护,保持传统格局、历史风貌和空间尺度,不得改变与其相互依存的自然景观和环境;建设控制地带内的新建筑物、构筑物,应当符合保护规划确定的建设控制要求;核心保护范围内的历史建筑,应当保持原有的高度、体量、外观形象及色彩等,从条例以上的内容描述可以看出,与历史文化名城展示与利用的相关信息具有非常典型的空间性.历史文化名城展示与利用中空间数据的采集,基于移动设备、互联网络、测绘系统、自动记录系统、数据档案系统等,以及通过这些系统综合分析所产生的再生数据.大数据通过整合和深入提取这些空间数据,将这些信息进行重新利用,实现海量展示与利用的数据信息的实时处理,智能判断以及快速决断,为某一项历史文化名城的展示利用提供决策依据.随着三维激光扫描技术的逐渐成熟,在历史文化名城的街区展示利用中,通常采用三维激光扫描技术,将历史街区现有的建筑特征和风貌进行数据的采集和整理,之后通过计算机相关软件的处理,恢复历史街区传统的风貌特征,并通过虚拟现实等技术手段将其进行一定的场景重现.

2.2在历史文化名城数据分析上的应用

由于大数据在信息处理上具有透彻感知、广泛互联互通、深入智能等特点,能够借助互联网络进行传递、协同以及共享操作,在通过利用先进的数据分析技术,深入分析收集到的展示利用的数据后,进而获取到更加具有创新性的、系统性的、全面性的数据信息来满足某一项历史文化名城在这方面的信息需求.大数据在数据分析方面的应用,从过去单维度的项目计划、项目管理和项目执行,转变为多维度的新兴的项目协作关系.在这种新的组织关系下,每一处历史文化名城个体,在进行展示与利用项目的筹划、设计和实施过程中,都可以精确地、自由地、即时地共享和获得相关信息,发掘同一类型数据的共性和不同,对彼此各自的特点进行正面、真实、合理的归纳与总结,找到若干种恰当的展示与利用的方式与方法,然后进行比较和选择,以达到最佳的展示利用的效果.大数据的应用,促进了历史文化名城的数字化基础构建和物理设备的相互融合,通过数据对于名城的数据采集和汇总,经过网络实现人与物的统一与整合,之后再通过云计算技术,使其对于历史文化名城的展示与利用的管理更加动态化、系统化.

3大数据对历史文化名城展示利用的意义

历史文化名城的组成是由历史文脉和城市形态两大重要要素构成.现在愈来愈多的人们开始呼吁政府有关部门采取有效的措施,保护和传承历史文化名城的历史脉络和注重塑造城市形态,传承历史记忆,展现人文气息.在社会经济处于重大历史变革的今天,对于历史文化名城传承的思考更加具有意义.历史文化名城的历史文脉和城市形态通常表现为包括城市空间形态、结构形态、聚集形态等一些具有可读性强的、城市意向明显的、静止性的、永久性的客观物体.城市形态作为物质属性,其展示利用通常是展现城市的空间轮廓、城市肌理、街道格局、风貌特征、建筑物和构筑物本体等;而历史文脉作为非物质属性,其展示利用通常是展现与历史文化形态有直接联系的演变规律、历史事件、社会结构、社会制度、哲学思想、伦理观念、语言文字、文学艺术、礼仪风俗以及地域文化等.历史文脉的展示通常是结合历史文化名城的物质空间和相关史实文献资料的整理,采用声、光、电等现代的技术手段将抽象的历史文脉以一种相对具体的形式进行展示.大数据的功能和作用就是能够把城市形态和历史文脉等这些具有物质属性和非物质属性的资料信息进行数据化、数字化的统计、整理和归纳,以一种清晰的思路与方式展示历史文化名城文化创造的成就,以生动、形象、完整的方式来诠释历史文化的脉络.通过大数据在历史文化名城形态特征的展示与利用,探索古代与现代文明相互融合的有效方式与途径,在保持相关历史记忆的同时,加入新的科学、技术的活力,从而促进历史文化名城的可持续发展.从历史文化名城的展示利用的角度来说,加强文化遗产展示与利用和促进经济与社会发展的有机结合,探索展示利用的有效解决途径和方式,是为历史文化名城的展示与利用提供策划方案、拟定策略、提供决策的科学依据.只有在保持古城的形态和历史文脉传承的前提下,选择大数据的方式进行历史文化名城的展示与利用,文化遗产本身及其遗产价值才能以更有成效、最佳的方式体现.

篇3

由于信息技术的迅速发展,现代的档案管理模式与过去相比,也有了很大的变化,也让如今的档案管理模式有了新的挑战。让人们对信息即时、大量地获取是目前档案管理工作和档案管理系统急切需要解决的问题。

一、数据挖掘概述

(一)数据挖掘技术。数据挖掘是指从大量的、不规则、乱序的数据中,进行分析归纳,得到隐藏的,未知的,但同时又含有较大价值的信息和知识。它主要对确定目标的有关信息,使用自动化和统计学等方法对信息进行预测、偏差分析和关联分析等,从而得到合理的结论。在档案管理中使用数据挖掘技术,能够充分地发挥档案管理的作用,从而达到良好的档案管理工作效果。(二)数据挖掘技术分析。数据挖掘技术分析的方法是多种多样的,其主要方法有以下几种:1.关联分析。指从已经知道的信息数据中,找到多次展现的信息数据,由信息的说明特征,从而得到具有相同属性的事物特征。2.分类分析。利用信息数据的特征,归纳总结相关信息数据的数据库,建立所需要的数据模型,从而来识别一些未知的信息数据。3.聚类分析。通过在确定的数据中,找寻信息的价值联系,得到相应的管理方案。4.序列分析。通过分析信息的前后因果关系,从而判断信息之间可能出现的联系。

二、数据挖掘的重要性

在进行现代档案信息处理时,传统的档案管理方法已经不能满足其管理的要求,数据挖掘技术在这方面确有着显著的优势。首先,档案是较为重要的信息记录,甚至有些档案的重要性大到无价,因此对于此类的珍贵档案,相关的档案管理人员也是希望档案本身及其价值一直保持下去。不过越是珍贵的档案,其使用率自然也就越高,所以其安全性就很难得到保障,在档案管理中运用数据挖掘技术,可以让档案的信息数据得到分析统计,归纳总结,不必次次实物查阅,这样就极大地提升了档案相关内容的安全性,降低档案的磨损率。并且可以对私密档案进行加密,进行授权查阅,进一步提高档案信息的安全性。其次,对档案进行鉴定与甄别,这也是档案工作中较困难的过程,过去做好这方面的工作主要依靠管理档案管理员自己的能力和水平,主观上的因素影响很大,但是数据挖掘技术可以及时对档案进行编码和收集,对档案进行数字化的管理和规划,解放人力资源,提升档案利用的服务水平。第三,数据挖掘技术可以减少档案的收集和保管成本,根据档案的特点和规律建立的数据模型能为之后的工作人员建立一种标准,提升了档案的鉴定效率。

三、档案管理的数据挖掘运用

(一)档案信息的收集。在实施档案管理工作时,首先需要对档案信息数据的收集。可以运用相关档案数据库的数据资料,进行科学的分析,制定科学的说明方案,对确定的数据集合类型和一些相关概念的模型进行科学说明,利用这些数据说明,建立准确的数据模型,并以此数据模型作为标准,为档案信息的快速分类以及整合奠定基础。例如,在体育局的相关网站上提供问卷,利用问卷来得到的所需要的信息数据,导入数据库中,让数据库模型中保有使用者的相关个人信息,通过对使用者的信息数据进行说明,从而判断使用者可能的类型,提升服务的准确性。因此,数据挖掘技术为档案信息的迅速有效收集,为档案分类以及后续工作的顺利展开,提供了有利条件,为个性化服务的实现提供了保证。(二)档案信息的分类。数据挖掘技术具有的属性分析能力,可以将数据库中的信息进行分门别类,将信息的对象通过不同的特征,规划为不同的分类。将数据挖掘技术运用到档案管理中时,可以简单快速地找到想要的档案数据,能根据数据中使用者的相关数据,找寻使用者在数据库中的信息,使用数据模型的分析能力,分析出使用者的相关特征。利如,在使用者上网使用网址时,数据挖掘技术可以充分利用使用者的搜索数据以及网站的访问记录,自动保存用户的搜索信息、搜索内容、下载次数、时间等,得到用户的偏好和特征,对用户可能存在的需求进行预测和分类,更加迅速和准确的,为用户提供个性化的服务。(三)档案信息的整合。数据挖掘技术可以对新旧档案的信息进行整合处理,可以较为简单地将“死档案”整合形成为“活档案”,提供良好的档案信息和有效的档案管理。例如,对于企事业单位而言,培训新员工的成本往往比聘请老员工的成本要高出很多。对老员工的档案信息情况进行全体整合,使档案资源充分发挥作用,将档案数据进行总结和规划,根据数据之间的联系确定老员工流失的原因,然后建立清晰、明白的数据库,这样可以防止人才流失,也能大大提高档案管理的效率。

四、结语

综上所述,在这个信息技术迅速跳跃发展的时代,将数据挖掘技术运用到档案管理工作中是时展的需求与必然结果。利用数据挖掘技术,可以使档案管理工作的效率大大提升,不仅减少了搜索档案信息的时间,节省人力物力,避免资源的浪费,还能帮助用户在海量的信息数据中,快速找到所需的档案数据信息。数据挖掘技术的运用,使静态的档案信息变成了可以“主动”为企事业单位的发展,提供有效的个性化服务的档案管家,推动了社会的快速发展。

作者:于然 单位:扬州市体育局办公室

【参考文献】

篇4

2上交产品质量

根据对样本图幅综合质量特性的检测结果,无锡市锡山区第二次土地调查1:500城镇土地调查(A标段)各项精度指标均需符合技术设计书和规范的要求,质量保证可靠。上交质量包括控制测量资料和城镇土地调查质量,其中控制测量资料包括一二级导线观测记录手簿、一二级导线平差计算成果、图根导线计算成果、一二级导线点点之记、埋石图根点点之记、一二级导线点成果表、图根点成果表、控制点展点图、仪器鉴定资料;城镇土地调查资料包括街道街坊分布图、城镇地籍调查表及相关资料、宗地界址点坐标及面积表、以街坊为单位的宗地面积汇总表、以街道为单位的土地分类面积汇总表、城镇土地分类面积统计表、1:500分幅地籍图接合表、宗地图、新旧街坊对照表、新旧宗地号对照表。上交质量还应该包括数据建库资料(宗地图分幅地籍图光盘、城镇地籍数据库)、专项调查统计资料(工业用地、基础设施用地、金融商业服务用地、开发园区用地、房地产用地统计)、文档资料(无锡市1:500城镇土地调查技术设计书、技术总结检查报告)。

篇5

2、HLR用户数据修改流程

HLR用户数据修改流程如图2所示。(1)DSG根据DCI消息中的路由键信息选择对应的DRUCluster,再根据负载均衡选择一个DRU节点,然后发送DCI消息给该节点。(2)DRU节点根据DCI消息中的路由键信息查找对应的DSUCluster,分析后得出消息的操作类型为数据修改,把消息发送到DSUCluster中的Master节点。(3)DSUMaster节点修改本节点数据成功后,发送复制消息给同一个Cluster中Slave节点,并等待其响应消息。(4)DSUSlave节点收到复制消息,修改本节点数据成功后,发送响应消息给Master节点。(5)DSUMaster节点发送响应消息给DRU节点。(6)DRU返回操作结果给DSG。

3、HLR用户数据开户流程

HLR用户数据开户流程如图3所示。(1)DSG根据DCI消息中的路由键信息选择对应的DRUCluster,再根据负载均衡选择一个DRU节点,然后发送DCI消息给该节点。(2)DRU节点根据DCI消息中的路由键信息查找对应的DSUCluster,分析后得出消息的操作类型为数据开户,把消息发送到DSUCluster中的Master节点。(3)DSUMaster节点发送路由更新消息给DRUMaster节点。(4)DRUMaster节点修改本节点数据成功后,发送复制消息给同一个Cluster中Slave节点,并等待其响应消息。(5)DRUSlave节点收到复制消息,修改本节点数据成功后,发送响应消息给Master节点。(6)DRU返回操作结果给DSUMaster节点。(7)DSUMaster节点修改本节点数据成功后,发送复制消息给同一个Cluster中Slave节点,并等待其响应消息。(8)DSUSlave节点收到复制消息,修改本节点数据成功后,发送响应消息给Master节点。(9)DSUMaster节点发送响应消息给DRU节点。(10)DRU返回操作结果给DSG。

篇6

二、大数据在电力营销中的应用策略

大数据时代正在逐渐崭露头角,企业要想顺应时代的变化获得新的发展,就必须对营销体系进行重构,若能够通过大数据资源开展电力营销,必然会产生极大的市场价值。

1通过消费者视角,分析潜在需求行为大数据的特征表现在海量化的数据上,企业要想获得更为精确的信息,就需要通过大数据的分析来寻找顾客的潜在需求。因此,电力营销企业要想做好营销体系的构建,扩大企业经济市场,就要制定好多种方案,在大数据中寻找潜在的客户需求,学会通过客户的视角,对客户的消费行为进行行为与特征分析,从而进一步提高客户满意度,最大化的打开企业知名度。

2精准定位消费群体,开展个性化营销大数据能够为电力营销提供海量的数据信息,让企业能够在追求精准化的同时准确定位自身营销方式,从而划分出消费群体,打造个性化营销。随着社会经济的发展,电力营销企业开始越来越重视营销的精准化,而大数据的出现在一定程度上改变了产品的质量,导致消费者市场也出现变化。消费者市场的划分需要通过大数据进行主要原因自傲与企业所面临的是个体消费者,而不是群体消费,这样一来,个性化的营销必然会成为电力企业的营销主体。

3拓展营销新市场,制定产品新战略大数据是营销策略制定的基础和依据,这对于市场和业务的开拓也具有重要的意义。如腾讯游戏的研发,往往是通过大数据来进行精确地分析,从而使其能够领先于其他手游行业,牢固自己的经济市场地位。运用大数据分析数据,开拓新市场、新业务也是当今时代电力企业营销发展的必然趋势。要想做到领先同行企业,牢固自身市场地位,就需要在产品研发前期深入分析和研发大数据,制定更为符合客户个性化需求的产品战略,并进一步确定产品营销渠道,拓宽产品领域。

4依靠互联网技术,合作开展大数据营销随着互联网营销的兴起,互联网行业将绝大部分的精力都放在了大数据的应用上,大数据的应用也逐渐成为了营销的主要手段。大数据从狭义来看是人们通过互联网的使用而产生的数据,互联网行业拥有者手握最大的数据源,如阿里巴巴、百度和微博等等,其搜索引起联合线下进行,已经覆盖了人们绝大部分的生活。而电力营销要想得到进一步的发展,就要挤入互联网行业中,进行大数据营销。除了在自身领域建立数据资源优势以外,还可以通过业务延伸来实现多元化的发展。

篇7

2系统主要功能模块设计

2.1系统关键技术

1)基于元对象的动态建模技术:航天试验数据管理系统的结构,再从元对象生成存储数据具体内容的表。在业务逻辑变更时,只需修改元对象描述的数据结构,而不需要对数据库结构进行变更。基于元对象的数据建模,将数据按内容格式分为多个对象,用静态的数据表建立这些对象的元对象,包括对象的名称、标识符、特征、每类数据的属性、各个属性的格式、数据之间的关系(一对多或多对多)。数据对象分为元对象本身和数据对象实例两个部分。其中,元对象分为数据对象定义、数据对象属性定义、文件仓库定义和数据对象数据表定义,数据库的逻辑模型如图3所示。2)数据对象追溯技术:数据对象可以表示设计过程中的人员、设备、模型、过程、结果等各类信息。数据类支持继承关系,数据类通过继承来扩展时,将自动获得其父类中建立的数据属性和数据关联关系。数据类之间的关联关系作为数据类的特殊属性进行定义,通过这类属性,数据类之间的相关性和追溯性可以保留下来,并通过门户等形式展现给终端用户,以辅助对流程、数据的分析。3)数据高效传输技术;数据文件的上传和下载均需要对大量数据进行高效传输,从而保证较高的效率和良好的用户体验。为解决大数据文件(文件大小≥1GB的文件)和多文件同时上传下载,需要开发数据传输控件,控件支持文件大小和进度显示,底层协议采用Socket实现高并发。大文件的传输方式采用断点续传技术保证传输效率和文件完整性。

2.1数据管理

数据管理系统以数据引擎为核心,按照功能性质可分为数据建模、数据产生、数据利用3个阶段。数据建模采用自定义数据对象类的方式实现,能够支持不同试验过程中各种复杂的数据结构和数据格式。一旦模型建立好之后,数据对象可以通过AE的调用进行创建,在AE的执行过程中,数据对象的关联关系以及谱系关系也会随之产生。在数据的分析利用阶段,可以通过第三方的分析软件或可视化控件对系统中的数据进行分析,同时系统还提供了对数据对象的查看、检索等基本功能。系统涉及到的相关功能模块如图4所示。

2.1.1基于产品结构树的数据导航

产品结构树是指依据产品几何结构间的隶属关系所形成树状图,航天产品设计人员一般习惯于按照产品结构树对三维模型进行管理。因此,需要为用户定制与PDM系统一致的产品结构树,实现数据按照产品间的隶属关系分层管理,以符合工程技术人员的使用习惯。用户通过点击产品结构树上的节点,即可显示隶属于该节点的数据,试验数据按条列表显示数据基本信息,并能查看和下载源文件。管理员能够根据用户的需求进行个性化定制,具体功能包括对项目、零部组件等各级节点的增加、删除、修改等操作,以满足普通用户的需求。产品结构树的配置采用XML文件进行描述,通过解析EL表达式实现灵活配置。EL表达式在处理数据管理关系时具有强大的表述能力,结合产品结构的需求,需要定制多个维度的数据对象所对应的数据类。各维度之间无直接关系,但可通过数据实现间接关联。详细的产品结构树数据对象定制流程如图5所示。

2.1.2基于数据谱系的查询检索

通过数据对象详情可对数据的上传时间、上传人员、文件类型、所属项目等信息进行追溯,还可对数据操作之间的关联关系和数据版本号等信息进行查看。试验查询搜索功能允许用户通过关键字来快速查询和搜索数据,快速查询将根据关键字返回数据库中具有关键字的数据对象,通过选择可限定该关键字出现的具置。对于查询的结果,用户还可以根据数据类型、所有者等属性对查询结果进行筛选,以缩小搜索范围,提高检索效率。

2.2数据应用工具

2.2.1试验数据可视化

仿真和试验数据的格式各不相同,不同格式数据的读取和显示依赖于不同的软件,因此在客户端对这些数据进行读取和显示时需要安装这些软件,使得数据显示过程较为繁琐。因此,需要实现仿真和试验数据的统一在线显示,以方便用户直接查看。用户通过浏览器登录进入数据管理系统,点击需要查看的数据,如果本地计算机上未安装可视化控件,则提示并自动安装。用户正确安装该控件后,即可通过浏览器窗口直接显示查看的三维模型、仿真或试验结果,而不需安装种类繁多的CAD和CAE软件,便于不同专业的人员查看数据。可视化控件能支持3种以上CAE数据格式(OP2、HSF等)的在线查看,作为数据管理系统的服务器,需要提供可视化控件的下载和版本管理,以及文件格式和控件在页面打开时的关联动作。通过编写可视化控件的viewPlugin.properties文件,在文件中添加file.type属性可以实现文件类型的可视化控件调用,如果控件不存在,将提示客户端安装可视化控件。

2.2.2试验数据处理与分析

为更好地利用仿真和试验结果,需要对仿真和试验数据进行处理,以方便用户查看和分析。试验数据处理与分析主要通过提供数据读取的WebService接口,调用分析控件实现对系统中数据的分析处理,这部分功能需要通过WebService接口将系统中的试验数据开放给第三方控件(数据导入、导出控件、数据分析控件等)。第三方控件能够将不同格式的数据以表格、曲线图、散点图、柱状图等不同的形式显示,能够完成对数据的常用处理操作,主要包括对数据进行插值、拟合、微分积分、FFT分析、滤波等,同时支持用户采用自定义算法对数据进行处理和分析。

3系统应用

目前该系统已应用于产品研制,通过该系统实现了项目团队中CAE仿真数据和试验数据的统一管理,为虚实数据对比和分析提供了支撑,改变了传统的仿真与试验数据分散管理的方式。便于设计人员、仿真分析人员和试验人员协同工作,充分挖掘数据中的信息,大幅减少了项目团队成员之间人工数据交互可能产生的错误,明显提高了团队的工作效率。

篇8

一、前言

在知识经济的时代,知识就是力量,知识就是资本。有效的知识管理可以使组织中的成员拥有更多的能够帮助其解决实际问题的知识,使每个组织成员的能力都得到提高,从而提升整个组织的绩效,使一个组织能够不断增强自己的竞争能力,不断进步和成长。

我们的各项教学活动的基本目标是更有效地让学生深入理解和掌握相关课程的理论与方法,并能够综合运用掌握的知识来解决实际的问题,从而提高自身的能力和素质。这和企业实施知识管理的目标有着很大程度的相似性,因此,尽管知识管理主要是针对企业的一种新的管理思想,但我们认为,它对于学校课程的教学,同样有着重要的思想价值和实践指导意义。本文着重探讨了如何将知识管理这一应用于企业中的管理思想运用到数据库这门课程的教学活动中来提高课程的教学质量,更好地实现教学目标。

但是由教师和学生构成的教学组织和一般的企业组织在组织形式、运作方式、目标等方面都有较大的差异,所以我们首先分析了教学中应用和实施知识管理和一般的企业组织的知识管理有哪些类似的、可比的地方,又有哪些是教学活动所特有的。然后,根据数据库课程教学的特点确定如何借鉴企业中的知识管理来实施针对数据库课程教学活动中的知识管理。

二、教学与一般企业组织的知识管理比较

不管是企业中的员工还是在校的学生,他们的知识都是通过各种方式的学习获得的,知识管理是围绕知识学习活动的管理,包括知识获取、知识交流、知识应用和知识创新的管理。如果把教师和学生看作一个组织,这个组织和一般的企业组织在知识学习的组织形式、运作方式、目标等方面存在一些差异。

通过分析比较,我们可以得出教学中的知识管理的目标、内容和企业大体相似,企业的实践经验可以借鉴。但由于实施知识管理的环境不一样,教学中的知识管理和企业的知识管理所注重的问题还是存在差异,主要表现在:

·教学中涉及的知识主要是显性的,而企业更关注隐性知识的管理;

·教学中的知识主要来源于教师,因而教师如何有效地传授知识是很关键的,而企业中的核心知识分布在各种企业内部资料库、各个专家和技术骨干的头脑中,因而如何利用知识管理工具和手段有效地组织、管理和利用这些知识是企业所关注的;

·教学中要注重调动学生学习知识的积极主动性,而在企业则更注重如何激励员工参与知识共享与交流的积极性;

·教学中的知识是为将来作准备的,注重基本素质和学习能力的培养,而企业中知识很快就会被应用,创造价值,因而更注重知识的实用性和时效性;

·教学活动是有组织的有计划的,教学安排合理与否是影响教学效果的一个重要因素,而企业中的知识活动是应工作需要而随时发生的,因而需将知识管理融入业务流程。

三、知识管理在数据库课程教学活动中的应用

作为计算机类的有关信息处理的基础课,数据库是一门实践性很强的课程,强调知识的应用,而不仅是理论上的、定性的分析,要求学生最终能够根据具体的实际应用需求,综合运用数据库的有关理论、方法,提出一个较为合理的信息处理方案,并辅助开发成员建立一个完整的数据库应用系统。它和其他计算机类的课程,如操作系统、程序设计、数据结构等不同,它的专业覆盖范围比较广。在信息化进程不断加速、信息量急剧膨胀的情况下,无论哪一类专业都要面对数据分析和信息处理的问题,所以不仅是计算机专业的学生需要学习数据库的有关知识,其他专业,特别是管理类专业的学生也需要具备信息处理方面的基本知识和能力。和计算机专业的学生都是理科背景不同,这些专业的学生通常是文、理科兼收的,学生的个体差异比较大,思考问题的角度有可能是多方面的,彼此也很难说服对方,要促进他们的交流与合作,必须给他们一定的磨合的时间和机会。

通过前面的分析研究,我们认为企业知识管理的实践中得出的许多经验在教学中可以借鉴,但不能全部照搬,需要就教学的特点进行调整,我们主要从促教、促学、促交流三个方面,以我们连锁经营管理专业的数据库课程教学为背景进行知识管理在数据库课程教学中的应用研究。

(一)有效地向学生传授知识

教学的基本任务是向学生传授知识,教师担当专家的角色通过各项教学活动将自己的知识传授给学生,使学生掌握应该课程要求的知识,完成教学任务。教师能否有效地传授知识是决定教学质量的一个重要因素。要有效地向学生传授知识,我们认为可以从三个方面着手:

首先要了解学生目前的知识结构状况;然后对教学内容作精心安排;最后是建立教学方法知识库。

对于初次参加一门课程学习的学生来说,教师所传授的是新知识。根据知识管理理论,个体吸收新知识的能力是与其自身原有的知识水平密切相关的,一项新的知识能被吸收加入到个人的知识库中的必要条件是新的知识和其原有的知识之间要有关联。因此在向学生传授新知识之前需要了解学生目前的知识结构。在正式上课之前通过查看任课班级已经学习了哪些课程、学生中文/理科背景来进行初步的了解。在第一节课,通过课堂提问这一现场调查的方式进一步了解学生的知识结构。据此,在保证课程大纲要求的内容不变的情况下调整了原先的教学计划安排。

教师在教学过程中不断积累经验,这些教学经验是宝贵的资源,应该加以利用。我们可以参照企业建立企业知识库的方法建立教育教学方法知识库,由学校教学管理部门按课程收集、整理学生反映良好、教学效果明显的教师成功的教学方法、教学心得体会、教学案例、课堂教学组织、教案设计等等,建立教学知识资源网,供广大教师根据自己的需要进行研习。这种方法可以更大程度地发挥教学知识的效用,覆盖更多的教师,使他们受益,进而使学生受益,也使得学校教师的教育教学成果得以延续。这和精品课程的建设是不一样的。精品课程是从教师的角度来进行创新性的教学设计,其中不乏好的教学方法、教学案例,但这种设计、方法是否有效,未必均已得到证实。而进入教育教学方法知识库的教学方法已被证实是有效的、成功的。

(二)激发学生主动学习的积极性,促进学生的自主学习

和企业中员工主动地自主地学习知识不同,学生们学习知识很多是被动的,这主要是因为他们对知识所能发挥的效用不甚了解,只是为了考试、证书之类的,这不利于知识的真正吸收、能力的提高。要激发学生主动学习的积极性,促进学生自主地学习需要从三个方面着手:首先要将课程教学和学生的职业规划联系起来;其次作业设计要给学生一定自由发挥的空间;最后给学生更多展示自己学习成果的机会。

学习知识的动力来源于对知识所能发挥的效用的认识,而这和学生对未来的职业规划是密切相关的。因此,首先要了解学生对未来的期望,将课程学习和未来的职业规划联系在一起,使学生认识到课程中所学到的知识对他们将来的发展是有用的。在开学后的第一次课,除了通常的介绍课程主要的内容和教学目标、安排、考核等之外,我们一定要将课程和学生的专业背景、他们将来可能从事的职业联系起来,使他们认识到学习这门课程可能对自己将来的工作有所帮助。

学生在完成教师布置的作业的过程中,需要将自己在课堂上、课本、其他参考资料上获取的知识进行综合化,进行知识的应用与创新,这些是知识转化为处理问题的能力的重要途径。而在教学中,我们发现学生作业相互抄袭的现象比较普遍,经过对学生作业的调查,我们发现:学生认为对于那些比较“死”的作业,自己做一遍和抄一遍没有多大区别,做了也没什么成就感。而对于比较“活”的题目,由于答案的不确定性,学生之间并不能确定谁的答案就是绝对正确的,求解这样的题,不仅需要课本、课堂上的概念知识,还需要根据自己的需要去查找一些相关的资料,再融入每个人自己的一些想法和技巧,需要付出一定的努力才能完成。因而,学生在完成这样的作业后会有一种成就感,也不愿意把自己的成果让别人随便抄。因此,在教师设计作业的时候应尽量出一些比较“活”的题,给学生一些自由发挥的空间。

在教学中要调动学生学习的积极性,激励是一个重要手段。在企业中,员工掌握知识的多少决定其在企业中的工作地位和薪资收入,同时,赢得别人的认同和尊敬也是一个重要的激励因素。在教学中,我们很少能给学生物质上的激励,因此,精神上的激励应该成为主要的激励手段。在老师和学生面前展示自己学习研究的成果可以让学生颇有成就感,同时也可以赢得其他同学的认同,提高自己在学生中的声望。每次作业中,我们可以选取一部分学生,让他们以PPT报告的形式来展示自己的成果,接受其他同学的提问、建议和评判。对于作业完成得不好的学生,可以促进他们今后做出更大的努力来赢回自己的声望,对于作业完成比较好的学生,可以使他们获得更大的满足感和成就感,对今后的学习也是一种鼓励。

(三)促进知识的共享与交流

传统的教学是知识从教师向学生的单向流动,传授的主要是显性知识,知识的来源比较单一,教师与学生、学生与学生之间的互动很少,这不利于知识的交流与分享。要促进教学中的知识共享与交流,我们认为需要从两个方面着手:拓宽学习交流的渠道和建立有利于知识共享的学习组织。

在课堂上,我们还是应以教师讲授为主,但也应该留些时间让学生提问和讨论。讲完一段内容,应该稍作停留,看看学生有什么问题,请他们提出来,其他学生和教师都可以尝试着来回答或补充这些问题。课后,教师和学生之间的交流可以通过电话、电子邮件、MSN等进行,及时解答学生的一些疑问。同时,教师应该引导学生参与课堂以外的有关课程学习的交流,访问学习资源网站、参加一些网上论坛、学习社区。通过参与课外的学习交流,学生能接触到很多课堂上没有讲过的东西,从而能弥补仅靠教师传授的不足,培养学生自主学习的能力。建立课程网上学习社可以使学生与学生、学生与教师之间的交流更加集中、更加便捷,一些在课堂上没有讨论完的问题可以在课后、在网上得以继续。

篇9

二、石家庄地区制药企业专利数据挖掘

本文对石家庄地区制药企业的专利数据进行挖掘分析,挖掘对象是华北制药集团公司、石家庄制药集团有限公司、石家庄神威药业股份有限公司、石家庄四药股份、河北以岭药业股份有限公司、石家庄市华曙制药集团、河北医科大学制药厂、河北圣雪大成制药有限责任公司等地址在石家庄且具有一定代表性的药企,希望通过这些药企数据能够找到石家庄地区制药领域的核心组成,并能为药企更好地发展提供有力的信息支持。IPC号是目前权威的专利技术主题的标识编码之一,基本包含了各行各业的专利信息,是一个庞大的专利信息体系。目前国内外很多分析方法及技术大部分是基于专利的IPC分类号来分析专利技术主题的,此分析方法有一定的参考价值和科学性,而且对于具有大量专利信息的分析具有很好的总结概括效果。本文以专利全部IPC号为分析对象,并且构建IPC号之间的关联规则,在最大程度上揭示隐含的专利技术关联性,从而为石家庄地区制药企业专利技术的发展提供参考。

1.数据准备。数据来源的准确与否是数据分析与挖掘的基础,是数据分析与挖掘的根本。本文所使用的石家庄地区制药领域专利数据由万方数据公司提供,以制药企业地址为石家庄为检索条件,搜索出了包括从1985—2014年间石家庄地区制药领域专利644条,分别分布在A、B、C、D、E、F、G、H八个大部。对专利数据库中的644条专利进行筛选,根据“分类号”字段限制,它涉及专利信息的分类,有些IPC所涉及的范围与石家庄地区制药领域没有联系或联系很小,不宜保留。根据“申请人(专利权人)”字段的限制,剔除与石家庄地区制药不相关或制药企业地址不在石家庄地区的专利。最后筛选出590条最符合该领域特点的专利。由于IPC号在几乎所有现存数据库中均是以一个字段存储一个专利的所有IPC分类号的,形如:A61K38/26、A61K9/08、A61K47/12、A61P3/10,且每个专利一般都有好几个分类号,而每个企业又研究大量的专利,所以在进行专利分析之前,需要对专利IPC号进行数据整理。由于过于细致的IPC分类号并不利于专利主题的分析与揭示,所以本文中采用专利小类分析,就是取IPC号的前4位。并将申请人与其对应的多条IPC号进行拆分,拆分后的数据项有773条,即显示每个申请人对应的一条IPC分类号。

2.数据挖掘。本文数据挖掘过程将采用Excel和SQLsever2005软件,首先对所得到的数据导入SQLserver2005进行挖掘,利用SQLserver2005可以直接进行IPC号的关联规则挖掘,然后对专利信息进行分析。

3.数据挖掘结果与分析。基于关联规则制作依赖关系网络图,可以更加直观地看到各个IPC号之间的关联和依赖状态。

(1)以A61K、C12N、C12P、C07D、C07C为中心的核心专利技术群。这些专利的IPC分类号是关键部分药物组成的各种化合物即药物主要成分的重要聚集组。A61K(医用、牙科用等的配置品)是项集次数最多的,即支持度较高的,C12P(发酵或使用酶的方法合成目标化合物或组合物或从外消旋混合物中分离旋光异构体)、C12N(微生物或酶;其组合物)、C07D(杂环环合物,例如邻氯苄星青霉素的合成)、C07C(无环和碳环化合物)通过专利相关知识我们已经知道这些都是药物的合成成分,即土霉素、链霉素、青霉素等多种抗生素和维生素的主要成分组成,是制药领域的核心。这也是和石家庄地区制药企业的核心领域相符合的。另外这些专利主题的相互关联、依赖说明了石家庄地区制药企业在该领域具有很好的布局网络,在研发数量上也占有一定优势,所以说是石家庄地区制药企业的主要研究领域。

(2)以B65G、C12M为中心的辅助设备专利技术群。药品的生产离不开设备的支持,所以设备方面的专利也能体现制药企业的技术水平。在图1中也能体现出来,专利间有着很强的依赖性和关联性,在核心专利周边有B65G(运输或贮存装置,例如装载或倾斜用输送机、车间输送机系统、气动管道输送机)、C12M(酶学或微生物学装置),这些是制药的辅助技术手段,与中心专利是相互联系的,也是制药过程中必不可少的,在这些方面的提高有利于制药核心领域的发展。先进药品的研制离不开先进制药设备支持,所以设备水平的提高也是关键的。如图3所示,石家庄地区制药企业在这一方面的技术依赖网络也已经形成,说明在此技术领域也已经拥有较强实力。但与中心主要专利相比,辅助设备专利技术还是需要不断提高的。

篇10

Abstract: As China's economic construction and social development speed is very quick, terrain and other factors change, the basic geographic data has a distinct feature of the current, directly restricts its use value and the range of use. So it is necessary to study the geographic database updates. This paper introduces briefly the basic steps of building characteristics and spatial database; and discusses some technical problems in spatial database, such as spatial data retrieval, seamless database. Finally discusses the update problem of geographic database.

Key words: spatial database update; seamless integration; massive data; data compression; data retrieval

中图分类号:G633.55文献标识码:A文章编号:

一、引言

随着基础地理数据的积累逐步完成和共享应用,其现势性问题已成为广大用户关注的热点问题。《国家科技基础数据库建设与发展的研究报告》指出:持续更新和业务化运行是一个科学数据库存在的根本。目前许多科技数据库是按项目方式一次性建立的,缺乏持续的数据来源,或有效的数据更新机制[1],很容易变成死库,或逐步地失去应用价值。因此有必要对基础地理数据成果定期进行更新,以满足国民经济、国防建设和社会发展的急切需求。

目前,空间数据管理技术呈现出网络化、集成化、组件化和可视化的趋势。Internet与Intranet的出现使分散于各地的数据,相互访问与远距离传输成为现实;数据仓库和数据库技术的出现,使人们能够快速、有效地对海量空间数据进行管理。虽然关系数据库是数据库发展的主流,但单一关系型数据库已不能完全满足对空间数据的管理[2]。随着数据库技术的进一步发展,面向对象技术和关系数据库技术相结合[3],形成了对象—关系型数据库。这进一步提高了数据管理的灵活性和应用开发能力。

二、空间数据库简介

1 数据库的概念

地理信息系统的数据库(简称空间数据库或地理数据库)是某一区域内关于一定地理要素特征的数据集合。与传统数据库相比,它具有如下特点:

(1)数据量特别大,地理系统是一个复杂的综合体,要用数据来描述各种地理要素,尤其是要素的空间位置,其数据量往往很大。

(2)不仅有地理要素的属性数据,还有大量的空间数据,并且这两种数据之间具有不可分割的联系。

(3)数据应用广泛,例如地理研究、环境保护、土地利用与规划等。

三、空间数据库建库步骤

1空间数据库的体系结构

地理信息空间数据库是实现数据组织、存储与管理,其体系结构[4]如图l所示。

图1 数据库体系结构

2 空间数据库建库流程

以下是空间数据库建库流程图[5]:

图2 空间数据库建库流程图

四、空间数据库建库的若干技术

1.多尺度数据的组织

为满足不同的需要,城市测绘部门一般要生产1:500、1:1000、1:2000、1:10000、1:50000等系列比例尺地形图,各种不同分辨率的航空、卫星遥感影像等,如何对这一系列的比例尺的空间数据进行组织,主要有三种方法[6]:

(1)建立统一数据库的多个比例尺;

(2)开发更好的层次数据结构来支持空间数据的多级表达,包括运用面向对象方法、语义数据模型等技术;

(3)通过自动综合的方法自动生成同一数据库的多个版本,这种方法的难度很大。

2.数据的无缝集成

GIS数据集成类型分空间数据的无缝集成和空间数据与属性数据的无缝集成。

2.1 空间数据的无缝集成

传统的空间数据都是基于图幅的,每一图幅以文件的方式存放起来。由于数据生产的系统误差或偶然误差,在图幅与图幅之间往往存在数据不一致的情况,如河流在图幅之间发生了错位、房屋在图幅之间不能闭合等现象,这种情况称为“图幅缝隙”。由于分幅生产的原理,这种“图幅缝隙”无法避免,以往的处理方法是增加一道接边的工序,这就造成了数据被人为的修改,增大了误差。可以设想,如果在整个数字化区域内进行数据生产,就可避免这一问题。具体实施步骤[7]为:

(1)详细拟定空间数据库结构,提出可操作的数据库建库方案。

(2)按照数据库建库方案对原始数据进行规范化整理。

(3)对于有属性表的数据如MapInfo、Arc/Info数据,进行属性整理;没有属性的数据如AutoCAD数据,单独在数据库里建立属性表。

(4)对已整理完成的空间数据进行批量入库。

(5)对属性数据进行批量入库。

(6)进行图形归一化处理,保证跨图幅的特征地物保持连续。

(7)进行属性连接。

2.2 空间数据与属性数据的无缝集成

对于这种情况,在数据入库时只需对图形和属性进行相应的对照入库即可。

3.海量数据存储和管理

当前,航空和航天对地观测技术迅速发展,利用多种星载和机载传感器,人们已经能够(准)实时获取反映地球表面动态变化的、多时相、多波段、多分辨率的对地观测数据[8]。因此,对海量空间数据的存储和管理形式的研究和探索也成为一个重要的研究方面,目前国际上正在采用对象—关系型数据库来存储和管理空间数据的技术和方法。