期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

期刊咨询 杂志订阅 购物车(0)

企业数据解决方案模板(10篇)

时间:2023-01-02 14:33:27

企业数据解决方案

企业数据解决方案例1

1 引言

在电力行业,坚强智能电网的迅速发展使信息通信技术正以前所未有的广度、深度与电网生产、企业管理快速融合,信息通信系统已经成为智能电网的“中枢神经”,支撑新一代电网生产和管理发展。目前,电网公司已初步建成了国内领先、国际一流的信息集成平台。随着各地集中式数据中心的陆续投运,一级部署业务应用范围的拓展,结构化和非结构化数据中心的上线运行,电网业务数据从总量和种类上都已初具规模。随着后续智能电表的逐步普及,电网业务数据将从时效性层面进一步丰富和拓展。电网业务数据将跨入海量数据时代,如何处理这些海量数据已成为电力企业信息管理首要解决的问题。而在海量数据的处理中,如何有效地保存和恢复数据就成了这些问题当中的首要问题。

2 海量数据特征

海量数据按照数据结构来进行划分,可以划分为结构化数据和非结构化数据两大类。

(1)结构化数据:简单来说就是数据库, 即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。结合到典型场景中更容易理解,比如企业ERP、财务系统;医疗HIS数据库;教育一卡通;政府行政审批;其他核心数据库等

(2)非结构化数据:相对于结构化数据而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。 非结构化数据库是指其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成的数据库,用它不仅可以处理结构化数据(如数字、符号等信息)而且更适合处理非结构化数据(全文文本、图象、声音、影视、超媒体等信息)

按照数据的时效性而言,海量数据又可划分为实时数据和离线数据两类。

实时数据:实时数据一般用于金融、移动和互联网B2C等产品,往往要求在数秒内返回上亿行数据的分析,从而达到不影响用户体验的目的。要满足这样的需求,可以采用精心设计的传统关系型数据库组成并行处理集群,或者采用一些内存计算平台,或者采用HDD的架构,这些无疑都需要比较高的软硬件成本。目前比较新的海量数据实时分析工具有EMC的Greenplum、SAP的HANA等。

离线数据:对于大多数反馈时间要求不是那么严苛的应用,比如离线统计分析、机器学习、搜索引擎的反向索引计算、推荐引擎的计算等,应采用离线分析的方式,通过数据采集工具将日志数据导入专用的分析平台。但面对海量数据,传统的ETL工具往往彻底失效,主要原因是数据格式转换的开销太大,在性能上无法满足海量数据的采集需求。互联网企业的海量数据采集工具,有Facebook开源的Scribe、LinkedIn开源的Kafka、淘宝开源的Timetunnel、Hadoop的Chukwa等,均可以满足每秒数百MB的日志数据采集和传输需求,并将这些数据上载到Hadoop中央系统上。

3 企业海量数据存储现状

3.1 海量数据导致存储成本、维护管理成本不断增加

大型企业都面临着业务和IT投入的压力,与以往相比,系统的性能/价格比更加受关注。GIGA研究表明,ROI(投资回报率)越来越受到重视。海量数据使得企业因为保存大量在线数据以及数据膨胀而需要在存储硬件上大量投资,虽然存储设备的成本在下降,但存储的总体成本却在不断增加,并且正在成为最大的一笔IT开支之一。另一方面,海量数据使DBA陷入持续的数据库管理维护工作当中。

3.2 海量数据缺乏快速备份与灾难恢复机制

传统的数据库备份技术,如通常采用的磁带备份方式,不能运用于海量数据,因为磁带备份将使备份时间增加,需要几小时-几天,不仅影响了生产,而且增加了备份的难度,使得备份/恢复变得缓慢而且不可靠,几乎无法在固定的时间窗口完成备份工作。另外,第三方备份软件隐含的成本代价如成本开销、复杂度、昂贵的实施等也是企业需要考虑的。因此海量数据安全显得异常重要,只有通过引入有效的备份、方便高效的备份恢复技术,才能满足海量数据安全的需要。

4 存储解决方案概述

在海量数据存储中我们主要考虑的是大数据的存储,虽然现行的商业平台也能满足非结构化数据的存储,但问题主要出在系统可扩展性和建设费用上。对于庞大的非结构化数据存储产生的I/O瓶颈问题和昂贵的服务器价格不得不使我们另谋出路。

Hadoop的分布式文件系统HDFS出现恰好解决了商业平台中的I/O瓶颈和服务器价格昂贵问题。Hadoop的优势体现在以下几个方面:

(1)Hadoop依赖于低端服务器甚至是普通计算机,相对于商业平台的高昂成本,它的成本要低得多,几乎可以说任何人都可以使用它,哪怕是信息化成本预算较少的小微企业;

(2)HDFS与Map/Reduce紧密集成是Hadoop分布式计算的存储基石。它有自己明确的设计目标那就是支持大的数据文件大至T级,并且这些文件以顺序读取为主,以文件存/读的高吞吐量为目标。在使用HDFS分布式文件系统存储非结构化文件后,将提高我们系统的存储文件速度;

(3)HDFS的数据恢复能力也保证了系统的安全可靠性,可靠性体现在它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。

(4)同时支持存储节点的热插拔和可以在普通PC机上存储非结构化文件,这不但提高了系统的扩展灵活性,还大大降低了企业在硬件方面的投入

5 应用架构

在本存储解决方案中,我们选择了Hadoop作为数据文件存储机制,Hadoop中的HDFS存储数据可以选择普通的PC机器作为数据节点,这大大的降低了存储数据所需要昂贵存储设备价格,并且在数据存储过程中,HDFS拥有很好的数据容灾机制。

6 HDFS

Hadoop的存储主要使用HDFS来进行管理,HDFS是一个分布式文件存储系统。HDFS起源于Apache Nutch Web 搜索引擎项目。

对于HDFS分布式文件系统中的块进行抽象会带来很多好处:

(1)文件的大小可以大于网络中任意一个磁盘的容量,文件的所有块不需要存储在同一个磁盘上,因此他们可以利用集群上的任意一个磁盘进行存储。

(2)使用块抽象而非整个文件作为存储单元,大大的简化了存储系统的设计。简化是所有系统的目标,但对于故障种类繁多的分布式系统来说尤为重要。

(3)块非常适合用于数据备份,进而提高数据容错能力和可用性。

6.1 HDFS架构

6.2 HDFS文件存储方式使用大块的原因

HDFS的块比磁盘大,其目的是为了最小化寻址的开销。如果块设置的足够大,从磁盘传输数据的时间可以明显的大于定位这个块开始位置所需的时间。这样,传输一个由多个块组成的文件的时间取决于磁盘的传输速率,由此可见适当的设置磁盘块空间大小可以加快数据读写效率。

6.3 HDFS的集群管理模式

HDFS集群有两类节点,并以管理者――工作者模式运行,即一个namenode(管理者)和多个datanode(工作者)。管理者管理文件系统的命名空间,它维护着文件系统树及整棵树内所有的文件和目录。这些信息以两个文件形式永久保存在本地磁盘上:命名空间镜像和编辑文件日志。工作者也记录着每个文件中各个块所有在的数据节点信息,但它不永久保存块的位置信息,因为这些信息会在系统启动时由数据节点重建。

6.4 HDFS文件写入方式

客户端通过调用HDFS类DistributedFileSystem对象调用create()函数来创建文件,在此时文件系统的命名空间中创建了一个新文件,但该文件还没有相应的数据块。管理者(namenode)执行各种不同的检查确保当前创建的文件不存在,并且客户端有创建该文件的权限,如果检查通过则创建新文件记录;否则,文件创建失败并抛出异常。在客户端写入数据时,数据被分成一个个的数据包,并写入内部队列,HDFS的DataStreamer处理数据队列,它的责任是根据工作者(datanode)的队列列表要求管理者(namenode)分配适合的新块来存储数据备份。如下图

7 实现功能

海量数据存储部分主要包含了三部分的功能:数据采集、数据存储与备份、数据分析,如图所示:

7.1 数据采集

海量数据存储采用开放上传接口的方式进行被动数据采集,各业务平台通过向上传接口传递业务平台标识、文件信息标识和文件信息的二进制流的方式将文件打包传送到非结构化数据管理平台,非结构化数据管理平台通过业务平台标识对传输过来的文件进行分类解码存储。

7.2 数据存储与备份

海量数据管理在接收到各业务平台发送过来的文件后,根据业务平台标识在HBASE中生成文件信息数据,同时将文件存储至HBase中。

7.3 数据分析

基于已存储的数据,可以分析各业务平台的数据量,数据高峰的周期,从而适时调整数据存储策略,为不同的业务应用制定不同的存储计划,充分体现系统存储的灵活性,提升海量数据的存储效率。

企业数据解决方案例2

对于将数据存储到云端的企业来说,有效的认证身份也可以防范数据被盗的风险,企业用户与云服务提供商可以指定用户认证系统,这样就可以确保只有企业级的用户进行了有效的身份认证之后才会访问云端数据。这样就能屏蔽非公司人员的窃取信息行为。除了进行有效的身份认证,企业用户也有必要与云服务提供商建立有效的监控机制,对云端数据进行实时监控。

针对企业自身特点选择个性化云服务

企业在决定将数据迁移至云端的时候,应该充分与公司的需求有效切合,是否需要将所有的数据放入云端,针对私有云和共有云的性质不同,可以选择内部搭建或者是数据共享模式,从而来指定个性化云服务。企业现在可以与多家云服务厂商进行沟通,在进行有效的评估后,选择切合企业内部要求的云服务厂商,针对企业来定制个性化云服务。在参考的过程中可以对云服务商的服务中断率及解决问题的间隔时间和服务反馈的优劣程度进行横向评估。

企业与云服务商拟定灾难后备方案

企业数据解决方案例3

如右上图所示,两地三中心方案由生产中心A、同城灾备中心B和异地灾备中心C构成。在本地生产中心A中,采用大型数据存储系统存储相应的业务数据,通过数据同步复制技术将数据复制到同城灾备中心B的数据存储系统中,实时保证数据的一致性。同时位于同城灾备中心B的数据存储系统还会以数据异步复制技术向异地灾备中心C进行数据镜像,实现异地的数据备份及保护。当同城灾备中心B发生故障时,生产中心A可以向异地灾备中心C通过数据异步复制技术同步数据,实现异地的数据备份及保护。当生产中心A所在地发生灾难时,生产中心A可将应用切换到同城灾备中心B或异地灾备中心C的备用数据服务器上,同时同城灾备中心B或异地灾备中心c的备用数据服务器接管灾备中心A的应用,恢复数据的访问及业务的连续性。

异地双中心方案

异地双中心方案较三中心方案减少了一个同城灾备中心,采用类似的企业级数据存储系统,通过数据异步复制技术进行备份数据的传递。因为缺少一个近距离的同城灾备中心,所以异地双中心方案无法提供实时的镜像数据备份恢复,RPO最短3秒至5秒。这种情况下虽然可以保证数据一致性且可以实时切换,但是因此会有少量的数据丢失,因此只适用于对数据实时更新要求不高的企业。

在本方案中,本地生产中心的数据存储系统存储着相应的业务数据,可以同异地灾备中心通过数据异步复制技术进行数据镜像,实现异地的数据备份及保护。当生产中心所在地发生灾难时,生产中心的应用将被切换到异地灾备中心的数据库服务器,异地灾备中心使用存储有数据镜像的存储系统,开始恢复数据的访问及业务的连续性。

存储HA+异地灾备方案

两地三中心方案的部署成本太高,而异地双中心方案又无法做到数据无丢失,而存储HA+异地灾备方案则可以在前两个方案之间取得较好的平衡。这实际上是两地三中心方案的一个变通做法,即将保存实时数据镜像的灾备存储系统放在生产中心,从而实现同城灾备中心的部分功能。从而实现生产中心存储HA(高可用性),使得RPO=0,实现实时数据的一致性。

在生产中心中,企业用户需要放置两套企业级存储系统在本地生产中心存储相应的业务数据,并在生产中心通过数据同步复制技术实现数据的实时同步,实现存储的高可用性。任意一套存储系统的宕机,都不会影响业务的运行。同时,结合数据异步复制技术,将本地生产中心的一套存储系统同异地灾备中心的存储系统通过数据异步复制技术进行数据镜像,实现异地的数据备份及保护。

同城双中心方案

如果企业的业务主要集中在一地开展,或者希望在预算有限的情况下优先满足数据的一致性,那么前面提到的异地灾备方案就不是那么合适了,此时可以考虑同城双中心方案,即将生产中心和灾备中心安排在同一个地区。然后根据情况选择磁盘数据同步/异步复制技术,进行生产中心与灾备中心之间的数据备份传输,实现同城的灾难备份恢复,从而有效地管理风险、保证业务的连续运行,提高业务服务水平。

企业数据解决方案例4

然而,掌控更多数据也会给企业带来更高的业务风险。它会阻塞网络通道,降低系统的数据存取性能,而且还会导致存储资源的耗竭。正如很多专家所指出的,仅仅简单地增加存储容量并不能解决问题。因为不同应用具有不同数据存取与管理方式,这样有可能造成无法整合的信息孤岛。

以这样的情形发展,最终的结果是,数据中心效率低下,关键信息丢失,存储管理成本不断攀升。这对于那些急于在瞬息万变、对成本敏感的市场中增加业务价值和提高企业竞争力的CIO们来说,绝对不是好兆头。

融合为何如此重要

为什么数据中心融合如此重要?目前,数据中心的融合让IT行业与商业界怦然心动的原因,在于它能够简化存储管理流程,并降低数据中心设施的整体成本,减少数据中心设施占用的空间。

简而言之,数据中心融合可以引入一系列新的集成服务器,能够在共同的管理平台之上,利用虚拟化技术拓展网络能力并进行存储创新。此外,数据中心融合还能够在消除数据中心设备与组件管理方面的低效状态的同时降低成本。

对客户而言,数据中心融合可以转化为立竿见影的两大价值:减少数据中心实际设备数量;降低管理成本、空间需求,以及减少能耗。

此外,在融合后,数据中心可以采用单个控制台管理所有数据中心组件,无论是服务器、网络还是存储资产。这样能够使数据中心对部署多种管理工具的需求显著降低,同时降低对获取管理各种工具所需专业知识的需求。另外,融合数据中心还可以解放价值不菲的IT人力,使这些IT人员能够从事对企业增值更高的业务。

这些价值优势加在一起可以为CIO们带来更有效的解决方案,同时为企业的云部署打下基础。

数据中心融合的优势

最近,很多解决方案的井喷式与推出,会让人产生“数据中心融合是一种新事物”的错觉。实际上,作为一种概念,它已经存在一段时间了。数据中心融合与统一计算已经被大家谈论了很多年。

数据中心融合近期地位的提高源于两方面的演进。

IT业的创新使数据中心组件整合在一起成为可能,企业还可以对这些组件进行统一管理。通过引入虚拟化技术、千兆以太网带宽以及能耗更低的服务器与处理器,现在业界已经可以设计和创建出集成系统。

IT行业目前还在整合这些资源,并创建以数据中心融合为中心的新合作关系。例如,日立数据系统与其合作伙伴依托稳固的合作关系,共同推出能够优化数据中心关键环境的融合数据中心解决方案。

这两方面的演进使许多企业的数据中心融合梦想变成现实。

虽然上述这一切已经提高了数据中心融合的价值定位,但是客户仍然对其发展趋势心存疑虑。而这种疑虑不无道理。

大多数产品是以新产品为中心,并且要求抛弃现有的基础设施组件。这一点在现如今企业都想方设法最小化开支和最大化投资收益的形势下,很受争议。另外,它也会影响到CIO自己的价值定位。因为它会让先前摆在首位的遗留数据中心组件的部署理由与决策一无是处。

不过,优势仍然超出风险。

如果不部署数据中心融合解决方案,数据管理就会成为一直存在且始终让人寝食难安的问题。

由于企业对数据中心融合的需求程度随着它们对数据性能要求的提高而提升,CIO们最终仍会对数据中心基础设施进行微调。同时,数据中心融合往往被视为数据中心实现云部署的第一步。其部署会从根本上提高数据使用效率。

日立融合数据中心解决方案的与众不同之处

日立数据系统公司为CIO们提供了让业务和经济两个层面都获益的更佳的解决方案。

日立融合数据中心解决方案(Hitachi Converged Data Center Solutions)将其领先的行业创新与数十载专业知识融为一体,实现优化存储、服务器及网络的目标。该解决方案采用了可运行多种应用、可随时部署的信息技术,能够简化管理、降低成本、减少空间占用,同时实现按照客户步调执行的云部署。

与并未针对关键任务应用环境进行优化的、松散整合的解决方案相比,日立融合数据中心解决方案在企业级可靠性、部署速度、性能及管理等方面具有显著的优势。此外,该解决方案还能够为企业解答许多问题,简化定购与部署过程,并带来可量化的成效。

与市场中其他解决方案不同,日立数据系统的解决方案在设计时还考虑到对IT投资的保护。每种解决方案都可以针对业务需求,尤其是数据与信息管理方面的需求,优化客户的现有关键任务环境。

电子邮件管理对许多企业都是一个关键问题。日立融合解决方案已经针对Microsoft Exchange 2010进行优化,可以解决电子邮件管理中的主要问题。利用处于单个平台中的日立数据保护套件(HDPS)与日立内容平台(HCP),该解决方案还可以帮助客户统一管理、备份资料,同时提高存档效率。

此外,由于允许Microsoft Exchange平台驻留于日立计算机刀片服务器机箱(解决方案的关键组件),该解决方案能帮助企业节省数据中心的占用空间。

另外,日立数据系统公司的方案使客户能够按照自己的步调实施云部署。例如,基于微软Hyper-V Cloud Fast Track的日立融合解决方案把日立存储、计算能力与网络功能融为一体,将Microsoft Windows Server 2008 R2与Hyper-V、System Center融为一体。一旦部署该系统,客户能够获得高性能私有云基础设施,以增强自动化和协调性。

结束语

总之,数据中心融合可以说是应对数据量剧增的灵丹妙药。它使数据中心能够与业务和市场需求发展保持更加一致的步调,同时,能打消企业对当前及未来数据可用性的顾虑。

企业数据解决方案例5

谈起云网络,不少人可能会认为这是概括数据中心网络变革的新名词。 但事实上,专业厂商对云网络的定义并不仅限于数据中心。在2012HCC大会上,华为正在展示一个完整的云网络图谱,它由五大部分组成:数据中心网络、骨干网、汇聚网、接入网及终端。除了目前业界普遍关注的数据中心网络、骨干网和终端解决方案之外,华为还特意了面向企业分支机构云应用的AR G3云接入网关和NE20E-S云管道路由器,在骨干网与终端之间,为企业构建起一个协助云交付的网络路径。

“当前,云化数据中心对虚拟交换、扩大带宽、降低时延、实现弹性调度、简化管理的需求日趋强烈,也让人们更容易在数据中心里看到云所带来的网络变革。但是,这并不代表云带来的网络变革仅限于数据中心。”华为数据中心网络产品总经理孙路遥告诉记者,在数据中心、骨干网之外,云对网络的需要还体现在两个方面:一是企业分支与数据中心的互联,二是数据中心与数据中心间的互联。前者关系着云业务交付的“最后一公里”,是企业不容忽视的环节。

把云应用有效地交付到企业的分支机构,让企业用户不受地点约束的使用云,正是让企业接纳云的关键。而企业分支机构与数据中心的网络互联是否顺畅,则决定着用户使用云的体验。孙路遥表示,决定用户体验的,正是骨干网和终端之间的网络。这一环节要起到承上启下的作用,既要汇聚骨干网的海量信息,还要将信息分发到企业的各个分支,其性能必须能够满足云业务流量的高速增长,同时其可靠性也必须满足云业务的高要求。华为认为,这样的需求会改变企业分支机构对网络出口处接入网关及路由产品的需要。

透过AR G3云接入网关和NE20E-S云管道路由器的特性和参数可以看到,企业分支与数据中心之间的云连接,将对网络产品提出一些新的需求。

对于云接入网关,目前业界有各种版本的理解。但从当前一些尝试云应用的企业用户的反馈来看,广域网的带宽和质量正是制约企业分支机构与数据中心畅通互联的关键因素。解决这一问题,必然是云接入网关的责任。目前,利用广域网加速解决方案节约带宽开支和提升网络传输质量被视为解决问题的最佳渠道之一。有测试数据表明,采用广域网加速技术后,应用协议的传输效率可以提高8~100倍。AR G3云接入网关就是通过融合广域网加速解决方案来实现云业务体验的提升的,通过带宽压缩和应用协议加速等专有技术,AR G3不仅可以大幅提升企业已有带宽的利用率,还能提升应用协议的传输性能。此外,云分支和数据中心之间的广域连接或云端业务并不是100%可靠。对此,AR G3还提供了“本地存活”功能。当云分支无法获取云端业务时,AR G3还可以转换为业务服务器,继续为分支提供功能,大大提升了云业务的可靠性。

华为NE20E-S是华为为云业务交付的“最后一公里”所设计的管道。华为企业数通产品线网络解决方案部部长潘曙光直言,尽管NE20E-S定位于企业级中端路由器市场,但它却继承了NE系列高端路由器的可靠性和高性能。最大480G的交换容量,是市场中同级别产品的3倍,但其满载业务的功耗仅相当于一台电饭煲。这种设计主要是为了适应云业务流量的高速增长。值得关注的是,在性能提升之外,NE20E-S还在简化IT运维方面做出了很多改变。如通过远程完成批量业务快速下发,让维护人员不用进机房就能完成设备安装和网络的组建,一天就能开通240个局点;提供简易可视的网络管理界面,能实现一键式快速诊断等。

“一站式”模式破解云难题

数据中心是云的心脏,数据中心网络是云实现规模化应用的基础。但在建设云化数据中心时,今天企业用户的烦恼不仅是如何构建一个符合多样化业务需求的网络,还有如何解决网络规模的不断扩大和组网复杂性不断增加所带来的安全、运维等问题。对于用户,当前的各种网络解决方案还难以让数据中心变成“交钥匙”工程。

在完善“云管道”图谱的同时,华为也在力图通过更完备的网络解决方案,让云的心脏——数据中心的构建变得更简单。在2012HCC上,华为推出了“一站式”数据中心网络解决方案,通过对企业业务、网络资源和IT资源的有效整合,将数据中心的交付变成了端到端的交付。

企业数据解决方案例6

人们熟知的企业决策管理是指企业在特定条件下,从决策目标的确定、信息收集、建立多个决策方案、寻找优化方案、执行方案及反馈控制等6个环节的活动管理。这个定义中“信息收集”与大数据密切相关。对于如何达到高水平的企业决策管理境界,管理学者有不同的解释。比如,美国密歇根大学的弗兰克 ・ 耶茨(Frank Yates)认为成功的企业决策需要有10个关键的步骤:需求(need)、模式(mode)、投入(investment)、选择(options)、可能性(possibility)、判定(judgment)、价值(value)、交换(trade offs)、接受度(acceptability)、执行(implementation)。根据上述的企业决策管理定义,耶茨的理念大致地分化为“需求”属于“决策目标的确定”的范畴;“投入”与企业特定条件,诸如物资资源和成本有关;“可能性”、“接受度”和“价值”与“反馈控制”和企业特定条件,诸如投资者和市场反应有关;“交换”和“判定”则是“寻找优化方案”;“执行”与“执行方案”是一致的。如此分析看来,耶茨的模型忽略了现代企业最重要的基础――大数据!它引起了企业决策根本性的改变。

如何提倡大数据背景下的新的企业决策管理模式呢?笔者认为,答案之一是将已知的企业决策管理修正为“数据驱动的企业决策管理”(Data-Driven Enterprise Decision Management)。要建立这样一个新的企业决策管理方法,首先要对大数据有一定的了解。

大数据展示了4个“V”的特征:即体量大(volume)、状态多(variety)、生成快(velocity)和含有高价值(value)。其中前3个“V”都给数据收集与预处理带来了高难度。如何快捷地将大数据从非结构化或半结构化(诸如音像、图片、文字等)状态转化为类似结构化的多维数据表格以便计算机能高效地处理和清洗,是每个企业面临的巨大挑战。至今还没有能统一处理大数据前3个“V”的标准技术。大数据的第4个“V”(value)表示大数据在其低密度的价值中含有巨大的看不见的高价值。寻找大数据的高价值必须像从金矿中淘金一样要进行数据挖掘。

企业数据解决方案例7

Abstract: With the gradually go deep into the research of big data, the enterprise innovation decision-makings are more and more dependent on data analysis, and the enterprise archive data resources provide the data base for enterprise’s these decisions, therefore used of big data analysis in Enterprise Archive Management has important significance. This paper detailed expounds the Data Quality Management, Visualization Analysis, Semantic Engines, Data Mining, Tendency Prediction and so on five big data analysis methods in the application of Enterprise Archive Management and problems that deserve attention.

Keywords: Big data analysis method; Enterprise Archive Management; archives data resources; enterprise innovation decision-making

2015年9月5日,我国政府了《促进大数据发展行动纲要》,旨在促进大数据和云计算、物联网、移动互联网等新一代信息技术的融合,探索大数据和传统产业发展新模式,推动传统产业转型升级和新兴产业发展。正如大数据专家舍恩伯格所说:大数据正在改变人们的生活和人们理解世界的方式,更多的变化正蓄势待发,大数据管理分析思维和方法也开始影响到我们企业档案管理的发展趋势。

1 大数据分析方法在企业档案管理中应用的背景

1.1 大数据研究逐渐纵深化。自从2008年science杂志推出Big Data专刊以来,国内外对大数据的研究如火如荼。经过一段时间的探索,“目前大数据领域的研究大致可以分为4个方向:大数据科学、大数据技术、大数据应用和大数据工程。而人们对于大数据技术和应用两个方面的关注比较多”[1]。正如2012年奥巴马政府投入2亿美元启动 “大数据研究和发展计划”的目标所显示的那样,目前大数据的研究逐渐向纵深化方向发展,着重从大型复杂的数据中提取知识和观点,帮助企业实现从“数据分析能力”向“数据决策能力与优势”的转化。

1.2 企业创新决策越来越依赖于数据分析。对于企业技术创新者而言,目前更多的企业高层越来越依靠基于数据分析的企业技术创新决策。靠传统的经验方法去决策往往是滞后的,因此,大数据分析方法作为先进的定量分析方法,目前出现的一些先进数据分析方法与技术势必会对企业的运行管理、生产业务流程、管理决策产生飞跃式的影响。大数据分析方法也成为企业档案数据分析、技术创新决策的有效工具。

1.3 企业档案为企业创新决策提供数据基础。对于一个企业而言,使用的数据资源必须具有真实性可靠性。“企业档案是在企业的各项活动中直接形成并保存备查的各种文献载体形式的历史记录”[2],企业档案是企业在生产、经营、管理等活动中形成的全部有用数据的总和。除了发挥着凭证参考维护历史真实面貌的作用之外,企业档案更“是企业知识资产和信息资源的重要组成部分”[3],具有知识创新性、不可替代性,为企业技术创新决策提供数据基础。“特别是在当前大数据背景下,企业档案数据资源的开发与建设对企业经营决策的制定与适应市场竞争环境起到关键性作用。”[4]

在上述背景下,将大数据分析方法应用在企业档案管理中具有重要性意义:不仅拓展企业的管理决策理论,同时帮助企业运用所拥有的档案数据资源洞察市场环境,发现新的竞争对手,进行自我总结,做出科学决策,使企业紧紧抓住大数据时代带来的市场机遇。

2 大数据分析方法在企业档案管理中应用的方式

大数据分析方法在企业档案管理中的实现方式即是将大数据分析方法运用在企业档案信息分析挖掘上。它贯穿企业数据处理的整个过程,遵循数据生命周期,广泛收集数据进行存储,并对数据进行格式化预处理,采用数据分析模型,依托强大的运行分析算法支撑数据平台,发掘潜在价值和规律并进行呈现的过程。常见的大数据分析方法“其相关内容包括可视化分析、数据挖掘、预测分析、语义分析及数据质量管理”[5]。

2.1 数据质量管理提升企业档案数据资源品质。大数据时代企业档案数据资源呈现出4V特点,这使得企业档案数据很容易出现不一致、不精确、不完整、过时等数据质量问题。基于数据生命周期对企业档案数据资源进行数据质量管理分为数据预处理、数据存储、数据使用三个阶段。在数据预处理阶段,通过ETL工具即数据经过萃取(Extract)、转换(Transform)、加载(Load)至目的端这几个预处理过程达到数据清洗和格式化的目的。目前Oracle公司的Data Integrator和Warehouse Build、微软的Dynamics Integration及IBM的Data Integrator都是比较常见的ETL工具。在数据存储与使用阶段,针对目前企业档案大数据呈现出4V的特点,传统关系型数据库在数据存储与数据管理方面已经难以胜任,非关系型数据库以其高吞吐量、可拓展性、高并发读写、实时性等特性能够满足数据存储与管理的要求。目前应用最广的是并行处理系统MapReduce和非关系型数据库比如谷歌的Big Table和Hadoop的HBase。将ETL工具移植入云计算平台系统,将会大大有助于完成数据清洗、重复对象检测、缺失数据处理、异常数据检测、逻辑错误检测、不一致数据处理等数据质量处理过程,从而保证企业档案数据资源的数据质量。

2.2 可视化分析提升企业档案数据资源可理解性。

“大数据可视分析是指在大数据自动分析挖掘方法的同时,利用支持信息可视化的用户界面以及支持分析过程的人机交互方式与技术,有效融合计算机的计算能力和人的认知能力,以获得对于大规模复杂数据集的洞察力。”[6]那么企业档案数据资源的可视化分析可以理解为借助可视化工具把企业档案数据资源转化成直观、可视、交互形式(如表格、动画、声音、文本、视频、图形等)的过程,便于企业经营者的理解利用。

以2015年2月15日最新版的“百度迁徙”(全称“百度地图春节人口迁徙大数据”)为例,该项目让我们近距离了解到大数据可视化。它利用百度后台每天数十亿次的LBS定位获得的数据进行计算分析,全程展现中国人口迁徙轨迹,为政府部门科学决策提供科学依据。受该项目启发,企业可将拥有不同类型的档案信息进行可视化,比如进行企业档案的网络数据可视化、时空数据可视化、时间序列数据可视化、多维数据可视化、文本数据可视化等[7]。以文本数据可视化为例,目前典型的文本可视化技术标签云,可以将档案文本中蕴含的主题聚类、逻辑结构、词频与重要度、动态演化规律直观展示出来,为企业决策提供依据。另外,常见的信息图表类可视化工具主要有Google chart、 IBM Many Eyes、Tableau、Spotfire、Data-Driven Documents(D3.js)等;时间线类可视化工具主要是Timetoast,、Xtimeline、Timeslide、Dipity等;数据地图类可视化工具主要有Leaflet、Google fushion tables、Quanum GIS等。这些新技术都为企业档案数据资源可视化提供了科学工具。

2.3 语义引擎实现企业档案数据资源的智能提取。大数据时代全球数据存储量呈激增趋势,传统的基于人工分类目录或关键词匹配的搜索引擎(谷歌、百度等)仅仅能够进行简单的关键词匹配,用户无法得到非常准确的信息,检索准确率并不高,而且检索结果相关度较低,检索结果缺乏引导性。为提供给用户高质量的检索结果,改善用户搜索体验,提高效率,实现智能提取,语义搜索引擎应运而生。“语义引擎是随着语义网的发展,采用语义网的语义推理技术实现语义搜索的语义搜索引擎。”[8]它具备从语义理解的角度分析检索者的检索请求,能够理解检索者的真正意图,实现信息智能提取。对语义分析可以采取自然语言处理方法进行概念匹配,提供与检索者需求相同、相近或者相包含的词语。目前存在基于本体的语义处理技术,它以本体库作为语义搜索引擎理解和运用语义的基础。对于企业而言,将语义引擎分析方法与协同过滤关联规则相结合,可以挖掘用户的需求,提供个性化的服务。比如亚马逊公司通过对用户检索的语义进行分析推理,结合协同过滤关联规则,为用户提供相近需求的产品,提升自己的经济效益。对于一份人事档案而言,语义引擎也能分析出该份人事档案中的某人的职务、级别,从中提取出姓名一职务一级别一时间等关键信息,提高检索准确率和效率,实现智能提取。

2.4 数据挖掘发现企业档案数据资源的隐性价值。“数据挖掘又称数据库中的知识发现”[9]。简而言之,数据挖掘就是企业从数据集中发现知识模式,根据功能一般分为预测性模式和描述性模式,细分主要有分类与回归模型、聚类分析模型、关联规则模型、时间序列模型、偏差检测模型等。主要挖掘方法有神经网络方法、机器学习方法数据库方法和统计方法等。

数据挖掘是大数据分析方法的核心。对于企业而言,数据挖掘的档案数据资源应该由两部分组成:一是企业正常运行管理过程中所形成的档案数据资源,通过运用分类、聚类、关联规则等方法对企业内部的数据进行挖掘,发现潜在模式,为企业技术创新人员决策提供支持。比如在2004年全球最大的零售商沃尔玛在分析历史记录的顾客消费数据时,发现每次季节性飓风来临之前,手电筒和蛋挞的数量全部增加。根据这一关联发现,沃尔玛公司会在飓风用品的旁边放上蛋挞,提升了企业的经济效益;二是企业在运行过程中遗存在互联网上的数据,通过网络舆情及时跟踪可以获取市场最新动态,为企业调整服务模式、市场策略、降低风险提供依据。比如Farecast公司运用数据挖掘,从网络抓取数据来预测机票价格以及未来发展趋势,帮助客户把握最佳购买时机,获得较大成功。

2.5 趋势预测分析实现企业档案数据资源的价值创造。“预测分析是利用统计、建模、数据挖掘工具对已有数据进行研究以完成预测。”[10]预测分析的方法分为定性与定量分析两种方法:定性分析如德尔菲法以及近年来人工智能产生的Boos-ting・贝叶斯网络法等;定量分析法一般从形成的历史数据中发掘数据模型达到预测效果,如时间序列分析模型、分类与回归分析模型等。

企业档案数据资源预测分析是在企业档案数据资源数据挖掘的基础之上,发现适合模型,将企业档案数据输入该模型使得企业技术创新人员达到预测性的判断效果,实现价值的创造。一个典型的例子即是市场预测问题,企业技术创新者可以根据档案数据预测某件产品在未来六个月内的销售趋势走向,进而进行生产、物流、营销等活动安排。具体来讲企业可以通过数据时间序列分析模型预测产品销售旺季和淡季顾客的需求量,从而制定针对独特的营销策略,减少生产和销售的波动性,获得利润和竞争优势。预测分析在大数据时代彰显出企业档案数据资源独特的魅力。

3 大数据分析方法运用于企业档案管理中应当注意的问题

3.1 成本问题。大数据分析需要依靠分析工具和运算时间,特别是在复杂的企业档案数据资源中采用相关大数据分析工具的科技成本还是很高的,要以最少运算成本获得更有价值的数据内容。合理选择大数据分析工具不光可以节省运算成本而且能够更快速获取盈利增长点,同时在大数据分析和企业档案数据资源的存储成本方面也要适当的控制在合理的范围内。既要保证大数据分析质量,又要降低企业档案存储成本是大数据分析方法运用到企业档案管理中的重要原则。

3.2 时效问题。“大数据的动态性强,要求分析处理应快速响应,在动态变化的环境中快速完成分析过程,有些甚至必须实时分析,否则这些结果可能就是过时、无效的”。[11]由此可见,影响大数据分析的重要因素就是时效性问题。“大数据数据分析的核心内容之一是数据建模”,[12]数据分析模型要不断的更新适应数据的动态变化。如果模型落后于数据的变化,那数据分析只能是失效的。同时由于经济环境、政治生态、社会文化等因素不断变革,企业档案数据的收集也会产生新的问题。只有不断加强对这些数据的实时监测和有效分析,才能更好的识别出数据变化中的细微之处,建立与之相适应的数据分析新模型。

企业数据解决方案例8

数据是新的石油

数据的价值正在前所未有地被认知。今年年初的瑞士达沃斯论坛上,海量数据也成为一个重要的讨论话题。数据是新的石油——这一观点正被广泛认同。

一些国家性的大数据规划也已出台。例如,美国在今年3月底宣布,将投资两亿美元启动“大数据研究和发展计划”,希望增强收集海量数据、分析萃取信息的能力,并特别提到大数据技术事关美国国家安全、科学和研究的步伐,将引发教育和学习的变革。

企业对数据分析的接受度也正逐渐提高。《麻省理工学院斯隆管理评论》和IBM商业价值研究院联合举行的2011年新智能企业全球高管调查和研究项目指出,2011年,58%的企业已经将分析技术用于在市场或行业内创造竞争优势,实现业务价值,这一数据比2010年增加了21%。

提供数据分析解决方案的IT厂商如IBM、Oracle、SAP则相继推出数据分析战略,包括大数据战略。

“四年前,我们开始组织构建智慧的地球。”IBM全球副总裁兼大中华区软件集团总经理胡世忠说,“通过与数以千计的客户合作,我们了解到,分析是成功的基础。”

智慧地球战略不久——2009年——IBM就BAO战略作为智慧地球落地的有效支撑。而近几年随着技术的发展,大数据进入到用户视野。

那么从2009年到现在,企业利用数据的环境发生了哪些变化?“智慧分析帮助企业从原来特定的企业数据分析扩展到海量数据的分析。业务分析已经从企业自发性工作演变到企业不可或缺的环节。”胡世忠指出。

大数据的利用可以满足四个突出的业务需求:第一,通过客户行为分析留住客户,并在此基础上实现客户群体的持续增长。第二,通过信息管理、业务分析、内容管理等先进手段,帮助企业提高IT水平,优化业务流程,提高运营效率。第三,通过将业务分析贯穿财务规划流程,洞悉企业利润和成本来源,加快结算流程的处理速度,改善其完整性,促进财务流程转型。第四,将分析洞察包含在传统和新兴的风险类别中,预测未来的法规要求及检测欺诈,帮助企业进行风险管理,满足合规性要求。

3A5步方法论

“从顾客购买习惯到供应链的信息,我们拥有越来越多的数据,但我们也正在被这些数据所淹没。”参加此次IBM智慧分析论坛的一位零售行业用户对记者说,很多企业的领导人都在苦苦挣扎于如何理解这些数据、如何利用数据。

虽然很多企业相继推出了大数据相关的存储和分析解决方案,但IBM此次提出利用大数据的“3A5步”方法论令人耳目一新。“3A5步”分别是掌控信息(Align)、获悉洞察(Anticipate)、采取行动(Act)、学习(Learn)和转型(Transform)。针对每一步、每一阶段,IBM都为用户提供了相应的软硬件产品和咨询服务。

第一步掌控信息:全面收集、整合、掌控信息。随着大数据时代的企业需求不断增加,IBM推出大数据平台、分析型数据仓库等解决方案,致力于对非结构化数据、流数据等新型数据的处理和掌控。

第二步获悉洞察:提取洞察并预测。自2005年开始,IBM在业务分析领域不断加大投资和收购力度。目前,IBM具有全面的分析能力,包括财务绩效管理、商业智能、预测分析、内容分析和风险分析。

第三步采取行动:优化决策成就业务绩效。通过将掌握的信息通过分析获取洞察,用到决策平台或决策流程中,帮助企业业务人员和企业高管等决策者实现业务绩效的优化。

第四步学习:从每一次业务结果中获得学习和反馈,改善基于信息的决策流程。以Watson为例,从信息证据和行动结果中进行学习,在每次迭代中获取更智慧的解决方案。

第五步转型:制定清晰的分析战略,结合行业经验和既有案例,缔造突破性业务成果。通过确定业务的优先级分析目标、清晰一致的策略,找到新的方法、业务创新模式;通过已经有的行业解决方案和其他客户的最佳实践,识别新的业务机会和价值。

IBM院士、副总裁及信息管理软件首席技术官TimVincent强调,IBM“3A5步”方法论是假设企业已经有非常好的IT系统来做这个工作。有很多企业的IT系统仅仅能够保留信息,仅仅支持这个公司信息化基本工作,没有多余的资源,这样的企业可以使用IBMPureSystems,解放出更多的成本和资源,并把它们投入到智慧的分析洞察当中来。

技术与行业经验并举

在Gartner近期的数据仓库魔力象限和数据集成魔力象限中,我们看到IBM都处于领导者地位。除了技术上的前瞻性,IBM在数据分析方面与业务结合的能力更被业界看好,特别是过往四年来在智慧地球领域的实践,为IBM积累了丰富的行业分析经验。

“从IT层面来看,业界领先的IBM的大数据平台、业务分析工具等将帮助企业重新构建、优化已有的IT架构,助力企业以更高的效率从大数据中掘金;从业务层面来看,智慧的分析洞察更具针对性的特色解决方案及方法论将帮助业务人员和决策者明确需求、快速行动,将最新的技术与实际业务相结合,从而获得深具价值的业务成果。”胡世忠说。

“IBM智慧分析洞察在行业中是独一无二的。”IBM软件集团大中华区业务分析洞察及智慧地球解决方案总经理卜晓军指出。

IBM全球业务咨询服务部、业务分析与优化服务大中华区总经理段仰圣从三个方面解释了IBM提供给客户的独特能力:首先,IBM拥有广泛且整合的信息与分析产品和服务组合,包括企业级的大数据平台、分析和决策解决方案。第二,拥有运用经验的能力,经过验证的经验可以节省创造价值的时间,在分析领域,IBM已经成功实施过两万多个项目,9000多个相关的专业顾问,以及专门的分析解决方案中心。第三,先进的分析能力。IBM拥有全球商业企业中最大的数学部门,每年有600项以上与分析相关的专利,有IBMWatson这种有自学习能力的智慧分析系统。

“为了帮助这些企业面对大数据挑战,IBM提出了大数据平台战略(BigDataPlatformStrategy),它突破了传统数据仓库和数据管理理念,能够为企业组织提供实时分析信息流和互联网范围信息源的能力,实现更为经济高效的大数据管理,并为在此之上的业务分析和洞察奠定坚实的基础。”卜晓军说。

这一综合全面的大数据平台可帮助客户应对大数据挑战,同时还能与客户现有的企业系统相集成。该平台的四大核心能力包括Hadoop、流计算、数据仓库,以及信息整合与治理。其他辅助平台服务包括虚拟化和探索、应用程序开发、系统管理及加速器。

TimVincent表示:“我们的大数据平台所整合的四大核心能力,可以帮助组织将其数据价值不断延伸,为企业发掘发展动力,应对所有的大数据业务挑战。IBM的愿景是将大数据融入企业,通过IBM大数据解决方案和客户端及合作伙伴解决方案,为客户提供优化的大数据环境,更加及时、经济高效地从规模化、多样化和高速化大数据中提取有效观点,帮助客户获得突破性的洞察力和价值。”

在将分析能力与行业结合方面,IBM了一系列智慧分析洞察特色解决方案(SmarterAnalyticsSignatureSolutions),包括在三个重要领域:欺诈预测、客户服务和财务运营。

持续性投入大数据

企业数据解决方案例9

作为富士通(中国)信息系统有限公司副总裁,黄邦瑜对于当下众多企业在大数据应用上的浮躁心有不满。在他看来,现在的大数据已经被某些人演绎成为包治百病的“一贴灵”,甚至完全背离了大数据的核心价值。

在现代化大潮的推动下,信息的重要性与日俱增,从某种角度而言,甚至可以直接等同于财富。尤其是随着网络和计算机技术的发展,信息呈现出爆炸式的增长态势,信息的过滤、筛选、分析、整理成为人们最关注的话题之一。

物联网、云存储、云计算等信息处理技术的飞速发展,开启了“大数据”的时代之门。越来越多的企业开始重视“大数据”的商业价值,期待能够有一个解决方案,帮助他们从众多碎片化的信息中,找到经营的规律。

“但大数据应用并不等于简单的信息梳理。大数据的应用通常需要有扎实的IT基础,来不得浮躁,否则很难让解决方案达到预期的效果。”黄邦瑜指出。

作为全球范围内的ICT领航企业,富士通拥有传统基础架构和云计算基础,但富士通并不大规模地生产模式化的解决方案,就是为了让企业客户通过定制化的服务,找到更适合自己的解决方案。

需要量体裁衣

自2012年起,富士通加大了推广行业解决方案的力度,并在中国市场上倾注了更大的热情。正是因为如此,富士通在中国的企业形象也在发生着巨大的改变。曾经那个只会生产笔记本和打印设备的制造商,已经一去不复返。

富士通正在通过其多年积淀的ICT技术,转型成为一家基于大数据的企业解决方案提供商。在与中国客户打交道的过程中,黄邦瑜发现,不少缺乏扎实IT基础的中国企业,把“大数据”看成了解决所有问题的“灵丹妙药”,在引进“大数据”解决方案的过程中显得过于浮躁。

胡春民:包括中国和欧美在内的众多跨国巨头都在涉足大数据业务,你认为中国与日本、欧美等国家相比,在大数据的研发和应用上有哪些差距?

黄邦瑜:大数据的应用在国际上也是个新事物,中国、日本和欧美等国家都仍处在研发阶段,我个人认为中国同日本、欧美等先进国家相比,在大数据的研发和应用的水平上并没有太大的差距。

如果说有差距,我觉得最大的差距还是体现在客户的成熟度上。欧美、日本等国家的企业客户相对更成熟一些,因为他们过去在业务层面和IT层面的积淀都比较深厚,这让他们在大数据的应用上会有更明确、更具体、更战略的方向和想法。

在中国,一些IT基础并不扎实的企业可能会进入一个比较浮躁的误区,希望大数据可以变成一贴灵药,能够马上解决他们过去积累的所有问题。其实富士通在应用层面上也没有能够放之四海而皆准的大数据解决方案。因为给企业提供的大数据方案,它本身就是针对不同客户要解决的不同问题“量体裁衣”而设计的,是需要通过与客户共同研讨,不断改进,逐步完善,才能最终形成。

富士通拥有很好的硬件技术、软件技术和IT技术,但是要帮助客户找出规律,关键还是要根据客户的业务,企业不能指望富士通来告诉你所有的一切。如果可以的话,富士通就直接去做汽车、医疗或者其他行业了。

大数据解决方案,从本质上来说就是客户和IT供应商一起去发掘规律的过程。就像制造业存在着大量的数据,但是很难有一种解决方案,刚好把企业经营者想要找的所有规律都找到。

富士通拥有很多大数据业务和应用场景的介绍,因为我们发现,大数据并不是一个像软件一样成型的方案,你拿光碟过来一装就能立刻解决所有的问题,而是一种我们称之为“最佳实践”的模式,即客户能够针对一个特定的问题或业务场景,把想要发掘的问题告诉富士通,然后我们一起去解决这个问题。

在中国,我最担心的就是有客户跟我说,富士通你给我提个方案吧,用了这个方案,研发、生产、市场等各种各样的问题都能解决了。坦白讲,这个真的做不到。

胡春民:关于制造业的转型升级,各国企业都拿出了不同的解决方案。美国GE提出了“工业互联网”,德国则提出了“工业4.0”,和这些欧美企业相比,富士通等日本企业的优势在哪?

黄邦瑜:相比来说,德日企业好像更相似一些,美国公司也有他们自己的一些特征。我们在实施的方法论和工作方式上存在着一些不同。我个人认为,与欧美国家的企业相比,富士通和其他传统的日资企业可能相对于其他国家的企业来说,做得更扎实一些。

欧美企业通常会制造大量模式化的产品,并把它们打包出售,可以更快地产生销售额。但是在解决单体客户的实际问题上,总是有些欠缺、不够完美。这与富士通“最佳实践”的服务方式完全不同。

富士通可能不一定会形成这种大量的模式化、可打包销售的解决方案,我们一直都是针对每一个客户在做精准的“量体裁衣”,我们认为这种个性化的服务方式会让我们的企业客户觉得更合适、更贴心,最后在用户体验上,我们的单个客户满意度会比欧美企业更高一些。

胡春民:除了硬件之外,富士通也在做软件产品,从产品线角度而言,富士通的大数据解决方案有什么特点?

黄邦瑜:每个企业在它的产品线上各具特色,而富士通最大的特色是“全”。我们在存储、服务器、运算分析软件等方面进行了整体的研发。富士通的全套解决方案能够将这些部分更优化地整合在一起,因此从整体架构上看比较全面。对于客户而言,找富士通一家,各个环节都能够全部搞定,比较方便。

业务的全面性,让富士通能够针对其中任何一个环节做一些功能优化,而这些经过优化的产品,可能在该环节的性能指标方面优于我们的竞争对手。

但这种全面性在某种程度上说也是我们的劣势,毕竟企业的经历是有限的,做得比较全从另一个角度来说,可能会使富士通在某些环节上的专精度做得不太到位。

胡春民:在大数据真正实施的过程中,IT企业跟客户是需要进行很多沟通的。跟欧美的公司相比,富士通在这方面是不是具有更多优势呢?

黄邦瑜:我觉得跟欧美公司相比,应该是各有优劣吧,不能一概而论。

富士通一直以来都做得比较务实,这就使我们与一些企业在某些领域的合作关系会相对比较长久。合作的时间长了,富士通的工程师就会相对更加了解我们的客户。而且在日资企业中,人员流动率没有欧美企业那么高。人员稳定的好处就是我们的工程师在行业和业务领域的知识积累会更多一些,这种好处最后也会反馈给我们的客户。

云安全必不可少

胡春民:日本企业和欧美企业相比,在做法上有很大区别。除了ICT技术以外,其工业基础也不一样。制造业的解决方案其实是一个整体,不可能单纯只靠ICT技术的支持。包括富士通在内的一些日本企业,在这方面有没有更好的一些做法?

黄邦瑜:举个医疗行业的例子来说明这个问题。在医疗方面有一个影像解决方案,包括对CT影像扫描的收集,对病人进行相应的管理等多个方面。

像美国的某医疗设备公司,他们是做医疗影像设备的,在卖设备的同时就可以附送打包的软件。如果客户刚好需要他的软件,那么跟他们比,在价格上富士通是没有任何竞争优势的。

但他的劣势是什么呢?因为它是设备制造商,他们附送的软件基本都是专门用于服务特定设备的,而医院不可能每个科室都使用它的设备,这时医院就需要一个全套的影响信息管理系统,而这恰恰就是富士通所擅长的了。

我们是IT厂商,我的关注点不在于设备本身,而是着眼在整个ICT的架构上,使之能够整体服务和支撑客户的影像系统。回到制造业上,道理也是一样的。

我觉得每行每业都存在“术业有专攻”的问题,而我们富士通最大的优势就在于能够通过IT手段将客户整个产品生命周期无缝连接在一起,全方位覆盖研发、制造、ERP、销售等各个环节,为客户提供一整套的价值。

胡春民:富士通在硬件方面根基深厚,但是与Informatica这样的数据提取公司相比,富士通在软件和大数据的获取及预处理方面有什么优势?

黄邦瑜:Informatica在大数据的数据提取领域里确实是非常领先的。富士通也有数据提取的功能,在这个环节可能没他们好。但是,大数据分为若干个环节,除了抽取还有分析和运算环节。这些恰恰是富士通的优势。

而且,富士通一个很重要的特点就是开放性。这就意味着并非大数据所有环节都只能使用富士通的技术,Informatica也可以成为我们的合作伙伴。这样一来,在抽取环节,我们既可以用Informatica的软件,也可以使用自己的软件,甚至可以使用其他合作伙伴的软件。

一体化整合是富士通比较优势的地方,但是其他过程中也有一些的问题存在,其中最大的问题是数据安全问题。对于普通用户和小型企业来说,这个问题可能并不是很重要。但是,一旦公司达到一定规模以后,数据安全问题就受到重视了。

在企业里面,对于非核心业务来说,放在哪里并不重要。但是当涉及到公司核心的销售系统或者会员管理系统需要放到云端时,企业可能就会担心:“我把数据给了服务商,它是不是会恶意使用呢?”

其实,我个人认为,数据安全性的问题并不是一个技术问题,而是一个制度或者运作的问题。现在的IT技术很强,我们可以通过各种技术防止黑客的攻击,但是却没有太多可供使用的法律法规和监管体制,防止客户信息的恶意使用。如果没有完善的制度去管理,云的使用可能只会停留在一个很粗浅的层面。

胡春民:富士通是制造业出身。目前制造业有一个趋势就是高度智能化和集成化,包括怎样让机器人、软件和系统更好地去结合。这其实是把IT企业的优势逐渐弱化了。你怎么看这种现象?

企业数据解决方案例10

IDC的数据显示,未来五年内,中国数据保护市场的年均增长率为18%,其中中小企业数据备份市场的增长潜力更大。专注于中小企业数据保护市场的Acronis推出的Backup & Recovery 11简体中文版本是其进军中国市场最好的一块敲门砖。

Backup & Recovery 11最突出的特点是将数据保护与灾难恢复融为一体。之前,CommVault公司、爱数公司等都提出过类似的一体化数据保护或容灾的理念。Bill Taylor-Mountford介绍说:“从架构上看,Backup & Recovery 11与CommVault的一体化方案类似,也可以根据需求添加不同的功能模块。Acronis用单个解决方案就可以同时提供灾难恢复与数据保护功能,还可以借助磁盘映像技术快速还原所有数据、文件、应用程序以及操作系统。”

与其他专注于企业级市场的公司不同,Acronis只专注于中小企业市场。除了技术和功能上的优势以外,Backup & Recovery 11最具优势的还是价格合理和使用简便。