数据库历史库
发布时间:2017-02-02 来源: 历史回眸 点击:
数据库历史库篇一:数据库历史及主流技术
数据库的诞生和发展给计算机信息管理带来了一场巨大的革命。通过本文让我们看看数据库的发展。/数据库发展历史//数据库技术从诞生到现在,在不到半个世纪的时间里,形成了坚实的理论基础、
成熟的商业产品和广泛的应用领域,吸引越来越多的研究者加入。数据库的诞生和发展给计算机信息管理带来了一场巨大的革命。三十多年来,国内外已经开发建设了成千上万个数据库,它已成为企业、部门乃至个人日常工作、生产和生活的基础设施。同时,随着应用的扩展与深入,数据库的数量和规模越来越大,数据库的研究领域也已经大大地拓广和深化了。30年间数据库领域获得了三次计算机图灵奖(C.W. Bachman, E.F.Codd, J.Gray),更加充分地说明了数据库是一个充满活力和创新精神的领域。就让我们沿着历史的轨迹,追溯一下数据库的发展历程。 一. 数据库发展简史 1. 数据管理的诞生 数据库的历史可以追溯到五十年前,那时的数据管理非常简单。通过大量的分类﹑比较和表格绘制的机器运行数百万穿孔卡片来进行数据的处理,其运行结果在纸上打印出来或者制成新的穿孔卡片。而数据管理就是对所有这些穿孔卡片进行物理的储存和处理。 然而,1951年雷明顿兰德公司(Remington Rand Inc)的一种叫做Univac I的计算机推出了一种一秒钟可以输入数百条记录的磁带驱动器,从而引发了数据管理的革命。1956年IBM生产出第一个磁盘驱动器——the Model 305 RAMAC。此驱动器有50个盘片,每个盘片直径是2英尺,可以储存5MB的数据。使用磁盘最大的好处是可以随机地存取数据,而穿孔卡片和磁带只能顺序存取数据。 1951: Univac系统使用磁带和穿孔卡片作为数据存储。 数据库系统的萌芽出现于60年代。当时计算机开始广泛地应用于数据管理,对数据的共享提出了越来越高的要求。传统的文件系统已经不能满足人们的需要。能够 统一管理和共享数据的数据库管理系统(DBMS)应运而生。数据模型是数据库系统的核心和基础,各种DBMS软件都是基于某种数据模型的。所以通常也按照 数据模型的特点将传统数据库系统分成网状数据库、层次数据库和关系数据库三类。 最早出现的是网状DBMS,是美国通用电 气公司Bachman等人在1961年开发成功的IDS(Integrated DataStore)。1961年通用电气公司(General Electric Co.)的Charles Bachman成功地开发出世界上第一个网状DBMS也是第一个数据库管理系统——集成数据存储(Integrated DataStore IDS),奠定了网状数据库的基础,并在当时得到了广泛的发行和应用。IDS具有数据模式和 日志的特征。但它只能在GE主机上运行,并且数据库只有一个文件,数据库所有的表必须通过手工编码来生成。 之后,通用电气公司的一个客户——BF Goodrich Chemical公司最终不得不重写了整个系统。并将重写后的系统命名为集成数据管理系统(IDMS)。 网状数据库模型对于层次和非层次结构的事物都能比较自然的模拟,在关系数据库出现之前网状DBMS要比层次DBMS用得普遍。在数据库发展史上,网状数据 库占有重要地位。 层次型DBMS是紧随网络型数据库而出现的。最著名最典型的层次数据库系统是IBM公司在1968年开发的IMS(Information Management System),一种适合其主机的层次数据库。这是IBM公司研制的最早的大型数据库系统程序产品。从60年代末产生起,如今已经发展到IMSV6,提供 群集、N路数据共享、消息队列共享等先进特性的支持。这个具有30年历史的数据库产品在如今的WWW应用连接、商务智能应用中扮演着新的角色。 1973年Cullinane公司(也就是后来的Cullinet软件公司),开始出售Goodrich公司的IDMS改进版本,并且逐渐成为当时世界上 最大的软件公司。 2. 关系数据库的由来 网状数据库和层次数据库已经很好地解决了数据的集中和共享问题,但是在数据独立性和抽象级别
上仍有很大欠缺。用户在对这两种数据库进行存取时,仍然需要明 确数据的存储结构,指出存取路径。而后来出现的关系数据库较好地解决了这些问题。 1970年,IBM的研究员E.F.Codd博士在刊物《Communication of the ACM》上发表了一篇名为“A Relational Model of Data for Large Shared Data Banks”的论文,提出了关系模型的概念,奠定了关系模型的理论基础。尽管之前在1968年Childs已经提出了面向集合的模型,然而这篇论文被普遍 认为是数据库系统历史上具有划时代意义的里程碑。Codd的心愿是为数据库建立一个(续致信网上一页内容)优美的数 据模型。后来Codd又陆续发表多篇文章,论述了范式理论和衡量关系系统的12条标准,用数学理论奠定了关系数据库的基础。关系模型有严格的数学基础,抽 象级别比较高,而且简单清晰,便于理解和使用。但是当时也有人认为关系模型是理想化的数据模型,用来实现DBMS是不现实的,尤其担心关系数据库的性能难 以接受,更有人视其为当时正在进行中的网状数据库规范化工作的严重威胁。为了促进对问题的理解,1974年ACM牵头组织了 一次研讨会,会上开展了一场分别以Codd和Bachman为首的支持和反对关系数据库两派之间的辩论。这次著名的辩论推动了关系数据库的发展,使其最终 成为现代数据库产品的主流。 1969: Edgar F。“Ted” Codd发明了关系数据库 1970年关系模型建立之后,IBM公司在San Jose实验室增加了更多的研究人员研究这个项目,这个项目就是著名的System R。其目标是论证一个全功能关系DBMS的可行性。该项目结束于1979年,完成了第一个实现SQL的DBMS。然而IBM对IMS的承诺阻止了 System R的投产,一直到1980年System R才作为一个产品正式推向市场。IBM产品化步伐缓慢的三个原因:IBM重视信誉,重视质量,尽量减少故障;IBM是个大公司,官僚体系庞大;IBM内部 已经有层次数据库产品,相关人员不积极,甚至反对。 然而同时,1973年加州大学伯克利分校的Michael Stonebraker和Eugene Wong利用System R已发布的信息开始开发自己的关系数据库系统Ingres。他们开发的Ingres项目最后由Oracle公司、Ingres公司以及硅谷的其他厂商所 商品化。后来,System R和Ingres系统双双获得ACM的1988年“软件系统奖”。 1976年霍尼韦尔公司(Honeywell)开发了第一个商用关系数据库系统——Multics Relational Data Store。关系型数据库系统以关系代数为坚实的理论基础,经过几十年的发展和实际应用,技术越来越成熟和完善。其代表产品有Oracle、IBM公司的 DB2、微软公 司的MS SQL Server以及Informix、ADABASD等等。 3. 结构化查询语言 (SQL) 1974年,IBM的Ray Boyce和Don Chamberlin将Codd关系数据库的12条准则的数学定义以简单的关键字语法表现出来,里程碑式地提出了SQL(Structured Query Language)语言。SQL语言的功能包括查询、操纵、定义和控制,是一个综合的、通用的关系数据库语言,同时又是一种高度非过程化的语言,只要求用 户指出做什么而不需要指出怎么做。SQL集成实现了数据库生命周期中的全部操作。SQL提供了与关系数据库进行交互的方法,它可以与标准的编程语言一起工 作。自产生之日起,SQL语言便成了检验关系数据库的试金石,而SQL语言标准的每一次变更都指导着关系数据库产品的发展方向。然而,直到二十世纪七十年 代中期,关系理论才通过SQL在商业数据库Oracle和DB2中使用。 1986年,ANSI把SQL作为关系数据库语言的美国标准,同年公布了标准SQL文本。目前SQL标准有3个版本。基本SQL定义是 ANSIX3135-89,“Database Language - SQL with Integrity Enhancement”[ANS89],一般叫做SQL-89。SQL-89定义了模式定义、数据操作和事务处理。SQL-89和随后的 ANSIX3168-1989,“Database
Language-Embedded SQL”构成了第一代SQL标准。ANSIX3135-1992[ANS92]描述了一种增强功能的SQL,现在叫做SQL-92标准。SQL-92包括 模式操作,动态创建和SQL语句动态执行、网络环境支持等增强特性。在完成SQL-92标准后,ANSI和ISO即 开始合作开发SQL3标准。SQL3的主要特点在于抽象数据类型的支持,为新一代对象关系数据库提供了标准。 4. 面向对象数据库 随着信息技术和市场的发展,人们发现关系型数据库系统虽然技术很成熟,但其局限性也是显而易见的:它能很好地处理所谓的“表格型数据”,却对技术界出现的 越来越多的复杂类型的数据无能为力。九十年代以后,技术界一直在研究和寻求新型数据库系统。但在什么是新型数据库系统的发展方向的问题上,产业界一度是相 当困惑的。受当时技术风潮的影响,在相当一段时间内,人们把大量的精力花在研究“面向对象的数据库系统(object oriented database)”或简称“OO数据库系统”。值得一提的是,美国Stonebraker教授提出的面向对象的关系型数据库理论曾一度受到产业界的青 睐。而Stonebraker本人也在当时被Informix花大价钱聘为技术总负责人。 然而,数年的发展表明,面向对象的关系型数据库系统产品的市场发展的情况并不理想。理论上的完美性并没有带来市场的热烈反应。其不成功的主要原因在于,这 种数据库产品的主要设计思想是企图用新型数据库系统来取代现有的数据库系统。这对许多已经运用数据库系统多年并积累了大量工作数据的客户,尤其是大客户来 说,是无法承受新旧数据间的转换而带来的巨大工作量及巨额开支的。另外, 面向对象的关系型数据库系统使查询语言变得极其复杂,从而使得无论是数据库的开发商家还是应用客户都视其复杂的应用技术为畏途。 5. 数据管理的变革 二十世纪六十年代后期出现了一种新型数据库软件:决定支持系统(DSS),其目的是让管理者在决策过程中更有效地利用数据信息。于是在1970年, 第一个联机分析处理工具——Express诞生了。其他决策支持系统紧随其后,许多是由公司的IT部门开发出来的。 1985年,第一个商务智能系统(business intelligence)由Metaphor计算机系统有限公司为Procter & Gamble公司开发出来,主要是用来连接销售信 息和零售的扫描仪数据。同年, Pilot 软件公司开始出售第一个商用客户/服务器执行信息系统——Command Center。 同样在这年,加州大学伯克利分校Ingres项目演变成Postgres,其目标是开发出一个面向对象的数据库。此后一年, Graphael公司开发了第一个商用的对象数据库系统—Gbase。 1988年,IBM公司的研究者Barry Devlin和Paul Murphy发明了一个新的术语—信息仓库,之后,IT的厂商开始构建实验性的数据仓库。1991年,W.H. "Bill" Inmon出版了一本“如何构建数据仓库”的书,使得数据仓库真正开始应用。 1991: W.H.“Bill” Inmon发表了”构建数据仓库” 二十世纪九十年代,随着基于PC的客户/服务器计算模式和企业软件包的广泛采用,数据管理的变革基本完成。数据管理不再仅仅是存储和管理数据,而转变成用 户所需要的各种数据管理的方式。Internet的异军突起以及XML语言的出现,给数据库系统的发展开辟了一片新的天地。 5. 数据库发展大事记 1951:Univac系统使用磁带和穿孔卡片作为数据存储。 1956:IBM公司在其Model 305 RAMAC中第一次引入了磁盘驱动器 1961:通用电气(GE)公司的Charles Bachman开发了第一个数据库管理系统——IDS 1969:E.F. Codd发明了关系数据库。 1973: 由John J.Cullinane领导Cullinane公司开发了 IDMS——一个针对IBM主机的基于网络模型的数据库。 1976: Honeywell公司推出了Multics Relational Data Store——第一个商用关系数据库产品。 1979: Oracle公司引入了第一个商用SQL关系数据库管理系统。 1983: IBM 推出了
DB2数据库产品。 1985: 为Procter & Gamble系统设计的第一个商务智能系统产生。 1991: W.H.“Bill” Inmon发表了”构建数据仓库”。
常见主流数据库分类
1、IBM 的DB2
DB2是IBM著名的关系型数据库产品,DB2系统在企业级的应用中十分广泛。截止2003年,全球财富500强(Fortune 500)中有415家使用DB2,全球财富100强(Fortune100)中有96家使用DB2,用户遍布各个行业。2004年IBM的DB2就获得相关专利239项,而Oracle仅为99项。DB2目前支持从PC到UNIX,从中小型机到大型机,从IBM到非IBM(HP及SUN UNIX系统等)的各种操作平台。
IBM绝对是数据库行业的巨人。1968年IBM在IBM 360计算机上研制成功了IMS这个业界第一个层次型数据库管理系统,也是层次型数据库中最为著名和最为典型的。1970年,IBM E.F.Codd发表了业界第一篇关于关系数据库理论的论文“A Relational Model of Data for Large Shared DataBanks”,首次提出了关系模型的概念。1974年,IBM Don Chamberlin和Ray Boyce通过System R项目的实践,发表了论文“SEQUEL:A Structured English Query Language”,我们现在熟知SQL就是基于它发展起来的。IBM 在1983年发布了DATABASE 2(DB2)for MVS(内部代号为“Eagle”),这就是著名的DB2数据库。2001年IBM以10亿美金收购了Informix的数据库业务,这次收购扩大了IBM分布式数据库业务。2006 DB2 9作为第三代数据库的革命性产品正式在全球发布。
作为关系数据库领域的开拓者和领航人,IBM在1977年完成了System R系统的原型,1980年开始提供集成的数据库服务器—— System/38,随后是SQL/DSforVSE和VM,其初始版本与SystemR研究原型密切相关。
DB2 forMVSV1 在1983年推出。该版本的目标是提供这一新方案所承诺的简单性,数据不相关性和用户生产率。1988年DB2 for MVS 提供了强大的在线事务处理(OLTP)支持,1989 年和1993 年分别以远程工作单元和分布式工作单元实现了分布式数据库支持。最近推出的DB2 Universal Database 6.1则是通用数据库的典范,是第一个具备网上功能的多媒体关系数据库管理系统,支持包括Linux在内的一系列平台。
2、 Oracle
Oracle 前身叫SDL,由Larry Ellison 和另两个编程人员在1977创办,他们开发了自己的拳头产品,在市场上大量销售,1979 年,Oracle公司引
入了第一个商用SQL 关系数据库管理系统。Oracle公司是最早开发关系数据库的厂商之一,其产品支持最广泛的操作系统平台。目前Oracle关系数据库产品的市场占有率名列前茅。
Oracle公司是目前全球最大的数据库软件公司,也是近年业务增长极为迅速的软件提供与服务商。IDC(Internet Data Center)2007统计数据显示数据库市场总量份额如下:Oracle 44.1% IBM 21.3%Microsoft 18.3% Teradata 3.4% Sybase 3.4%。不过从使用情况看,BZ Research的2007年度数据库与数据存取的综合研究报告表明76.4%的公司使用了Microsoft SQL Server,不过在高端领域仍然以Oracle,IBM,Teradata为主。
2007年7月12日,甲骨文公司在美国纽约宣布推出数据库Oracle 11g,这是Oracle数据库的最新版本。Oracle介绍说,Oracle 11g有400多项功能,经过了1500万个小时的测试,开发工作量达到了3.6万人/月。Oracle 11g在安全,XML DB,备份等方面得到了很大提升。Oracle发展历史见转载《书写历史的甲骨文--ORACLE公司传奇》一文。
3、 Informix
Informix是IBM公司出品(2001)的关系数据库管理系统(RDBMS)家族。作为一个集成解决方案,它被定位为作为IBM在线事务处理(OLTP)旗舰级数据服务系统。Informix在1980年成立,目的是为Unix等开放操作系统提供专业的关系型数据库产品。公司的名称Informix便是取自Information 和Unix的结合。Informix第一个真正支持SQL语言的关系数据库产品是Informix SE(StandardEngine)。InformixSE是在当时的微机Unix环境下主要的数据库产品。它也是第一个被移植到Linux上的商业数据库产品。
4、Sybase
美国Sybase公司研制的一种关系型数据库系统,是一种典型的UNIX或WindowsNT平台上客户机/服务器环境下的大型数据库系统。Sybase SQL Server 是 Sybase 公司产品。Sybase公司成立于1984年11月,产品研究和开发包括企业级数据库、数据复制和数据访问。
Sybase公司成立于1984年,公司名称“Sybase”取自“system”和“database” 相结合的含义。Sybase公司的创始人之一Bob Epstein 是Ingres 大学版(与System/R同时期的关系数据库模型产品)的主要设计人员。公司的第一个关系数据库产品是1987年5月推出的Sybase
数据库历史库篇二:历史数据库定义
此主题相关图片如下:
按此查看图片详细信息
[这个贴子最后由zhanxiangsen在 2004/(转载于:wwW.zHaoQt.NEt 蒲 公 英 文 摘:数据库历史库)05/17 05:41pm 第 1 次编辑]
1. 要定义历史数据库,首先应当在SysTbl表中添加一条记录,记录的Key值为TaskHistory;
value2为主机名,如zhanxs, value3为数据库名,如hs300, value4为历史数据库表名,如hist_hs300.
2. 按照上面记录TaskHistory的定义, 在value2指定的主机的数据库(由value3指定)上新建表格(由value4指定),
在新建表格对话框中的文本框"表格名称"中输入要建立的表的名字(即上面value4指定的名字),在"表格类型"
列表框中选择"历史数据表", 然后单击对话框左上角的"新建"图标, 添加一个字段Label, 指定"索引"为Yes.
其他取缺省值即可. 如图1所示:
3. 接下来在所定义的历史数据库表hist_hs300中添加记录,要添加的记录就是你要存储到历史数据库中的记录,
需要设置如下内容:
Label : 要存储的数据点名.字段名;
ST : 数据上限
SB : 数据下限
SampleTime: 采样时间, 单位是秒
Error : 静态偏差限值
DivError : 偏差变化限值
MaxSnapTime : 最大步进时间. 即如果数据变化,或者数据变化率均未超过上面的限值, 则经过多少时间之后
也要存储一个数据记录.示例如图2所示.
zhanxiangse
n
等级: 侠客
信息:
46
现金: 3887 电
力币
存款: 10 电力
币
贷款: 没贷款
来自: 保密
威望: 0 积分: 消息 只看我 查看 搜索 好友 复制 引用 回复 [第 2 楼]此主题相关图片如下:
发帖: 29 篇
精华: 0 篇
资料:
在线: 16 时 17
分 28 秒
注册:
2004/1/12
按此查看图片详细信息
[这个贴子最后由zhanxiangsen在 2004/05/17 05:45pm 第 1 次编辑]
如上示例中定义了两个历史记录.
使用时, 在任务管理器中就可以看到TaskHistory任务, 将其启动即可.
数据库历史库篇三:数据库发展史的启示
数据库发展史的启示
摘要:数据库技术从诞生到现在,在不到半个世纪的时间里,形成了坚实的理论基础、成熟的商业产品和广泛的应用领域,吸引越来越多的研究者加入。数据库的诞生和发展给计算机信息管理带来了一场巨大的革命。三十多年来,国内外已经开发建设了成千上万个数据库,它已成为企业、部门乃至个人日常工作、生产和生活的基础设施。同时,随着应用的扩展与深入,数据库的数量和规模越来越大,数据库的研究领域也已经大大地拓广和深化了。30年间数据库领域获得了三次计算机图灵奖(C.W. Bachman,E.F.Codd, J.Gray),更加充分地说明了数据库是一个充满活力和创新精神的领域。就让我们沿着历史的轨迹,试图从数据库50 多年发展历程中寻找对大数据管理的一些启示。
关键词:数据库 发展 大数据
数据库发展简史:
1、数据独立性
20 世纪60 年代数据库领域的主要成就是IDS 系统和DBTG 报告。其中,IDS 系统是由数据库领域的第一位图灵奖获得者美国科学家Charles W. Bachman 研制的,第一次将数据独立于应用系统存在。在此基础上形成的DBTG 报告,更进一步提出了数据库系统的三级模式结构。这个三级模式结构直到今天还是数据库应用开发的基本体系框架, 它让我们深刻理解了数据独立性的价值。所谓数据独立性是指数据库应用和数据库的逻辑结构和物理结构存在一定的分离。这样当应用发生变化时,无须变更数据库,反之亦然。这样做的好处是可以强化数据库系统的稳定性,为数据的独立存在提供了可能。数据独立性是通过支持三级模式结构来实施的,目前所有的关系数据库都支持三级模式结构。大数据从本质上讲是强调数据独立存在的。在一些应用中,大数据是伴随业务系统运行而产生的,例如电商企业的交易记录等。在其他一些场合下,甚至我们还不知道大数据有什么用,就已经开始大数据的采集和保存了。因此,是“先有数据后有应用”。这就要求我们在考虑大数据系统时,要更多地关注数据本身,深刻理解数据之间的关系,实现有效的数据存储、访问和利用。数据独立性对于大数据而言,已经不再是要不要的问题,而是必然的结果。因此,大数据时代要特别重视大数据本身,重视对数据治理的研究。数据治理是一个管理学的概念,是指要对数据的获取、处理、使用进行监管,具体包括数据质量、数据集成与清洗、数据隐私与安全等方面。
2、关系数据库
Edgar F. Codd 博士在20 世纪70 年代提供了关系数据模型及相关的论文,而且花了近10 年时间实现了System R 系统,证明了系统的性能可以通过优化技术来提升。关系数据库的优点有很多,最突出的是简单的数学模型和非过程化的SQL 语言。关系模型的好处是简洁,全部的概念就是“关系”,用户数据、系统数据都用关系表示。SQL 语言的好处包括非过程性、统一性、标准性、简单易用性等。非过程性对于数据库的推广和普及起到了很大的作用,特别是对于提高应用系统的生产效率功不可没;统一性是指SQL 包括了多种类型的数据操作,包括查询、修改、安
全性控制等,方便了用户使用;标准性是指国际标准化组织的介入,使其成为业界的标准,这给数据库上的应用迁移,或者说构建跨平台的应用软件,奠定了良好的基础。历史上关系数据库受到了传统势力的巨大批判,主要是关系数据库的性能低下。但是,由于Edgar F. Codd 博士的杰出贡献,这一缺点不攻自破。由此可见,我们需要先构建一个好的框架,然后性能问题可以通过不断的技术创新实现。基准测试20 世纪80 年代是关系数据库产品走向成熟的年代,这个时期的代表性人物是1998 年图灵奖获得者Jim Gray。他的成就包括发展了事务理论,以及关系数据库的一系列实现技术等。用基准测试来评价每一个产品的优劣,对于促进产品的技术进步意义非凡。有关的企业也都加入到定义基准测试的标准和方法中来,客观上也促进了产品功能的统一,为进一步的标准化奠定了良好的基础。在关系数据库的发展过程中,事务处理协会 (TPC) 的各种测试尤其是TPC-C 功不可没。TPC 是一个中立的评测关系数据库性能的委员会,它发布了一系列关于不同类型应用的基准性能评测标准,对于推动关系数据库技术的发展起到了不可替代的作用。大数据目前所处的阶段类似关系数据库在20 世纪80 年代的情况,是一个春秋战国时代。全世界每天都有所谓新的大数据系统出现。因此,设计合适的大数据基准测试十分必要。然而,大数据的多样性给大数据评测基准的制定也带来了很多挑战。
(1) 从数据类型来看,大数据包括结构化数据、非结构化的文本和多媒体数据、半结构化的日志数据、流数据、图数据等。不同类型数据的处理方法和所依赖的系统平台可能差别很大,一些应用还会涉及多种不同类型的数据,这为标准的制定带来了巨大挑战。
(2) 大数据系统面对的应用类型也存在很多差异,有面向数据分析的、有事务型数据管理的、有针对复杂机器学习算法的、有对流数据进行分析和监控的、有面向科学计算和图像处理的。不同类型的应用对系统的性能要求存在较大的差异,这也为大数据系统的基准制定带来了巨大挑战。
(3) 系统测试指标也存在很大的差异性,有的关心系统事务处理时间、有的关注数据载入( 预处理) 时间、有的关注系统存储代价和扩展性、有的关注系统能耗等,这对基准制定提出了更高的要求。尽管目前已经出现了BigBench 等面向大数据系统的基准测试,但是,仍然有很多工作要做。
3、系统适应性
上世纪80 年代后期,随着计算机应用的开展,人们已经越来越认识到关系数据库的不足,特别是在表达能力方面的不足,关系数据库无法表达和处理XML 数据、非结构化数据等,这直接导致了上世纪90 年代面向对象数据库系统的产生,并大有要取代关系数据库的架势。很可惜,由于种种原因这种努力并没有成功。之后,还提出了XML 数据库等新的数据库系统原型,也都没有产生颠覆性的影响。要说部分获得成功的倒是数据仓库系统,通过提出位图索引、按列存储、立方体等技术,减少并发控制带来的性能损耗,确实对于复杂分析查询获得了极大的性能提升。因此,想用一个系统来处理全部类型的应用是不现实的,最好的办法是针对某类应用采用相应的系统。普遍的做法是将应用区分为所谓OLTP 和OLAP两大类,前者要确保数据库的正确性,后者重视复杂分析查询的计算性能。 2012 年3 月,美国奥巴马政府发布了《大数据研究和发展倡议》,提出联邦政府与行业、科研院校和非盈利机构一起,共同迎接大数据创造的机遇和挑战。某种程度上,大数据在美国已经形成了
全体动员格局。大数据技术将在科学研究、环境保护、生物医药研究、教育以及国家安全等领域重点突破。美国国家科学基金会、国家卫生研究院、国防部、能源部、国防部高级研究局等六个联邦部门和机构承诺,将投入超过2 亿美元资金用于研发“从海量数据信息中获取知识所必需的工具和技能”。 2013 年2 月,法国政府发布《数字化路线图》,列出了将会大力支持的战略性高新技术,大数据是其中一项。同年4 月,法国召开“第二届巴黎大数据大会”,法国经济、财政和工业部门宣布将投入1 150 万欧元用于支持未来重点项目。2012 年5 月,联合国 “全球脉动”(Global Pulse)发布《大数据开发:机遇与挑战》报告,阐述了大数据带来的机遇、主要挑战和大数据应用。全球脉动计划的目标在于利用数字化的早期预警分析,提前规划、调整、指导联合国在全球范围内,针对众多行业领域的援助项目,以提高援助项目完成的精确性和有效性。
4、 我国大数据发展探索
我国在信息化发展领域,多次强调重视提升信息资源开发利用水平,强调关注大数据工作。目前,国内的实质推进更多地处于地方、产业等各部门自发的探索实践。广东省是国内率先关注大数据的地方之一。2013 年出台《广东省信息化发展规划纲要》,明确 “大数据和商业智能试点示范应用成效明显,公共服务和社会管理电子化、网络化全面普及,信息化有效推动产业转型升级和生产方式转变,信息化成果惠及全省人民”。在构建信息技术产业体系任务中,明确“构建面向企业经营管理及社会服务和管理的大数据挖掘应用创新平台。”在推动信息化和工业化深度融合任务中,明确“推进大数据商业化应用.培育数据资源服务重点企业,提高数据资源服务能力”。
2012 年12 月,陕西省发布“大数据产业发展战略”与“沣西大数据产业园发展规划”。陕西省大数据发展分为三个阶段:导入期、建设期、成长期;到2017 年,建成以西咸新区为核心的大数据处理与服务产业集群,力争成为国家政务信息资源的汇集地、社会信息资源的集散地。2013 年3 月深圳市大数据产业研联盟成立。联盟立足于发挥深圳高新技术研究和产业化优势,发挥产业联动作用,促进同行业间信息沟通、业务合作、资源共享、优势互补,促进大数据产业链的形成。2013 年6 月,山东农业大数据产业技术创新战略联盟成立。由政府、高校、科研单位、企业组成的联盟将通过加强对农业相关信息和数据的分析研究,为政府决策、产业发展提供更多的服务和支持。针对大数据应用,按照领域或者按照应用的不同类型区别对待,研制最合适的系统是目前可行的办法。例如,对于复杂数据分析、即时查询请求及流数据处理,可能需要不同类型的系统。纵观现在的商业公司及数据库产品有下面几种类型。
1)IBM 的DB2
作为关系数据库领域的开拓者和领航人,IBM在1997年完成了System R系统的原型,1980年开始提供集成的数据库服务器—— System/38,随后是SQL/DSforVSE和VM,其初始版本与SystemR研究原型密切相关。DB2 forMVSV1 在1983年推出。该版本的目标是提供这一新方案所承诺的简单性,数据不相关性和用户生产率。1988年DB2for MVS 提供了强大的在线事务处理(OLTP)支持,1989 年和1993 年分别以远程工作单元和分布式工作单元实现了分布式数据库支持。最近推出的DB2Universal Database 6.1则是通用数据库的典范,是第一个具备网上功能的多媒体关系数据库
管理系统,支持包括Linux在内的一系列平台。
2)Oracle
Oracle前身叫SDL,由LarryEllison 和另两个编程人员在1977创办,他们开发了自己的拳头产品,在市场上大量销售,1979 年,Oracle公司引入了第一个商用SQL 关系数据库管理系统。Oracle公司是最早开发关系数据库的厂商之一,其产品支持最广泛的操作系统平台。目前Oracle关系数据库产品的市场占有率名列前茅。
3)Informix
Informix在1980年成立,目的是为Unix等开放操作系统提供专业的关系型数据库产品。公司的名称Informix便是取自Information 和Unix的结合。Informix第一个真正支持SQL语言的关系数据库产品是I n f o r m i x S E(StandardEngine)。InformixSE是在当时的微机Unix 环境下主要的数据库产品。它也是第一个被移植到Linux上的商业数据库产品。
4)Sybase
Sybase公司成立于1984年,公司名称“Sybase”取自“system”和“database”相结合的含义。Sybase公司的创始人之一Bob Epstein 是Ingres 大学版(与System/R同时期的关系数据库模型产品)的主要设计人员。公司的第一个关系数据库产品是1987年5月推出的SybaseSQLServer1.0。Sybase首先提出了Client/Server 数据库体系结构的思想,并率先在Sybase SQLServer 中实现。
5)SQL Server
1987 年,微软和IBM合作开发完成OS/2,IBM 在其销售的OS/2 ExtendedEdition 系统中绑定了OS/2Database Manager,而微软产品线中尚缺少数据库产品。为此,微软将目光投向Sybase,同Sybase 签订了合作协议,使用Sybase的技术开发基于OS/2平台的关系型数据库。1989年,微软发布了SQL Server 1.0 版。
6)PostgreSQL
PostgreSQL 是一种特性非常齐全的自由软件的对象——关系性数据库管理系统(ORDBMS),它的很多特性是当今许多商业数据库的前身。PostgreSQL最早开始于BSD的Ingres项目。PostgreSQL 的特性覆盖了SQL-2/SQL-92和SQL-3。首先,它包括了可以说是目前世界上最丰富的数据类型的支持;其次,目前PostgreSQL 是唯一支持事务、子查询、多版本并行控制系统、数据完整性检查等特性的唯一的一种自由软件的数据库管理系统。
数据库技术是计算机发展史上最成功的系统技术之一,产生了三个图灵奖,形成了巨大的产业,推动了信息系统的发展。总结数据库发展过程中的一些经验教训,对大数据系统的发展同样具有借鉴意义。特别是数据独立性的要求,关系数据库的一些优点,基准测试的做法,以及“一招鲜”失灵了的结论对于当前大数据分析与管理的研究都具有参考价值。
相关热词搜索:数据库 历史 nba历史数据库 双色球历史数据库
热点文章阅读