随着互联网的迅猛发展和普及,人们可以通过盘算机与互联网联接,从世界各地实时的接收和发送大批、最新的信息,但在信息交换的过程中存在着一个突出的标题,就是多种多样的数据格局,给信息的有效应用带来了障碍。所以在信息时代,如何以最便捷、最可靠、最有效的方法获取所需的信息是一个很大的困扰。人们等待着能够找到一种可以描写任何逻辑关系的数据格局来同一电子数据的存储,从而不再由于数据格局的不同一而苦恼和困惑。目前,能够担负此任的就是xml(extensible markup language,可扩大符号化语言)。
可以说,xml的呈现给数据交换带来了一场革命;xml的呈现是至今为止最聪慧的一种符号化语言;xml成为下一代网络发展的基石。
xml出生的背景
sgml先容
说到xml,我们必定要先懂得一下sgml (standard generalized markup language) 。sgml最初是由ibm开发的一种用于排版的符号化语言,称为gml。经过若干年的发展,1984年国际尺度化协会(iso)开端对此提案进行讨论,于1986年正式承认sgml为国际尺度规范(iso8879)。
图:xml作为电子数据交换的同一格局
sgml实际上是一种通用的文档结构描写符号化语言,重要用来定义文献模型的逻辑和物理类结构。一个sgml语言文件由三部分组成,即语法定义、文件类型定义dtd(definition type document)和文件实例。语法定义部分定义了文件类型定义和文件实例的语法结构;文件类型定义部分定义了文件实例的结构和组成结构的元素类型;文件实例是sgml语言程序的主体部分。
在sgml的实际应用中,每一个特定的dtd都定义了一类文件。因此,人们习惯上把具有某一特定dtd的sgml语言,称为某某符号化语言。这样sgml就成为那些派生语言的元语言。
html的呈现
1989年,欧洲物理量子实验室(cern)的信息专家蒂姆·伯纳斯·李发明了超文本链接语言, 应用此语言能轻松地将一个文件中的文字或图形连到其它的文件中往,这就是html的前身。1991年,蒂姆·伯纳斯·李在cern定义了html语言的第一个规范,之后成为w3c组织为专门在互联网上宣布信息而设计的符号化语言规范。可以说,html(hypertext markup language)是sgml的一个实例,它的dtd作为尺度被固定下来。因此,html不能作为定义其它符号化语言的元语言。
作为world wide web的一个组成部分,html语言发展很快,在短短的几年里,它已历经了html1.0、html2.0和html3.0、html4.0等多个版本,同时dhtml (动态)、vhtml(虚拟)、shtml等也飞速发展起来。html以简略精练的语法、极易把握的通用性与易学性,使web网页可以亲近于每一个普通人,互联网因此得以普及发展以至本日光辉。
但是,目前的html还不稳固,不同的浏览器会产生不同的显示后果。此外 ,由于html对超级链接支撑不足,并缺乏空间立体描写,处理图形、图像、音频、视频等多媒体才能较弱,图文混排功效简略,不能表现多种媒体的同步关系等毛病,也影响html的大范围利用以及用于复杂的多媒体数据处理。
xml的出生
xml是由w3c于1998年2月宣布的一种尺度。它同样是sgml的一个简化子集,它将sgml的丰富功效与html的易用性联合到web的利用中,以一种开放的、自我描写方法定义了数据结构。在描写数据内容的同时能突出对结构的描写,从而体现出数据之间的关系。这样所组织的数据对于利用程序和用户都是友爱的、可把持的。之后,w3c又用xml设计出一个与html4.01功效等价的语言,称为xhtml1.0 (extensible hyper text markup language)使之与html相兼容。
xml是sgml的一个子集,严格地讲,xml也还是sgml。与html不同的是xml有dtd,因而也可以像sgml那样作为元语言来定义其它文件系统,或称其它符号化语言。假如把符号化语言分为元符号化语言和实例符号化语言的话,sgml和xml都是元符号化语言,而html和由xml派生的xhtml都是实例符号化语言。
所以可以说,xml的呈现,使html存在的标题可以得到很好的解决。
xml的特点
xml作为引人注视标核心技巧利用于btob、web服务、.net等很多系统中。xml是it界谈话中不可缺乏的一个要害词。因此,xml对于盘算机工程师来说,是必不可少的一门知识。
xml可以作为电子数据交换的同一格局
10年来,web存储格局语言,从html发展到dhtml,直到今天最新的xml,发展的每一步,都是为了适应web利用发展的需求。固然xml底本是为出版界设计的一种文档描写语言,即sgml派生而来的一种符号化语言,但是它也是为互联网的数据交换而设计的。从而,xml不仅仅是sgml定义的用于描写的文档,而且在电子商务等各个范畴使数据交换成为可能。
xml能够利用于各种范畴的原因,就是xml具有到目前为止其他方法所不具备的数据描写特点,把持信息不是采用利用软件的独占情势,而是采用谁都可以看得懂的标记情势来表现,所以xml最合适作为数据交换的尺度,这也是 xml受人关注的原因。
用xml可以对数据关系进行定义形成特有的尺度,因此各行各业都在建立自己的行业化尺度,以利用于网络上处理电子商务,把后台系统通过web站点表现出来。xml还可以作为数据仓储,一个xml文件就是一个小的数据库,通过对数据关系的定义形成各种关系、属性的数据,实现数据交换、高低文检索、多媒体传输。
xml具有其他方法所不具备的数据描写特点
xml是以文本情势来描写的一种文件格局 由于xml是以文本情势描写的,所以合适于各种平台环境的数据交换。同样由于应用文本来描写内容,可以超出不同平台的障碍进行正常的数据交换。但是,文本情势也会由于文字代码的不同造成不能浏览的标题,在这一点上xml有着非常完善的解决计划。
xml应用有意义的标记(tag) 在xml中文件是由一个个称之为元素(element)的部件构成。应用标记(tag )来描写元素。由于应用了标记的描写方法,可以保持原数据的意思和结构在互联网上进行数据交换,进而可以保持不同系统之间数据交换的机动性。
为什么具有上述的长处呢?首先是应用标记描写数据的话,可以具体指出开端元素(开端标记)、结束元素(结束标记),在开端和结束元素之间是要表现的元素数据。这就是用元素表现数据的方法。
标记可以作为子元素 xml中用标记符号化的元素可以作为子元素形成数据嵌套。
xml的标记名和关系可以自由定义 就像很多文章中先容的那样“xml是用标记描写的语言”,而且xml的标记名标记的层次结构等都可以由用户定义。也就是说,根据xml语法可以定义用户特别用处的标记聚集形成一个全新的符号化语言。这就是xml“可扩充(extensible)”名字的起源。
可以说,xml是“定义语言的语言”,也即是一种元语言。由于xml具有元语言的功效,所以可以成为描写电子商务数据、多媒体演示数据、数学公式等各种各样数据利用语言的基础语言。下面供给几个以xml为基础天生的数据描写语言(本文亦称为xml利用语言)的利用例子,即出版媒体:open ebook(电子书籍)、newsml(消息媒体);科学:mathml(数学表达式)、cml(化学);电子商务:cxml(电子商务)、fpml(金融);多媒体:smil(多媒体演示)、bml(卫星数据传送)。