这些日子,几乎每个人都在谈论XML (Extensible Markup Language),但是很少有人真正懂得其含义。XML的推重者认为它能够解决所有HTML不能解决的标题,让数据在不同的把持系统或利用之间进行机动交换。确实,所有的观察家们都批准XML将引发一场内容宣布和知识交换的革命。谁先进进这个范畴,谁就能够大获其利。
这里的20个有关XML的热点标题能够让你成为一XML“专家”,或至少让你能够在今后看准XML的发展方向。
1.什么是XML?
XML代表扩大标识语言(Extensible Markup Language). 由 World Wide Web Consortium (W3C)带头, XML在仲春中期成为一个正式的规范.
XML开发者会告诉你XML不是一种语言,而是一个定义其他语言的系统. 你可能已经听说过, 或应用过这些语言中的一种,--如Microsoft支撑"推技巧"的 Channel Definition Format (CDF).
正从事于XML相干建议工作的W3C, 称XML为"表达数据中结构 的共同语法". 结构化的数据指的是其内容,意义或利用被标记的数据. 例如, HTML中
通过将结构,内容和表现分别, 同一个XML源文档只写一次, 可以用不同的方法表现出来: 在盘算机屏幕上, 在手提电话显示屏上, 在为盲人服务的设备上翻译成语音, 等等. 它可以在可能开发的任何通信产品上工作. 一个XML文档因此可以比其书写时的作者和显示技巧生存得更久.
所以, XML将不仅限于Internet, 例如, 可以服务于全部出版业, 特别是对于想制作可呈现在多种媒体上的文档的人. 一些应用Standard Generalized Markup Language (SGML)多年的大型文档出版商将转向XML. 还有, 独立于平台的XML是为Web开发的, 这是它将最具影响的处所.
DOM
XML在Web的真正实力在于它是如何与Document Object Model (DOM)交互的. DOM是定义拜访文档中数据的机制的界面.
应用DOM, 程序员可以用一个尺度的方法写动态的内容. 换句话说, 他们可以应用它来使浏览器文档树中的一部分特定内容按照必定的方法表现, 例如, 产生一个小后果, 当用户将鼠标移至文字上时, 这些文字变成蓝色. Netscape Navigator 和 Microsoft Internet Explorer 都有他们各自的DOM, 但是他们都称将在其下一版本的浏览器中支撑W3C 的尺度DOM.
2.XML何以重要?
Web领袖之间的说法是内容至上. 不幸地, 内容经常和其表现紧密联合. 请问你多少次在一个网站上碰到一个小小的提示, "最好在800x600像素的分辨率上显示"?
XML将帮助解决以上标题, 由于网站建造者不用再指明在哪里显示什么, 而是指明文档 的结构. 例如, 你可以阐明文档的标题, 作者, 关联文档的清单, 等等. 然后, 任何一个有XML浏览器的设备都可以给出最合适它的文档版本, 这样的设备可以是一个掌上型盘算机, 置顶盒, 或高速的工作站.
但是, 也许XML的最佳特征是其内在的可扩大性. 公司和组织能够扩大XML来满足新的挑衅和利用. 一个基于XML的语言已经在应用--微软的Channel Definition Format (CDF)-- 还有更多将呈现, 包含 Resource Definition Format (RDF) 和 Open Software Description (OSD).
XML 也承诺成为交换数据 和文档的尺度机制. 例如, XML可能成为不同厂商的数据库在Internet上交换信息的一种方法.现在准确地决定XML的方向还有一些早. 但是, 其各种可能性是令人敬畏的,这就是为什么缭绕着XML有如此多的激动的一个重要原因.
3.SGML、HTML和XML有什么接洽?
Standard Generalized Markup Language (SGML) 是在文字处理利用中表达数据的一个方法. 它已经呈现十多年了, XML 和 HTML 都是从SGML 发展而来的文档情势. 因此, 它们都有一些共同点, 如类似的语法和带括弧的标记符的应用. 但是 HTML 是SGML的一个利用, 而 XML是SGML的一个子集.
差别是重要的. 基础上HTML不能用来定义新的利用, 而XML可以. 例如, Resource Description Format (RDF) 和 Channel Description Format (CDF)都是应用XML定义的利用. XML和HTML更象表兄弟, 而不是亲兄弟.
事实上, XML和SGML是兼容的 -- XML文档可以通过任何SGML制作或浏览工具浏览. 但是, XML没有SGML那么复杂, 它是设计用于有限带宽的网络的, 如Internet. XML规范的合作者Tim Bray说, XML的设计出发点是取SGML的长处, 往除复杂的部分, 使其保持轻盈, 可以在Web上工作.
HTML,SGML和XML将持续用于其合适的处所, 它们中的任何一个不会使其他一个放弃. HTML还是在Web上快速出版数据的最简略的方法, 大部分短期的数据, 如会议议程或广告宣传册. 假如数据会长期应用, 并且需要更多的一些结构, Web建造者将愿意应用XML. 不同于HTML和XML, SGML可能永远不会在Internet上被广泛接收, 由于它从来没有为某个网络协议的需求而设计或优化过. 对于高真个, 复杂结构的出版利用, SGML将持续实用.
4.如何实现XML?
XML将以几个不同的方法利用. 一个是在人机之间交换数据, 如从Web服务器至用户的浏览器. 另外一个是在不同的利用之间交换数据, 或者是机器之间交换数据.
在这些情况下, 你都可能需要三层架构: 后端数据库, 针对数据的处理逻辑的中间层服务器, 以及数据进一步显示和处理的客户端. 数据库可以从多个数据起源接收信息, 可能已经是XML格局的数据. 中间层然后集合数据并在终极的表现层上颁布.
现在, 网页有时候以这种方法传送 --CNET的NEWS.COM 从一个数据库中发表数据. 但是要获得一页的新的视图, 如NEWS.COM的新的“打印机友爱”选项, 服务器必需产生一个新的页面. 一份适当格局化的XML文档将答应客户真个利用为不同的媒体修正文档的表现情势, 比如为打印机.
5.什么是DTD?
文档类型定义 (DTD) 是一套关于标记符的语法规矩. 它告诉你可以在文档中应用哪些标记符, 它们应当按什么次序呈现, 哪些标记符可以呈现于其它标记符中, 哪些标记符有属性, 等等. DTD本来是为应用SGML开发的, 它可以是XML文档的一部分, 但是它通常是一份单独的文档或者一系列文档
由于XML本身 不是一种语言, 而是定义语言的一个系统, 它没有象HTML一样拥有一个通用的DTD. 相反, 想应用XML进行数据交换的产业或组织可以定义它们自己的DTD.
假如一个组织想用XML来标识仅在内部应用的文档, 它可以发明自己私有的DTD. 比如 Wall Street Journal Interactive Edition 拥有一个 DTD 来具体阐明每一版, 其中有关于页, 文章, 概要, 标题下署名等等的信息. 刊物目前应用SGML DTD (称作Dow Jones Markup Language), 但是它也正在开发一个XML版本.
关于DTD并不是没有争议的. 一些人感到它给贸易业务增加了实实在在的价值, 而一些人感到它限制了发明性. 还有一些人认为DTD有用, 但是还做得不够. 微软正尝试用它的XML数据提议来解决上一个埋怨, 但是批评者说这些改良应当在DTD规范本身进行.
微软的schema
一些供应商, 包含微软, 已经提议了调换DTD的一个方法, 称为schema. 他们已经将其以XML数据提交给了W3C. 就象DTD, schema供给了文档的规矩, 并指出用什么标记符, 标记符的属性, 之间的接洽, 等等.
但是, 不同于DTD, schema可以定义数据类型. 例如, DTD可能有一个标记符