我感到初学者可能会走近的误区:
1. XML 是不是 HTML 的代替者?
不是。写得好的 html 应当是一个 well-formed 的 xml 文档,其他方面最好不要把他们放在一个程度线上比拟。
2. XML 是不是数据库的代替者?
不是。
3. XML 是不是...的代替者?
都不是。
这个结论可能听上往很幽默:XML 是非常非常重要的东西,但它什么都代替不了。
但这并不希奇,有人把它比做 ASCII 尺度,他们是一切一切的基础,但并没有(也不需要)代替什么。(但是就如同 ASCII 代替了一些没有成大器的字符集定义,XML 也会代替你在利用中自己定义的一些数据传输规范,但没有什么特别主流的东西。)
刚开端学 XML (或者说没开端学之前)的时候最爱问的一个标题确定是:应用 XML 能给我带来什么利益?
我感到从某种角度上说,应用 XML 有些象应用 OO 面向对象:
- 你可以用它,你也可以不用它。
- 假如你的利用非常简略,用它不必定方便,没准儿用了后果还会更差。
- 和其他实际东西比如数据库,MTS,Web Server比起来,它更像是一个概念,一种方法
- 项目越大,它的施展余地越大,作用越大。
- 一旦真正懂得后,哪怕不用 xml parser,也不妨碍你应用这个概念,如同可以抛开特定语言应用 OO。
- ......
似乎更抽象,更没谱儿了吧。
那就随便举个例子。比如你本来想在 bbs 利用中的两个模块之间传一些数据:
- 发言人
- 密码
- 标题
- 内容
应用四个参数是不太现实的,由于你随时可能要扩大功效,比如再加上个
- 表情符号
等等
不可能每次加个功效,就重新定义一遍函数。
所以最简略的方法是把他们合并起来作为一个参数传递给函数。
在有 xml 之前,你可能会应用分隔符:
str = '发言人=张三;密码=**;标题=abc;内容=xyz'
到 server 那边应用 dictionary 或 collection 或 split 等等方法把他们拆开。
(当然可以自己定义对象啦,结构啦等等,但多数情况下还得是纯字符串--比如另一个模块不是自己开发的。)
这种传递字符串的方法有几个标题,总结成两个最大的方面就是:
1. 准确的解析它很麻烦。(比如标题正好是“发言人=张三;”怎么办)
2. 是平面的,没有层次型结构
你可以写些函数来解决这些标题,比如确保里面确定有“发言人”,“密码”等等;
再写些函数做一下字符转义,再写些函数制作出层次性的后果...
够了!咱还是用 XML 吧。在我目前浅易的熟悉里:
- XML 是用来传递数据的
- XML 让这些数占领了结构 -- 一个树型结构
- xml 有全套的把持这种结构的方法
- xml 规范(或者说的实际点,xml parser)帮你断定你创立的字符串是正当的
- xml 规范(或者说的实际点,xml parser)中有措施验证这个正当性
- 对于拿到这个字符串的 server component 来说,可以用 xml 中现成的方法来把持它,这就是 xpath, pattern,类似于 T-SQL 语句。(但记住 xml 是树型结构的)
- XSLT 应用 xpath 对 xml 进行转换(类似于 DTS),其中一种特例是把 XML 转换成 HTML 输出。