所有XML文档中的文本均会被解析器解析。
只有CDATA区段(CDATA section)中的文本会被解析器疏忽。
XML解析器通常会解析XML文档中所有的文本。
当某个XML元素被解析时,其标签之间的文本也会被解析:
此文本也会被解析
解析器之所以这么做是由于XML元素可包含其他的元素,就像这个例子中,其中的
Bill Gates
而解析器会把它分解为像这样的子元素:
Bill Gates
非法的XML字符必需被调换为实体引用(entity reference)。
假如您在XML文档中放置了一个字符,例如'<',那么这个文档会产生一个错误,这是由于解析器会把它说明为新元素的开端。因此你不能这样写:
if salary <1000 then
为了避免这个错误,您需要把字符'<'调换为实体引用,就像这样:
if salary <1000 then
注释:严格地讲,在XML中仅有字符'<'和'&'是非法的。省略号、引号和大于号是正当的,但是把它们调换为实体引用是个好的习惯。
CDATA内部的所有东西都会被解析器疏忽。
假如您的文本中包含了大批的'<'和'&'字符 - 就像编程代码中经常呈现的情况一样 - 那么这个XML元素就可以被定义为一个CDATA部分。
CDATA区段开端于',结束于']]>':
在上面的例子中,在CDATA区段中的所有东西都会被解析器疏忽。
CDATA区段不能包含字符串']]>',所以,CDATA区段的嵌进是不被答应的。
同时也需要确保在']]>'字符串中没有空格或折行。