热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

xml格式详解

一、xml基础详解:1、概述:xml:即可扩展标记语言,xml是互联网数据传输的重要工具,它可以跨越互联网任何的平台&#x

一、xml基础详解:

1、概述:

    xml:即可扩展标记语言,xml是互联网数据传输的重要工具,它可以跨越互联网任何的平台,不受编程语言和操作系统的限制,可以说它是一个拥有互联网最高级别通行证的数据携带者。xml是当前处理结构化文档信息中相当给力的技术,xml有助于在服务器之间穿梭结构化数据,这使得开发人员更加得心应手的控制数据的存储和传输。

Xml用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。Xml是标准通用标记语言(SGML)的子集,非常适合Web传输。XML提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。

2、xml的特点及作用:

特点:

v xml与操作系统、编程语言的开发平台都无关;

v 实现不同系统之间的数据交互。

作用:

v 配置应用程序和网站;

v 数据交互;

v Ajax基石。

在配置文件里边所有的配置文件都是以XMl的格式来编写的。

跨平台进行数据交互,它可以跨操作系统,也可以跨编程语言的平台。

Ajax是现在目前比较流行的一个网络交互的技术。Ajax里面最后一个x实际上就是xml的缩写。Xml(Extensible Markup Language)是可扩展标记语言

一个xml文档必须要有第一行的声明和它的文档元素的描述信息就可以了。

3、xml声明

例子:

注:xml声明一般是xml文档的第一行;xml声明由以下几个部分组成:

4、根元素

它是xml文档里面唯一的;它的开始是放在最前面,结束是放在最后面。

5、元素:

(1) 所有的xml元素都必须有结束标签;

(2) xml标签对大小写敏感;

(3)  xml必须正确地嵌套;

(4)元素的命名规则:

名称中可以包含字母、数字或者其他的字符;

名称不能以数字或者标点符号开始;

名称中不能包含空格。

(5)空元素

6、属性

(1)语法

<元素名 属性名=“属性值”/>

例:

       Tom

(2)注意:

属性值用双引号包裹;一个元素可以有多个属性,它的基本格式为:

<元素名 属性名=“属性值” 属性名=“属性值”>;

属性值中不能够直接包含<.”,&。

7、实体:

在xml中,一些字符拥有特殊的意义。如果把字符“<”放在xml元素中,会发生错误,这是因为解析器会把它当作新元素的开始,这样会产生xml错误:

为了避免这个错误,请用实体引用来代替“<”字符:

xml中5个预定义实体

8、注释

注:注释内容中不要出现”--”;不要把注释放在标签中间;注释不能嵌套。

9、总结:

(1)xml描述的是文档的内容与语义,而不是文档应当如何显示;

(2)格式正规(well formed)的xml文档

遵循如下规则的xml文档称为格式正规的xml文档:

v 必须有xml声明语句;

v 必须有且仅有一个根元素;

v 标签大小写敏感;

v 属性值用双引号;

v 标签成对;

v 空标签关闭;

v 元素正确嵌套。

(3)有效的(valid)xml文档。首先xml文档是个格式正规的xml文档,然后又需要满足DTD的要求,这样的xml文档称为有效的xml文档;

10、解析器

11、命名空间

11.1、xml命名空间(xml Namespaces)

(1)xml命名空间提供避免元素命名冲突的方法。

(2)在xml中,元素名称是由开发者定义的,当两个不同的文档使用相同的元素名时,就会发生命名冲突。

11.2、xml命名空间示例

(1)使用前缀示例

与仅仅使用前缀不同,我们为标签添加了一个xmlns属性,这样就为前缀赋予了一个与某个命名空间相关联的限定名称。

二、DTD技术——xml文件的验证机制

1、DTD概述:

文档类型定义——Document Type Definition

DTD用来描述xml文档的结构,一个DTD文档包含:  

元素的定义规则;元素之间的关系规则;属性的定义规则。

2、为什么要用DTD呀

v 有了DTD,每个xml文件可以携带一个自身格式的描述,所谓格式描述就是我的xml文档里面可以写哪些东西,比如元素、属性;

v 有了DTD,不同组织的人可以使用一个通用DTD用来交换数据,xml是随意定义的,有了DTD,我们可以限制多个公司之间按照这种DTD的规则来编写xml文档,由于DTD都是统一格式,所以不同的公司之间,不同的组织之间就可以用这种通用的xml文档格式进行交互数据了;

v 应用程序可以使用一个标准DTD校检从外部接收的xml数据是否有效。

3、如何编写一个DTD

DTD分成三大类,第一是内部DTD,第二是外部DTD,第三是内外结合的DTD。

(1)内部DTD文档(Students.xml):

(2)就是说这个xml文档里面既包含xml定义,又包含DTD的定义。

这个[]里面是DTD的定义的内容,就是第一个叫内部DTD文档。

(3)外部DTD文档(Students.xml  Students.dtd):

所谓外部就是DTD的定义和我们的xml文档是在不同的文件里面。

那么外部的DTD如何使用呢?那就需要在前面的xml文档的根元素的上面这个位置跟刚才内部的是一样的,要写上

这类年改革文档在同一个文件夹下面,就可以了。

有内部DTD了,为什么还要学习外部DTD呢??

内部的DTD,它只能验证当前的这个xml文档。那假如说,我们有一个DTD需要验证多个xml文档的话,那就直接使用外部DTD就行。

(4)内外部DTD文档结合

4、DTD的具体定义——元素的定义

元素名称:是指xml文档里面的元素名称

元素类型:

(1)EMPTY

示例第一个是对的,第二个是错误的,因为它有内容了。

(2)#PCDATA

第一个是对的,第二个是错误的。

(3)纯元素类型的DTD语法

(4)ANY

5、定义属性的语法结构

xml文档携带数据的方式,不仅仅是xml的元素的内容,还可以是元素的属性。

所以说在DTD里面我们有必要对属性进行限制。

(1)编写属性验证的语法规则:

(2)属性类型——CDATA

CDATA是表示属性的值,可以是任何字符,这里包括数字和中文。

问题一:属性的CDATA与元素的CDATA节有何区别呢??

属性的CDATA表示属性值是任何的字符,元素里的CDATA节是表示在CDATA节里面的内容不被xml文档进行解析。

问题二:#PCDATA与CDATA有何区别??

#PCDATA是限制元素里面的内容是字符类型的,而这个CDATA是限制属性里面的内容是字符类型。

(3)属性类型——ID

表明该属性的取值必须是唯一的。

(4)属性类型——IDREF/IDREFS

v IDREF是指它的值要指向文档当中其它地方声明的ID。把IDREF当成数据库的外键,把ID当成主键理解就行;

v IDREFS同IDREF,但是可以具有由空格分开的多个引用;

(5)属性类型——Enumerated

预先定义了一些值,属性的值必须在所列出的值的范围内

(6)属性特点——#REQUIRED

它表示元素的所有的实例都必须有该属性的值(NOT NULL)

(7)属性特点——#IMPLIED

这就表示该属性的值是可以被忽略的。

(8)属性特点——#FIXED

元素中该属性的值必须为指定的固定值。

(9)属性特点——Default

为属性提供一个默认的值。

三、实体

1、实体概述

实体,简单理解就是C#中的常量,我们在DTD里面定义,在xml文档里面去使用。(实际上就是自定义实体,与前面的预定义实体差不多是一回事)。

2、实体的定义

四、xml之Schema技术

1、Schema概述:xml Schema是用一套预先规定的xml元素和属性创建的,这些元素和属性定义了xml文档的结构和内容模式。Xml Shema规定xml文档实例的结构和每个元素/属性的数据类型。

理解:对于Schema来讲,我们可以将shema比喻成为是表结构。在表结构里,定义一些数据的限制要求。然后我们xml文档呢就相当于是数据表将来要存储的数据u,也就是数据库里面的数据表数据了,所以整体来讲的话schema它就是用于验证xml文档的。

2、有了DTD,为什么要用Schema呢?

(1)DTD的局限性

DTD不遵守xml语法(写xml文档实例时用一种语法,写DTD的时候用另外一种语法);DTD数据类型有限(与数据库数据类型不一致);DTD不可扩展;DTD不支持命名空间(命名冲突)。

(2)Schema的新特性

Shema基于xml语法的;Shema可以用能处理xml文档的工具处理;Schema大大扩充了数据类型,可以自定义数据类型;Schema支持元素的继承——Object-Oriented;Shema支持属性组。

3、Shema(模式):其作用与DTD一样,也是用于验证xml文档的有效性,只不过它提供了比DTD更强大的功能和更细粒度的数据类型,另外Schema还可以自定义数据类型。此外,Schema也是一个xml文件,而DTD则不是。

4、所有的Schema文档,其根元素必须为Schema。

5、Schema的文档结构

6、Schema的数据类型

6.1、Schema的数据类型概述

6.2、简单类型:

(1)内置的数据类型:

基本的数据类型;

扩展的数据类型;

(2)用户自定义简单类型(通过simpleType定义)。

6.3、复合类型(通过complexType定义)

6.4、数据类型的特征

7、Schema的元素类型

7.1、Schema根元素

作用:包含已经定义的Schema

用法:

属性:xmlns/targetNamespace/elementFormDefault

例子:

7.2、element元素

作用:声明一个元素

属性:name/type/ref/minOccurs/maxOccurs

例子:

7.3、group元素

作用:把一组元素声明组合在一起

属性:name

例子:

7.4、attribute元素

作用:声明一个属性

属性:name/type/use/default/fixed

例子:

7.5、attributeGroup元素

作用:把一组属性声明组合在一起

属性:name/ref

例子:

7.6、simpleType元素

作用:定义一个简单类型,它决定了元素和属性值的约束和相关信息

属性:name

常用的两种方式:restriction——>一个约束;list——>从列表中选择。

(1)simpleType元素的子元素——>restriction

子元素为:——>定义一个约束条件

例子:

(2)simpleType元素的子元素——>list

子元素为:——>从一个特定数据类型的集合中选择定义一个简单类型元素。

例子:

7.7、complexType元素

作用:定义一个复合类型,它决定了一组元素和属性值的约束和相关信息。

属性:name

常用的两种方式:sequence——>一个序列;choice——>设置选择项。

(1)complexType元素——sequence

作用:给一组元素一个特定的序列

例子:

(2)complexType元素——choice

作用:把一组属性声明组合在一起,以便可以被复合类型应用

属性:name/ref

例子:

7.8、complexType与simpleType区别

simpleType类型的元素中不能包含元素或者属性;

当需要声明一个元素的子元素和或属性时,用complexType;

当需要基于内置的基本数据类型定义一个新的数据类型时,用simpleType。
--------------------- 
原文:https://blog.csdn.net/com_ma/article/details/73277535 


推荐阅读
  • 本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容,主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]
  • Java序列化对象传给PHP的方法及原理解析
    本文介绍了Java序列化对象传给PHP的方法及原理,包括Java对象传递的方式、序列化的方式、PHP中的序列化用法介绍、Java是否能反序列化PHP的数据、Java序列化的原理以及解决Java序列化中的问题。同时还解释了序列化的概念和作用,以及代码执行序列化所需要的权限。最后指出,序列化会将对象实例的所有字段都进行序列化,使得数据能够被表示为实例的序列化数据,但只有能够解释该格式的代码才能够确定数据的内容。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • Nginx使用AWStats日志分析的步骤及注意事项
    本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息,并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境,并进行DNS解析。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • Spring源码解密之默认标签的解析方式分析
    本文分析了Spring源码解密中默认标签的解析方式。通过对命名空间的判断,区分默认命名空间和自定义命名空间,并采用不同的解析方式。其中,bean标签的解析最为复杂和重要。 ... [详细]
  • 搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的详细步骤
    本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的步骤,包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • javascript  – 概述在Firefox上无法正常工作
    我试图提出一些自定义大纲,以达到一些Web可访问性建议.但我不能用Firefox制作.这就是它在Chrome上的外观:而那个图标实际上是一个锚点.在Firefox上,它只概述了整个 ... [详细]
  • 本文详细介绍了MysqlDump和mysqldump进行全库备份的相关知识,包括备份命令的使用方法、my.cnf配置文件的设置、binlog日志的位置指定、增量恢复的方式以及适用于innodb引擎和myisam引擎的备份方法。对于需要进行数据库备份的用户来说,本文提供了一些有价值的参考内容。 ... [详细]
  • 如何用UE4制作2D游戏文档——计算篇
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了如何用UE4制作2D游戏文档——计算篇相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因,文件需要分割成多个部分发送,因此无法按顺序接收。文章中提供了merge2.php的源码,通过使用shuffle函数打乱文件读取顺序,实现了乱序合并文件的功能。同时,还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]
author-avatar
侯faulds_534
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有