当前位置: 开发笔记 > 编程语言 > 正文

Python中使用xml格式化存储文件

作者：手机用户2502940275 | 来源：互联网 | 2023-05-27 10:33

文章目录结构化文件存储xmlxml文档的构成XML访问读取结构化文件存储xml、json为了解决不同设备之间文件交换问题xmlXML(eXtensibleMarkupLangu

文章目录

- - 结构化文件存储
  - - xml
    - xml文档的构成
    - XML访问
    - - 读取

结构化文件存储

xml、json
为了解决不同设备之间文件交换问题

xml

XML(eXtensibleMarkupLanguage)&＃xff0c; 可扩展标记语言
标记语言&＃xff1a; 语言中使用尖括号括起来的文本字符串标记
可扩展&＃xff1a;用户可以自己定义需要的标记
例如&＃xff1a;

自定义标记Teacher在两个标记之间任何内容都应该跟Teacher相关
是w3c组织制定的一个标准
XML描述的是数据本身&＃xff0c;即数据的结构和语义
HTML侧重于如何显示web页面中的数据

xml文档的构成

处理指令(可以认为一个文件内只有一个处理指令)
- 最多只有一行
- 且必须在第一行
- 内容是与xml本身处理起相关的一些声明或者指令
- 以xml关键字开头
- 一般用于声明XML的版本和采用的编码
  - version属性是必须的
  - encoding属性用来支出xml解释器使用的编码
根元素(一个文件内只有一个根元素)
- 在整个xml文件中&＃xff0c;可以把他看作一个树形结构
- 根元素有且只能由一个
子元素
属性
内容
- 表明标签所存储的信息
注释
- 起说明作用的信息
- 注释不能嵌套在标签里
- 只有在注释的开始和结尾使用双短横线
- 三短横线只能出现在注释的开头而不能用在结尾

<School type&＃61;"online" loc&＃61;"beijing"><Student gender&＃61;"male"><score> math>80 score><name>hahaname><age>18age>Student><Student><name>hahaname><age>18age>Student><Student><name>hahaname><age>18age>Student> School>

保留字符的处理
- XML中使用的符号可能跟实际符号相冲突&＃xff0c;典型的就是左右尖括号
- 使用实体引用(EntityReference)来表示保留字符
  
  score>80 #有错误&＃xff0c;xml中不能出现> score>80 #使用实体引用
- 把含有保留字符的部分放在CDATA块内部&＃xff0c;CDATA块把内部信息视为不需要转义
  
  80]]>
- 常见的需要转义的保留字符
  - &: & amp;
  - <: & lt;
  - >: & gt;
  - &＃39;:'
  - ":"
  - 一共五个&＃xff0c; 每个实体引用都以 & 开头并且以分号结尾
XML标签的命名规则
- Pascal命名法
- 用单词表示&＃xff0c;第一个字母大写
- 大小写严格区分
- 配对的标签必须一直
命名空间
- 为了防止命名冲突
  
  LiuYing2320141-23-1
- 两个name会产生冲突
- xmlns: xml name space 的缩写
  
  LiuYing2320141-23-1

XML访问

读取

XML读取分两个主要技术SAX、DOM
SAX&＃xff08;Simple API for XML&＃xff09;&＃xff1a;
- 基于事件驱动的API
- 利用SAX解析文档设计到解析器和事件处理两部分
- 特点&＃xff1a;
  - 快
  - 流式读取
DOM
- 是W3C规定的xml变成接口
- 一个xml文件在缓存中以树形结构保存&＃xff0c;读取
- 用途
  - 定位浏览XML任何一个节点信息
  - 添加删除相应内容
- minidom
  - minidom.parse(filename):加载读取的xml文件, filename也可以是xml代码
  - doc.documentElement:获取xml文档对象&＃xff0c;一个xml文件只有一个对于的文档对象
  - node.getAttribute(attr_name):获取xml节点的属性值
  - node.getElementByTagName(tage_name)&＃xff1a;得到一个节点对象集合
  - node.childNodes:得到所有孩子节点
  - node.childNodes[index].nodeValue:获取单个节点值
  - node.firstNode:得到第一个节点&＃xff0c;等价于node.childNodes[0]
  - node.attributes[tage_name]

# v01 import xml.dom.minidom # 负责解析xml文件 from xml.dom.minidom import parse # 使用minidom打开xml文件 DOMTree &＃61; xml.dom.minidom.parse("student.xml") #得到文档对象 doc &＃61; DOMTree.documentElement # 显示子元素 for ele in doc.childNodes:if ele.nodeName &＃61;&＃61; "Teacher":print("-------Node:{0}-----".format(ele.nodeName))childs &＃61; ele.childNodesfor child in childs:if child.nodeName &＃61;&＃61; "Name":# data是文本节点的一个属性&＃xff0c;表示他的值print("Name: {0}".format(child.childNodes[0].data))if child.nodeName &＃61;&＃61; "Mobile":# data是文本节点的一个属性&＃xff0c;表示他的值print("Mobile: {0}".format(child.childNodes[0].data))if child.nodeName &＃61;&＃61; "Age":# data是文本节点的一个属性&＃xff0c;表示他的值print("Age: {0}".format(child.childNodes[0].data))if child.hasAttribute("detail"):print("Age-detail: {0}".format(child.getAttribute("detail")))

<School><Teacher desc&＃61;"PythonTeacher" score&＃61;"good"><Name>LiuDanaName><Age_1 Detail&＃61;"Age for year 2010">18Age_1><Mobile>13260446055Mobile>Teacher><Student><Name Other&＃61;"他是班长">ZhangSanName><Age Detail&＃61;"The yongest boy in class">14Age>Student><Student><Name>LiSiName><Age>19Age><Mobile>15578875040Mobile>Student> School>

etree
- 以树形结构来表示xml
- root.getiterator:得到相应的可迭代的node集合
- root.iter
- find(node_name):查找指定node_name的节点,返回一个node
- root.findall(node_name):返回多个node_name的节点
- node.tag: node对应的tagename
- node.text:node的文本值
- node.attrib&＃xff1a; 是node的属性的字典类型的内容

# v02 import xml.etree.ElementTree root &＃61; xml.etree.ElementTree.parse("student.xml") print("利用getiterator访问&＃xff1a;") nodes &＃61; root.getiterator() for node in nodes:print("{0}--{1}".format(node.tag, node.text)) print("利用find和findall方法&＃xff1a;") ele_teacher &＃61; root.find("Teacher") print(type(ele_teacher)) print("{0}--{1}".format(ele_teacher.tag, ele_teacher.text)) ele_stus &＃61; root.findall("Student") print(type(ele_stus)) for ele in ele_stus:print("{0}--{1}".format(ele.tag, ele.text))for sub in ele.getiterator():if sub.tag &＃61;&＃61;"Name":if "Other" in sub.attrib.keys():print(sub.attrib[&＃39;Other&＃39;])

xml文件写入
- 更改
  - ele.set:修改属性
  - ele.append&＃xff1a;添加子元素
  - ele.remove&＃xff1a;删除元素

import xml.etree.ElementTree as et tree &＃61; et.parse(r&＃39;to_edit.xml&＃39;) root &＃61; tree.getroot() for e in root.iter(&＃39;Name&＃39;):print(e.text) for stu in root.iter(&＃39;Student&＃39;):name &＃61; stu.find(&＃39;Name&＃39;)if name !&＃61; None:name.set( &＃39;test&＃39;, name.text * 2) stu &＃61; root.find(&＃39;Student&＃39;) #生成一个新的元素 e &＃61; et.Element(&＃39;ADDer&＃39;) e.attrib &＃61; {&＃39;a&＃39;:&＃39;b&＃39;} e.text &＃61; &＃39;我加的&＃39; stu.append(e) # 一定要把修改后的内容写回文件&＃xff0c;否则修改无效 tree.write(&＃39;to_edit.xml&＃39;)

<School><Teacher><Name>LiuYingName><Age detail&＃61;"Age for year 2010">18Age><Mobile>13260446056Mobile>Teacher><Student><Name Other&＃61;"&＃20182;&＃26159;&＃29677;&＃38271;" test&＃61;"ZhangSanZhangSan">ZhangSanName><Age Detail&＃61;"The yongest boy in class">14Age><Student><Name test&＃61;"luodayouluodayou">luodayouName><Age>59Age><Mobile>1387878776787Mobile>Student><Student><Name test&＃61;"LiSiLiSi">LiSiName><Age>19Age><Mobile>13240484187Mobile>Student> School>

生成创建
- SubElement v04
- minidom v05
- etree v06

# v04 import xml.etree.ElementTree as et stu &＃61; et.Element("Student1") name &＃61; et.SubElement(stu, &＃39;Name&＃39;) name.attrib &＃61; {&＃39;lang&＃39;,&＃39;en&＃39;} name.text &＃61; &＃39;maozedong&＃39; age &＃61; et.SubElement(stu, &＃39;Age&＃39;) age.text &＃61; 18 et.dump(stu)

# v05 import xml.dom.minidom # 在内存中创建一个空的文档 doc &＃61; xml.dom.minidom.Document() # 创建一个根节点Managers对象 root &＃61; doc.createElement(&＃39;Managers&＃39;) # 设置根节点的属性 root.setAttribute(&＃39;company&＃39;, &＃39;xx科技&＃39;) root.setAttribute(&＃39;address&＃39;, &＃39;科技软件园&＃39;) # 将根节点添加到文档对象中 doc.appendChild(root) managerList &＃61; [{&＃39;name&＃39;: &＃39;joy&＃39;, &＃39;age&＃39;: 27, &＃39;sex&＃39;: &＃39;女&＃39;},{&＃39;name&＃39;: &＃39;tom&＃39;, &＃39;age&＃39;: 30, &＃39;sex&＃39;: &＃39;男&＃39;},{&＃39;name&＃39;: &＃39;ruby&＃39;, &＃39;age&＃39;: 29, &＃39;sex&＃39;: &＃39;女&＃39;}] for i in managerList:nodeManager &＃61; doc.createElement(&＃39;Manager&＃39;)nodeName &＃61; doc.createElement(&＃39;name&＃39;)# 给叶子节点name设置一个文本节点&＃xff0c;用于显示文本内容nodeName.appendChild(doc.createTextNode(str(i[&＃39;name&＃39;])))nodeAge &＃61; doc.createElement("age")nodeAge.appendChild(doc.createTextNode(str(i["age"])))nodeSex &＃61; doc.createElement("sex")nodeSex.appendChild(doc.createTextNode(str(i["sex"])))# 将各叶子节点添加到父节点Manager中&＃xff0c;# 最后将Manager添加到根节点Managers中nodeManager.appendChild(nodeName)nodeManager.appendChild(nodeAge)nodeManager.appendChild(nodeSex)root.appendChild(nodeManager) # 开始写xml文档 fp &＃61; open(&＃39;Manager.xml&＃39;, &＃39;w&＃39;) doc.writexml(fp, indent&＃61;&＃39;\t&＃39;, addindent&＃61;&＃39;\t&＃39;, newl&＃61;&＃39;\n&＃39;, encoding&＃61;"utf-8")

# v06 import xml.etree.ElementTree as et # 在内存中创建一个空的文档 etree &＃61; et.ElementTree() e &＃61; et.Element(&＃39;Student&＃39;) etree._setroot(e) e_name &＃61; et.SubElement(e, &＃39;Name&＃39;) e_name.text &＃61; "hahahah" etree.write(&＃39;v06.xml&＃39;)

推荐阅读

require
使用nodejs爬取b站番剧数据，计算最佳追番推荐

本文介绍了如何使用nodejs爬取b站番剧数据，并通过计算得出最佳追番推荐。通过调用相关接口获取番剧数据和评分数据，以及使用相应的算法进行计算。该方法可以帮助用户找到适合自己的番剧进行观看。 ... [详细]

蜡笔小新 2023-12-14 20:44:52
php
GetWindowLong函数

今天在看一个代码里头写了GetWindowLong(hwnd,0)，我当时就有点费解，靠，上网搜索函数原型说明，死活找不到第 ... [详细]

蜡笔小新 2023-12-14 17:58:15
text
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52
object
XML介绍与使用的概述及标签规则

本文介绍了XML的基本概念和用途，包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则，包括标签的尖括号和合法标识符的组成，标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读，读者可以对XML的基本知识有一个全面的了解。 ... [详细]

蜡笔小新 2023-12-13 17:39:50
php
React基础篇一 - JSX语法扩展与使用

本文介绍了React基础篇一中的JSX语法扩展与使用。JSX是一种JavaScript的语法扩展，用于描述React中的用户界面。文章详细介绍了在JSX中使用表达式的方法，并给出了一个示例代码。最后，提到了JSX在编译后会被转化为普通的JavaScript对象。 ... [详细]

蜡笔小新 2023-12-11 11:37:05
io
Android实战——jsoup实现网络爬虫，糗事百科项目的起步

本文介绍了Android实战中使用jsoup实现网络爬虫的方法，以糗事百科项目为例。对于初学者来说，数据源的缺乏是做项目的最大烦恼之一。本文讲述了如何使用网络爬虫获取数据，并以糗事百科作为练手项目。同时，提到了使用jsoup需要结合前端基础知识，以及如果学过JS的话可以更轻松地使用该框架。 ... [详细]

蜡笔小新 2023-12-11 09:19:45
command
Backwardsincompatible change made.

Commit1ced2a7433ea8937a1b260ea65d708f32ca7c95eintroduceda+Clonetraitboundtom ... [详细]

蜡笔小新 2023-12-14 15:35:09
object
实现下拉列表，点击其他位置自动隐藏效果的三种方式比较

目录实现效果：实现环境实现方法一：基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]

蜡笔小新 2023-12-14 15:03:14
php
Redis数据结构之string应用场景解析

本文介绍了Redis的基础数据结构string的应用场景，并以面试的形式进行问答讲解，帮助读者更好地理解和应用Redis。同时，描述了一位面试者的心理状态和面试官的行为。 ... [详细]

蜡笔小新 2023-12-14 14:02:42
object
阿里云物联网 .NET Core 客户端 | CZGL.AliIoTClient：4. 设备上报属性

阿,里,云,物,联网,net,core,客户端,czgl,aliiotclient, ... [详细]

蜡笔小新 2023-12-14 12:40:20
tags
使用在线工具jsonschema2pojo根据json生成java对象

本文介绍了使用在线工具jsonschema2pojo根据json生成java对象的方法。通过该工具，用户只需将json字符串复制到输入框中，即可自动将其转换成java对象。该工具还能解析列表式的json数据，并将嵌套在内层的对象也解析出来。本文以请求github的api为例，展示了使用该工具的步骤和效果。 ... [详细]

蜡笔小新 2023-12-13 21:23:45
io
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
text
Android 7自学笔记总结、移动架构视频、安卓面试真题、项目实战源码讲义

本文介绍了Android 7的学习笔记总结，包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容，并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同，否则会出现问题。 ... [详细]

蜡笔小新 2023-12-13 10:06:58
foreach
MyBatis多表查询与动态SQL使用

本文介绍了MyBatis多表查询与动态SQL的使用方法，包括一对一查询和一对多查询。同时还介绍了动态SQL的使用，包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]

蜡笔小新 2023-12-12 17:12:51
object
to_a和to_ary有什么区别？ - What's the difference between to_a and to_ary?

Whatsthedifferencebetweento_aandto_ary?to_a和to_ary有什么区别？ ... [详细]

蜡笔小新 2023-12-11 19:30:04

手机用户2502940275

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章