热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Python中使用xml格式化存储文件

文章目录结构化文件存储xmlxml文档的构成XML访问读取结构化文件存储xml、json为了解决不同设备之间文件交换问题xmlXML(eXtensibleMarkupLangu


文章目录

      • 结构化文件存储
        • xml
        • xml文档的构成
        • XML访问
          • 读取


结构化文件存储


  • xml、json
  • 为了解决不同设备之间文件交换问题

xml


  • XML(eXtensibleMarkupLanguage), 可扩展标记语言

  • 标记语言: 语言中使用尖括号括起来的文本字符串标记

  • 可扩展:用户可以自己定义需要的标记

  • 例如:

    自定义标记Teacher在两个标记之间任何内容都应该跟Teacher相关

  • 是w3c组织制定的一个标准

  • XML描述的是数据本身,即数据的结构和语义

  • HTML侧重于如何显示web页面中的数据


xml文档的构成


  • 处理指令(可以认为一个文件内只有一个处理指令)
    • 最多只有一行
    • 且必须在第一行
    • 内容是与xml本身处理起相关的一些声明或者指令
    • 以xml关键字开头
    • 一般用于声明XML的版本和采用的编码
      • version属性是必须的
      • encoding属性用来支出xml解释器使用的编码
  • 根元素(一个文件内只有一个根元素)
    • 在整个xml文件中,可以把他看作一个树形结构
    • 根元素有且只能由一个
  • 子元素
  • 属性
  • 内容
    • 表明标签所存储的信息
  • 注释
    • 起说明作用的信息
    • 注释不能嵌套在标签里
    • 只有在注释的开始和结尾使用双短横线
    • 三短横线只能出现在注释的开头而不能用在结尾


<School type&#61;"online" loc&#61;"beijing"><Student gender&#61;"male"><score> math>80 score><name>hahaname><age>18age>Student><Student><name>hahaname><age>18age>Student><Student><name>hahaname><age>18age>Student>
School>

  • 保留字符的处理
    • XML中使用的符号可能跟实际符号相冲突&#xff0c;典型的就是左右尖括号

    • 使用实体引用(EntityReference)来表示保留字符

      score>80 #有错误&#xff0c;xml中不能出现> score>80 #使用实体引用

    • 把含有保留字符的部分放在CDATA块内部&#xff0c;CDATA块把内部信息视为不需要转义

      80]]>

    • 常见的需要转义的保留字符

      • &: & amp;
      • <: & lt;
      • >: & gt;
      • &#39;:'
      • ":"
      • 一共五个&#xff0c; 每个实体引用都以 & 开头并且以分号结尾
  • XML标签的命名规则
    • Pascal命名法
    • 用单词表示&#xff0c;第一个字母大写
    • 大小写严格区分
    • 配对的标签必须一直
  • 命名空间
    • 为了防止命名冲突

      LiuYing2320141-23-1

    • 两个name会产生冲突

    • xmlns: xml name space 的缩写

      LiuYing2320141-23-1


XML访问


读取

  • XML读取分两个主要技术SAX、DOM
  • SAX&#xff08;Simple API for XML&#xff09;&#xff1a;
    • 基于事件驱动的API
    • 利用SAX解析文档设计到解析器和事件处理两部分
    • 特点&#xff1a;
      • 流式读取
  • DOM
    • 是W3C规定的xml变成接口
    • 一个xml文件在缓存中以树形结构保存&#xff0c;读取
    • 用途
      • 定位浏览XML任何一个节点信息
      • 添加删除相应内容
    • minidom
      • minidom.parse(filename):加载读取的xml文件, filename也可以是xml代码
      • doc.documentElement:获取xml文档对象&#xff0c;一个xml文件只有一个对于的文档对象
      • node.getAttribute(attr_name):获取xml节点的属性值
      • node.getElementByTagName(tage_name)&#xff1a;得到一个节点对象集合
      • node.childNodes:得到所有孩子节点
      • node.childNodes[index].nodeValue:获取单个节点值
      • node.firstNode:得到第一个节点&#xff0c;等价于node.childNodes[0]
      • node.attributes[tage_name]

# v01
import xml.dom.minidom
# 负责解析xml文件
from xml.dom.minidom import parse
# 使用minidom打开xml文件
DOMTree &#61; xml.dom.minidom.parse("student.xml")
#得到文档对象
doc &#61; DOMTree.documentElement
# 显示子元素
for ele in doc.childNodes:if ele.nodeName &#61;&#61; "Teacher":print("-------Node:{0}-----".format(ele.nodeName))childs &#61; ele.childNodesfor child in childs:if child.nodeName &#61;&#61; "Name":# data是文本节点的一个属性&#xff0c;表示他的值print("Name: {0}".format(child.childNodes[0].data))if child.nodeName &#61;&#61; "Mobile":# data是文本节点的一个属性&#xff0c;表示他的值print("Mobile: {0}".format(child.childNodes[0].data))if child.nodeName &#61;&#61; "Age":# data是文本节点的一个属性&#xff0c;表示他的值print("Age: {0}".format(child.childNodes[0].data))if child.hasAttribute("detail"):print("Age-detail: {0}".format(child.getAttribute("detail")))



<School><Teacher desc&#61;"PythonTeacher" score&#61;"good"><Name>LiuDanaName><Age_1 Detail&#61;"Age for year 2010">18Age_1><Mobile>13260446055Mobile>Teacher><Student><Name Other&#61;"他是班长">ZhangSanName><Age Detail&#61;"The yongest boy in class">14Age>Student><Student><Name>LiSiName><Age>19Age><Mobile>15578875040Mobile>Student>
School>

  • etree
    • 以树形结构来表示xml
    • root.getiterator:得到相应的可迭代的node集合
    • root.iter
    • find(node_name):查找指定node_name的节点,返回一个node
    • root.findall(node_name):返回多个node_name的节点
    • node.tag: node对应的tagename
    • node.text:node的文本值
    • node.attrib&#xff1a; 是node的属性的字典类型的内容

# v02
import xml.etree.ElementTree
root &#61; xml.etree.ElementTree.parse("student.xml")
print("利用getiterator访问&#xff1a;")
nodes &#61; root.getiterator()
for node in nodes:print("{0}--{1}".format(node.tag, node.text))
print("利用find和findall方法&#xff1a;")
ele_teacher &#61; root.find("Teacher")
print(type(ele_teacher))
print("{0}--{1}".format(ele_teacher.tag, ele_teacher.text))
ele_stus &#61; root.findall("Student")
print(type(ele_stus))
for ele in ele_stus:print("{0}--{1}".format(ele.tag, ele.text))for sub in ele.getiterator():if sub.tag &#61;&#61;"Name":if "Other" in sub.attrib.keys():print(sub.attrib[&#39;Other&#39;])

  • xml文件写入
    • 更改
      • ele.set:修改属性
      • ele.append&#xff1a;添加子元素
      • ele.remove&#xff1a;删除元素

import xml.etree.ElementTree as et
tree &#61; et.parse(r&#39;to_edit.xml&#39;)
root &#61; tree.getroot()
for e in root.iter(&#39;Name&#39;):print(e.text)
for stu in root.iter(&#39;Student&#39;):name &#61; stu.find(&#39;Name&#39;)if name !&#61; None:name.set( &#39;test&#39;, name.text * 2)
stu &#61; root.find(&#39;Student&#39;)
#生成一个新的 元素
e &#61; et.Element(&#39;ADDer&#39;)
e.attrib &#61; {&#39;a&#39;:&#39;b&#39;}
e.text &#61; &#39;我加的&#39;
stu.append(e)
# 一定要把修改后的内容写回文件&#xff0c;否则修改无效
tree.write(&#39;to_edit.xml&#39;)


<School><Teacher><Name>LiuYingName><Age detail&#61;"Age for year 2010">18Age><Mobile>13260446056Mobile>Teacher><Student><Name Other&#61;"&#20182;&#26159;&#29677;&#38271;" test&#61;"ZhangSanZhangSan">ZhangSanName><Age Detail&#61;"The yongest boy in class">14Age><Student><Name test&#61;"luodayouluodayou">luodayouName><Age>59Age><Mobile>1387878776787Mobile>Student><Student><Name test&#61;"LiSiLiSi">LiSiName><Age>19Age><Mobile>13240484187Mobile>Student>
School>

  • 生成创建
    • SubElement v04
    • minidom v05
    • etree v06

# v04
import xml.etree.ElementTree as et
stu &#61; et.Element("Student1")
name &#61; et.SubElement(stu, &#39;Name&#39;)
name.attrib &#61; {&#39;lang&#39;,&#39;en&#39;}
name.text &#61; &#39;maozedong&#39;
age &#61; et.SubElement(stu, &#39;Age&#39;)
age.text &#61; 18
et.dump(stu)

# v05
import xml.dom.minidom
# 在内存中创建一个空的文档
doc &#61; xml.dom.minidom.Document()
# 创建一个根节点Managers对象
root &#61; doc.createElement(&#39;Managers&#39;)
# 设置根节点的属性
root.setAttribute(&#39;company&#39;, &#39;xx科技&#39;)
root.setAttribute(&#39;address&#39;, &#39;科技软件园&#39;)
# 将根节点添加到文档对象中
doc.appendChild(root)
managerList &#61; [{&#39;name&#39;: &#39;joy&#39;, &#39;age&#39;: 27, &#39;sex&#39;: &#39;女&#39;},{&#39;name&#39;: &#39;tom&#39;, &#39;age&#39;: 30, &#39;sex&#39;: &#39;男&#39;},{&#39;name&#39;: &#39;ruby&#39;, &#39;age&#39;: 29, &#39;sex&#39;: &#39;女&#39;}]
for i in managerList:nodeManager &#61; doc.createElement(&#39;Manager&#39;)nodeName &#61; doc.createElement(&#39;name&#39;)# 给叶子节点name设置一个文本节点&#xff0c;用于显示文本内容nodeName.appendChild(doc.createTextNode(str(i[&#39;name&#39;])))nodeAge &#61; doc.createElement("age")nodeAge.appendChild(doc.createTextNode(str(i["age"])))nodeSex &#61; doc.createElement("sex")nodeSex.appendChild(doc.createTextNode(str(i["sex"])))# 将各叶子节点添加到父节点Manager中&#xff0c;# 最后将Manager添加到根节点Managers中nodeManager.appendChild(nodeName)nodeManager.appendChild(nodeAge)nodeManager.appendChild(nodeSex)root.appendChild(nodeManager)
# 开始写xml文档
fp &#61; open(&#39;Manager.xml&#39;, &#39;w&#39;)
doc.writexml(fp, indent&#61;&#39;\t&#39;, addindent&#61;&#39;\t&#39;, newl&#61;&#39;\n&#39;, encoding&#61;"utf-8")

# v06
import xml.etree.ElementTree as et
# 在内存中创建一个空的文档
etree &#61; et.ElementTree()
e &#61; et.Element(&#39;Student&#39;)
etree._setroot(e)
e_name &#61; et.SubElement(e, &#39;Name&#39;)
e_name.text &#61; "hahahah"
etree.write(&#39;v06.xml&#39;)

推荐阅读
  • 使用nodejs爬取b站番剧数据,计算最佳追番推荐
    本文介绍了如何使用nodejs爬取b站番剧数据,并通过计算得出最佳追番推荐。通过调用相关接口获取番剧数据和评分数据,以及使用相应的算法进行计算。该方法可以帮助用户找到适合自己的番剧进行观看。 ... [详细]
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • React基础篇一 - JSX语法扩展与使用
    本文介绍了React基础篇一中的JSX语法扩展与使用。JSX是一种JavaScript的语法扩展,用于描述React中的用户界面。文章详细介绍了在JSX中使用表达式的方法,并给出了一个示例代码。最后,提到了JSX在编译后会被转化为普通的JavaScript对象。 ... [详细]
  • Android实战——jsoup实现网络爬虫,糗事百科项目的起步
    本文介绍了Android实战中使用jsoup实现网络爬虫的方法,以糗事百科项目为例。对于初学者来说,数据源的缺乏是做项目的最大烦恼之一。本文讲述了如何使用网络爬虫获取数据,并以糗事百科作为练手项目。同时,提到了使用jsoup需要结合前端基础知识,以及如果学过JS的话可以更轻松地使用该框架。 ... [详细]
  • Commit1ced2a7433ea8937a1b260ea65d708f32ca7c95eintroduceda+Clonetraitboundtom ... [详细]
  • 目录实现效果:实现环境实现方法一:基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]
  • 本文介绍了Redis的基础数据结构string的应用场景,并以面试的形式进行问答讲解,帮助读者更好地理解和应用Redis。同时,描述了一位面试者的心理状态和面试官的行为。 ... [详细]
  • 阿,里,云,物,联网,net,core,客户端,czgl,aliiotclient, ... [详细]
  • 使用在线工具jsonschema2pojo根据json生成java对象
    本文介绍了使用在线工具jsonschema2pojo根据json生成java对象的方法。通过该工具,用户只需将json字符串复制到输入框中,即可自动将其转换成java对象。该工具还能解析列表式的json数据,并将嵌套在内层的对象也解析出来。本文以请求github的api为例,展示了使用该工具的步骤和效果。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 本文介绍了Android 7的学习笔记总结,包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容,并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同,否则会出现问题。 ... [详细]
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
  • Whatsthedifferencebetweento_aandto_ary?to_a和to_ary有什么区别? ... [详细]
author-avatar
手机用户2502940275
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有