jaxp,属于javase中的一部分。是对xml进行解析的一个工具类;
既然说到这里,还是讲全一点,讲讲上面说到的xml的解析技术。
xml的一个标记型文档。
在html的层级结构中,它会在内存中分配一个树形结构,会把html中的标签,属性,文本等都封装成一个个对象:
列如:document对象,element对象,属性对象,文本对象,Node节点对象。为啥讲html了呢?因为在html中js使用dom解析标记型文档。当然html这次就不说了,咱们重点说一说xml中的解析方式及具体的解析过程
在xml中的解析技术中,主要有两种技术:dom和sax
那么这两种解析技术,有什么区别呢?
1.dom:
(1)解析原理:更加xml的层级结构,在内存中分配一个树形结构,把xml的标签,属性,文本都封装成一个个对象。
(2)优缺点:首先,因为对于它的解析方式,它会一次性把所有的层级结构全部解析,那么构造出来的树形结构都会全部加载在内存中,所以它如果面对大型的xml文档进行解析,就会出现OOM(内存溢出)现象。优点呢?也正是它的树形结构方式,所以开发中对于它的增删改查操作就比较容易了,它的优点也就是在此。
2.sax:
(1)解析原理:采用事件驱动方式,在读取的时候,一边解析。自上而下的,逐步解析,解析到某一个xml的标签或者属性或者文本等对象,然后就把对象名称返回。
(2)优缺点:优点呢,就是和dom相反,不会造成内存溢出。因为他的解析方式,自上而下。缺点呢,不能实现增删改操作。
这次先说dom解析过程:
DocumentBuilder:解析器类,
这个类是一个抽象类,所以不能构造对象,所以我们只有从它的具体实现类中寻找突破口
DocumentBuilderFactory中的newDocumentBuilder()方法获取
返回的是document是一个接口,父节点是Node。
那么在document中有些方法在我们等等要执行的增删改查操作,所以我们先声明一下。
1.得到标签,得到一个集合NodeList:getElementByTagName(String tagName)
2.创建一个标签:createElement(String tagName)
3.创建文本:createTextNode(String data)
4.在标签中添加文本:appendChild(Node newChild)
5.通过父节点删除节点:removeChild(Node oldChild)
6.获取父节点:getParentNode()
7.获取集合的长度:getLength()
8.获取下标具体的值:item(int index)
9.获取标签里面的内容:getTextContent()
===================================================
那么了解了初步的准备,我们准备一个具体的demo来,这样会更加形象的了解运用
首先定义一个xml文件:dog.xml
Tom
write
Jack
blue
创建一个类:TestJaxp
首先实现增:我们在dog1标签下面添加12
/**
*
* 1.创建解析器工厂
* 2.根据解析器工厂创建解析器
* 3.解析xml返回document
* 4.得到第一个dog1元素
* 5.创建age标签createElement
* 6.创建文本createTextNode
* 7.把文本添加到age下面appendChild()
* 8.把age添加到第一个dog1下面
*
* 9.回写xml
*/
public static void createTag() throws
ParserConfigurationException, SAXException,
IOException, TransformerException{
//创建解析器工厂
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
//创建解析器
DocumentBuilder db = dbf.newDocumentBuilder();
//解析xml返回document
Document document = db.parse("src/dog.xml");
//得到第一个dog1元素
Node dog1= document.getElementsByTagName("dog1").item(0);
//创建age标签
Node age1= document.createElement("age");
//创建文本
Text test1 = document.createTextNode("12");
//age1标签添加text1
age1.appendChild(test1);
//dog1添加age1
dog1.appendChild(sex1);
//回写xml
TransformerFactory tf = TransformerFactory.newInstance();
Transformer t = tf.newTransformer();
t.transform(new DOMSource(document), new StreamResult("src/dog.xml"));
}
实现删:我们把刚刚创建的age标签删除
思路:/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml,返回document
*
* 4、获取age元素
* 5、获取age的父节点
* 6、删除使用父节点删除 removeChild方法
*
* 7、回写xml
* */
public static void delectTag() throws Exception {
//创建解析器工厂
DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
//创建解析器
DocumentBuilder builder = builderFactory.newDocumentBuilder();
//得到document
Document document = builder.parse("src/dog.xml");
//得到age元素
Node age1= document.getElementsByTagName("age").item(0);
//得到age1父节点
Node dog1= age1.getParentNode();
//删除操作
dog1.removeChild(age1);
//回写xml
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult("src/dog.xml"));
}
实现改操作://修改第一个dog1下面的Tom为LiLi
思路:/*
* 1.创建解析器工厂
* 2.根据解析器工厂创建解析器
* 3.解析xml返回document
*
* 4.得到第一个name元素 item方法
*
* 5.修改name中的文本 setTextContent方法
*
* 6.回写xml
*
*/
public static void updateTextNode() throws TransformerException,
ParserConfigurationException, SAXException, IOException{
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document document = db.parse("src/dog.xml");
Node name1 = document.getElementsByTagName("name").item(0);
//System.out.println(name1);
name1.setTextContent("LiLi");
TransformerFactory tf = TransformerFactory.newInstance();
Transformer t = tf.newTransformer();
t.transform(new DOMSource(document), new StreamResult("src/dog.xml"));
}
实现查操作,查操作中,可以具体到查询某一个元素的值,也可遍历所以同一个元素名称的值
也可以将所有元素名称打印出来:
(1)那么我先查询某一个元素的值,查询第一个name下的值,输出到控制台
思路: /**
* 1.创建解析器工厂
* 2.根据解析器工厂创建解析器
* 3.解析xml返回document
* 4.得到第一个name元素
* 5.得到第一个name元素的值
*/
public static void selectSin() throws SAXException, IOException, ParserConfigurationException {
//创建工厂
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
//创建解析器
DocumentBuilder db = dbf.newDocumentBuilder();
//解析xml返回docuemnt
Document document = db.parse("src/dog.xml");
//得到第一个name元素
Node name1 = document.getElementsByTagName("name").item(0);//得到第一个name元素
//得到第一个name元素里面的值
String str1 = name1.getTextContent();
System.out.println(str1);
}
实现对所有name标签中的值查询只需要增加一个循环结构,就可以将所有的遍历出来
思路: /*
* 1.创建解析器工厂
* 2.根据解析器工厂创建解析器
* 3.解析xml返回document
*
* 4.得到所有的name元素
* 5.返回集合,遍历集合,得到每一个name元素
*
*/
private static void selectAll() throws ParserConfigurationException, SAXException, IOException {
/*
* 1.创建解析器工厂
* 2.根据解析器工厂创建解析器
* 3.解析xml返回document
*
* 4.得到所有的name元素
* 5.返回集合,遍历集合,得到每一个name元素
*
*/
//创建解析器工厂
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
//创建解析器
DocumentBuilder db = dbf.newDocumentBuilder();
//解析xml返回document
Document document = db.parse("src/dog.xml");
//得到name元素
NodeList list = document.getElementsByTagName("name");
//遍历集合
for (int i = 0; i Node name1 = list.item(i);//得到每一个name元素
//得到name元素里面的值
String str = name1.getTextContent();
System.out.println(str);
}
}
最后一个,遍历节点,把所有的元素名称都获取到,也可属于查的一部分吧:
思路:
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml,返回document
*
*
* ===递归实现
* 4.得到根节点(打印node.getNodeName())
* 5.得到根节点子节点
* 6.得到根节点子节点的子节点
*/
所以在这个方法里面需要先写一个递归输出的方法
//递归遍历的方法
private static void list1(Node node) {
//判断是元素的时候才打印
if (node.getNodeType() == node.ELEMENT_NODE) {
System.out.println(node.getNodeName());
}
NodeList list = node.getChildNodes();
//遍历list
for (int i = 0; i //得到每一个节点
Node node1 = list.item(i);
list1(node1);
}
}
public static void listElement() throws SAXException, IOException, ParserConfigurationException{
//创建解析器工厂
DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
//创建解析器
DocumentBuilder builder = builderFactory.newDocumentBuilder();
//得到document
Document document = builder.parse("src/dog.xml");
list1(document);
}
所以在xml中的DOM解析操作中,增删改查就这样了。