SAX是Simple API for Xml的简写,主要功能是用于对xml文档进行解析。由于该方式采用的是事件驱动(callback回调机制)解析方式,所以有速度快、占内存少的优点,当然这些优点也仅限于xml的读取操作,SAX是无法对读取的XML元素进行修改的。如果要修改节点元素则需要使用DOC方式进行将xml文件读取,它会将xml读取成document树结构对象,这样可用对节点元素进行编辑操作;DOC方式的缺点也比较明显:占内存大、解析速度较慢。
所以仅用于读取xml操作,使用SAX方式是比较好的方式。
创建一个解析的xml文件
<&#63;xml version="1.0" encoding="utf-8"&#63;>1001 张三 1002 李四
创建一个XMLparseHandler用于自定义xml解析
public class Customhandler extends DefaultHandler2 { List
创建SAX解析对象解析xml
public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException { //创建xml解析工厂 SAXParserFactory factory = SAXParserFactory.newInstance(); //创建xml解析对象 SAXParser parser = factory.newSAXParser(); File file = new File("test/custom/user.xml"); InputStream inputStream = new FileInputStream(file); Customhandler customhandler = new Customhandler(); //方式一 //parser.parse(inputStream, customhandler); //方式二 InputSource source = new InputSource(file.toURI().toURL().toString()); XMLReader xmlParser = parser.getXMLReader(); xmlParser.setContentHandler(customhandler); xmlParser.parse(source); List c = customhandler.list; inputStream.close(); } //打印结果为: 开始解析xml 开始解析元素:开始解析元素: 开始解析元素: 解析到元素值:1001 结束解析元素: 开始解析元素: 解析到元素值:张三 结束解析元素: 结束解析元素: 开始解析元素: 开始解析元素: 解析到元素值:1002 结束解析元素: 开始解析元素: 解析到元素值:李四 结束解析元素: 结束解析元素: 结束解析元素: 结束解析xml
在tomcat源码中,有一个Digester对象,这个Digester是tomcat启动时,初始化各个容器(service、engine、Connetor)的执行者,而Digester执行容器初始化的依据是解析配置文件server.xml的内容,根据xml的具体配置进行来初始化容器。
下面是Digester的类的一些主要方法:
//org.apache.tomcat.util.digester.Digester#parse(org.xml.sax.InputSource) public class Digester extends DefaultHandler2 { //读取解析xml public Object parse(InputSource input) throws IOException, SAXException { configure(); getXMLReader().parse(input); return root; } //对每个xml标签进行解析,并执行于之对应的Rule规则列表 public void startElement(String namespaceURI, String localName, String qName, Attributes list) throws SAXException { boolean debug = log.isDebugEnabled(); // Parse system properties list = updateAttributes(list); // Save the body text accumulated for our surrounding element bodyTexts.push(bodyText); bodyText = new StringBuilder(); // the actual element name is either in localName or qName, depending // on whether the parser is namespace aware String name = localName; if ((name == null) || (name.length() <1)) { name = qName; } // Compute the current matching rule StringBuilder sb = new StringBuilder(match); if (match.length() > 0) { sb.append('/'); } sb.append(name); //根据每次xml节点的名称拼接成匹配url match = sb.toString(); // Fire "begin" events for all relevant rules(根据namespaceURI匹配获取的Rule规则列表,有顺序规则) Listrules = getRules().match(namespaceURI, match); matches.push(rules); if ((rules != null) && (rules.size() > 0)) { for (Rule value : rules) { try { Rule rule = value; if (debug) { log.debug(" Fire begin() for " + rule); } //依次执行begin方法 rule.begin(namespaceURI, name, list); } catch (Exception e) { log.error("Begin event threw exception", e); throw createSAXException(e); } catch (Error e) { log.error("Begin event threw error", e); throw e; } } } else { if (debug) { log.debug(" No rules found matching '" + match + "'."); } } } }
与之对应的server.xml片段如下:
Digester读取到上面这些xml标签后,就会从外向里进行嵌套解析,将这些标签创建为与之对应的java类实例,也就是tomcat的主体容器结构。
以上就是Java使用SAX解析xml的示例的详细内容,更多关于Java使用SAX解析xml的资料请关注其它相关文章!