XML解析方式分为两种:DOM方式和SAX方式
DOM:Document Object Model,文档对象模型。这种方式是W3C推荐的处理XML的一种方式。
SAX:Simple API for XML。这种方式不是官方标准,属于开源社区XML-DEV,几乎所有的XML解析器都支持它。
Dom解析
原理:DOM解析是把整个XML文档当成一个对象来处理,会先把整个文档读入到内存里,构造成DOM树,然后直接以树的形式来操作。
- //创建DOM解析器工厂
- DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
- //创建DOM解析器
- DocumentBuilder documentBuilder = factory.newDocumentBuilder();
- //解析XML文档,获得该XML文档对应的Document对象
- Document document = documentBuilder.parse(inputStream);
SAX解析
原理:SAX解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才会文档进行操作。
SAX 解析器采用了基于事件的模型,它在解析XML文档的时候可以触发一系列的事件
Start document
Start element (config)
Characters (whitespace)
Start element (server)
Characters (UNIX)
End element (server)
Characters (whitespace)
End element (config)
End document
发生相应事件时,将调用一个回调方法
这里的XMLContentHandler 继承 DefaultHandler
- //使用SAXParserFactory创建SAX解析工厂
- SAXParserFactory spf = SAXParserFactory.newInstance();
- //通过SAX解析工厂得到解析器对象
- SAXParser sp = spf.newSAXParser();
- //通过解析器对象解析xml文件
- xmlReader.parse("book.xml“,new XMLContentHandler());
- public class XMLContentHandler extends DefaultHandler {
- // 当前元素中的数据
- private String currentData;
- // 取得元素数据
- public void characters(char[] ch,int start,int length)
- throws SAXException {
- currentData = new String(ch,start,length);
- }
- // 在解析整个文档结束时调用
- public void endDocument() throws SAXException {
- System.out.println("结束文档");
- }
- // 在解析元素结束时调用
- public void endElement(String uri,String localName,String name)
- throws SAXException {
- System.out.println("节点数据 *************************" + this.currentData);
- System.out.println("结束元素 ************" + name);
- }
- // 在解析整个文档开始时调用
- public void startDocument() throws SAXException {
- System.out.println("开始文档");
- }
- // 在解析元素开始时调用
- public void startElement(String uri,String name,Attributes attributes) throws SAXException {
- System.out.println("开始元素 ************" + name);
- }
- }