Java SAX解析器
SAX(针对XML的简单API)是基于事件为XML文档的解析器。不像DOM解析器,SAX解析器创建没有解析树。 SAX是一个流接口用于XML的,这意味着使用SAX应用接收事件通知有关XML文档被处理的元素,属性,在按顺序每次开始在文档的顶部,并与所述闭合结束根元素。
-
读取XML文件从上到下,构成一个结构完整的XML文档的标记
-
令牌以相同的顺序进行处理,它们出现在文档中
-
报告应用程序,因为它们所出现解析器遇到标记的特性
-
应用程序提供了必须的解析器注册的“事件”处理程序
-
作为标记标识,在处理程序回调方法相关信息调用
什么时候使用?
应该使用SAX解析器的时候:
-
可以在XML文档从上往下处理以线性方式
-
该文件并不深层次嵌套
-
处理一个非常大的XML文档,DOM树会占用太多的内存。典型DOM的实现使用10字节的存储器以表示XML的一个字节
-
解决的问题涉及的XML文档的一部分
-
数据是可用的,只要它是由解析器看出,这样的SAX可以很好地用于到达流的XML文档
SAX的缺点
-
它是在一个只进入处理随机访问方式XML文档
-
如果需要跟踪的数据分析器已经看到或更改项目的顺序,必须自已编写代码和数据存储
ContentHandler接口
此接口指定SAX解析器用来通知XML文档,已经看到部件应用程序的回调方法。
-
void startDocument() - 调用在一个文件的开头。
-
void endDocument() - 调用在一个文件的末尾。
-
void startElement(String uri, String localName, String qName, Attributes atts) - 调用在一个元素的开头。
-
void endElement(String uri, String localName,String qName) - 调用在一个元件的末端。
-
void characters(char[] ch, int start, int length) - 字符数据出现时调用。
-
void ignorableWhitespace( char[] ch, int start, int length) - 当DTD是当前和忽略空白遇到时调用。
-
void processingInstruction(String target, String data) - 当处理指令的认可时调用。
-
void setDocumentLocator(Locator locator)) - 提供可用于识别文档中的位置的定位器。
-
void skippedEntity(String name) - 一个尚未解决实体遇到时调用。
-
void startPrefixMapping(String prefix, String uri) - 当一个新的命名空间的映射定义调用。
-
void endPrefixMapping(String prefix) - 当一个命名空间定义结束其范围时调用。
属性接口
这种接口指定用于处理连接到一个元素的属性的方法。
-
int getLength() - 返回属性的数目。
-
String getQName(int index)
-
String getValue(int index)
-
String getValue(String qname)