位置:首页 > Java技术 > Java XML在线教程 > Java SAX解析器

Java SAX解析器

SAX(针对XML的简单API)是基于事件为XML文档的解析器。不像DOM解析器,SAX解析器创建没有解析树。 SAX是一个流接口用于XML的,这意味着使用SAX应用接收事件通知有关XML文档被处理的元素,属性,在按顺序每次开始在文档的顶部,并与所述闭合结束根元素。

  • 读取XML文件从上到下,构成一个结构完整的XML文档的标记

  • 令牌以相同的顺序进行处理,它们出现在文档中

  • 报告应用程序,因为它们所出现解析器遇到标记的特性

  • 应用程序提供了必须的解析器注册的“事件”处理程序

  • 作为标记标识,在处理程序回调方法相关信息调用

什么时候使用?

应该使用SAX解析器的时候:

  • 可以在XML文档从上往下处理以线性方式

  • 该文件并不深层次嵌套

  • 处理一个非常大的XML文档,DOM树会占用太多的内存。典型DOM的实现使用10字节的存储器以表示XML的一个字节

  • 解决的问题涉及的XML文档的一部分

  • 数据是可用的,只要它是由解析器看出,这样的SAX可以很好地用于到达流的XML文档

SAX的缺点

  • 它是在一个只进入处理随机访问方式XML文档

  • 如果需要跟踪的数据分析器已经看到或更改项目的顺序,必须自已编写代码和数据存储

ContentHandler接口

此接口指定SAX解析器用来通知XML文档,已经看到部件应用程序的回调方法。

  • void startDocument() - 调用在一个文件的开头。

  • void endDocument() - 调用在一个文件的末尾。

  • void startElement(String uri, String localName, String qName, Attributes atts) - 调用在一个元素的开头。

  • void endElement(String uri, String localName,String qName) - 调用在一个元件的末端。

  • void characters(char[] ch, int start, int length) - 字符数据出现时调用。

  • void ignorableWhitespace( char[] ch, int start, int length) - 当DTD是当前和忽略空白遇到时调用。

  • void processingInstruction(String target, String data) - 当处理指令的认可时调用。

  • void setDocumentLocator(Locator locator)) - 提供可用于识别文档中的位置的定位器。

  • void skippedEntity(String name) - 一个尚未解决实体遇到时调用。

  • void startPrefixMapping(String prefix, String uri) - 当一个新的命名空间的映射定义调用。

  • void endPrefixMapping(String prefix) - 当一个命名空间定义结束其范围时调用。

属性接口

这种接口指定用于处理连接到一个元素的属性的方法。

  • int getLength() - 返回属性的数目。

  • String getQName(int index)

  • String getValue(int index)

  • String getValue(String qname)