国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Java > 正文

java中使用sax解析xml的解決方法

2019-11-26 16:08:34
字體:
供稿:網(wǎng)友

在java中,原生解析xml文檔的方式有兩種,分別是:Dom解析和Sax解析

Dom解析功能強(qiáng)大,可增刪改查,操作時(shí)會(huì)將xml文檔以文檔對象的方式讀取到內(nèi)存中,因此適用于小文檔

Sax解析是從頭到尾逐行逐個(gè)元素讀取內(nèi)容,修改較為不便,但適用于只讀的大文檔

本文主要講解Sax解析,其余放在后面

Sax采用事件驅(qū)動(dòng)的方式解析文檔。簡單點(diǎn)說,如同在電影院看電影一樣,從頭到尾看一遍就完了,不能回退(Dom可來來回回讀取)

在看電影的過程中,每遇到一個(gè)情節(jié),一段淚水,一次擦肩,你都會(huì)調(diào)動(dòng)大腦和神經(jīng)去接收或處理這些信息

同樣,在Sax的解析過程中,讀取到文檔開頭、結(jié)尾,元素的開頭和結(jié)尾都會(huì)觸發(fā)一些回調(diào)方法,你可以在這些回調(diào)方法中進(jìn)行相應(yīng)事件處理

這四個(gè)方法是:startDocument() 、 endDocument()、 startElement()、 endElement

此外,光讀取到節(jié)點(diǎn)處是不夠的,我們還需要characters()方法來仔細(xì)處理元素內(nèi)包含的內(nèi)容

將這些回調(diào)方法集合起來,便形成了一個(gè)類,這個(gè)類也就是我們需要的觸發(fā)器

一般從Main方法中讀取文檔,卻在觸發(fā)器中處理文檔,這就是所謂的事件驅(qū)動(dòng)解析方法

如上圖,在觸發(fā)器中,首先開始讀取文檔,然后開始逐個(gè)解析元素,每個(gè)元素中的內(nèi)容會(huì)返回到characters()方法

接著結(jié)束元素讀取,所有元素讀取完后,結(jié)束文檔解析

現(xiàn)在我們開始創(chuàng)建觸發(fā)器這個(gè)類,要?jiǎng)?chuàng)建這個(gè)類首先需要繼承DefaultHandler

創(chuàng)建SaxHandler,并覆寫相應(yīng)方法:

復(fù)制代碼 代碼如下:

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

 
public class SaxHandler extends DefaultHandler {

    /* 此方法有三個(gè)參數(shù)
       arg0是傳回來的字符數(shù)組,其包含元素內(nèi)容
       arg1和arg2分別是數(shù)組的開始位置和結(jié)束位置 */
    @Override
    public void characters(char[] arg0, int arg1, int arg2) throws SAXException {
        String content = new String(arg0, arg1, arg2);
        System.out.println(content);
        super.characters(arg0, arg1, arg2);
    }

    @Override
    public void endDocument() throws SAXException {
        System.out.println("/n…………結(jié)束解析文檔…………");
        super.endDocument();
    }

    /* arg0是名稱空間
       arg1是包含名稱空間的標(biāo)簽,如果沒有名稱空間,則為空
       arg2是不包含名稱空間的標(biāo)簽 */
    @Override
    public void endElement(String arg0, String arg1, String arg2)
            throws SAXException {
        System.out.println("結(jié)束解析元素  " + arg2);
        super.endElement(arg0, arg1, arg2);
    }

    @Override
    public void startDocument() throws SAXException {
        System.out.println("…………開始解析文檔…………/n");
        super.startDocument();
    }

    /*arg0是名稱空間
      arg1是包含名稱空間的標(biāo)簽,如果沒有名稱空間,則為空
      arg2是不包含名稱空間的標(biāo)簽
      arg3很明顯是屬性的集合 */
    @Override
    public void startElement(String arg0, String arg1, String arg2,
            Attributes arg3) throws SAXException {
        System.out.println("開始解析元素 " + arg2);
        if (arg3 != null) {
            for (int i = 0; i < arg3.getLength(); i++) {
                 // getQName()是獲取屬性名稱,
                System.out.print(arg3.getQName(i) + "=/"" + arg3.getValue(i) + "/"");
            }
        }
        System.out.print(arg2 + ":");
        super.startElement(arg0, arg1, arg2, arg3);
    }
}

XML文檔:
復(fù)制代碼 代碼如下:

<?xml version="1.0" encoding="UTF-8"?> 
<books> 
   <book id="001"> 
      <title>Harry Potter</title> 
      <author>J K. Rowling</author> 
   </book> 
   <book id="002"> 
      <title>Learning XML</title> 
      <author>Erik T. Ray</author> 
   </book> 
</books>

TestDemo測試類:
復(fù)制代碼 代碼如下:

import java.io.File;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

 
public class TestDemo {

    public static void main(String[] args) throws Exception {
        // 1.實(shí)例化SAXParserFactory對象
        SAXParserFactory factory = SAXParserFactory.newInstance();
        // 2.創(chuàng)建解析器
        SAXParser parser = factory.newSAXParser();
        // 3.獲取需要解析的文檔,生成解析器,最后解析文檔
        File f = new File("books.xml");
        SaxHandler dh = new SaxHandler();
        parser.parse(f, dh);
    }
}

輸出結(jié)果:
復(fù)制代碼 代碼如下:

…………開始解析文檔…………

開始解析元素 books
books: 

開始解析元素 book
id="001"book: 

開始解析元素 title
title:Harry Potter
結(jié)束解析元素  title

       
開始解析元素 author
author:J K. Rowling
結(jié)束解析元素  author

    
結(jié)束解析元素  book

    
開始解析元素 book
id="002"book: 

開始解析元素 title
title:Learning XML
結(jié)束解析元素  title

       
開始解析元素 author
author:Erik T. Ray
結(jié)束解析元素  author

    
結(jié)束解析元素  book

 
結(jié)束解析元素  books

…………結(jié)束解析文檔…………

上面的雖然正確顯示了執(zhí)行流程,但是輸出卻很亂

為了更加清晰的執(zhí)行此流程,我們還可以重寫SaxHandler,使其將原先的xml文檔還原一遍

重寫的SaxHandler類:

復(fù)制代碼 代碼如下:

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

 
public class SaxHandler extends DefaultHandler {

    @Override
    public void characters(char[] arg0, int arg1, int arg2) throws SAXException {
        System.out.print(new String(arg0, arg1, arg2));
        super.characters(arg0, arg1, arg2);
    }

    @Override
    public void endDocument() throws SAXException {
        System.out.println("/n結(jié)束解析");
        super.endDocument();
    }

    @Override
    public void endElement(String arg0, String arg1, String arg2)
            throws SAXException {
        System.out.print("</");
        System.out.print(arg2);
        System.out.print(">");
        super.endElement(arg0, arg1, arg2);
    }

    @Override
    public void startDocument() throws SAXException {
        System.out.println("開始解析");
        String s = "<?xml version=/"1.0/" encoding=/"UTF-8/"?>";
        System.out.println(s);
        super.startDocument();
    }

    @Override
    public void startElement(String arg0, String arg1, String arg2,
            Attributes arg3) throws SAXException {

        System.out.print("<");
        System.out.print(arg2);

        if (arg3 != null) {
            for (int i = 0; i < arg3.getLength(); i++) {
                System.out.print(" " + arg3.getQName(i) + "=/"" + arg3.getValue(i) + "/"");
            }
        }
        System.out.print(">");
        super.startElement(arg0, arg1, arg2, arg3);
    }

}

執(zhí)行結(jié)果:

現(xiàn)在看起來好多了,將其還原更能充分說明其解析流程

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 大英县| 肇庆市| 青河县| 东乌珠穆沁旗| 平邑县| 高雄市| 新田县| 宁明县| 桓仁| 神池县| 中牟县| 中山市| 原平市| 建阳市| 宾阳县| 南昌县| 肃北| 曲松县| 上林县| 巴林左旗| 营口市| 揭东县| 松潘县| 丰县| 读书| 泰顺县| 屏山县| 土默特左旗| 门头沟区| 肥城市| 绥滨县| 泽州县| 四子王旗| 宿迁市| 兴隆县| 高雄县| 宜城市| 富平县| 浪卡子县| 武乡县| 曲阳县|