web-dev-qa-db-ja.com

Java DOMでXMLから要素名を取得

要素名を取得してXMLでデータを印刷したいが、特定の要素の下でデータを取得する方法がわからない。

これがXMLサンプルと私のコードです。

   <mdb>
    <movies>
    <movie id="godfather">
      <title>The Godfather</title>
      <year>1972</year>
      <directors>
        <director idref="francisfordcoppola"/>
      </directors>
      <genres>
        <genre>Crime</genre>
        <genre>Drama</genre>
      </genres>
       <cast>
        <performer>
          <actor idref="marlonbrando"/>
          <role>Don Vito Corleone</role>
        </performer>
     </cast>
    </movie>
    </movies>

    <performer id="kimnovak">
      <name>Marilyn Pauline Novak</name>
      <dob>1933-02-13</dob>
      <pob>Chicago, Illinois, USA</pob>
      <actedin>
        <movie idref="vertigo"/>
      </actedin>
    </performer>
    </mdb>



try {
        File fXmlFile = new File(filename);
        DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
        DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
        Document doc = dBuilder.parse(fXmlFile);

        NodeList nodes = doc.getElementsByTagName("movie");
         System.out.println("nodes length"+ nodes.getLength());
        for (int i = 0; i < nodes.getLength(); i++){
            Element element = (Element) nodes.item(i);
            NodeList name = element.getElementsByTagName("title");
            Element line = (Element) name.item(0);
            System.out.println(": " + line.getFirstChild().getTextContent());

ムービー内の要素のみを取得します。ただし、次のコードはパフォーマー内の<movie idref="vertigo"/>も読み取ります(コンテンツを取得する場合はNullpointer例外が発生します)。 DOMを使用してパフォーマンスの下の読み取りを回避する可能な方法があるかどうか疑問に思っていますか?

NodeList nodes = doc.getElementsByTagName("movie");

最初の映画の最終出力は次のようになります

('godfather', 'The Godfather', '1972', 'Crime;Drama')
13
Michael

これを行う1つの方法は、movieタグの代わりにmoviesタグから読み取りを開始することです。これがあなたが探しているものかどうかわからない!!。

NodeList nodes = doc.getElementsByTagName("movies");

Element element = (Element) nodes.item(0);
NodeList movieList = element.getElementsByTagName("movie");
for (int i = 0; i < movieList.getLength(); i++) {
    Element movieElement = (Element) movieList.item(i);
    System.out.println(movieElement.getAttributes().getNamedItem("id").getNodeValue());
    NodeList name = movieElement.getElementsByTagName("title");
    NodeList year = movieElement.getElementsByTagName("year");
    NodeList genres = movieElement.getElementsByTagName("genres");
    Element genreline = (Element) genres.item(0);

    System.out.println(name.item(0).getFirstChild().getTextContent());
    System.out.println(year.item(0).getFirstChild().getTextContent());
    System.out.println(genreline.getElementsByTagName("genre").item(0).getTextContent() 
               + ":" + genreline.getElementsByTagName("genre").item(1).getTextContent());
}

出力:

:ゴッドファーザー
: ゴッドファーザー
:1972
: 犯罪ドラマ

18
Ramadas

XPath を読むことをお勧めします。ここにいくつかの があります。

たとえば、映画の年を読むには、XPathを使用できます...

/mdb/movies/movie/year/text()
3
Andrew White

私は同じ問題を抱えていました、これは私の実装です、

public String getTagValue(org.w3c.dom.Document xmlDoc, String tagName) throws Exception {
        xmlDoc.getDocumentElement().normalize();

        NodeList nodeList = xmlDoc.getElementsByTagName(tagName);

        for (int temp = 0; temp < nodeList.getLength(); temp++) {
            Node nNode = nodeList.item(temp);
            if (nNode.getNodeType() == Node.ELEMENT_NODE) {
                org.w3c.dom.Element eElement = (org.w3c.dom.Element) nNode;
                return eElement.getFirstChild().getNodeValue();
            }
        }
        return "-1";
    }
0
tk_