web-dev-qa-db-ja.com

Python ElementTreeを使用して要素ツリーのすべてのサブ要素を取得する方法は?

ElementTree.getchildren()はPythonバージョン2.7で廃止されたため、getchildren()のように要素ツリーのすべてのサブ要素を取得する方法を見つけたい現在はまだ使用できますが、もう使用したくありません。

ありがとう。

13
j5shi

elemのすべてのサブエレメント(子孫):

all_descendants = list(elem.iter())

より完全な例:

>>> import xml.etree.ElementTree as ET
>>> a = ET.Element('a')
>>> b = ET.SubElement(a, 'b')
>>> c = ET.SubElement(a, 'c')
>>> d = ET.SubElement(a, 'd')
>>> e = ET.SubElement(b, 'e')
>>> f = ET.SubElement(d, 'f')
>>> g = ET.SubElement(d, 'g')
>>> [elem.tag for elem in a.iter()]
['a', 'b', 'e', 'c', 'd', 'f', 'g']

ルート自体を除外するには:

>>> [elem.tag for elem in a.iter() if elem is not a]
['b', 'e', 'c', 'd', 'f', 'g']
12
Eli Bendersky

すべての要素「a」を取得したい場合は、以下を使用できます。

a_lst = list(elem.iter('a'))

elemも 'a'の場合は、含まれます。

4
pepr

既存の答えのどれもすべての子供を見つけません。このソリューションは、ETreeの代わりにBeautifulSoupを使用しますが、トップレベルだけでなく、すべての子を見つけます。

from bs4 import BeautifulSoup    

with open(filename) as f:
    soup = BeautifulSoup(f, 'xml')

results = soup.find_all('element_name')
3

多分これはOPの実際の質問に対応していませんが、より広い意味で、誰かが特定の名前で名前が付けられたすべての要素を取得したい場合、たとえば'オブジェクト'が使用できます(@Turtles Are Cuteの代替アプローチは、少なくとも私にとってはより自然に思えます)。

objs = tree.findall('object')

これもリストを返します。

2
Eypros

pydocでは、ノードに対してlist()メソッドを使用して子要素を取得することが記載されています。
list(elem)

2
Harshal Zope