web-dev-qa-db-ja.com

Serialize Python辞書からXMLへ

PythonオブジェクトをJSONに簡単にシリアル化する "simplejson"という名前の単純なJSONシリアル化モジュールがあります。

XMLにシリアル化できる同様のモジュールを探しています。

62
zinovii
14
S.Lott

huTools.structured.dict2xml があり、simplejsonと互換性があります。ネストされたサブ構造をラップする方法のヒントを与えることができます。 huTools.structured.dict2et のドキュメントを確認してください。これは、文字列がdict2xmlによって返された場合、代わりにElementTreeオブジェクトを返します。

>>> data = {"kommiauftragsnr":2103839, "anliefertermin":"2009-11-25", "prioritaet": 7,
... "ort": u"Hücksenwagen",
... "positionen": [{"menge": 12, "artnr": "14640/XL", "posnr": 1},],
... "versandeinweisungen": [{"guid": "2103839-XalE", "bezeichner": "avisierung48h",
...                          "anweisung": "48h vor Anlieferung unter 0900-LOGISTIK avisieren"},
... ]}

>>> print ET.tostring(dict2et(data, 'kommiauftrag',
... listnames={'positionen': 'position', 'versandeinweisungen': 'versandeinweisung'}))
'''<kommiauftrag>
<anliefertermin>2009-11-25</anliefertermin>
<positionen>
    <position>
        <posnr>1</posnr>
        <menge>12</menge>
        <artnr>14640/XL</artnr>
    </position>
</positionen>
<ort>H&#xC3;&#xBC;cksenwagen</ort>
<versandeinweisungen>
    <versandeinweisung>
        <bezeichner>avisierung48h</bezeichner>
        <anweisung>48h vor Anlieferung unter 0900-LOGISTIK avisieren</anweisung>
        <guid>2103839-XalE</guid>
    </versandeinweisung>
</versandeinweisungen>
<prioritaet>7</prioritaet>
<kommiauftragsnr>2103839</kommiauftragsnr>
</kommiauftrag>'''
18
max

これを試してください。私は属性を使用しない唯一の問題(私はそれらが好きではないため)
pynuggets.wordpress.comのdict2xml
activestateのdict2xml

from xml.dom.minidom import Document
import copy

class dict2xml(object):
    doc     = Document()

    def __init__(self, structure):
        if len(structure) == 1:
            rootName    = str(structure.keys()[0])
            self.root   = self.doc.createElement(rootName)

            self.doc.appendChild(self.root)
            self.build(self.root, structure[rootName])

    def build(self, father, structure):
        if type(structure) == dict:
            for k in structure:
                tag = self.doc.createElement(k)
                father.appendChild(tag)
                self.build(tag, structure[k])

        Elif type(structure) == list:
            grandFather = father.parentNode
            tagName     = father.tagName
            grandFather.removeChild(father)
            for l in structure:
                tag = self.doc.createElement(tagName)
                self.build(tag, l)
                grandFather.appendChild(tag)

        else:
            data    = str(structure)
            tag     = self.doc.createTextNode(data)
            father.appendChild(tag)

    def display(self):
        print self.doc.toprettyxml(indent="  ")

if __== '__main__':
    example = {'auftrag':{"kommiauftragsnr":2103839, "anliefertermin":"2009-11-25", "prioritaet": 7,"ort": u"Huecksenwagen","positionen": [{"menge": 12, "artnr": "14640/XL", "posnr": 1},],"versandeinweisungen": [{"guid": "2103839-XalE", "bezeichner": "avisierung48h","anweisung": "48h vor Anlieferung unter 0900-LOGISTIK avisieren"},]}}
    xml = dict2xml(example)
    xml.display()
11
nuggetier

辞書をxmlにシリアル化する単純な関数を作成しました(30行未満)。

使用法:

mydict = {
    'name': 'The Andersson\'s',
    'size': 4,
    'children': {
        'total-age': 62,
        'child': [
            {
                'name': 'Tom',
                'sex': 'male',
            },
            {
                'name': 'Betty',
                'sex': 'female',
            }
        ]
    },
}
print(dict2xml(mydict, 'family'))

結果:

<family name="The Andersson's" size="4">
        <children total-age="62">
                <child name="Tom" sex="male"/>
                <child name="Betty" sex="female"/>
        </children>
</family>

完全なソース(例を含む)は https://Gist.github.com/reimund/5435343/ にあります。

注:この関数は、辞書ノードをテキストノードではなく属性としてシリアライズします。テキストをサポートするように変更するのは非常に簡単です。

9
Reimund

Pythonのほとんどのオブジェクトは、下の辞書として表されます。

>>> class Fred(object) : 
...    def __init__(self, n) : self.n = n 
... 
>>> a = Fred(100)
>>> print a.__dict__ 
{'n': 100}

したがって、これは辞書をXMLに変換する方法を尋ねることに似ています。 dictからXMLへ/からXMLに変換するためのツールがあります:

http://www.picklingtools.com

以下に簡単な例を示します。

    >>> import xmltools

    >>> d = {'a':1, 'b':2.2, 'c':'three' }
    >>> xx = xmltools.WriteToXMLString(d)
    >>> print xx
    <?xml version="1.0" encoding="UTF-8"?>
    <top>
      <a>1</a>
      <b>2.2</b>
      <c>three</c>
    </top>

Webサイトには、例を示す多くのドキュメントがあります。

XMLツールマニュアル

辞書とXMLの間で「正確に」変換することは困難です。リストとは何ですか?属性で何をしますか?数値キーはどのように処理しますか?これらの問題の多くは対処されており、XMLツールのドキュメント(上記)で説明されています。

あなたにとって速度は重要ですか?または、使いやすさが重要ですか?純粋なC++モジュール(すべてC++で記述)、純粋なPythonモジュール(すべてPythonで記述)、およびPython C拡張モジュール(記述C++ではありますが、ラップされていますPython呼び出すことができます)。C++およびPython C拡張モジュールは数桁高速ですが、もちろんコンパイルが必要ですPythonモジュールは動作するはずですが、遅いです:

2
rts1