web-dev-qa-db-ja.com

XMLをCSVシェルコマンドラインに変換する

大きなXMLファイル(600MB)があり、ターミナルコマンドを使用してCSVに変換したいです。次の構文を使用して、xml2コマンドでXMLをTXTに変換しようとしました。

xml2 <BIG.xml> BIG.txt

私のXML Fromatは

<ReportDetails>
    <Date>08/08/2012</Date>
    <CaseNo>13030903</CaseNo>
    <UserDetailsText>Individual Details</UserDetailsText>
    <UserDetails>
        <UserId>0903</UserId>    
        <FirstName>John</FirstName>
        <Surname>Perry</Surname>
        <Occupation>Developer</Occupation>
        <DateofBirth>02/14/1981</DateofBirth>    
    </UserDetails>
    <ApplicationDetailsText>Conflict Resolution Details</ApplicationDetailsText>
    <ApplicationDetails>
        <ApplicationNo>13033</ApplicationNo>
        <ApplicationName>John Perry</ApplicationName>
        <Department>Information Technology</Department>
        <ApplicationType>Personal</ApplicationType>
        <ApplicationDate>06/07/2012</ApplicationDate>
        <ApplicationEndDate>09/07/2012</ApplicationEndDate>
        <ApplicationStatus>Closed</ApplicationStatus>    
     </ApplicationDetails>  
</ReportDetails>

CSVファイルのこれらのフィールドをパイプ(|)で区切って欲しい

日付| CaseNo | FirstName |姓|アプリケーションApplicationName | ApplicationDate |アプリケーションの状態

また、PHPファイルを介してファイルを実行する場合は、それを実行するためのシェルスクリプトが必要になります。

5
HardCode

XSLを使用して、必要な正確な形式への変換を実行します。例えば。、

<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" encoding="iso-8859-1"/>
<xsl:strip-space elements="*" />

<xsl:template match="/ReportDetails">
  <xsl:value-of select="Date"/><xsl:text>|</xsl:text>
  <xsl:value-of select="CaseNo"/><xsl:text>|</xsl:text>
  <xsl:apply-templates select="UserDetails" />
</xsl:template>

<xsl:template match="/ReportDetails/UserDetails">
  <xsl:value-of select="FirstName"/><xsl:text>|</xsl:text>
  <xsl:value-of select="Surname"/><xsl:text>|</xsl:text>
</xsl:template>

<!-- etc -->
</xsl:stylesheet>

次に、上記を指定します(たとえば、foo.xslで元のxmlドキュメントfoo.xmlを変換します):

$ xsltproc  foo.xsl  foo.xml 
08/08/2012|13030903|John|Perry|

(悪魔はxslの詳細にあります...これを実装する方法は多数あります...)

7
michael