web-dev-qa-db-ja.com

Pascal voc xmlで画像に注釈を付ける

長方形の境界ボックスで画像に注釈を付けるツールが必要です。出力はPascal voc xml形式になります。注釈と画像は、オブジェクト検出を行うために畳み込みニューラルネットで使用されるトレーニングデータセットの一部になります。手動で画像に注釈を付けます。

以下のツールを検討しましたが、Pascal-vocをサポートしていません。

LabelmeSlothPilabNo name

時間を節約できる注釈ツールはありますか?

9
gobob

このpythonコードスニペットは、Sloth jsonをPascal voc xmlに変換します。

  def make_anno():
    zind = 0
    for z in data:
        print zind
        filename = data[zind]["filename"]
        print filename
        head, tail = os.path.split(filename)
        basename, file_extension = os.path.splitext(tail)    
        f = open(basename + '.xml','w') 
        line = "<annotation>" + '\n'
        f.write(line)
        line = '\t\t<folder>' + "folder" + '</folder>' + '\n'
        f.write(line)
        line = '\t\t<filename>' + tail + '</filename>' + '\n'
        f.write(line)
        line = '\t\t<source>\n\t\t<database>Source</database>\n\t</source>\n'
        f.write(line)
        im=Image.open('/home/location/VOCdevkit/newdataset/img/' + tail)
        (width, height) = im.size
        line = '\t<size>\n\t\t<width>'+ str(width) + '</width>\n\t\t<height>' + str(height) + '</height>\n\t'
        line += '\t<depth>Unspecified</depth>\n\t</size>'
        f.write(line)
        line = '\n\t<segmented>Unspecified</segmented>'
        f.write(line)
        ind = 0
        for i in data[zind]["annotations"]:
            line = '\n\t<object>'
            line += '\n\t\t<name>Name</name>\n\t\t<pose>Unspecified</pose>'
            line += '\n\t\t<truncated>Unspecified</truncated>\n\t\t<difficult>Unspecified</difficult>'
            xmin = (data[zind]["annotations"][ind]["x"])
            line += '\n\t\t<bndbox>\n\t\t\t<xmin>' + str(xmin) + '</xmin>'
            ymin = (data[zind]["annotations"][ind]["y"])
            line += '\n\t\t\t<ymin>' + str(ymin) + '</ymin>'
            width = (data[zind]["annotations"][ind]["width"])
            height = (data[zind]["annotations"][ind]["height"])
            xmax = xmin + width
            ymax = ymin + height
            line += '\n\t\t\t<xmax>' + str(xmax) + '</xmax>'
            line += '\n\t\t\t<ymax>' + str(ymax) + '</ymax>'
            line += '\n\t\t</bndbox>'
            line += '\n\t</object>'     
            f.write(line)
            ind +=1
            f.close()
        zind +=1
7
gobob

私のgithubを参照してください: https://github.com/tzutalin/ImageNet_Utils

画像に注釈を付ける方法: https://www.youtube.com/watch?v=p0nR2YsCY_

9
tzatalin

希望するフォーマットを出力するツールがないようです。 xmlを別の形式で出力するツールを使用して、それを変換することができます。理想的ではありませんが、おそらく機能します。

たとえば、xsltをビルドして、ツールのxml出力をPascal VOC xml標準に変換できます。

2
RobAu