人、猫、犬などの特定のクラスのみを検出するYolo Darknet

Question

オブジェクトの検出にはYOLO Darknetを使用しています。 Python3、tensorflow 1.0、numpy、opencv 3を使用しています。検出にはyolo.weightを使用しています。以下のリンクに記載されているとおり： https://github.com/thtrieu/darkflow#cameravideo-file-demo

ビデオで実行すると、すべてのオブジェクトが同時に検出されますが、これは不要です。

検索対象の特定のクラス名のみを検出する方法についてご案内ください。

ありがとう

Bhavul · Accepted Answer

@JP Kimが述べた手順を実行すると、ラベルだけでビデオが出力されますが、他のオブジェクトもラベルの1つとして出力されます。

darkflowリポジトリの特定のセクションがあります異なる出力が必要な場合に何をするかを正確に示します。 TLDR-モデルを再トレーニングする必要があります。彼らは3つのクラスの例を取り上げてこれを示しています。

しかし、とにかくプロセスを順を追って説明しましょう。あなたがビデオを持っていて、その中のすべての人々を追跡する必要があるだけだと考えてみましょう。したがって、追跡する必要があるのは1種類のオブジェクト-「人物」のみです。

これは、darkflowリポジトリページにも記載されています。

Darkflowがtiny-yolo-voc.weightsをロードしていることを確認すると、cfg /フォルダーでtiny-yolo-voc.cfgを探し、その構成ファイルを--model cfg/tiny-yoloで設定した新しいファイルと比較します-voc-1c.cfg。この場合、最後の2つを除いてすべてのレイヤーのウェイトの正確な数は同じになるため、最後の2つまでのすべてのレイヤーにウェイトがロードされます。

これで、モデルをトレーニングできます。これをトレーニングするGPUがない場合は、_--gpu 0.9_の部分を削除できます。

_# Train the net on the Pascal dataset: flow --model cfg/tiny-yolo-voc-1c.cfg --load bin/tiny-yolo-voc.weights --train --dataset "~/VOCdevkit/VOC2007/JPEGImages" --annotation "~/VOCdevkit/VOC2007/Annotations" --gpu 0.9 _

損失が減少しなくなったと思われる場合は、Ctrl + Cを押してトレーニングを終了します。通常、適切な損失/平均損失は1以下です。

250ステップごとに、darkflowは_ckpt/_ディレクトリにチェックポイントを保存し続けることに注意してください。トレーニングを停止すると、これらのチェックポイントのいずれかを使用してモデルをテストできます。

人々のビデオでそれを実行し、境界ボックス予測で新しいビデオを保存します。この例では、1500番目のステップのチェックポイントを使用します。
```
_flow --model cfg/tiny-yolo-voc-1c.cfg --load 1500 --demo video-input.mp4 --gpu 0.9 --saveVideo _
```

これを実行すると、モデルがビデオを操作できるFPSが表示されます。これはマシンによって異なる場合があります。 FPSとビデオの長さによっては、これが完了するまでに時間がかかる場合があります。プロセスが完了すると、_video.avi_ディレクトリに_darkflow/_が作成されます。

これは、ビデオで検出されたpersonタイプのオブジェクトのみを持つ必要があります。

出力が適切でない場合は、モデルをさらにトレーニングしたり、しきい値やその他のパラメーターを変更して、より良い出力を得ることができます。

お役に立てれば。

JP Kim · Answer

私が見つけたものから、あなたは次のようにそれを行うことができます：

元のyolo cfgファイルを新しいファイルにコピーし、[region]セクションのクラスの値を、検出するクラスの数に編集します。
ラベルテキストファイルを作成し、検出するクラス名（元のクラスのサブセット）を入力します

その後、

flow --model cfg/your_new_copied_file.cfg --load path/to/weight_file --demo your_video.mp4 --labels your_labels.txt --saveVideo

それでおしまい。

しかし問題は、全体的な検出精度が大幅に低下することです。多くの場合、完全に異なるオブジェクトをラベル内のオブジェクトとして検出します。（おそらく、ダークフローがしきい値を超えている場合、ラベルの中で最も信頼できる推測を選択するだけですか？）

したがって、他のオブジェクトをスキップしながら（つまり、それらを認識し、スキップしながら）、他のクラスから一部のオブジェクトのみを検出する場合は、追加のパラメーター（--mark marklabels.txtなど）を受け入れるようにdarkflowソースを編集することをお勧めします。