web-dev-qa-db-ja.com

OpenCVを使用したHoG機能の抽出

OpenCVのHoG APIを使用して機能を抽出しようとしていますが、それを可能にするAPIが見つからないようです。

私がやろうとしているのは、HoGを使用してすべてのデータセット(ポジティブイメージとネガティブイメージのセット)からフィーチャを抽出し、独自のSVMをトレーニングすることです。

OpenCVでHoG.cppを覗いてみましたが、役に立ちませんでした。すべてのコードは複雑さの中に埋もれており、さまざまなハードウェアに対応する必要があります(例:IntelのIPP)

私の質問は:

  1. SVMにフィードされるすべての機能/記述子を抽出するために使用できるOpenCVのAPIはありますか?どうすればそれを使用して自分のSVMをトレーニングできますか?
  2. ない場合は、同じことを達成できる既存のライブラリがありますか?

これまでのところ、私は実際に既存のライブラリ(http://hogprocessing.altervista.org/)をProcessing(Java)からC++に移植していますが、まだ非常に遅く、検出には少なくとも16秒かかります

他の誰かがHoG機能の抽出に成功しましたが、どうやってそれを回避しましたか?そして、私が使用できるオープンソースコードはありますか?

前もって感謝します

38
sub_o

次のようにopencvでhogクラスを使用できます

HOGDescriptor hog;
vector<float> ders;
vector<Point> locs;

この関数はあなたのために豚の特徴を計算します

hog.compute(grayImg, ders, Size(32, 32), Size(0, 0), locs);

grayImgに対して計算されたHOG特徴は、dersベクトルに格納されてマトリックスになり、後でトレーニングに使用できます。

Mat Hogfeat(ders.size(), 1, CV_32FC1);

for(int i=0;i<ders.size();i++)
    Hogfeat.at<float>(i,0)=ders.at(i);

これで、HOG機能がHogfeatマトリックスに保存されます。

次のようにオブジェクトhogを使用して、ウィンドウサイズ、セルサイズ、ブロックサイズを設定することもできます。

hog.blockSize = 16;
hog.cellSize = 4;
hog.blockStride = 8;

// This is for comparing the HOG features of two images without using any SVM 
// (It is not an efficient way but useful when you want to compare only few or two images)
// Simple distance
// Consider you have two HOG feature vectors for two images Hogfeat1 and Hogfeat2 and those are same size.

double distance = 0;
for(int i = 0; i < Hogfeat.rows; i++)
    distance += abs(Hogfeat.at<float>(i, 0) - Hogfeat.at<float>(i, 0));

if (distance < Threshold)
    cout<<"Two images are of same class"<<endl;
else
    cout<<"Two images are of different class"<<endl;

それが有用であることを願っています:)

50
G453

GPUバージョンもここにあります。

cv::Mat temp;
gpu::GpuMat gpu_img, descriptors;

cv::gpu::HOGDescriptor gpu_hog(win_size, Size(16, 16), Size(8, 8), Size(8, 8), 9,
                               cv::gpu::HOGDescriptor::DEFAULT_WIN_SIGMA, 0.2, gamma_corr,
                               cv::gpu::HOGDescriptor::DEFAULT_NLEVELS);
gpu_img.upload(img);
gpu_hog.getDescriptors(gpu_img, win_stride, descriptors, cv::gpu::HOGDescriptor::DESCR_FORMAT_ROW_BY_ROW);
            descriptors.download(temp);
3
user3398689

上記の記事の助けと比較して、2つの豚の機能のプログラムも書きました。そして、このメソッドを適用して、ROI領域の変化をチェックします。こちらのページを参照してください。 ソースコードと簡単な紹介

3
Jeonghyun Kim

OpenCV 3では、GPUアルゴリズム(つまりCUDA)をユーザーが使用する方法にいくつかの変更が加えられています。 移行ガイド-CUDA を参照してください。

回答をuser3398689からOpenCV 3に更新するためのコードを次に示します。

#include <opencv2/core/cuda.hpp>
#include <opencv2/cudaimgproc.hpp>

[...]

/* Suppose you load an image in a cv::Mat variable called 'src' */

int img_width  = 320;
int img_height = 240;
int block_size = 16;
int bin_number = 9;

cv::Ptr<cv::cuda::HOG> cuda_hog = cuda::HOG::create(Size(img_width, img_height),
                                                    Size(block_size, block_size),
                                                    Size(block_size/2, block_size/2),
                                                    Size(block_size/2, block_size/2),
                                                    bin_number);

/* The following commands are optional: default values applies */
cuda_hog->setDescriptorFormat(cuda::HOG::DESCR_FORMAT_COL_BY_COL);
cuda_hog->setGammaCorrection(true);
cuda_hog->setWinStride(Size(img_width_, img_height_));

cv::cuda::GpuMat image;
cv::cuda::GpuMat descriptor;

image.upload(src);

/* May not apply to you */
/* CUDA HOG works with intensity (1 channel) or BGRA (4 channels) images */
/* The next function call convert a standard BGR image to BGRA using the GPU */
cv::cuda::GpuMat image_alpha;
cuda::cvtColor(image, image_alpha, COLOR_BGR2BGRA, 4);

cuda_hog->compute(image_alpha, descriptor);

cv::Mat dst;
image_alpha.download(dst);

その後、たとえばG453で提案されているように、「dst」変数で記述子を好きなように使用できます。

1
Claudio