web-dev-qa-db-ja.com

OpenCVと機械学習を使用した単純なオブジェクト検出

OpenCVを使用してオブジェクト検出器(この場合はボール)をコーディングする必要があります。問題は、Googleで検索を行うたびに、FACE DETECTIONを含む何かが返されることです。だから私はどこから始めて、何を使うかなどの助けが必要です。

いくつかの情報:

  • ボールの色は固定されておらず、おそらく白になりますが、変化する可能性があります。
  • 機械学習を使用する必要がありますが、複雑で信頼性の高いものである必要はありません。KNNをお勧めします(これは非常に簡単で簡単です)。
  • すべての検索の後、サンプルのボールのみの画像のヒストグラムを計算し、それをMLに教えることが有用であることがわかりましたが、ここでの私の主な懸念は、ボールのサイズが変化する可能性があることです(カメラからより近く)私が分類するためにMLに何を渡すかわからない、つまり..すべての可能なサイズ(たとえば、5x5からWxHまで)で画像のすべてのピクセルをテストすることはできません(またはできますか?) )そして肯定的な結果を見つけたいと思っています。
  • 人、ボールの後ろの布などのように、不均一な背景があるかもしれません。
  • 私が言ったように、私はMLアルゴリズムを使用する必要があります。つまり、HaarまたはViolaアルゴリズムは使用しません。
  • また、輪郭を使用してCanny'ed画像上の円を見つけることを考えました。輪郭をデータの行に変換してKNNを教える方法を見つける必要があります。

    だから...提案?

    前もって感謝します。 ;)

25
hfingler

基本的に、circlesを検出する必要があります。 cvHoughCircles()を見ましたか?使用を許可されていますか?

このページには、どのように OpenCVを使用してものを検出する についての良い情報があります。 セクション2.5 にもっと興味があるかもしれません。

これは、この写真のコインを検出するために作成した小さなデモです。うまくいけば、コードの一部をあなたの利益のために使うことができます。

入力: input img

出力: output opencv img

_// compiled with: g++ circles.cpp -o circles `pkg-config --cflags --libs opencv`
#include <stdio.h>
#include <cv.h>
#include <highgui.h>
#include <math.h>

int main(int argc, char** argv)
{
    IplImage* img = NULL;

    if ((img = cvLoadImage(argv[1]))== 0)
    {
        printf("cvLoadImage failed\n");
    }

    IplImage* gray = cvCreateImage(cvGetSize(img), IPL_DEPTH_8U, 1);
    CvMemStorage* storage = cvCreateMemStorage(0);

    cvCvtColor(img, gray, CV_BGR2GRAY);

    // This is done so as to prevent a lot of false circles from being detected
    cvSmooth(gray, gray, CV_GAUSSIAN, 7, 7);

    IplImage* canny = cvCreateImage(cvGetSize(img),IPL_DEPTH_8U,1);
    IplImage* rgbcanny = cvCreateImage(cvGetSize(img),IPL_DEPTH_8U,3);
    cvCanny(gray, canny, 50, 100, 3);

    CvSeq* circles = cvHoughCircles(gray, storage, CV_HOUGH_GRADIENT, 1, gray->height/3, 250, 100);
    cvCvtColor(canny, rgbcanny, CV_GRAY2BGR);

    for (size_t i = 0; i < circles->total; i++)
    {
         // round the floats to an int
         float* p = (float*)cvGetSeqElem(circles, i);
         cv::Point center(cvRound(p[0]), cvRound(p[1]));
         int radius = cvRound(p[2]);

         // draw the circle center
         cvCircle(rgbcanny, center, 3, CV_RGB(0,255,0), -1, 8, 0 );

         // draw the circle outline
         cvCircle(rgbcanny, center, radius+1, CV_RGB(0,0,255), 2, 8, 0 );

         printf("x: %d y: %d r: %d\n",center.x,center.y, radius);
    }


    cvNamedWindow("circles", 1);
    cvShowImage("circles", rgbcanny);

    cvSaveImage("out.png", rgbcanny);
    cvWaitKey(0);

    return 0;
}
_

円の検出は、cvHoughCircles()のパラメーターに大きく依存します。このデモでは、Cannyも使用したことに注意してください。

36
karlphillip