web-dev-qa-db-ja.com

画像処理の特徴記述子(アルゴリズムまたは説明)とは何ですか?

私はしばしば、画像の特徴の文脈における用語記述子の意味と混同されます。記述子はポイントのローカル近傍の記述(フロートベクトルなど)ですか、それとも記述子は記述を出力するアルゴリズムですか?また、特徴抽出器の出力は正確に何ですか?

私は長い間この質問を自問してきましたが、私が思いついた唯一の説明は、記述子がアルゴリズムと説明の両方であるということです。特徴点は、特徴的な点を検出するために使用されます。ただし、機能抽出プログラムは意味をなさないようです。

この誤解を明確にするのを手伝ってください。 THX!

21
Richard

特徴detectorは、画像を取得してlocations(つまり、画像内の重要な領域のピクセル座標)。この例として corner detector があります。これは、画像の角の位置を出力しますが、検出された特徴に関するその他の情報は表示しません。

フィーチャーdescriptorは、画像を取得してfeature descriptorsを出力するアルゴリズムです/機能ベクトル。特徴記述子は、興味深い情報を一連の数字にエンコードし、ある特徴を別の特徴と区別するために使用できる一種の数値「指紋」として機能します。理想的には、この情報は画像変換の下で不変であるため、画像が何らかの方法で変換された場合でも、再び特徴を見つけることができます。例として [〜#〜] sift [〜#〜] があります。これは、局所近傍画像勾配に関する情報を特徴ベクトルの数にエンコードします。あなたが読むことができる他の例は [〜#〜] hog [〜#〜][〜#〜] surf [〜#〜] です。


編集:フィーチャーディテクターに関しては、「ロケーション」にはフィーチャーのサイズまたはスケールを説明する数字も含まれる場合があります。これは、「ズームイン」したときに角のように見えるものが「ズームアウト」したときに角のように見えない場合があるため、スケール情報を指定することが重要だからです。したがって、「イメージスペース」内の場所として(x,y)ペアを使用する代わりに、「スケールスペース」内の場所としてトリプル(x,y,scale)を使用できます。

63
eigenchris