web-dev-qa-db-ja.com

コンピュータビジョン、プロジェクトのアイデア?

私は学部生で、このプログラムの最後の年です。他のコンピューティングの学位と同様に、私はコンピューティングの対象となるトピックに関してプロジェクト(個人)を行う必要があります。コンピュータービジョン(正確には、オブジェクトの検出または追跡)の対象となる何かをしたい。このトピックに関する情報を検索していると、この種のプロジェクトを行った人がすでにたくさんいることがわかりました。私の質問は、ビデオ内のオブジェクトを追跡するようなプロジェクトを行う場合、独自のアルゴリズムを考え出す必要があるのか​​、それともすでに利用可能なアルゴリズムがあるのか​​ということです。 (私はJavaに精通していて、Pythonを少し始めました)

トピックを取り上げる際のガイドと、開始方法または開始場所に関するアイデアを教えてください。

9
peedarpk

私は大学院でコンピュータービジョンの基本コースを受講しました。最初のプロジェクトの1つは、一連の画像をシームレスな360度のパノラマにつなぎ合わせるシステムを実装することでした。

それは関係しました:

  1. (SIFT特徴抽出を使用して)個々の画像の識別特徴を検出し、
  2. 他の画像で最も一致する特徴(特徴の一致)、
  3. 写真を自動的に位置合わせする(ホモグラフィ推定)、
  4. それらのオーバーラップとカメラの相対位置を決定する(カメラポーズ推定)、
  5. 画像を円筒座標系に投影します(画像ワーピング)。
  6. そして最後に、結果の写真を1つのシームレスなパノラマにブレンドします(画像ブレンディング)。

このプロジェクトの課題は、高速な画像スティッチングを可能にするのに十分な効率のコードを作成することです。

あなたはプロジェクトであなたを助けるためにインターネット上でたくさんのリソースを見つけることができます。

6
nilay

本当にクールで面白いことをしたい場合は、ビデオで活動検出アルゴリズムを開発してみてください。たとえば、「車を離れる人」、「建物に入る人」などです。これは簡単な作業ではなく、UG論文としては十分に挑戦的です。 OpenCVなどのツールキットを使用して、アルゴリズムに焦点を合わせながら、ビデオ処理やオブジェクト検出などの基礎を築くことができます。

3
Mikos

多くのコンピュータビジョンと画像分析アルゴリズムがすでに存在しています。数年前に大学院で授業を受けたので面白かったので、大学の図書館や書店でこのトピックに関するテキストを探して、何が利用できるかをよく理解することをお勧めします。

このテクノロジーには実際のアプリケーションがあります。光学式文字認識(OCR)は、注目を集めているアプリケーションの1つです。

あなたは面白いトピックを選びました、楽しんでください! :)

1
Greg D
0
janmartin

以下は、興味深いと思われるコンピュータビジョンプロジェクトのアイデアの一部です。

  1. MNIST数字の多様体を学ぶ
  2. 画像検索のための視覚的な言葉
  3. ノンパラメトリッククラスタリングを使用した画像セグメンテーション
  4. CNNを使用したビデオ分類
  5. CNNとPCA埋め込みに基づく画像検索
  6. カルマンフィルター追跡
  7. スーパーピクセルに基づくビデオ圧縮
  8. ニューラルネットを使用した光学式文字認識
  9. 視覚的および意味論的埋め込み(画像のキャプションの生成)

ディープラーニングプロジェクトを開始するには、Theano/TensorFlowで実行されるKerasライブラリを多数のバックエンドとして使用することをお勧めします 。さらに、OpenCV tutorials が非常に役立つことがわかります。また、上記のいくつかのプロジェクトの実装は、次の github ページにあります。

0
Vadim Smolyakov