CVPR 最終日 - lonerの日記

今日のワークショップで最後。プログラムをはじめ見た時には、やはり組み込み機器を扱っているからには、Workshop on Embedded Computer Vision を見るべきでしょうと思いましたが、考えなおしてBeyond Patches Workshop: Patches Everywhere。やはりパラレルなので、Embedded...の方がどうだったか分りませんが、正解だったような気がします。
人によって使う用語が多少違うのは、どの分野でもありがちですが、Patchというのはイメージの部分領域のことで、Segmentって言ってみたり、Regionって言ってみたり、Blobって言ってみたりしてるような気がします。何か違うのかな？

Session 1

Using Multiple Patches for 3D Object Recognition

[Andrea Selinger Salgian]

Extraction of 3D Transform and Scale Invariant Patches from Range Scans

[Erdem Akag�nd�z, İlkay Ulusoy]

Invariant Features of Local Textures - A Rotation Invariant Local Texture Descriptor

[Pranam Janney, Zhenghua Yuji]

Session 2

The Effective Resolution of Correlation Filters Applied to Natural Scenes

[Michel Vidal-Naquet, Manabu Tanifuji]

Modelling Objects using Distribution and Topology of Multiscale Region Pairs

[Himanshu Arora, Narendra Ahuja]

Unsupervised Learning of Hierarchical Semantics of Objects (hSOs)

[Devi Parikh, Tsuhan Chen]
CMUの人の発表。Hierachical Semantics of ObjectsをUnsupervied Learning。例えば、オフィス風景の写真の中にコンピュータが写っている場合、コンピュータをコンピュータと認識する他に、モニタ、キーボード、マウス等、構成要素を認識することもできる。これらのオブジェクトは、画像の中に同時に出現する確率は非常に高いし、各々のオブジェクトの相対的な位置関係もたいがい決まっている。こういった知識を、オブジェクト認識に使用する研究は過去にもあるが、この研究はオブジェクト認識ではなく、あるシーンを特徴づけるhSOを学習することにある。

Adaptive Patch Features for Object Class Recognition with Learned Hierarchical Models

[Fabien Scalzo, Justus Piater]

Plenary Speaker: Cordelia Schmid (INRIA, France)

1つのワークショップの中にも、何人ものプレゼンターがいて、Patchのワークショップの中でも、非常に人気があった(参加人数が多かった)のは、INRIAのCordelia Schmidの講演。

INRIAにおけるComputer Visionのトピックを幾つかピックアップして解説してくれましたが、PAS(Pais of Adjacent Segment)がどこかで役立つかも(ちなみに、これは、Vittorio Ferrariの研究)。
目標としては、イメージの中に存在するあるオブジェクトのローカライゼーションを行いたいのですが、そのオブジェクト(カテゴリ)は、サイズ、方向などか異なるし、バリエーションもある。例としては、マグカップがプレゼン中に使用されていましたが、確かに撮影された方向、サイズ、バリエーションなどが違うものばかり。与えられたトレーニングデータには、Bounding boxとしてマグカップのあるエリアが示されているが、オブジェクトの形状を示したものではなく、矩形のエリアだけ。そこから各々エッジを検出し、さらに各々のトレーニングデータから、オブジェクトの形状をするのに適当なエンコードデータを作る。そこがポイントですが、テクニカルな詳細は把握してません。評価実験では、単純な線で書いた、白鳥、ボトル、アップルのロゴマーク等を使って、対応するオブジェクトのローカライズに成功している。これを応用すれば、手がきスケッチで、画像検索ができるんじゃない？

Session 3

Complex Salient Regions for Computer Vision Problems

[Sergio Escalera, Oriol Pujol, Petia Radeva]

Patch-based Image Correlation with Rapid Filtering

[Guodong Guo, Charles Dyer]

Toward A Discriminative Codebook: Codeword Selection across Multi-resolution

[Lei Wang]

Scene Classification Using Bag-of-Regions Representations

[Demir G�kalp, Selim Aksoy]