CVPR 最終日
今日のワークショップで最後。プログラムをはじめ見た時には、やはり組み込み機器を扱っているからには、Workshop on Embedded Computer Vision を見るべきでしょうと思いましたが、考えなおしてBeyond Patches Workshop: Patches Everywhere。やはりパラレルなので、Embedded...の方がどうだったか分りませんが、正解だったような気がします。
人によって使う用語が多少違うのは、どの分野でもありがちですが、Patchというのはイメージの部分領域のことで、Segmentって言ってみたり、Regionって言ってみたり、Blobって言ってみたりしてるような気がします。何か違うのかな?
Session 1
Using Multiple Patches for 3D Object Recognition
[Andrea Selinger Salgian]
Extraction of 3D Transform and Scale Invariant Patches from Range Scans
[Erdem Akag�nd�z, İlkay Ulusoy]
Invariant Features of Local Textures - A Rotation Invariant Local Texture Descriptor
[Pranam Janney, Zhenghua Yuji]
Session 2
The Effective Resolution of Correlation Filters Applied to Natural Scenes
[Michel Vidal-Naquet, Manabu Tanifuji]
Modelling Objects using Distribution and Topology of Multiscale Region Pairs
[Himanshu Arora, Narendra Ahuja]
Unsupervised Learning of Hierarchical Semantics of Objects (hSOs)
[Devi Parikh, Tsuhan Chen]
CMUの人の発表。Hierachical Semantics of ObjectsをUnsupervied Learning。例えば、オフィス風景の写真の中にコンピュータが写っている場合、コンピュータをコンピュータと認識する他に、モニタ、キーボード、マウス等、構成要素を認識することもできる。これらのオブジェクトは、画像の中に同時に出現する確率は非常に高いし、各々のオブジェクトの相対的な位置関係もたいがい決まっている。こういった知識を、オブジェクト認識に使用する研究は過去にもあるが、この研究はオブジェクト認識ではなく、あるシーンを特徴づけるhSOを学習することにある。
Adaptive Patch Features for Object Class Recognition with Learned Hierarchical Models
[Fabien Scalzo, Justus Piater]
Plenary Speaker: Cordelia Schmid (INRIA, France)
1つのワークショップの中にも、何人ものプレゼンターがいて、Patchのワークショップの中でも、非常に人気があった(参加人数が多かった)のは、INRIAのCordelia Schmidの講演。
INRIAにおけるComputer Visionのトピックを幾つかピックアップして解説してくれましたが、PAS(Pais of Adjacent Segment)がどこかで役立つかも(ちなみに、これは、Vittorio Ferrariの研究)。
目標としては、イメージの中に存在するあるオブジェクトのローカライゼーションを行いたいのですが、そのオブジェクト(カテゴリ)は、サイズ、方向などか異なるし、バリエーションもある。例としては、マグカップがプレゼン中に使用されていましたが、確かに撮影された方向、サイズ、バリエーションなどが違うものばかり。与えられたトレーニングデータには、Bounding boxとしてマグカップのあるエリアが示されているが、オブジェクトの形状を示したものではなく、矩形のエリアだけ。そこから各々エッジを検出し、さらに各々のトレーニングデータから、オブジェクトの形状をするのに適当なエンコードデータを作る。そこがポイントですが、テクニカルな詳細は把握してません。評価実験では、単純な線で書いた、白鳥、ボトル、アップルのロゴマーク等を使って、対応するオブジェクトのローカライズに成功している。これを応用すれば、手がきスケッチで、画像検索ができるんじゃない?
Session 3
Complex Salient Regions for Computer Vision Problems
[Sergio Escalera, Oriol Pujol, Petia Radeva]
Patch-based Image Correlation with Rapid Filtering
[Guodong Guo, Charles Dyer]
Toward A Discriminative Codebook: Codeword Selection across Multi-resolution
[Lei Wang]
Scene Classification Using Bag-of-Regions Representations
[Demir G�kalp, Selim Aksoy]