CVPR 1日目

学会のスケジュールと、毎晩のように開かれるパーティのおかげで、日記の更新をサボっていましたが、忘れないうちにアップデートしていく予定。初日は、幾つかのShort Course/Workshopがパラレルで開催されました。メインのカンファレンスは、明日からなので、まだまだ人が少ないようです。初日の朝、レジストレーションを済ませると、会場に朝食が用意されていました。マフィンとかフルーツケーキのような甘いものばっかりですが、学会期間中無料でスタバのコーヒーが飲めるなんて幸せ。IEEEの学会って初めてなんですが、けっこう派手です。Tシャツが配られる学会なんて初めてです。

Short Course: Visual Search and Its Applications on Web

このShort Courseは、Riyaという、Visual Searchサービスを行っている会社の人による、様々なVisual Searchに関するレクチャー。まず、入力(クエリー)と出力(サーチ結果)を各々Text/Imageのケースで4つにSearchを分類し、既にサービスが開始されているGoogleとかYahooを軽く説明。その後、このレクチャーの主題である、クエリー/サーチ結果共に画像である検索サービスの利点などを説明する。探しているものの類似画像を与えることによる検索は、画像を与えるところが面倒で、不便なんじゃないかと思っていましたが、ケースによってはかゆい所に手が届き、Google Image Searchのようなテキストによるクエリーよりも効果的。Riyaは、この利点を活かす場所も既に発見したようで、like.comというショッピングサイトが実例として紹介されてました。

Short Course: Recognizing and Learning Object Categories: Year 2007

L. Fei-Fei (Princeton), R. Fergus(MIT), A. Torralba(MIT)の3人による、近年のオブジェクトカテゴリ認識のサーベイICCV2005のShort Courseでも似たようなレクチャーを同じメンバーでやったようですが、それ以後の成果も盛り込んだ2007年版。FeiFeiからは、テキスト分類の分野では知られている"bag of words"というモデルをオブジェクト認識へ適用するというアイディアについて紹介。基本的に、構造を無視して、画像を分割して得られる沢山の領域(の各々の特徴量)を、テキスト分類の際の単語に見立て、画像を分類する。3人の研究ともに言えることだが、基本的にフォアグラウンドにかなり大きく対象オブジェクトが存在していることを想定している。
"Bag of words"のように位置関係を無視するのはあんまりだ、位置関係をモデル化してオブジェクト認識をやろういうとうのがFergusの研究、Constallation/Star/K-Fan等、位置関係をモデル化する手法の紹介。
Torralbaの手法は、もっとシンプル。リージョンから抽出した沢山の特徴量のどれをどの程度評価してやればいいかをBoostingで学習。Torralbaは、LabelMeのプロジェクトのメンバーでもある。
短い時間(とはいっても3時間ぐらい)に、情報満載で消化不良気味。とはいえ、オブジェクト認識の初心者には、非常に効率的に、何がこの分野でおこっているかを把握できる素晴らしい内容。リファレンスもおっかけたいので、ぜひスライドをアップしてもらいたい。