研究
以前、PRML(Pattern Recognition and Machine Learning)でやった、MCMC(Markov Chain Monte Carlo)がどうにも消化不足だったんですが、そんな方のためにお薦めのイントロがUofAのVision Seminarで紹介されてました。 An introduction to MCMC for machine le…
今週のゼミは、以下の論文(?)についてディスカッション。 A Stochastic Grammar of Images, Song-Chun Zhu and David Mumford, Foundations and Trends in Computer Graphics and Vision, 2007 出典のFoundations and Trends in Computer Graphicsというのは…
NIPS 2006から以下の論文についてディスカッション。 Unsupervised learning of a probabilistic grammar for object detection and parsing., L Zhu, Y. Chen, and A. Yuille, NIPS2006 Computer Visionの分野では、流行のProbabilistic Grammerというのは…
画像のセグメンテーション(e.g. Normalized Cut)とか切り出した領域からの特徴量抽出って、結構時間がかかるものです。画像のサイズにもよりますが、400x300程度の画像でも1枚あたり、20分もNormalized Cutに時間がかかっています(パラメータにも依存しま…
夏休みも、週2回ゼミが開かれていて、今日は先日紹介した"Multiple View Geometry in Computer Vision"のChapter 9. Epipolar Geomery and the Fundamental Matrix.です。
Computer Vision Labのゼミでは、統計関連の教科書、論文を読むことが多いのですが、今日はMultiple View Geometry in Computer Visionという教科書のイントロとChapter 9。Multiple View Geometry in Computer Vision作者: Richard Hartley,Andrew Zisserma…
登録をすませたImageCLEFのデータセットをダウンロードしてみると、画像に付加されていたのは、ワードではなくXML形式で記述されたアノテーションで、TitleとかDescriptionなど自然言語で記述されていました。これからどうやってキーワードを抽出してやろう…
画像とそのアノテーションのデータセットを物色しているうちに、MIT AI Labが提供しているLabel Meが興味深いと思いました。LableMe自体は、データセットではなく、ツールセットで、マニュアルでポリゴンで囲まれた領域を作成し、そこにワードを付加すること…
研究室では、これまでGeneric Object Recognition用のデータセット(多量のアノテーション済の画像ファイル)としてCorel Image Dataを使用していたわけなんですが、商用画像というのと、Corel社が販売を止めてしまったということもあってか、他のデータセット…
1日〜3日までのような日本的正月休みというのはなさそうですが、そろそろ学生も研究室へ顔を出す時期なようなので大学へ行ってみました。大学時代あまり、Numerical Recipeなんかにあるような数値計算らしい数値計算をするプログラムを書いたことがなかった…
今日は、IBM Almaden Research CenterのArnon Amir氏によるコロキウムに出席。隔週ぐらいのペースでコロキウムが開かれているのですが、気になったネタだったし、Kobus氏もお薦めのコロキウムだったので参加。コロキウムのTopicは、"Improving Accesibility …
実装したMBRM、CRM(Continous-space Relevance Model)の認識結果がひどい。特に、University of Massachusettsからの報告によると、MBRMは既存のアルゴリズムと比較して段違いに良い結果(Coral dataセットを使用した実験において、precision 0.74, recall 0.…
今回は、自分で論文を書くわけではなかったですが、研究室にいるPh.Dの学生と共同で研究を行うことになり、手始めに実験のお手伝い(統計モデルの実装と結果処理)をしてました。本日真夜中に投稿〆切になるCVPR 2007に向けてやっていたわけなのですが、良い結…
CVPR2004で発表されたUniversity of MassachusettsのMBRM(Multiple Bernoulli Relevance Model)の実装中。実験使用している画像データ(Coral Image)は、研究室で使用している処理済データ(セグメンテーション、特徴量抽出済)と同じですが、セグメンテーショ…