Efficient Scan-Window Based Object Detection
using GPGPU
松島千佳
8. 19. 2008
はじめに

歩行者検出における問題点

HOG特徴量の算出時に重複部分が存在するため処理コストが高い



検出ウィンドウの移動やスケールの変化
検出ウィンドウ内のブロックの移動
解決法

制限付きHOG特徴量の算出方法



多重解像度の入力画像を用意しセルのサイズで分割
事前に全てのヒストグラムを算出
GPUを用いた高速化
GPGPUのプログラムモデル
1.
入力データを2次元のテクスチャに変換し,GPUのメモリに転送
2.
フラグメントプログラムを全てのピクセルに対し実行
3.
いくつかのテクスチャ間を反復し,レンダリング手順を実行
CPUベースのHOG-SVM検出器

歩行者検出


DalalらによってHOG-SVMを用いた手法が提案
歩行者検出の実行時間について分析

スキャンウィンドウのサイズ: w×h (w = 64,h = 128)
Histogram of Oriented Gradients (HOG)


グレースケールの画像から算出される傾きのヒストグラムを
正規化したもの
パラメータ



1セル
: r×r ピクセル (r = 8)
ビンの数 : 8ビン
1ブロック : c×cセル (c = 2)
HOGのメモリアクセス数の演算コスト

HOG特徴量のベクトル計算


効率よく算出するためにIntegral Imageを使用


Lは特徴ベクトルの大きさ
4点の頂点演算で四角い領域内の和を算出
アクセスコストの比率

Integral Imageを用いた方がアクセスコストは低い

事前計算することに対しオーバーヘッドが存在
SVM識別器

統計的な学習方法

クラス内のマージンが最大となる識別境界を決めること

線形SVM




特徴ベクトルと重みベクトル間の内積
出力が閾値より大きければ特徴ベクトルは人として識別
メモリアクセスに関する演算コストは2L
入力画像の1スケールにおける検出の総演算コスト

dはスキャンウィンドウのずらし幅
GPUベースのHOG-SVM検出器

問題点



Integral Imageの演算をGPGPUへ応用することは難しい
GPU-CPU間のデータ転送は高コスト
解決方法

4つのモジュールに分割して処理




スケーリング
特徴抽出
識別
削減
スケーリング


入力画像だけを転送
GPU内で異なるスケールの画像を全て生成
メインメモリからGPUへ転送するデータを削減
特徴抽出

隣接したスキャンウィンドウにはオーバーラップ存在


ずらし幅が小さいため
提案方法



スキャンウィンドウに左右されないヒストグラムを事前に演算
識別モジュールの後に異なるウィンドウ間でそれらを共有
ずらし幅dの大きさはセルの大きさrと同じ

ヒストグラムのセルの境界はいつもスキャンウィンドウのずらし幅
特徴抽出のレンダリングの手順
識別

特徴量の配列から結果を格納するテクスチャにレンダリング


ヒストグラムの値と重みベクトル間の内積を算出
算出した値を正規化

特徴抽出と識別ステップの総演算コスト

CPUベースのものと提案法のアクセスコストの比率

今回のパラメータを使用した場合,比率は0.46

Integral Imageを用いたHOG-SVM検出器よりも2倍速い
識別のレンダリング手順
評価(1)

検出器の性能を評価


INRIAの人データを使用
パラメータ



r=d=8
c=2
スケール比 = 1.2
評価(2)

検出器の処理速度を評価

CAVIARデータセットを使用

3つの異なる方法を実装
1.
2.
3.
CPUベースでIntagral Imageを用いた検出器(CPU-II)
CPUベースでヒストグラムを事前に演算した検出器(CPU-HC)
GPGPUベースの検出器(GPGPU)
おわりに

GPUのを用いたHOG特徴量の算出方法について記述

スケール比率が1.05の場合

GPGPUを用いた検出器は1画像あたり73msで処理することが可能
ダウンロード

第9回ゼミ輪講