混合ガウスモデル
背景モデリングとガウス モデルに基づく移動ターゲット検出アルゴリズムは、一般的に使用されるビデオ分析およびコンピューター ビジョン テクノロジです。混合ガウス背景モデリングを使用して、バイナリ イメージに基づいて移動ターゲットを抽出します。入力されたビデオ ファイルの場合、ビデオ内の歩行者や車の動きを抽出する場合、画像の特定のフレームは、特定のピクセルを中心としてその隣接ピクセルを含むガウス分布を表します。
このアルゴリズムの基本的な手順は次のとおりです。
-
初期化: ビデオ シーケンスの最初のフレームから背景モデルを抽出します。各ピクセルのグレー値または色の特徴を背景モデルの表現として使用することを選択できます。
-
ガウス モデリング: 平均、分散、重みを含む各ピクセルのガウス モデルを維持します。通常、最初は各ピクセルの背景モデルにガウス分布が含まれています。
-
背景モデルの更新: 新しいビデオ フレームごとに、ピクセルごとに、現在の背景モデルとの差を計算します。差が特定のしきい値より小さい場合、ピクセルは背景とみなされ、背景モデルのパラメーター (平均、分散、および重み) が更新されます。
-
前景の検出: 各ピクセルについて、背景モデルとの違いに基づいて、それが前景であるかどうかを判断します。差が大きいピクセルは前景としてラベル付けされ、移動するターゲットを表す可能性があります。
-
ターゲットのセグメンテーションと追跡: 前景の検出結果に基づいて、ターゲットのセグメンテーションと追跡を実行して、ビデオ シーケンス内の移動ターゲットを識別して追跡できます。
ガウス モデルに基づく背景モデリングと移動ターゲット検出アルゴリズムには、照明の変化や動的な背景などを伴う複雑なシーンや状況を扱う場合、いくつかの制限がある可能性があることに注意してください。したがって、実際のアプリケーションでは、他のテクノロジーと改良されたアルゴリズムを組み合わせて、検出精度と堅牢性を向上させる必要がある場合があります。
Matlab は、ガウス モデルに基づいた背景モデリングと移動ターゲット検出アルゴリズムを実装します。
clear all
clc;
close all;
source = VideoReader('one.mp4');
ResVid = VideoWriter('second.avi');
open(ResVid);
numFrames = source.NumberOfFrames;
%vidFrames = read(source);
% ----------------------- frame size variables -----------------------
%
%fr = source(1).cdata; % read in 1st frame as background frame
fr= read(source,1);
fr_bw = rgb2gray(fr); % convert background to greyscale
fr_size = size(fr);
width = fr_size(2);
height = fr_size(1);
fg = zeros(height, width); % 用于计算前景,储存前景像素
bg_bw = zeros(height, width);% 用于背景的更新
% --------------------- mog variables -----------------------------------
C = 3; % number of gaussian components (typically 3-5)高斯个数
M = 3; % number of background components背景个数
D = 2.5; % positive deviation threshold比较门槛值
alpha = 0.01; % learning rate (between 0 and 1) (from paper 0.01)初始化的学习率
thresh = 0.25; % foreground threshold (0.25 or 0.75 in paper)前景门槛
sd_init = 3; % initial standard deviation (for new components) var = 36 in paper初始化偏差
w = zeros(height,width,C); % initialize weights array初始化权重
mean = zeros(height,width,C); % pixel means像素均值
sd = zeros(height,width,C); % pixel standard deviations像素标准偏差,注意与下面的方差区别,平方的关系
u_diff = zeros(height,width,C); % difference of each pixel from mean每个像素与均值的差值
p = alpha/(1/C); % initial p variable (used to update mean and sd)均值,方差的更新系数
rank = zeros(1,C); % rank of components (w/sd)用于排序
% --------------------- initialize component means and weights -----------
pixel_depth = 8; % 8-bit resolution
pixel_range = 2^pixel_depth -1; % pixel range (# of possible values)
%初始化每个点的每个高斯模型的均值,权重,方差
for i=1:height
for j=1:width
for k=1:C%每个像素点设置了三个高斯模型
mean(i,j,k) = rand*pixel_range; % means random (0-255)
w(i,j,k) = 1/C; % weights uniformly dist
sd(i,j,k) = sd_init; % initialize to sd_init
end
end
end
%--------------------- process frames -----------------------------------
% for n = 1:length(source)% 计算视频的总帧数
for n = 30:numFrames
fprintf("Num: %d \n",n); % disp(['Num: ' num2str(n)]); (运行失败可代替代码)
%fr = source(n).cdata; % read in frame改
fr = read(source,n);
fr_bw = rgb2gray(fr); % convert frame to grayscale
%所以fr_bw(i,j)可以认为是当前像素点吧
% calculate difference of pixel values from mean
%计算当前帧每个像素值与每个高斯模型均值的差,即进行相应的匹配,
for m=1:C
u_diff(:,:,m) = abs(double(fr_bw) - double(mean(:,:,m)));
end
% update gaussian components for each pixel
% 将当前帧的每个像素值进行匹配
for i=1:height
for j=1:width
match = 0;
for k=1:C
if (abs(u_diff(i,j,k)) <= D*sd(i,j,k)) % pixel matches component
% pixel matches component
% 当前像素与某一高斯模型匹配,匹配准
% 则是与高斯模型差值小与2.5倍的标准差
match = 1; % variable to signal component match
% 匹配的时候,匹配标志设置为1
% variable to signal component match
% update weights, mean, sd, p 更新每个像素的高斯模型,如果当前像素与某个背景高斯模型相匹配,则对背景进行更新
w(i,j,k) = (1-alpha)*w(i,j,k) + alpha;% 权值的更新
p = alpha/w(i,j,k); % 更新率的更新
mean(i,j,k) = (1-p)*mean(i,j,k) + p*double(fr_bw(i,j));% 当前像素点的均值的更新
sd(i,j,k) = sqrt((1-p)*(sd(i,j,k)^2) + p*((double(fr_bw(i,j)) - mean(i,j,k)))^2);% 标准差的更新(也可以用方差)
else % pixel doesn't match component当像素与任何一个高斯模型都不匹配的时候
w(i,j,k) = (1-alpha)*w(i,j,k); % weight slighly decreases% 对权重进行更新,不匹配的高斯模型权重减小
end
end
w(i,j,:) = w(i,j,:)./sum(w(i,j,:));% 各个像素所有高斯背景模型的值之和,一个统计值
bg_bw(i,j)=0;
for k=1:C
bg_bw(i,j) = bg_bw(i,j)+ mean(i,j,k)*w(i,j,k);%更新背景
%%5............
%if(bg_bw(i,j)>thresh)
% k=k-1;
% M=k;
%end%????..........
end
% if no components match, create new component
% 当所有的高斯模型都不匹配的时候,用当前的图像参数建立一个新的高斯模型,取代权重最小的模型
if (match == 0)
[min_w, min_w_index] = min(w(i,j,:)); %找出每一个像素对应的权重最小的高斯模型
%找出w中的所有维数(也就是所有高斯模型)对应的第i行,第j列的最小值(也就是权重),
%返回值min_w为数值(权重)大小,min_w_index为对应的维数(高斯模型)
mean(i,j,min_w_index) = double(fr_bw(i,j));%fr_bw为背景灰度图像,由于没有匹配,所以保留原值不变
%我认为是当前像素值作为新模型的均值
sd(i,j,min_w_index) = sd_init;%没有匹配,保留原值不变
end
rank = w(i,j,:)./sd(i,j,:); % calculate component rank
rank_ind = [1:1:C]; %计算权重与标准差的比值,用于对背景模型进行排序
% sort rank values
for k=2:C
for m=1:(k-1)
if (rank(:,:,k) > rank(:,:,m))
% swap max values
rank_temp = rank(:,:,m);
rank(:,:,m) = rank(:,:,k);
rank(:,:,k) = rank_temp;
% swap max index values
rank_ind_temp = rank_ind(m);
rank_ind(m) = rank_ind(k);
rank_ind(k) = rank_ind_temp;
end
end
end
% calculate foreground%计算前景
match = 0;
k=1;
fg(i,j) = 0; %前景
while ((match == 0)&&(k<=M))% 没有匹配,而且当前高斯数号小于背景数
if (w(i,j,rank_ind(k)) >= thresh)
if (abs(u_diff(i,j,rank_ind(k))) <= D*sd(i,j,rank_ind(k)))
fg(i,j) = 0; %判断是否是前景,如果符合匹配准则就认为是背景
match = 1;
else %否则认为是前景,前景值为255,即白色
fg(i,j) = 255;
end
end
k = k+1; %计算下一个高斯模型
if(k==5)
k=k-1;
break
end
end
end
end
figure(1),subplot(3,1,1),imshow(fr)%显示输入图像三行一列定位第一个
subplot(3,1,2),imshow(uint8(bg_bw))%显示背景图像三行一列定位第2个
subplot(3,1,3),imshow(uint8(fg)) %显示前景图像
pause(0.5);
BG = uint8(zeros(size(fr)));
BG(:,:,1) = uint8(fg);
BG(:,:,2) = uint8(fg);
BG(:,:,3) = uint8(fg);
Res = [fr BG];
%将图像矩阵转换为视频帧
% Mov1(n) = im2frame(uint8(fg),gray); % put frames into movie前景帧
% Mov2(n) = im2frame(uint8(bg_bw),gray); % put frames into movie背景帧
writeVideo(ResVid,Res);
end
close(ResVid);
% movie2avi(Mov1,'mixture_of_gaussians_output','fps',30); % save movie as avi
% movie2avi(Mov2,'mixture_of_gaussians_background','fps',30); % save movie as avi
上記のコードを簡単に分析してください。
- まず、コードは
VideoReader
関数を使用して「one.mp4」という名前のビデオ ファイルを開き、関数を使用してVideoWriter
「second.avi」という名前のビデオ ライター オブジェクトを作成します。
アルゴリズムの実行結果:
-
このコードは、ビデオの合計フレーム数を取得し、変数に格納します
numFrames
。 -
初期化フェーズでは、コードはガウス モデルの数 (C)、背景モデルの数 (M)、標準偏差の初期値 (sd_init) などのいくつかのパラメーターを定義し、対応する配列を作成します。モデルの重み、平均、標準偏差を保存します。
-
次に、フレーム ループの処理の主要部分が続きます。このコードはビデオからフレームごとに画像を読み取り、各フレームをグレースケール画像に変換します。次に、コードはピクセルごとに、そのピクセルと各ガウス モデル間の差分を計算し、照合と更新を実行します。ピクセルが背景のガウス モデルと一致する場合、モデルの重み、平均、標準偏差が更新されます。ピクセルがどのモデルにも一致しない場合は、新しいガウス モデルが作成されます。
-
このコードはまた、重みと標準偏差の比に基づいて背景モデルをランク付けし、前景を計算します。最後に、コードは元のフレーム、背景画像、および前景画像を 3 つのサブ画像に表示し、それらのフレームを「second.avi」ビデオに書き込みます。
全体的には、各モデルとのピクセル値の差を照合することで、ピクセルが背景に属するか前景に属するかを判断し、照合結果に基づいてモデルのパラメータを更新します。