目的
我々は、次の質問に対する回答を検討します。
- 画像内の各ピクセルを通過するには?
- OpenCVの行列値格納する方法ですか?
- どのように私たちのアルゴリズムの性能をテストするために実装されていますか?
- どのようなルックアップテーブル?なぜそれを使うのか?
テストケース
ここではテストし、それは簡単な減色方法です。行列の要素は、画素に格納されている単一チャネルである場合、CまたはC ++の符号なし文字型は、次に、画素256個の異なる値を有することができます。しかし、3チャンネル画像ならば、あまりにも多くのこの保存形式上の色の数は(というか、以上1600万種類があります)。我々は非常に多くの色を使用するアルゴリズムの性能に重大な影響を与える可能性があります。実際には、時々、これらの色のごく一部には、同じ効果を達成するのに十分です。
この場合、この方法は、一般的に使用される 色空間の減少を 。アプローチがある:既存の色空間は、色の小さな数を得るために、入力された値で除算します。例えば、0〜9のカラー値は、好ましくは0,10〜19の新しい値は、好ましくは10、などです。
UCHAR (unsigned char型、0と255の間の数、すなわち値)タイプの値で割った 整数の 値は、結果がまだ チャー 。char型は、結果として、そうも小数点以下を切り捨て模索します。これにより、に記載さ UCHAR カスタムフィールドの色を低減する操作次の形式のように表すことができます。
この場合には、単純な色空間の削減アルゴリズムは、次の2つのステップで表すことができる:ピクセル内の各画像マトリックスを横切る第二に、上記式画素のアプリケーション。ここでは、操作は特に時間がかかりれているので、我々は、加算、減算、譲渡及びその他の操作など低コストでそれらを交換する必要があり、どちらも除算と乗算を使用する、ということは注目に値します。また、値のみの限られた範囲にわたって上記入力動作は、のようなことに留意すべきである UCHAR 好ましくは256個の値を入力します。
見ることができ、より大きな画像に対して、事前計算すべての可能な値は、次いで、ルックアップテーブルを用いて、必要なこれらの値を直接割り当てることができることが有効です。1次元ルックアップテーブルまたは多次元配列であり、出力値を計算することなく、異なる入力値に対応する読み取り専用利点が格納されています。
次のことを行うために私たちのテストプログラム(だけでなく、サンプルコードここで与えられました):
読み取られた画像は、(カラー画像とすることができるコマンドラインパラメータによって決定されるグレースケール画像であってもよい)、コマンドラインパラメータが指定され、減色コマンドライン引数の整数です。
現在、OpenCVの画素によって画像ピクセルを横断するための主に3つのメソッドを有しています。我々は、これら三つの方法は、画像をスキャンした使い、画面上の時間でそれらを出力します。私は、これは非常に興味深い対照的であるべきだと思います。
あなたはから得ることができる ためにここに あなたも、OpenCVのサンプルディレクトリを見つけるCPPのコアディレクトリのtutorial_codeを入力し、プログラムのコードを探すことができ、ソースコードをダウンロードしてください。プログラムの基本的な使い方は以下のとおりです。
how_to_scan_images imageName.jpg intValueToReduce [ G ]
その最後の引数はオプションです。提供される場合、画像はグレースケール形式、そうでなければカラーフォーマットにロード。このプログラムでは、第1のルックアップテーブルを計算します。
int divideWith; // convert our input string to number - C++ style
stringstream s;//数据类型转换
s << argv[2];
s >> divideWith;
if (!s)
{
cout << "Invalid number entered for dividing. " << endl;
return -1;
}
uchar table[256];
for (int i = 0; i < 256; ++i)
table[i] = divideWith* (i/divideWith);
这里我们先使用C++的 stringstream 类,把第三个命令行参数由字符串转换为整数。
然后,我们用数组和前面给出的公式计算查找表。这里并未涉及有关OpenCV的内容。
另外有个问题是如何计时。没错,OpenCV提供了两个简便的可用于计时的函数 getTickCount() 和 getTickFrequency() 。第一个函数返回你的CPU自某个事件(如启动电脑)以来走过的时钟周期数,第二个函数返回你的CPU一秒钟所走的时钟周期数。这样,我们就能轻松地以秒为单位对某运算计时:
double t = (double)getTickCount();
// 做点什么 ...
t = ((double)getTickCount() - t)/getTickFrequency();
cout << "Times passed in seconds: " << t << endl;
图像矩阵是如何存储在内存之中的?
图像矩阵的大小取决于我们所用的颜色模型,确切地说,取决于所用通道数。如果是灰度图像,矩阵就会像这样:
而对多通道图像来说,矩阵中的列会包含多个子列,其子列个数与通道数相等。例如,RGB颜色模型的矩阵:
注意到,子列的通道顺序是反过来的:BGR而不是RGB。很多情况下,因为内存足够大,可实现连续存储,因此,图像中的各行就能一行一行地连接起来,形成一个长行。连续存储有助于提升图像扫描速度,我们可以使用 isContinuous() 来去判断矩阵是否是连续存储的. 相关示例会在接下来的内容中提供。
1.高效的方法 Efficient Way
说到性能,经典的C风格运算符[](指针)访问要更胜一筹. 因此,我们推荐的效率最高的查找表赋值方法,还是下面的这种:
Mat& ScanImageAndReduceC(Mat& I, const uchar* const table)
{
// accept only char type matrices
CV_Assert(I.depth() != sizeof(uchar));
int channels = I.channels();
int nRows = I.rows * channels;
int nCols = I.cols;
if (I.isContinuous())
{
nCols *= nRows;
nRows = 1;
}
int i,j;
uchar* p;
for( i = 0; i < nRows; ++i)
{
p = I.ptr<uchar>(i);
for ( j = 0; j < nCols; ++j)
{
p[j] = table[p[j]];
}
}
return I;
}
这里,我们获取了每一行开始处的指针,然后遍历至该行末尾。如果矩阵是以连续方式存储的,我们只需请求一次指针、然后一路遍历下去就行。彩色图像的情况有必要加以注意:因为三个通道的原因,我们需要遍历的元素数目也是3倍。
这里有另外一种方法来实现遍历功能,就是使用 data , data会从 Mat 中返回指向矩阵第一行第一列的指针。注意如果该指针为NULL则表明对象里面无输入,所以这是一种简单的检查图像是否被成功读入的方法。当矩阵是连续存储时,我们就可以通过遍历 data 来扫描整个图像。例如,一个灰度图像,其操作如下:
uchar* p = I.data;
for( unsigned int i =0; i < ncol*nrows; ++i)
*p++ = table[*p];
这回得出和前面相同的结果。但是这种方法编写的代码可读性方面差,并且进一步操作困难。同时,我发现在实际应用中,该方法的性能表现上并不明显优于前一种(因为现在大多数编译器都会对这类操作做出优化)。
2.迭代法 The iterator (safe) method
在高性能法(the efficient way)中,我们可以通过遍历正确的uchar域并跳过行与行之间可能的空缺-你必须自己来确认是否有空缺,来实现图像扫描,迭代法则被认为是一种以更安全的方式来实现这一功能。在迭代法中,你所需要做的仅仅是获得图像矩阵的begin和end,然后增加迭代直至从begin到end。将*操作符添加在迭代指针前,即可访问当前指向的内容。
Mat& ScanImageAndReduceIterator(Mat& I, const uchar* const table)
{
// accept only char type matrices
CV_Assert(I.depth() != sizeof(uchar));
const int channels = I.channels();
switch(channels)
{
case 1:
{
MatIterator_<uchar> it, end;
for( it = I.begin<uchar>(), end = I.end<uchar>(); it != end; ++it)
*it = table[*it];
break;
}
case 3:
{
MatIterator_<Vec3b> it, end;
for( it = I.begin<Vec3b>(), end = I.end<Vec3b>(); it != end; ++it)
{
(*it)[0] = table[(*it)[0]];
(*it)[1] = table[(*it)[1]];
(*it)[2] = table[(*it)[2]];
}
}
}
return I;
}
对于彩色图像中的一行,每列中有3个uchar元素,这可以被认为是一个小的包含uchar元素的vector,在OpenCV中用 Vec3b 来命名。如果要访问第n个子列,我们只需要简单的利用[]来操作就可以。需要指出的是,OpenCV的迭代在扫描过一行中所有列后会自动跳至下一行,所以说如果在彩色图像中如果只使用一个简单的 uchar 而不是 Vec3b 迭代的话就只能获得蓝色通道(B)里的值。
3. 通过相关返回值的On-the-fly地址计算
事实上这个方法并不推荐被用来进行图像扫描,它本来是被用于获取或更改图像中的随机元素。它的基本用途是要确定你试图访问的元素的所在行数与列数。在前面的扫描方法中,我们观察到知道所查询的图像数据类型是很重要的。这里同样的你得手动指定好你要查找的数据类型。下面的代码中是一个关于灰度图像的示例(运用 + at() 函数):
Mat& ScanImageAndReduceRandomAccess(Mat& I, const uchar* const table)
{
// accept only char type matrices
CV_Assert(I.depth() != sizeof(uchar));
const int channels = I.channels();
switch(channels)
{
case 1:
{
for( int i = 0; i < I.rows; ++i)
for( int j = 0; j < I.cols; ++j )
I.at<uchar>(i,j) = table[I.at<uchar>(i,j)];
break;
}
case 3:
{
Mat_<Vec3b> _I = I;
for( int i = 0; i < I.rows; ++i)
for( int j = 0; j < I.cols; ++j )
{
_I(i,j)[0] = table[_I(i,j)[0]];
_I(i,j)[1] = table[_I(i,j)[1]];
_I(i,j)[2] = table[_I(i,j)[2]];
}
I = _I;
break;
}
}
return I;
}
该函数输入为数据类型及需求元素的坐标,返回的是一个对应的值-如果用 get 则是constant,如果是用 set 、则为non-constant. 出于程序安全,当且仅当在 debug 模式下 它会检查你的输入坐标是否有效或者超出范围. 如果坐标有误,则会输出一个标准的错误信息. 和高性能法(the efficient way)相比, 在 release模式下,它们之间的区别仅仅是On-the-fly方法对于图像矩阵的每个元素,都会获取一个新的行指针,通过该指针和[]操作来获取列元素。
当你对一张图片进行多次查询操作时,为避免反复输入数据类型和at带来的麻烦和浪费的时间,OpenCV 提供了:basicstructures:Mat_ <id3> data type. 它同样可以被用于获知矩阵的数据类型,你可以简单利用()操作返回值来快速获取查询结果. 值得注意的是你可以利用 at() 函数来用同样速度完成相同操作. 它仅仅是为了让懒惰的程序员少写点 >_< .
4. 核心函数LUT(The Core Function)
这是最被推荐的用于实现批量图像元素查找和更改操作的图像方法。在图像处理中,对于一个给定的值,将其替换成其他的值是一个很常见的操作,OpenCV提供里一个函数直接实现该操作,并不需要你自己扫描图像,就是:operationsOnArrays:LUT() <lut> ,一个包含于core module的函数. 首先我们建立一个mat型用于查表:
Mat lookUpTable(1, 256, CV_8U);
uchar* p = lookUpTable.data;
for( int i = 0; i < 256; ++i)
p[i] = table[i];
然后我们调用函数 (I 是输入 J 是输出):
LUT(I, lookUpTable, J);
性能表现
为了得到最优的结果,你最好自己编译并运行这些程序. 为了更好的表现性能差异,我用了一个相当大的图片(2560 X 1600). 性能测试这里用的是彩色图片,结果是数百次测试的平均值.
Efficient Way | 79.4717 milliseconds |
Iterator | 83.7201 milliseconds |
オンザフライRA | 93.7878ミリ秒 |
LUT機能 | 32.5759ミリ秒 |
私たちは、いくつかの結論を出す:OpenCVのライブラリはもちろん、インテル®スレッドにより、マルチスレッドアーキテクチャを有効にすることができますので、あなたは、スキャンした画像に反復をポインタを使用する方法を好む場合は、最速を得ることができますOpenCVのLUTの機能と呼ばれる組み込み関数を使用するように...フランスは良い選択が、低速です。オンザフライ方式デバッグモードで使用されるマップ全体がリリースモードでは、資源の方法で最も無駄でスキャンし、それはほぼ同じ性能と反復法ですが、セキュリティの観点から、反復法は、より良い選択であります
ます。https://www.cnblogs.com/james1207/p/3266645.htmlで再現