Dieser Inhalt wird im Kurs "Introduction to OpenCV Intensive Lecture (C++/Python Bilingual Teaching)" geteilt, Adresse:
Intensive Einführung in OpenCV (Zweisprachiger C++/Python-Unterricht)
Wenn Sie Ihr C++-Programmierniveau verbessern möchten, können Sie sich auf den Kurs beziehen:
C++ Fortgeschrittenes Lernen
Auch im OpenCV-Kurs gibt es viele interessante und praktische Cases, die in C++ und Python implementiert sind und deren Codes ausführlich erklärt werden.
Handschriftliche Ziffernerkennung basierend auf OpenCV Laden Sie den handschriftlichen Ziffernerkennungsdatensatz aus „digits.png“, trainieren Sie dann einen SVM- und KNearest-Klassifikator und bewerten Sie ihre Genauigkeit.
Der Datensatz wird wie folgt vorverarbeitet:
- bildbasierte Momententzerrung (siehe Funktion deskew())
- Das digitale Bild wird in 4 10x10-Zellen und 16 Bins unterteilt, und für jede Bin wird ein Histogramm orientierter Gradienten berechnet
- Wandeln Sie das Histogramm mithilfe der Hellinger-Metrik in Raum um (siehe [1] (RootSIFT))
Code zeigen wie unten
int main(int /* argc */, char *argv[])
{
help(argv);
vector<Mat> digits; // 训练数据
vector<int> labels; // 标签
// 加载训练数据和标签
load_digits(DIGITS_FN, digits, labels);
cout << "preprocessing..." << endl;
// 数据打乱
shuffle(digits, labels);
vector<Mat> digits2;
// 扭曲图像
for (size_t i = 0; i < digits.size(); i++)
{
Mat deskewed_digit;
deskew(digits[i], deskewed_digit);
digits2.push_back(deskewed_digit);
}
Mat samples;
// 预处理求hog算子
preprocess_hog(digits2, samples);
// imshow("samples", samples);
// waitKey(0);
// 90%的数据做训练集
int train_n = (int)(0.9 * samples.rows);
Mat test_set;
// 存储测试数据
vector<Mat> digits_test(digits2.begin() + train_n, digits2.end());
// 马赛克式将小图像拼成大图像
mosaic(25, digits_test, test_set);
imshow("test set", test_set);
imwrite("test_image.jpg", test_set);
// 训练数据和测试数据划分
Mat samples_train = samples(Rect(0, 0, samples.cols, train_n));
Mat samples_test = samples(Rect(0, train_n, samples.cols, samples.rows - train_n));
vector<int> labels_train(labels.begin(), labels.begin() + train_n);
vector<int> labels_test(labels.begin() + train_n, labels.end());
Ptr<ml::KNearest> k_nearest;
Ptr<ml::SVM> svm;
vector<float> predictions;
Mat vis;
// K最近邻算法
cout << "training KNearest..." << endl;
k_nearest = ml::KNearest::create();
// 模型训练
k_nearest->train(samples_train, ml::ROW_SAMPLE, labels_train);
// KNearest做结果预测
k_nearest->findNearest(samples_test, 4, predictions);
// 模型评估,计算错误率
evaluate_model(predictions, digits_test, labels_test, vis);
imshow("KNearest test", vis);
imwrite("KNearest-test.jpg", vis);
k_nearest.release();
// SVM算法
cout << "training SVM..." << endl;
svm = ml::SVM::create();
svm->setGamma(5.383);
svm->setC(2.67);
svm->setKernel(ml::SVM::RBF);
svm->setType(ml::SVM::C_SVC);
svm->train(samples_train, ml::ROW_SAMPLE, labels_train);
// predict digits with SVM
svm->predict(samples_test, predictions);
evaluate_model(predictions, digits_test, labels_test, vis);
imshow("SVM test", vis);
imwrite("SVM-test.jpg", vis);
cout << "Saving SVM as \"digits_svm.yml\"..." << endl;
// 训练的结果保存
svm->save("digits_svm.yml");
svm.release();
waitKey();
return 0;
}
Die Trainingsergebnisse sind wie folgt:
KNearest error: 2.80 %
SVM error: 2.40 %
Das Testbild sieht wie folgt aus:
KNächstgelegene Algorithmus-Testergebnisse (rote Markierung ist das Ergebnis eines Erkennungsfehlers):
Testergebnisse des SVM-Algorithmus (rote Markierungen sind die Ergebnisse von Erkennungsfehlern):