【パターン認識&ターゲット検出】——パターン認識技術&ナンバープレート検出アプリケーション

目次

導入

1. パターン認識の主な方法

1. 統計的パターン認識

2. 隠れマルコフモデルに基づく認識

3. ファジーパターン認識

4. 人工ニューラルネットワークのパターン認識

要約する

2. パターン認識の応用

1. ナンバープレートの位置

2. ナンバープレートの認識

参考文献:


導入

人は物や現象を観察するとき、他の物や現象との違いを探したり、細部が異なる類似した物や現象を特定の目的に応じてグループ化することがよくあります。たとえば、数字は各人が書いたものですが、文字認識などです。 8 インチはすべて異なりますが、すべて同じクラスです。

パターン認識はAI の重要な方向性であり、その目的は、 「機械知覚」、「インテリジェント知覚」としても知られる人間の知覚をシミュレートすることです1940年代に電子計算機の出現とともに発展し、21世紀にはディープラーニングと融合し、近年ではディープラーニングやビッグデータによってその発展が大きく進んでいます。音声および言語認識、テキスト認識、指紋認識、ソナーおよび地震信号分析、画像分析、化学パターン認識などが含まれます。


1. パターン認識の主な方法

データ関係のマイニングを分類問題抽象化することは、パターン認識問題ですパターン認識は、専門家の経験と既存の認識に基づいて、コンピューターと数学的推論方法を使用して、大量の情報とデータから始まり、形状、パターン、曲線、数字、文字形式、グラフィックスなどを自動的に認識するプロセスです

1. 統計的パターン認識

これは比較的一般的で完全な識別方法であり、主な手順は次のとおりです。

1. 数据预处理:收集和准备用于训练和测试的数据集,剔除噪声和冗余。
2. 特征提取:从原始数据中提取有代表性的特征向量,映射到特征空间。
3. 特征选择:根据算法需求或者降低维度的目标,选择最重要的特征。
4. 模型训练:使用统计方法(如贝叶斯分类器、支持向量机等)对提取的特征进行训练。
5. 模型评估:通过测试数据集评估模型的准确性和性能。
6. 模型优化:根据评估结果对模型进行调优,例如调整参数或改善特征提取过程。
難しさと重要な点は、偏りを無視して正規分布の場合に現在一般的に使用されている適切な分類器アルゴリズムを使用する方法です。
遠くの値を推定する方法。

2. 隠れマルコフモデルに基づく認識

隠れマルコフ モデル (HMM) は、隠れた未知のパラメーターを使用してマルコフ過程を記述するために使用される統計モデルです。それは通常、2 つの部分で構成されます: ① 肉眼では観察できない特定の状態をもつ暗黙的なマルコフ連鎖、② 統計解析手法 (通常は正規分布およびポアソン分布に基づく確率密度関数) によって直接記述される離散一般ランダム過程。ある程度の統計学習を行って近似的な状態値を求めた後、近似的な隠れマルコフモデルを生成し、特徴を抽出して置換するだけで識別・分類に適したデータを得ることができます。

1. 定义状态集合:确定系统的状态集合,每个状态表示一个观测值的类别。
2. 定义观测集合:确定系统可能产生的观测值集合。
3. 确定初始概率分布:指定模型在开始时处于每个状态的概率。
4. 确定转移概率矩阵:指定模型在不同状态之间转移的概率。
5. 确定观测概率矩阵:指定模型在每个状态下观测到每个观测值的概率。
6. 解码算法:使用算法(如维特比算法)根据观测序列推断隐藏状态序列。

3. ファジーパターン認識

ファジィパターン認識はファジィ数学から派生し、ファジィ集合論はこれに基づいて確立されます。ファジィ集合とはファジィ性を持った概念の集合であり、抽出したデータをファジィ化した後、適切なメンバーシップ関数とファジィルールセットを設定し、最終的に結果を解きます。

1. 模糊化:将输入的模糊数据转化为隶属度函数,描述其在各个类别上的归属程度。
2. 规则定义:根据领域知识或经验,定义一组模糊规则,用于将模糊数据映射到具体的类别。
3. 推理机制:基于模糊规则,使用推理机制对输入进行推理,以确定输出的类别。
4. 去模糊化:将推理结果从模糊集合转化为具体的类别或数值。

この方法により、識別の成功率が大幅に向上し、特別なパラメータによってデータが認識できなくなることはありません。欠点は、ファジィ集合の範囲が人の主観的な経験によって決まり、人によって概念モデルが異なるため、他の識別方法と組み合わせる必要があることですが、この理論は現時点では十分ではありません。

4. 人工ニューラルネットワークのパターン認識

最もポピュラーなパターン認識手法であり、精度と応用性の点で優れた性能を持っています。BP ニューラル ネットワークは、誤差逆伝播アルゴリズムに従ってトレーニングされた多層フィードフォワード ニューラル ネットワークであり、最も広く使用されているニューラル ネットワーク モデルの 1 つです。それは教師あり学習に属します。

1. 确定网络结构:选择适当的神经网络类型(如前馈神经网络、卷积神经网络等)和层数,并确定每层的节点数和连接方式。
2. 数据预处理:收集和准备用于训练和测试的数据集,并进行标准化处理。
3. 初始化网络:初始化网络的权重和偏置参数。
4. 前向传播:将输入数据通过网络,逐层计算每个节点的输出值。
5. 反向传播:根据网络的输出结果和目标值,计算每个节点的误差,并通过梯度下降法更新网络参数。
6. 训练模型:重复进行前向传播和反向传播,调整网络参数,直到达到预定的停止条件。
7. 模型评估:使用测试数据集评估训练好的模型的性能和准确性。
BP ニューラル ネットワークに適切な量の隠れ層を追加すると、正しい情報は「ニューロン」に沿って前方に伝播し、間違った情報は前のニューロンに返されます。
ニューロンを認識し、伝播ノード間の重みを修正し、判別関数が動的に更新されるため、認識精度が非常に高くなります。 欠点
適切なニューラル ネットワークを構築するには、大量のデータが必要となり、多くのリソースを消費します。

要約する

① 統計的パターン認識は、統計理論とモデルに基づいた手法であり、特徴抽出とモデルトレーニングに重点を置いています。さまざまなデータ型に適していますが、優れた特徴量エンジニアリング機能が必要です。
②隠れマルコフモデルベースの認識手法は、シーケンスデータの背後にある状態変化を記述することに重点を置いており、時系列データのモデリングと認識に適しています。時間依存性を考慮できますが、初期状態と遷移確率に関する仮定は比較的限定されています。
③ ファジィパターン認識は、ファジィ化と非ファジィ化のプロセスを通じて、ファジィ性の強い入力データを処理することができます。不確実性や曖昧さには対処できますが、ルールの定義にはドメイン知識のサポートが必要です。
④人工ニューラルネットワークパターン認識は、ニューラルネットワークの強力なフィッティング能力を利用して、特徴表現と複雑な非線形関係を自動的に学習します。さまざまなタスクに適していますが、トレーニングには大量のデータとコンピューティング リソースが必要です。


統計的パターン認識および隠れマルコフ モデルベースの認識手法は、モデリングと確率的推論により重点を置き構造化データと時系列データの処理に適していますファジー パターン認識は、曖昧さと不確実性の処理に焦点を当てており、ルール定義にはドメインの知識が必要です。人工ニューラル ネットワークのパターン認識は、さまざまなタスクやデータ タイプに柔軟に適応でき、大量のトレーニング データを通じてより優れたパフォーマンスを達成できますが、高いコンピューティング リソースと時間コストが必要です。


2. パターン認識の応用

医療分析、顔指紋認識、音声認識、交通ネットワークなどはすべてその数値を持っています。以下は音声認識のフローチャートです。

ナンバープレートの位置決めと認識を例に とると、一般的なプロセスは次のとおりです。

位置決め: ① まずナンバー プレートの画像を HSI 色空間に変換します; ② 従来の画像処理方法を使用してナンバー プレートの位置を大まかに特定します; ③ 重心法を使用して傾き補正を実行し、最終的にナンバー プレートの領域を決定します

認識: ① 中国語と中国語以外の文字の文字分割に異なるアルゴリズムを使用します; ② パターン認識の理論を使用して、ナンバー プレート領域の特徴を抽出および選択します; ③ ナンバー プレートの文字認識を分類および判断し、出力しますナンバープレートの番号。

1. ナンバープレートの位置

現在のナンバー プレートの位置には、主に、数学的形態学、カラー セグメンテーション、画像ベースのテクスチャと形状の特徴など、複数の特徴の位置特定アルゴリズムが含まれています。

①大まかな位置決め:画像の二値化、画像のノイズ除去、および接続セットの分析を含めて、画像内でナンバー プレートが位置する領域をセグメント化して、ナンバー プレート領域の位置を特定します。

まず最初に、画像をRGB から HSI 空間に変換する必要があり、対応するしきい値を設定して予備的な位置決めを行います。その後、画像が 2 値化され、ピクセルを 1 行ずつスキャンするポイント スキャン法によってノイズと細線が除去されます。、設定されたしきい値を満たしません 白い点を削除します。

この時点で、接続された平行四辺形のセットが得られ、この領域を切り取って、大まかに位置決めされたナンバー プレートの画像を取得できます。

② 傾き補正:画像が水平にならない場合があり、ナンバープレートの文字の分割や認識に影響します。

まず、粗く配置された二値画像と粗く配置されたナンバープレート画像を別々に解析し、傾き K (重心の考え方に基づいて取得)を取得します。

a. バイナリ イメージ内の各白色点ピクセルを品質 1 の質点として扱い、重心公式を使用して$x=\frac{\sum m_i x_i}{\sum m_i}y=\frac{\sum m_iy_i}{\sum m_i}$イメージの重心を取得します。

b. 2値画像の全体の重心を求めた後、重心の画素を境界として画像を左右に分割し、それぞれ左部分と右部分の重心を求めます。同じように。

c. 2 つの重心 をベクトルで結び、このベクトルの水平方向に対する傾き角、つまり傾き角 K を計算します。これをもとにカラー画像を起こし補正します。

2. ナンバープレートの認識

文字認識には主にテンプレートマッチング、ガボール変換、SVM、深層学習に基づく認識アルゴリズムが含まれます

① 文字の分割:ナンバープレート領域の文字を 1 つずつ分割し、文字認識モジュールに送信して認識します。

a. 前処理アルゴリズム: 光やその他の効果の影響により、青色のナンバー プレートは名前、純度、彩度などに明らかな違いがあり、深さが異なるため、グレースケールの前に、ヒストグラムを指定する必要があります。make all ナンバープレートの青色の背景と白色の文字を同じグレーレベルで配分します。

規制後は、以前の経験と実験的テストに基づいて適切な閾値を設定し、閾値より小さいピクセルを黒に設定し、処理閾値を白に設定してグレースケールを実現します。

b. 主なアルゴリズム:英文字とアラビア数字は単一連結セット文字セットであり連結セットの方法で分割できます;漢字は複数の連結セットで構成されているため、この方法は使用できず、集合四角形多数の実験によって得られた長さと幅によるインターセプト方法を使用できます。

1、对于字母和数字,只要得到每一个字符连通域起点像素和终止像素 , 
就得到了包含整个单连通域的最小矩形区域。依此方法逐个切割矩形区域图像,
实现非中文字符的切割。
具体算法是逐列逐行扫描像素,当扫描到连续 m(3) 列有像素灰度级为 1 时,
将扫描到的第一个像素所在的列当作字符连通域的第一列,继续逐列扫描,
当发现连续 n(3) 列所有像素灰度级为 0 时,将首先出现全为 0 灰度级的列
当作字符连通域的结束列。这样我们就能够将车牌的第 2 到 7 个的字符逐步切割
输出该部分图像,完成非汉字字符分割。
2、对于汉字字符的切割,几乎所有省份的简称都包含有多个连通集,所以连通集取
矩形轮廓的方法将不再适用。采用将第二个字符框平缩放移的方法:在大量实验结果发现,
在取已经分割出来的第二个字符(即第一个非汉字字符)图像的矩形扩大 1.2 倍,
再将此矩形往左平移 1/7 整个车牌矩形的宽度,此时矩形所在的车牌的区域就是中文字符所在区域,
我们将此区域图像截取输出,完成车牌中文字符的切割。

②文字認識

パターン認識の一般的なプロセス:測定空間から特徴空間へ、そしてパターン空間へのマッピング

文字認識の場合: まず、認識する文字の画像特徴を取得し、対応する基準 (特徴の取得、特徴の選択、分類、判断) に従って文字画像のパターン カテゴリを決定します。

a. 既知の文字カテゴリの文字画像を収集し、二次元空間での位置特徴、ヒストグラム特徴、形状特徴、フーリエ変換によって周波数領域に変換された特徴などの特徴をカウントします。これらの特徴が抽出および学習され、得られたテンプレートが保存されます。

b. 同様の方法で認識対象の文字画像の各種特徴を取得し、保存されているテンプレートと照合・比較し、比較結果に応じて文字カテゴリを判定する。

注:根据向量间的距离(欧氏距离)衡量字符和模板的匹配程度。
建立模板库的具体过程是将每一类图像的每一张图片平均分成8份,
逐点扫描每一份图片区域,以一维向量的形式记录并保存下这份图像的像素信息,
从而每一张字符图像都有相应的8维向量形成的模板。将待识别的车牌字符图片
采取相同的方法,然后确定每个字符图片的8维向量值。我们求出这个字符的
8维向量值和所有模板字符图片的8 维向量值的n维欧式空间距离,将其中距离最小的N个
(5 个)模板字符图片保存下来。

参考文献:

[1] Lin Hanran. パターン認識技術と画像処理におけるその応用 [J]. 現代産業経済と情報化、2023,13(02):161-163.DOI:10.16525/j.cnki.14- 1362/n. 2023.02.059。

[2] Li Xiaotong. パターン認識に基づくインテリジェント ナンバー プレート認識システム [J]. 中国戦略的新興産業、2018 (04): 155-156. DOI: 10.19474/j.cnki.10-1156/f.003243.

おすすめ

転載: blog.csdn.net/weixin_51658186/article/details/131513951