著者: 禅とコンピュータープログラミングの芸術
機械学習やコンピュータビジョンなどのAI分野において、画像処理は欠かせない基盤技術です。したがって、AI エンジニアがいくつかの一般的な画像処理ツールの使用法を習得することが非常に重要です。この記事では、オープンソースで無料の使いやすいマシン ビジョン ツールとその仕組みをいくつか紹介します。
2. 基本的な概念と用語の説明
概念的用語の説明:
- 画像: 写真、絵画、ビデオなどのデジタルの有形または無形の情報。
- ピクセル: 画像内の各点をピクセルと見なすことができます。
- カラーモデル: RGB モデル、CMYK モデル、YUV モデルなどのさまざまな色の彩度の定義。
- 寸法: 画像サイズ。
- 解像度: 保存時の画像の解像度は、通常、1 インチあたりのピクセル数を指します。
- RGB 値: 赤、緑、青の 3 つのカラー チャネルの強度値。
- カラースペース: SRGB、XYZ、CIELAB などのカラープレーン。
- 3 次元グラフィックス: 三角形のパッチで構成される 3 次元画像。
- 2次元グラフィックス: 直線、曲線、点のみで構成される画像。
- 特徴抽出: 画像記述子の抽出プロセス。
- エッジ検出: 画像の境界を抽出するために使用される技術。
- テンプレートマッチング:画像内の小さな領域を検索し、その領域に最も近い位置を見つけることで対象認識を実現する技術。
- HOGの特徴ÿ