これらの Python コンピューター ビジョン ツールを使用すると、半分の労力でコードを作成できます。

開発者に人気の言語の 1 つである Python は、コミュニティで利用できる豊富なツールとライブラリのセットで知られています。開発者が検出や視覚化を含む開発タスクを自動化できるように、コンピューター ビジョンに使用できる 10 個の人気のある Python ライブラリまたはプラットフォームをリストしました。

1| 速い

fastai は、標準の深層学習ドメインで最先端の結果を迅速かつ簡単に提供できる高レベルのコンポーネントを提供する深層学習ライブラリです。また、新しいアプローチを構築するために組み合わせて使用​​できる低レベルのコンポーネントも研究者に提供します。

fastai には、純粋な Python で拡張できる GPU に最適化されたコンピューター ビジョン ライブラリ、テンソルのセマンティック型階層を備えた新しい Python 型ディスパッチ システムなど、さまざまな機能が含まれています。

リンク: https://github.com/fastai/fastai

2 | IPSDK

IPSDK は、C++ と Python で書かれた画像処理ライブラリです。このライブラリは、データセットを処理するための画像処理関数の完全なセットと、2D および 3D 画像処理のための包括的で最適化された一連の関数を提供します。

IPSDK は、プロセッサーのアーキテクチャーと機能に合わせて自動的に調整されます。このライブラリの機能には、完全な PC クラスターのサポート、高性能、高可用性コンピューティングなどが含まれます。

リンク: https://www.reactivip.com/image-processing/

3 | イムチル

Imutils は、変換、回転、サイズ変更、スケルトン化、Matplotlib 画像の表示、輪郭の並べ替え、エッジの検出などの基本的な画像処理機能を非常に簡単にする OpenCV+ 便利な関数のコレクションを含むコンピューター ビジョン パッケージです。

リンク: https://www.pyimagesearch.com/2015/02/02/just-open-sourced-personal-imutils-package-series-opencv-convenience-functions/

4 | 難しい

Keras は、Python で書かれた高レベルのニューラル ネットワーク ライブラリであり、TensorFlow または Theano 上で実行できます。このライブラリは、迅速な実験を可能にすることに重点を置いて開発されました。

この深層学習ライブラリは、畳み込みネットワークとリカレント ネットワークのサポートを含むいくつかの機能を提供し、簡単かつ迅速なプロトタイピングなどを可能にします。

リンク: https://keras.io

5 | マットプロットリブ

Matplotlib は、Python で静的、アニメーション、インタラクティブな視覚化を作成するための包括的な視覚化ライブラリです。このライブラリは、出版品質のグラフィックの開発、さまざまなファイル形式やインタラクティブ環境へのエクスポートと埋め込みなどの機能を実行できます。

リンク: https://matplotlib.org

6 | OpenCV

OpenCV は、リアルタイム アプリケーションに焦点を当てた人気のオープンソース コンピューター ビジョン ライブラリです。このライブラリはモジュール構造になっており、数百のコンピューター ビジョン アルゴリズムが含まれています。OpenCV には、画像処理、ビデオ分析、2D 特徴フレームワーク、物体検出、カメラ キャリブレーション、3D 再構成、その他のモジュールが含まれています。

リンク: https://opencv.org

7 | パイテサークト

Pytessarct または Python-tesseract は、Python 言語用の光学式文字認識 (OCR) ツールです。このツールは、Google の tesseracc (画像に埋め込まれたテキストの認識と読み取りを支援する ocr エンジン) のラッパーです。

このツールは、tesseract のスタンドアロン呼び出しスクリプトとしても使用でき、jpeg、png、gif、bmp、tiff など、Pillow および Leptonica 画像ライブラリでサポートされているすべての画像タイプを読み取ることができます。

リンク: https://pypi.org/project/pytesseract/

8 | PyTorchCV

PyTorchCV は、pytorch に基づくコンピューター ビジョン タスク用のフレームワークです。このフレームワークは、画像分類、セグメンテーション、検出、姿勢推定モデルのコレクションです。このフレームワークには、AlexNet、ResNet、ResNeXt、ピラミッド idnet、SparseNet、DRN-C/DRN-D などを含む多くのモデルが実装されています。

リンク: https://pypi.org/project/pytorchcv/

9 | Scikit イメージ

Scikit-Image は、画像処理用の一連のアルゴリズムを含む人気のオープンソース Python ライブラリです。これは基本的に SciPy 画像処理ツールボックスです。組み込みの scipy.n-image は、Python 言語での一連の汎用画像処理ルーチンを提供します。この画像処理ライブラリは、Python プログラミング言語で十分に文書化された API を提供し、研究、教育、産業アプリケーション向けのアルゴリズムとユーティリティを実装します。

リンク: https://scikit-image.org

10 | SimpleCV

SimpleCV は、コンピューター ビジョン アプリケーションを構築するための一般的なマシン ビジョン フレームワークです。このライブラリは Python で書かれており、OpenCV などのいくつかの高性能コンピュータ ビジョン ライブラリへのアクセスを容易にします。

フレームワークは、ビジョン アプリケーションの開発に使用できるライブラリとソフトウェアのコレクションです。カメラ、画像処理、特徴抽出、フォーマット変換にクリーンで読みやすいインターフェイスを提供します。また、Web カメラ、Kinect、FireWire、IP カメラ、携帯電話からの画像またはビデオ ストリームを使用することもできます。

リンク: http://simplecv.org

おすすめ

転載: blog.csdn.net/AbnerAI/article/details/129336956