深層学習ResNetモデルに基づく画像認識

 

返信を開始:

  私たちのプロジェクトの方向性は、深層学習に基づく画像認識です。画像認識は、人工知能において非常に基本的で有望な技術であると言えます。

  コンピュータ画像認識技術は、公共安全、生物学、産業、農業、輸送、医療などの多くの分野で応用されています。

例えば、輸送におけるナンバープレート認識システム、公安における顔認識技術と指紋認識技術、農業における種子認識技術、食品品質検出技術、医療分野における心電図認識技術など。コンピュータ技術の継続的な開発に伴い、画像認識技術も継続的に最適化され、そのアルゴリズムも継続的に改善されています。

 

  私たちのチームは、機械学習のResNetモデルと既存のcifar10データベースを使用して、画像認識システムを実装しました。テスト後、画像のシステムの精度は90%に達しました。設備が不足しているため、ネットワークの改善は非常に遅いですまた、非常に手間がかかり、この結果を達成するには不十分であると考えられます。

  以下では、ネットワークモデルとデータセット選択の2つの側面について説明します。

  私たちが使用したネットワークモデルは、2015年に3人の中国の学者によって提案されたResNetでした。このモデルには、他のネットワークに比べて次の利点があります。

 

 

 

  深い残差学習フレームワークが導入されました。一部のスタックレイヤーに元のフィーチャを直接学習させる代わりに、スタックレイヤーを使用して残差マップを適合させます。

  ResNetは深さを増すことで精度を向上させることができ、Resnetによって生成された結果もその時点でレコードを更新しました。

  ResNetは強力なスケーラビリティを備えており、ネットワークが100層または1000層にまで増加しても、劣化の問題は発生しません。

  そこで、ここではこのネットワークを利用して画像認識技術を実現しています。

 

  10カテゴリの60,000個の32x32カラー画像で構成され、各カテゴリに6000個の画像があるcifar10データセットを紹介します。50,000のトレーニング画像と10,000のテスト画像があります。

  トレーニングセットは、普遍的なオブジェクトを識別するためにAlexとIlyaによって照合された小さなデータセットです。したがって、このデータセットを使用します。

  実験後、トレーニング結果も改善されました。

  

 

 

 

  システムの使い方も非常に簡単で、画像をimgフォルダーに保存し、name.jpgという名前を付けてから、直接predict.pyプログラムを実行して結果を取得します。

  このシステムは私たちのチームの最初のプロジェクトであり、その結果を見て、私たちは有頂天であり、皆の承認を得たいと思っています。

  次のビデオは、システムの実際の測定効果を示しています。

 

  

  

おすすめ

転載: www.cnblogs.com/bianjunting/p/12722412.html