コンピューター ビジョン エンジニアとしての私の日々の仕事、数か月にわたるプロジェクトについて話します。

コンピュータビジョンは一般的な方向性であり、美容、顔認識、医療効果、セキュリティ監視、ビデオ理解、無人運転、仮想現実などを含むがこれらに限定されないアプリケーションシナリオは非常に豊富です。

これらの大きな経済的利益をもたらすアプリケーションに加えて、比較的経済的利益が小さいアプリケーションもいくつかあります。たとえば、宿題アプリを変更したり、コンピュータービジョンエンジニアがさまざまなシナリオで仕事をしたりするなど、仕事は非常に異なります。私自身にインターンシップを加えたもので、私は約6〜7年間画像の仕事をしてきました。それなりに経験は積んできましたが、まだまだごく普通のプログラマーです。私がやってきたビジネス以外にも、なかなか話せない現場があります。

次に曾進が参加したプロジェクトを紹介したいと思います。

多くの第一線のエンジニアに確認したところ、このプロジェクトに関わる作業は多岐にわたります。言い換えれば、ここに含まれるワークフローとテクノロジースタックは普遍的です。

私は警備会社で 2 年間働いていますが、この機器メーカーは森林火災をリアルタイムで監視するために森林監視塔にカメラを設置する必要があります。これには構造、ハードウェア、ソフトウェア、画像処理が含まれるため、さまざまな立場でのコラボレーションの問題があります。私と同僚は主に画像処理とハードウェアを担当しています。要件を取得したら、まずビジネスシナリオを分析するための会議を開催します。明らかに、これは 2D 画像の検出と認識の問題です。ターゲットは裸火と煙です。ターゲットは背景は複雑で変更可能ですが、データ量はわずかです。

当時、ディープラーニングはすでに火がつき始めていました。ディープラーニングは人工精神遅滞として知られています。データがなければ実行できません。顧客から提供されたデータが少なすぎることがわかりました。通常の慣例によれば、私は Google を使用して、一連の公開データ セットを検索しました。少し見つけたんですけど、僕らのシーンとは全然違うんです。さらに、エンドサイドでの展開を考慮し、従来の画像処理技術を使用する予定です。

アイデアが固まってから作り始めました。

まず、インターネットでビジネスシナリオに関する論文を必死に探したところ、同じく従来の画像処理ソリューションを使用したイギリスのケンブリッジ大学発行の SCI 論文を見つけたので、ダウンロードして Google に放り込んで翻訳しましたそれを中国語に翻訳します。しかたなく検索を続けたところ、米国のコーネル大学が発表した別の論文を見つけ、検討・評価した結果、こちらのほうが当社に適していることがわかり、再現を開始しました。

実験段階では、Python の opencv を使用して、さまざまな前処理、混合ガウス モデル、形態素処理、ウェーブレット変換などを数日間いじってみました。効果はOKです。ようやく安堵のため息をつきました。次に、このデモを C++ で作成し、Linux 産業用コンピューターで実行し、顧客に見せました。顧客の指導後、テストのために森林公園に行きました。

しかし結果はバチが当たり、社内では悪くなかったデモが実環境ではすぐに崩れてしまい、ひどいものでした。会社に戻ってデータを再分析し、ビジネス ロジックについて顧客とさらにコミュニケーションを取り、関連する論文を見つけてコードを書き直す以外に選択肢はありません。BUGを調整し、さまざまなモデルのパラメータを調整し、何度もやり直して、最後にフォレストテストを実行しましたが、結果はまだ動作しません。

正午にテストを行ったため、太陽は暑く、非常に明るい環境下で煙検知モジュールが直接クラッシュし、まったく使用できなくなりました...

上記の作業内容には、Python、C++、Linux、opencv、伝統的な画像処理技術、論文の審査と再現、すべての画像を理解する試みなど、学生が習得する必要がある一般的なスキルが含まれることに注意してください。アルゴリズム モデルは、従来のモデルであってもディープ ラーニング モデルであっても、照明の問題が発生するとすぐにクールになってしまいます。

OK! ここまで数か月が経ちましたが、画像アルゴリズムさえ理解できませんでした。

最善を尽くしたつもりですが、極端な環境でのいくつかのテストには対処できません。学部長は香港大学の博士号を持っているので仕方がありませんが、これは知力ではなく体力の問題です。同僚の髪がさらに数本抜け落ちているのを見て、自分の髪を触ってしまったようですが、幸いなことにあまり抜け毛はなく、今でもとてもハンサムです!

つづく……(後日解決しましたので、次回時間のあるときに更新します)

私があなたのために編集した人工知能学習教材の一部を無料で共有してください。これは長期間にわたって編集されており、非常に包括的です。人工知能の基本的な紹介ビデオ + AI 共通フレームワークの実践ビデオ、画像認識、OpenCV、NLP、YOLO、機械学習、pytorch、コンピューター ビジョン、ディープ ラーニング、ニューラル ネットワークなどのビデオ、コースウェアのソース コード、国内外の有名なビデオを含むエリートリソース、AI の人気論文など。

以下はいくつかのスクリーンショットです。記事の最後にあるコードをスキャンして、私を追加して無料で入手してください (AI テクノロジーに関する 1 つまたは 2 つの質問にも答えることができます)

目次

1. AI無料ビデオコースとプロジェクト

2. 人工知能必読の本

3. 人工知能に関する論文集

4. 機械学習 + コンピューター ビジョンの基本アルゴリズムのチュートリアル

 5、ディープラーニング機械学習チートシート(計26枚)

人工知能をうまく学ぶには、より多くの本を読み、より多くの実践的な作業を行い、より多くの練習をする必要があります。レベルを向上させたい場合は、落ち着いて体系的にゆっくりと学習して、何かを得ることができるようにする必要があります。終わり。

下の名刺をクリックしてコードをスキャンすると、テキスト内の情報を無料でダウンロードできます。

Guess you like

Origin blog.csdn.net/gp16674213804/article/details/126480108