なぜテスラはトランスフォーマーにすべてを賭けているのでしょうか?

純粋に視覚的な自動運転ソリューションというと、誰もが最初に思い浮かべるのは Tesla です。実際、テスラは 2021 年の時点で、純粋に視覚的な BEV 検出ソリューションを実装しており、その効果は非常に良好です。

d4dccd0fa71339d21cfc723bc4c50ba0.png

注意深い学生は、画像をカメラ空間から BEV 空間に変換するこの BEV ソリューションの中心コンポーネントがトランスフォーマーであることに気づいたかもしれません。

Transformer は自然言語処理の分野に由来し、最初に機械翻訳に適用されました。その後、これがコンピュータ ビジョンの分野でも非常に効果的であることが誰もが発見し、主要なランキングで CNN ネットワークを圧倒しました。

68c05c5aaec0d998659967b5b15ab75e.png

ターゲット検出の分野では、Visual Transformer は 2D 検出、3D 検出だけでなく、マルチモーダル検出も実現でき、BEV の観点からの検出パフォーマンスも非常に優れています。

ccd2e9cc5841f2bfff09c3630867ad73.png

そのため、企業がアルゴリズムエンジニアを採用する際には、Transformer 関連の知識とエンジニアリングの基礎を習得することがスキル要件となっており、履歴書でも大きな加点となります。

ただし、 Transformer ベースのターゲット検出アルゴリズムを習得するには、次の 3 つの困難があります。

  • セルフアテンション メカニズム (セルフ アテンション)、位置埋め込み (位置埋め込み)、オブジェクト クエリなど、Transformer の背後にある理論的基礎を理解します。インターネット上の情報は比較的乱雑で十分に体系化されていないため、 -独学で理解を深め、統合します。e3682ad81c1f097119524c0489c86bd3.png

  • Transformer ベースのターゲット検出アルゴリズムのアイデアと革新をマスターします。Transformer の論文の中には、多くの新しい概念が含まれており、言語が理解するのがそれほど簡単ではありません。論文を読んでも、アルゴリズムの詳細はまだ理解できません。

246868e916e8e70e1f182da1e402491c.png
2
  • Transformer のコードは動作メカニズムが CNN とは大きく異なるため、理解するのが容易ではありません。そのため、コードを完全に理解して実際に適用するには多大な労力がかかります。

c2c0e45955c3f466c4d4b87697b109fc.png
3

では、Tansformer に基づいたターゲット検出アルゴリズムを学習するにはどうすればよいでしょうか?

3D ビジョン ワークショップの共同講師「Yu Yan」は、主に学生が上記の問題を解決できるように、全員のために「ターゲット検出におけるビジュアル トランスフォーマー」コースを注意深く準備しました。

Visual Transformer の基礎知識、さまざまな古典的な Transformer ベースのターゲット検出アルゴリズムを詳細に説明するだけでなく、コード解釈と実践的なコースも提供するため、誰もがこれらの知識理論を真に学び、適用し、理解し、習得できます。

実践編

dd65b2817ec6f1e9136bbe1b84bff29a.png 0550314c2e3f14d54aadb3b684c3e018.png 50280d48c392fcbd47a7e39b1013543c.jpeg 14574cd4e03284505f8e0e56002d2606.jpeg 109c1da397c4190ffb1f3b19e8f6b95a.jpeg 80aa11113d22bb0332fbd88bef1fef77.jpeg 7963577138bd4f97c2c429917f2b8bf7.png 924b0722a4da5eb655e035343f8cd367.png 337dfdaf97537d35cf40bf24e4e1c150.png

6b3a68c9537fca995e0a43308b2df2dd.png

f85eb2b6dc88da05d0247af1cc2b2370.jpeg e25b167e9dc2959ccd7219d5ad6b05dc.jpeg 5044b62babbaa52671dc9673beadcdb1.jpeg

授業開始時間

2023年7月28日(金)20時、毎週1話ずつ更新されます。

コースQ&A

このコースに関する質問と回答は、主にこのコースに対応する Goose Circle で行われ、学習中に質問があればいつでも Goose Circle で質問することができます。

27c44dca3982b692c79710a5caf90368.png
▲長押しでコースを購入すると、先着50名様に早割価格で30元が即割引されます。
f5321f706709dd8043eb00af608a7bae.jpeg
▲長押ししてアシスタント WeChat を追加します: cv3d007、さらに相談するには

おすすめ

転載: blog.csdn.net/Yong_Qi2015/article/details/132929008
おすすめ