ヘテロジニアスコンピューティングのはなぜヘテロジニアス・コンピューティングの二つの派閥?

インターネット業界では、情報技術の普及とともに、データの量が、それは、ストレージスペースは、新しい要件を持って飛び込ん作る機械学習、人工知能、無人、産業シミュレーションの分野で上昇するので、その汎用CPUながら、大規模な計算処理、例えば並列度などの大容量データ/画像は、高い、不十分な帯域幅、高い待ち時間でない場合に遭遇する、より多くのパフォーマンスのボトルネック。

コンピューティングの幅広いニーズに対応して、より多くのシーンのは、GPU、FPGAおよびその他のハードウェアアクセラレーションを導入し始めた、ヘテロジニアス・コンピューティングがされて入ってきました。異種コンピューティング(ヘテロジニアス・コンピューティング)は、主部及びその命令セット・アーキテクチャの異なるタイプを算出する算出システムを指します。

1980年代、異種のコンピューティング技術が生まれてきました。様々ないわゆる不均質なコンピューティングは、CPU、DSP、GPU、ASIC、コプロセッサ、FPGAおよび他のユニット、命令セットの異なるタイプの使用、計算手段異なるアーキテクチャは、ハイブリッドシステムからなる、特別な計算が行われています方法は、「ヘテロジニアス・コンピューティング」と呼ばれています。

特に、人工知能の分野では、ヘテロジニアスコンピューティングが有望。我々はすべて知っているようにコンピューティングパワーで、AIの平均超高需要、現在の異種コンピューティングGPUアクセラレーションAIは、革新的なコンピューティング・アーキテクチャの新世代の代表となっています。

なぜ我々は、ヘテロジニアス・コンピューティングが必要なのでしょうか?

計算を言えば、私たちは通常、CPUと思うが、ムーアの法則に、汎用コンピューティング、対象に属するCPUは、多様な種類の、特にアプリケーション、コンピューティングの広い範囲の発展に伴い、計算の特定の種類を扱っで「無力」にCPUを引き起こし状況。コンピューティングシステムは、ハイブリッド構造が必要になってきているとなって、単位の計算のそれぞれ異なるタイプが彼らの最も山の良い作業を行うことができます作るために、特定のユニットをご紹介します。

CPUの動作は、このようなデータ、ファイル管理、人間とコンピュータの相互作用、およびより多くのルーチンを読み取りなどの作業が、良い管理とスケジューリングを、していませんが、多くの補助があり、GPU管理が弱く、より強力な操作、それはより複雑なプロセスであり、そしてより適切なブロックデータストリーム処理アルゴリズム、FPGAは動作を管理することができるが、開発サイクルが長く、複雑なアルゴリズムの開発は困難です。ストリーム処理アルゴリズムに適した、またはそれがキャリーへのデータの単一片であるかどうか。リアルタイムではFPGAが最も高い、があります。

人工知能膨大なコンピューティングパワーは、「熟した」それを計算するCPUで到着、GPU、FPGAを要求する場合。

2つの派閥--GPU異種コンピューティングおよびFPGA

私たちは、「CPU + GPU」と「CPU + FPGA」アーキテクチャである異種のコンピューティング・プラットフォームに最も精通しています。最大の利点は、全体のコンピューティング業界、特に上がって、コンピューティング業界の性能要件の場合には、ヘテロジニアス・コンピューティングがますます重要になってきた、伝統的なCPU、より効率的かつ低レイテンシのコンピューティング性能より計算典型的なヘテロジニアスコンピューティングアーキテクチャに平行ですここではすべての生態系の力です。

CPUに比べて我々はすべて知っている、として、GPUとFPGAは、あまりにも多くの利点を持っている、GPUは、計算上、より効率的な並列処理度が高く、高いスタンドアロンコンピューティングピークを有し、かつFPGAの利点を主にそれに反映され、より高いあたりを持っていますワット性能、非構造化データの計算より高い性能、より高いハードウェア加速性能、下層配線遅延。

現在、最も使用され、異種コンピューティングが加速するGPUを使用することです。主流のGPUユニットは、プログラム可能なストリームプロセッサ、かなり遅れCPUの単精度浮動小数点実行中のGPUの強力なラインナップと、統一されたアーキテクチャを採用しています。GPU様々なメーカーは、汎用コンピューティング、GPGPU(一般Perpose GPU)のためにGPUを導入しました。時間のために、業界では、GPUコンピューティングについて話しています。

GPUに加えて、FPGAは、近年では、ホットスポット、半導体産業になります。FPGAは、高性能、低消費電力、プログラマブルチップが行うように設計された特定のアルゴリズムに応じてカスタマイズすることができます。大量のデータを扱う際にそのため、FPGAは、CPUとGPUへの優位性を比較した:FPGAより計算効率、FPGA近いIO。

PGAは使用されず、ソフトウェア命令は、ハードウェアが統一デバイスです。ハードウェア記述言語を使用して、FPGAロジックをプログラムするために、ハードウェア記述言語は、トランジスタ回路の組み合わせに直接コンパイルすることができます。したがって、ユーザは、実際には翻訳システムによって指示することなく、直接アルゴリズムFPGAトランジスタ回路が実装されています。

もちろん、GPUやFPGA、ASICチップに加えて、現在のオプションの計算です。ASICは、専用のチップで、従来の汎用チップは、カスタマイズされたチップの特定のニーズに合わせていくつかの違いが、持っています。コンピューティングパワーと効率ASICチップの汎用チップASICに比べので、アルゴリズムに応じてカスタマイズすることができ、側面以下の優位:小さなサイズ、低消費電力、高性能コンピューティング、高い計算効率、チップ音量が大きいほど、コストを下げます。しかし、欠点も明らかです:アルゴリズムの変更が使用できない場合があります一度アルゴリズムは、固定されています。

人工知能は、現在の期間の大流行である、多数のアルゴリズムは、様々なアルゴリズムに適応するために行う方法をASIC ASIC、それははるかに安定したアルゴリズムの時代からある、注がれている最大の問題です。

異なるプロセッサチップは、異種コンピューティングを構築する独自の明確な特徴を有します。CPU、GPUフィールドは、オープンソース・ソフトウェアとアプリケーション・ソフトウェアがたくさんある、任意の新しい技術意志CPUとの最初のアルゴリズム、豊富な資源と簡単にアクセスでき、低開発コストと開発サイクルをプログラミングCPU。FPGA実装、FPGAチップの特性のより完全な理解を開発する必要がありますが、高い並列性の性質は、多くの場合、順序は、サービスのパフォーマンスを向上させるために作ることができる人をVerilogの/ VHDLおよび他の低レベルのハードウェア記述言語を使用して、動的なFPGAながら、データセンターに配置されたとき、再構成可能なは、異なるロジックがビジネスフォームに応じて、異なるハードウェアアクセラレーション機能を実装するように構成されてもよいです。

しかしAISC偉大な開発リスク、時間の長い期間、コストの価格でなく、また、開発から市場に確実にするために十分な大きさの市場を持っている必要があります。ASICチップは、最適な性能、すなわち高い面積効率、高速、低消費電力化を図ることができますこのようCNNや他の深い学習アルゴリズムなどの分野に適していない高速な反復です。

エピローグ

止められない現在の計算の多様化の傾向は、単一CPUの電力要件を計算することができませんでした。この場合には、異種コンピューティングGPUとFPGAで人気表さ。特に人工知能、ビッグデータ、および他のものの新技術を促進するために、アプリケーションの種類にもプレゼントを計算するための需要が特性を差別化、多様化。かどうかは、「CPU + GPU」または「CPU + FPGAは、」より良い個々のニーズに応えるために計算されます。

コンピューティング業界の進化は、ヘテロジニアス・コンピューティングは、開発のための広範な領域があると、私たちはより多く表示され、より多くの異種のコンピューティング・アーキテクチャは、アプリケーションを運んでますます重要な役割を果たしていることが予想されます。

関連勧告:

小Meige FPGA設計と検証方法のビデオチュートリアル

FPGA元対話 - チャット技術の両方が、また、市場の話へ

NI FPGAベースの学習ビデオ(のcRIOに基づきます)

公開された74元の記事 ウォンの賞賛337 ビュー130万+

おすすめ

転載: blog.csdn.net/kebu12345678/article/details/103517619