マルチプロセッサ・テクノロジー

 

①並列処理、開発、科学技術の適用範囲の拡大、高性能コンピュータで、低価格が高い要件があり、並列計算機は、アプリケーションの広い範囲を持って、大規模なマルチプロセッサコンピューティング技術の起源これは、コンピュータネットワークベースの迅速な計算のニーズを満たすために、分散現代のコンピュータ、および並列処理のキーテクノロジーとなっていると、それゆえ、マルチプロセッシングシステムのキーテクノロジーは、問題の核心となっています。複数のスレッドからストレージ構造からハードウェアおよびソフトウェアは、これらの二つの側面は、複数のプロセッサをサポートして議論されています。②マルチプロセッサは、上記命令レベル並列性を達成するために、一元管理システムの下で動作し、高速インターネットを介して接続された二つ以上の技術のプロセッサを定義しています。分類は、フリンによると、マルチプロセッサシステムは、MIMDコンピュータです。独立した複数のプロセッサによるマルチプロセッシングシステム、独立して、独自のプログラムを実行することができる各プロセッサ
PS:MIMD MIMD独立して動作を複数有する並列処理技術、および非同期MIMDコンピュータを実装するためのプロセッサは、異なるストリームデータである命令ストリームが作動、同時に命令ストリームの複数を実行する、すなわち、異なるデータセグメント異なる命令にプロセッサ・クロック・サイクルの種々の任意で行うことができる
マルチプロセッサメークシステムは、単一の命令ストリームの流れと比較して、複数のデータ・アレイ・プロセッサ、マルチ命令ストリームの複数のデータ・ストリームであり、差は主に平行の異なるレベルから導出されます。マルチプロセッサは、より高いレベルのタスク又は動作の間に並列に達成され、開発され、並列に分配されるように加工することにより、ハードウェア構成、それぞれ命令制御手段の複数を使用し複数のプロセッサ、でインターネットとの間の非同期通信。このアルゴリズムでは、それはまた、効果的にアドレスリソースの割り当てと管理にオペレーティングシステムやその他のソフトウェア・ツールにより依存するように、システム管理に、より普遍的アルゴリズムの暗黙的な並列処理を実現鉱業、ベクトル、配列処理に限定されるものではなく、特定のタスク割り当て、プロセッサ・スケジューリング、プロセスの同期と通信問題で
PS:並行してメモリ動作-パラレルストレージ、連想プロセッサ手順並列プロセッサ-並列に動作するプロセッサパイプラインプロセッサ-アレイプロセッサタスク、オペレーションパラレル-マルチプロセッサ
PS:コンピュータアーキテクチャレベル並列:(1)ビット列文字列:ワードプロセッサの一方のみ。これは何の並列性がない、基本的な文字列処理モードです。(2)とビット列は:ワードのすべてのビットが処理されるために、同時に、異なる単語が連続しています。私たちは、並列処理を表示されるようになったてきました。(3)ワード線とビット列:単語の多くは処理中に。このアプローチは、高い並列性を持っています。(4)完全に平行:全てのビット多くのワープロつつ。これは、並列処理の最高レベルです。観点からプログラムの実行、ローからハイレベルに並列に分けることができる:(1)内部並列命令:命令の並列実行の間に各マイクロオペレーション。(2)命令レベル並列の2つの以上の並列実行命令。(3)タスクレベルまたはレベル並列処理:プロセスまたはタスク(ブロック)の二つ以上の並列実行。(4)ジョブまたはプログラムレベル並列性の2つの以上のジョブまたはプログラムの並列実行。

③マルチ汎用マルチプロセッサは、一方が大の複雑な問題を解決する速度を増加させるためにプロセッサによって、並行して複数のタスクを複数のジョブを実行したいと思い、二つの異なる目的を持って、それによってシステム全体の性能を向上させます再編成によってシステムに冗長な複数のプロセッサの別の使用は、信頼性、適応性及び可用性を向上させます。マルチプロセッサは、同一の構成を有し、異種、分散型3
PS:並列処理:また、SIMDコンピュータとしても知られている、特定の方法で相互接続されたPUを複数、同じCU制御で、それぞれのデータ集合的に同じ所定の指示の操作を完了します。そのようにアレイプロセッサと呼ばれる制御部材の下に複数の処理ユニットの単一の制御配列です。同じ命令を操作するために、専用:④マルチプロセッサシステムは、複数の独立したプロセッサ、マルチプロセッサ機能(1)並列プロセッサの構造的柔軟性の組成物です。PE(処理単位)ロット番号、限定固定マルチプロセッサ通信:一般的には、異なる複数の命令を実行することができます。柔軟な高速通信(2)並列手順並列並列プロセッサ命令は、比較的簡単な、家庭で複数のタスクを外部からの指示にマルチプロセッサの並列存在を同定するために、内部に存在する、平行に(3)困難識別並列処理タスクが動作モードと一緒に由来直接同時にマルチプロセッサによって開始された各PE命令が並行関係を表現するために特別なコマンドを使用し、タスクが、それと並行して実行派生他のタスクを開始することができますもしプロセッサの数、キュー過剰待機中のタスクよりもタスクの数。天然に同期(4)並列プロセッサの同期処理のみCU、マルチ異なる命令を実行し、作業を停止し、待機するように最初に行われ、関連する制御データが関連されるべきで、同じままでない進行しないであろう適切な同期シーケンスを維持するために特別な措置をとるために停止し、待機、(5)の手順は、リソース割り当て及びプロセススケジューリング並列プロセッサPEが固定されて必要に応じて、実際にマルチ同時実行の動作に関与するPEの数を変更する遮蔽手段の使用プロセッサの数が固定されていない目的のタスクは、タスクを入力するか、終了するたびに、プロセッサが同じではない、共有リソースがどのように大きなジョブを研究するために、マルチプロセッシングの変化⑤技術的問題に種類、数量及び被験者のために必要又はタスクは、各タスクの合理的な粒子サイズおよび粒子サイズの均一性を選択するタスク、並列処理のように高いだけでなく、分割ので、追加の誘導体、収束、通信及び他の小さな補助オーバーヘッドは、並列アルゴリズム、並列言語を含むこと調査、分析、およびマルチプロセッサ性能効率のデザイン。
PS:タスクの粒径が大きく、マルチプロセッサの性能と効率に影響することができ
、マシンが固定されていないことを同時タスクの必要数を実行するためにマルチプロセッサを、プロセッサは、入力するか、時間を終了し、リソースがタスク変更を必要と比較的大きい、より良いので、各プロセッサの負荷ができるだけバランスをとることを、動的なリソース割り当てとタスクのスケジューリングを解決するために、デッドロックを防ぐためにどのように検討する必要があります
シングルプロセッサシステムの後に、(例えば、タスクレベルでの並列処理のレベルまたはプロセスのような)特定のレベルにこの並列上昇はマルチプロセッサシステムでは、(例えば、オペレーティングシステムのプロセス管理、運用管理などの)ソフトウェアで実現する必要があります、既にタスクまたは動作プロセッサ、ハードウェアによって実現される並列処理を完了しました。コンピュータシステムにおいて、様々な対策が並列性を取ることができます。密結合マルチプロセッサの共有メモリの⑥ハードウェア構成は、プロセッサ間通信を介して達成され、通信速度は、相互接続されたプロセッサの限られた数の、メインメモリ、インターネットを介してプロセッサに接続されたメインメモリの帯域幅によって制限されますネットワークの帯域幅と各訪問確率プロセッサメインメモリの競合。モジュロMマルチボディインターリーブを使用して、アクセス競合をメインメモリをメインメモリを削減するために。大きなモジュラスM、衝突の確率は低いが、良好な分布及び各メモリモジュールの位置決めデータを解決するには、プロセッサは、ここでオペレーティングシステムと共通のコアコードの小容量のプロセッサ独自のローカルメモリをもたらすことができますテーブルには、さらに競合を減らすために、メインメモリにアクセスしてください。PS:Mマルチボディインターリーブモード:二つの方法、大容量のコンピュータのメインメモリからなる1つの並列メインメモリシステムは、複数のメモリバンクとすることができ、各本体は、それ自身のリード線アドレスレジスタを有しますそして「メモリモジュール」と呼ばれるデータ・レジスタは、このようなマルチモジュールメモリがオーバーラップして実装されてもよいインターリーブ、各モジュールMの交点にアドレッシング、クロス対処モジュロM.呼び出された場合 ①同時アクセス:すべてのモジュールが開始され、メモリMは、各モジュールの容量はLである、モジュールのセットを含む、低次のように交差する隣接するモジュール・アクセス・モジュールマルチボディの分布に連続したアドレスをアドレス各メモリモジュールを横切ります各データ対向メモリサイクルは、読み出しまたは②平行クロスリファレンス情報のライトレジスタ:Mモジュール順番に特定の順序でそれぞれのアクセス期間を開始する、隣接する二つのモジュールは、単一の遅いアクセスモジュールに等しい間隔の最小時間を開始します1 / M
⑦プロセッサの数の形で機械ユニット間の相互接続は、高い通信速度、低コストの条件を満たすように、性能を決定する際にマルチプロセッサの重要な因子の形で相互接続されている、様々な複合さえを達成するために、フレキシブル配線であるべきです共通バスインターフェースを介して、プロセッサバス、メモリモジュールと複数の周辺機器の形態でコンフリクト1)なしの不規則な相互接続は、接続された、またはマルチプレクサ時分割伝送技術です。バス構造のシンプルな形、低コスト、スケーラビリティ、パフォーマンスと信頼性の利点が、深刻な物理的な要因によって制限。あなたはアクセス競合バスを解決するために、適切な機関制御バスとバス調停アルゴリズムの形でバスを使用する必要があります。バスの伝送速度を増加させる一方に高周波同軸ケーブルの形態におけるシステムバスの効率を改善するための二つの方法があります。第二は、バスを訪れ減らすために、マルチバス衝突確率通りです。アドレスに複数のプロセッサが同時に紛争の共通バスにアクセスし、我々は、最初に来る最初務め、多くのバス調停アルゴリズムを動的優先順位を静的優先、固定のタイムスライスを開発しました。深刻な物理的要因によって制約させながら2)ので、少し環状プロセッサに接続されたステーションとの間の、論理的バス構成考え、リング相互接続バス相互接続の形で利点を維持し、顧客サービスの欠如、前記環状相互接続。このようなマルチプロセッサ上で、情報転送処理は、連続的にこれまでの送信者への情報バックするまで、下向き転送リングネットワークプロセッサを介して環に情報を送信する処理です。リング相互接続は、光通信に適した物理的パラメータを制御することが容易であるほとんどの接続ではなく、バス接続、各インターフェースは、垂直および水平クロスバーの形態の伝送ユニット3)を有し、高い通信帯域幅、遅延情報欠点を有しますスイッチアレイプロセッサP横方向及びI / Oチャネルと垂直メモリモジュールMが接続されています。i番目とnプロセッサはIに/ Oデバイスは、M個の並列通信の1つと各メモリモジュールバス通信に割り当てることができる場合、クロススイッチは、領域割当てメカニズム、任意のプロセッサまたは情報交換のI / Oチャネル、唯一のクロスでありますスイッチは、伝送遅延部、より多くの場合の単位プロセッサの数、各メモリモジュールのマルチポートメモリの形でシステム4)の大流量特性との良好なスケーラビリティを有する複数のアクセスポート、クロスの分布を有しています制御スイッチマトリクス、およびメモリモジュールに転送優先度アービトレーションロジックは、適切なインタフェースに移動され、それはマルチポートメモリ構造の形態を構成します。マルチポートメモリは、中央マルチポートメモリモジュールの形態である、複数のメモリモジュールの対応するポートは、互いに接続されたポートの各々は、メモリアクセス要求ハンドラP又はI / Oチャネルを処理する責任があり、各メモリモジュール、そのに従って各ポートは、分解するために優先順位を指定しました これは、アクセス違反です。5)小容量のネットワーク・バッファ・メモリを貫通するとともにウォームマシン間、目的、ワームネットワークルーティング保存および回送メッセージパケットを達成するために、メッセージパケットは、より小さいグループの系列に分割され、非同期パイプライン的に同じグループ内のすべてのグループ順次スイッチハードウェア相互接続構造と内装変速ハブ構造を切り替えるため)群の頭部のみがトランスポンダ6を通してパケット転送それの先を知る、同じグループ内の中断されない、すべてのグループを送信することに配置され各プロセッサまたは内部インターフェイス、分散構成の組成物は、ハブ構造を切り換えると称します。より少ないので、システムができ、モジュール自体の構造を変更することなく、大量高速互いに接続プロセッサの数に非常に短いパスの可能な各スイッチングハブのポートの数が少ないと、柔軟な通信に使用されるスイッチングハブあらゆる規模の拡大を得ます。このモジュール式の再構成可能なマルチプロセッサ強い、システムは強力な汎用性を持っています。
⑧マルチプロセッサの並列処理マルチプロセッサの並列内部コマンドに存在するだけでなく、外部からの指示で、そのため、あなたは、アルゴリズムを使用して、言語、コンパイラ、オペレーティングシステム、および説明書、ハードウェア、および開発するために他の方法をプログラミング、マルチプロセッシングでなければなりません低レベルの並列計算機1、パラレルハイレベルのタスクとジョブによって達成定量するために開発することができるアルゴリズム、コンパイラ、オペレーティングシステム及び言語に主として依存する)アルゴリズムが悪い演算処理がある場合に特定の問題を解くための並列アルゴリズムを提供ステップ。並列アルゴリズムは、同時に、プロセスが相互作用し、同時動作を調整することができるで実行できるプロセスの複数の集合を指します。研究のアイデアマルチプロセッサ並列アルゴリズム:アルゴリズムは、コンピュータの構造とトピックに依存し、キーは、並列マルチプロセッサの性能を向上させることです。並列アルゴリズムは、アイデアは、並行して並列処理中にプロセッサにプログラムに十分な大きさであることがあります。各プロセスは、組成物を記述するために、各階層のノードのツリーを増加させる、すなわち、ツリーにプロセッサを増加させるプロセスが同時に実行できるノードとの間の関連付けのプロセスとノードツリーと見なされます、段マルチプロセッサ動作の数を減少させる、即ち、木の高さを低減します。良いコンパイラに設計要件にマルチプロセッサ、並列プログラムに、高レベル言語ソース・コードではなく生成よりも、並列処理可能な対象プログラムの高度をコンパイルすることができる)ブロック2は、シリアルプログラムに関連する多数の命令を有します(プログラムの並列分析)相関分析大幅に加えて、タスクの並列アルゴリズムは、プログラムの構造に依存して、プログラム間の平行度が、複数のプログラム、プロセス、タスク、の間の平行セグメントが依拠するかどうかを意味するかどうかプログラムの構造。データブロック間の関連付けは、並列プログラムを制限する重要な因子である、コマンドデータの間に相関があるかもしれない、それはまた、ブロック間に存在してもよいです。最初のリードアフターライトデータ依存性がシリアルであってもよい場合は、平行反比例書込みデータの前に読んでいない場合、シリアルすることができ、シリアル交換は、並列に実行することができないが、それは、共有メモリに書き込まれたことを確認する必要があります出力データは、関連するセル書き込み前提ことを確実にするために、直列する場合は、ライトアフターライトの書き込み順序の前に読み、パラレル、シリアル、しかし同時読み取り後の書き込みがあった場合に交換することはできません最初の読み取りと関連する2つの書き込みは、時間のために交換データを、パラレル、および要求完全に同期読み書き、シリアル順序及びシリアル相関のない交換がない場合、唯一のソースデータを許可されていないなければならない、または同じ、パラレル、シリアル、またはシリアル順序を切り替えます。PS:目的は、交換シリアルにある、あなたはブロックするだけでなく、アイドルプロセッサが仕事をスピードアップするためのマクロから様々なブロック間の平行度を高めることができ、次のブロックの実装を進めることを可能にすることができない場合との間に並列に終了しました搬送速度、システムを改善
⑨性能タスク性能尺度粒径および効率的な計算のためのプログラムEのプロセッサと実行時間との間のC補助オーバーヘッド時間通信の比に基づいて、タスクの粒度。並列度の最大値が最大補助オーバーヘッド通信をもたらす場合にE / Cが大きいだけ比が、並列利益を利用するために、それは、従って、より少ない補助オーバーヘッドを低減するために、タスク並列性の粒度を増加させますすべてのタスクがお互いに割り当てられている場合、最高のパフォーマンスのために、並列処理とN = 2とオーバーヘッド通信の総合的なバランスの必要性は重複計算プログラムは、そのプロセッサという、デュアルプロセッサ上で実行されてはならないと平行でない、コンピュータ間の通信が必要とされないプロセッサのアイドル状態は、しかし、プログラムの実行時には、R =私は1つのプロセッサに割り当てられたタスクは、残りのタスクを別のTIに割り当てられている場合T * Eの合計でありますプロセッサは、R = E * maxの{TI、I} + C *(TI)I2.N> 2及びIKは、オーバーラップ最初のタスクは、プロセッサユニットKは、R = Eに割り当てられていない場合は、通信を算出します* MAX {IK} + C / 2(T ^ 2-)平均割当または集中分布を使用するか、簡略化のためにこれら二つのタスク割当て戦略の総走行時間との差を計算することによって決定することができるTはNの整数倍で提供、総走行時間差の分布と割当の平均濃度 ET / N + CT ^ 2/2-CT ^ 2 / 2N)-ET、それは場合は0に等しくする、利用可能なE / Cとして説明E / C = T / 2、>ときにT / 2、平均割当戦略を使用して場合ので、より大きなオーバーヘッドC、集中配分戦略、さもなければ総走行並列実行の時間が、延長のE / C <T / 2、。集中分布SP = R /均等に分散Rの加速度並列システムの分配比は、重要な結論が得られた場合、さらに、平均値を使用して、得られるE / C >> T *(N-1)/ 2なら高速化が近いNにすることができ、タスクT及びハンドラの数が数N、E / Cが大きな加速度である場合、すなわち、並列プロセッサシステムは、数Nの比で含まれている小さいが直線的に増加、近くのマシンを増加します数Nが大きい機械に増加された後に、SPは、E / CとタスクTの数に、2E /(CT)に近づくと、機械Nの数は実質的に無関係

マシン間の通信を同時に多重化することができる。なお、各プロセッサは他のプロセッサと通信するための通信リンクを有することが想定される、通信動作は、一つのプロセッサので、任意の時点で、タスク自体の実行とオーバーラップすることができ、他のリンクの数は、システムビットR = E *が最大の操作の合計時間に、Nビット、最大で、同時通信局Nにプロセッサ二乗場合でもプロセッサ、......それが唯一の通信との間の通信差分その缶N増大補助オーバーヘッド削減で順次シリアル通信。増加並列処理と通信リンクの帯域幅が増加し、総実行時間を短縮することができるが、タスクが相応に小さいサイズにすることができますが、増加し、リンク帯域幅の通信リンクの数を増やすには、通信以外は減少しません補助オーバーヘッドは、有意システムのコストを増加させるであろう、従って、並列度は、マシン間通信技術を使用し、相互接続構造体及びその他の措置が取ら補助オーバーヘッドを低減するために、システムのコストパフォーマンスに主に依存します。
要するに:マルチプロセッサマシンの数と、実行時間が低減される計算が、スケジューリング、共有リソース競合、同期、補機間の通信オーバーヘッドが増加し、その量を増加させることができる場合の問題点を解決するため機械よりも大きい数で直線的に増加、特定のシステム上で、大きなオーバヘッド時間、および通信プログラムの実行時間の比率、より良好な計算処理、処理を向上させることができる細粒度並列処理を使用する場合、しかし、それは単に高性能なマルチプロセッサを製造するマシンの数を増やすために、プロセッサに依存することはできません、設計者は可能な限り高く、リーズナブルな価格、マシンの数だけでなく、より効率的に使用するようE / C値を設計する方法を検討する必要がありますプロセッサ、



⑩並列処理のマルチプロセッサ上で実行されているオペレーティングシステムを構成するプログラム、主に達成するために、システムソフトウェア手段を動作させるマルチプロセッサを通じて、管理機能を実現するために、適切な制御機構を持っている必要があります。マルチプロセッサでは、1)プロセッサの割り当てとプロセススケジューリング、割り当ておよびスケジューリングプロセスが合理的である直接フィットしつつ、各プロセッサを理解する能力を有することに加えて、並列プログラムの性能、プロセスの割り当てに影響を与えますタスクは、外部の処理に割り当てられただけでなく、システムリソースの使用状況を理解するように、プロセッサ、入出力ロードバランシング。マルチプロセッサの同期、2)プロセスの間に並列に複数のプロセスを実行し、いくつかのプロセスがので、同じプロセッサプログラムで同時実行中の同期の問題を解決するだけでなく、異なる解決するために、共有リソースへの同時アクセスが必要とされてもよいですプロセス間通信を同時に3を実行しているプロセッサ間の同期)は、異なるプロセッサ上で実行されているそれぞれの他のプロセスと協働し、通信は、さらに、疎結合マルチプロセッサ間の複数のプロセス間通信処理を実行する場合4メモリ管理システムの各プロセッサは、長距離ネットワークまたはチャネルを介して自身のメモリマルチプロセッサを有する)を行ってもよいし、共有データの一貫性に、メモリを共有する複数のプロセッサによって共有されてもよいですメインメモリのデータ処理装置、ファイル管理システムは、重大度ベル3に応じて異なっていてもよい、マルチプロセッサ・システム・ファイル内の)それらの管理5の一貫性を確保する方法、ローカルメモリの複数の発生ユーザーがファイルを使用することができ、ファイルの物理的な場所を知っている必要はありませんが、ファイルやドキュメントにこの保護アクセス速度が前進高い入れます 要件。6)組換えシステムプロセッサまたはシステム内の機器の故障、かつ迅速に操作の再構築縮退再開します
集中制御から指定されたホスト・プロセッサ上で実行するマルチプロセッシングシステム1)のみメインタイプのオペレーティングシステムによってクラス3、利点がある:ホストプロセッサ重いワークロードに影響あれば比較的簡単なハードウェアは、システムは、容易に麻痺欠点でありますロードロックを動作するように適合され、システム全体の性能は、管理ヘテロジニアスマルチプロセッサ2)の制御機能を別々に複数のプロセッサに分散させ、一緒にすることによって行われます。各プロセッサは、ステーションがプロセッサを発生した場合、別の管理プログラムは、プロセッサの障害がシステム全体の麻痺を引き起こすが、より多くのスケジュールやコスト上昇のプロセスの複雑さを実現するために複雑ではないだろう、実行されています障害は、フローティングタイプのオペレーティングシステムの管理制御ハイパーバイザがプロセッサリソース間浮遊することができる、それは比較を行うことができる)地理的に疎結合に適応マルチプロセッサ3に分散、負荷分散プロセッサが困難で、修復することは困難です良好な負荷分散は、分散制御は、信頼性と密接なマスタースレーブ型のオペレーティングシステムにあるハードウェア構成、オペレーティング・システムの複雑さと経済、という利点を有するが、しっかりと結合するための最も困難な設計の適切な均質マルチプロセッサ

 

おすすめ

転載: www.cnblogs.com/ywangji/p/11831707.html