[投稿]泰光の秘密

秘密の太光

DECのに基づいて26010 プロセッサ製品の

アルファ12月から技術   21164 プロセッサ。

HTTP:// server.zol.com.cn/592/5926903_all.html#p5934510

 

1つのスーパーコンピューティングの世界の舞台:何であるかTOP500?

 

  1946年、米軍のコンピュータ「ENIAC」利用可能でカスタマイズし、その後、「大きな男は、」追加または毎秒5000回、400回の乗算を行うことができます。開発の70年後、スーパーコンピューティング走行速度は億億回/秒のレベルに達しています。神性太光:今年の6月には、ISC 2016は、TOP500には、新しい世界チャンピオンを発表しました。一部の人々は助けるが、天河-2以上の、まさにこのスーパーコンピューティング能力を求めることはできませんか?国内プロセッサシェン魏26010は、秘密兵器の一種でありますか?

TaihuLight
神性太ライト

スーパーコンピュータの世界アリーナ:TOP500

  展開され、世界の500のスーパーコンピュータのリリース前にLinpackのテスト・性能に応じて1993年以来、国際TOP500組織毎年、スーパーコンピューティング、プロモーションおよびアプリケーションの分野における交流と協力の促進を目的とした年2回のランキングがあるでしょう。2002年以来、中国HPC(ハイパフォーマンスコンピューティング)は、国際Linpackの結果に宣言されていないので、TOP500に含まれていません。その後、テストまで開かれ、関連機関と、中国はすぐに、国際スーパーコンピューティング市場に現れ始めた定期的なトップ10になりました。

  Linpackのは、最初の1974年4月に使用された、それは現在、評価するために、N個のスーパーコンピュータの元に密な線形代数方程式を解くことによって、小数点性能を浮動高性能コンピュータシステムをテストするための最も人気のあるベンチマークです。LinpackのテストはLinpack100、Linpack1000とHPLが含まれます。これは、HPLは、高度な並列コンピューティング・ベンチマーク、アプリケーションの近代的な、より広い範囲で作られた並列計算機のためのテストモードと呼ばれています。

  ピークコンピューティングは、コンピュータの性能の重要な尺度であり、理論値と実際の値に分け、いわゆる浮動小数点演算ピーク、前者コンピュータは、理論的には秒当たりの浮動小数点演算の最大数を完了することができ、それは主にCPUのクロック速度によって決定され、後者すなわち、得られた試​​験結果の一連のコンピュータ、最適な調整にLinpackのテストプログラムを実行Linpackのテスト値です。

  中国の特色あるフランクフルト、ドイツ語、英語の文字列の第47回国際スーパーコンピュータ会議「TaiHuLightは」観客の焦点となっている、その正式名称は「神性太光」です。ピーク容量93PetaflopsでLinpackのスーパーコンピューティングは、よく知られている、ならびに国内のプロセッサシェンウェイ26010と共に、TOP500をリード、遼寧-2圧。初めてHPC中国(167単位)のリストの数は、米国(165台)を上回っていることを言及する価値があります。

TaihuLight
太光TOP500サミット

  上の2つの太光遼寧-2に加えて、第四の10にした超カウントタイタン、セコイアセコイア、日本K北京、ミラ、トリニティ、ピッツDaint、ヘイゼル編とシャヒーンII。公式声明によると、中国は、メインCPUを使用して第三の国は世界で1000000000000000レベルのスーパーコンピュータを構築し、米国、日本に従っています。

  TOP500の旧6回受賞として、天河-2、国防科学によって開発され、広州スーパーコンピュータセンターに定住、Linuxベースのキリン・システムを実行するIntel Xeonプロセッサを搭載しに言及することも必要であり、革新的な使用異種の統合アーキテクチャ。乳白色IIノード演算は、約18メガワット未満、20メガワットとともに冷却システムの全体的なエネルギー消費量を消費します。

2太湖は、ローカリゼーションを達成するために、ソフトウェアとハ​​ードウェアを獲得する最初のショーを点灯します

 

知人「太ライト」

  実際には、今年のISCは、最初のショーの神性の家族ではない、2011年に神性のBlu-rayシステムがあった、済南にある国立スーパーコンピュータセンターが設置され、その後、シェン魏で使用TOP500の第14号は、第三SW1600でランク付けし16コアのチップの代わりに。5年後、国立研究センターの中国国家コンピュータ工学の平行線(NRCPC)の863の支援を受けてシェン魏SW26010がチャンピオンシップを勝つために太光を助けるより強力なプロセッサを発表しました。

  TAIシェンウェイ26010は、複数の億億回/秒で動作する光多コア・プロセッサを備え、12.54億億回/秒のピーク性能は9.3億億回の性能アップを持続/秒、消費電力比は、ワット当たりの6051000000倍に達しました操作。遼寧-2と比較して、ほぼ3倍の計算速度、低消費電力試験(15371KW、天河-2 17808KWある)増強し続けます。Linpackの試験において、太光四時間遼寧-2のコンピューティングタスクを完了するために20時間以上完了する。

TaihuLight
シェンウェイ26010プロセッサ、マザーボード2ノード(ジャック・ドンガラから画像)であります

  全体的な効率太光は65.19パーセントチタンと比較して、74.16パーセントに達し、遼寧-2は、強力なパフォーマンス、より大きなケースのサイズは容易ではない55.83パーセントでした。ワットあたりのパフォーマンス、6G / W、タイタンのパフォーマンス太光の利用規約2.143G / W、天河-2は、1.95G / W.です また、また、トップ3の中で太湖Green500の光の中で、考慮に入れて上の2つのスーパーコンピュータは、低消費電力のIntel E5によって供給され、その認識のこの成果は価値があります。

  全体として、フレームワーク光太であるべきであるが、青色MPP(超並列処理)分散型アプローチ、従来のHPCアプリケーションに沿って、より多くの、より効率的に追従します。コンピューターキャビネット40によって生成されたTAI光は、各キャビネットは、4つのスーパーノード(256ノード)、40,960ノードの総数、単一のCPUコア260とそれぞれ、2ノードのシステムボードの設計、各CPUは、硬化を有しますオンボードメモリは32ギガバイトDDR3-2133です。

TaihuLight
タイの光キャビネット(ジャック・ドンガラからの画像)

TaihuLight
マザーボードに埋め込まするノードの四対、正と負の2つ(ジャック・ドンガラからの画像)のそれぞれであってもよいです

TaihuLight
スーパースーパー(ジャック・ドンガラからの画像)

  此外,太湖之光运行的是基于Linux的Sunwei Raise OS 2.0.5操作系统,配有兼容众核的编译器,支持Fortran、C/C++、OpenACC 2.0等语言,以及神威OpenACC编译工具。互联方面,其选择了PCI-E 3.0物理链路,软件协议是自主的Sunway Network。在PCI-E嵌入的交换芯片会被当作虚拟网卡使用,这就使得各节点有了独立的IP。

TaihuLight
太湖之光软件堆栈(图片来自Jack Dongarra)

TaihuLight
太湖之光互联架构(图片来自Jack Dongarra)

TaihuLight
太湖之光整体布局(图片来自Jack Dongarra)

  至于机房摆放,太湖之光采用了两侧各20个计算机柜和存储机柜、中间单列网络系统机柜的布局,占地面积605平方米。

 

3申威26010扬名 摆脱国外技术依赖

国产申威26010的秘密武器

  除了太湖之光夺冠,其实更令人兴奋的是其采用了国产处理器申威26010,可以说有着一定的历史意义。2015年4月,美国商务部发布公告,决定禁止英特尔向四家国家超级计算机中心出售Xeon Phi处理器。而在此之前,曾经的TOP500冠军天河二号采用的就是Xeon系列处理器。这意味着,天河二号将无法继续使用英特尔提供的用于升级系统的新款芯片。

  然而,申威26010的出现击碎了外界对于国产化的质疑。与此同时,这款处理器也带来了一个“新名词”:众核。超算界早已对以GPU、众核为代表的异构计算持开明态度,GPU应用的场景越来越多,在算法上也有了更多的支持。从长远来看,异构集群对超算的重要性会加大,在确保灵活性和软件兼容性的前提下,追求更高的性能和更低的功耗。

  一直以来,HPC的发展离不开军用和科研,太湖之光也不例外。事实上,申威在业内早有耳闻,但为什么外界鲜有人知呢?主要原因或许就是军方背景。申威系列芯片的研发单位是江南计算机所(即总参某部56所),而申威26010就是在国家高性能集成电路(上海)设计中心生产,被部署于无锡国家超级计算中心。总参某部56所创建于1951年6月,位于无锡。

  申威最初的技术来源是DEC公司开发的Alpha 21164,后者在1995面世,采用0.5um制造工艺,主频为200MHz。不过,随着技术研发的深耕,江南所拓展出了自主的申威-64指令集,摆脱了Alpha的影子。

  申威26010采用了“CPU+加速器”的方案(管理核心+运算核心),为64位RISC(主频1.45GHz),拥有260个处理核心和4个内存控制器。处理器内包括四个核心组,每组有65个内核,由8×8 Mesh架构计算集群(CPE)、一个管理单元(MPE)、一个内存控制器(MC)组成。其中,MPE和MC也可以被当作独立的处理核心,前者负责系统管理和通讯,后者则用于浮点运算,单个内存(128bit的DDR3)带宽为34GB/s,因此整个处理器提供了136.5GB/s的带宽。

TaihuLight
申威26010核心组结构(图片来自Jack Dongarra)

  申威26010支持264位的矢量指令集,内置各32KB的L1指令缓存和数据缓存,以及256KB L2缓存,没有L3缓存。对于CPE来说,单条处理管线使得每个主频周期可进行8次浮点运算,浮点性能为11.6GFLOPS,而MPE则约为CPE的两倍。

TaihuLight
申威26010节点基础设计(图片来自Jack Dongarra)

  此外,申威26010可能并非采用NUMA(非统一内存访问架构)架构,这使得处理器组内之间的内容共享成为可能,在硬件方面没有缓存的一致性需求,由软件负责同步。相比之下,英特尔Kight Landing则是将缓存一致性(Cache Coherence)都交给硬件。从性能来看,申威26010的双精浮点峰值为3.06TFlops,与Kight Landing处在同一水平线。

  不过,作为完全自主的国产处理器,申威26010也面临着一些问题。首先就是制造工艺,有人猜测28nm,尽管并不是官方说法,但相较英特尔的14nm还是有些落后。其次,太湖之光的HPCG(High Performance Conjugate Gradients)成绩也一般,峰值效率为0.3%,低于天河二号的1.1%。

TaihuLight
太湖之光的HPCG成绩不理想(图片来自Jack Dongarra)

  对于HPCG测试,可能是内存和互联宽带拖了后腿。前面提到过,申威26010采用的是DDR3,而英特尔Kight Landing已经用上六通道DDR4,Xeon Phi的内存带宽达到了512GB。虽然太湖之光在Linpack上大幅领先,但在HPC的适用性方面就会有些下降。总的来说,申威26010在计算能力上的优势有目共睹,不过由于更偏向军用,因此部分功能经过了特殊调校,应用范围有一定的局限。

 

4太湖之光应用贡献大 照亮中国超算

 

超算之路不平坦 太湖之光只是开始

  从天河系列的70%国产化,到神威蓝光的85%以上,再到如今完全自主、耗时三年研制的神威太湖之光,中国超算在美国芯片禁运的“倒逼”下,已经跨出了历史性的一步。值得一提的是,基于太湖之光系统的三项全机应用还入围了有超算界诺贝尔之称的“戈登贝尔奖”。该奖项自1987年设立以来,中国团队从未入围过。

  在国家863计划的支持下,作为“国之重器”的超级计算机在工业制造、航天、军事、医学、科研等领域将发挥更大的作用,并且会助推深度学习、人工智能的发展。未来,太湖之光将在四个方向发挥作用:全球高分辨率模拟,为气候变化研究提供量化研究的基础;先进制造,助力“中国制造”转向“中国创造”;生命科学,为研发新药和探索生命奥秘提供支撑;大数据分析。

  举例来说,国家超级计算无锡中心与清华大学、北京师范大学合作,在太湖之光上进行了CAM全球大气模式的重构与优化,以及全球超高分辨率大气模式实验框架。其中,大气模式实验框架已初步实现了3公里精度,仅次于日本NICAM 870米的分辨率。清华大学计算机科学与技术系副教授薛巍表示:“有了这套计算机系统,我们可以在30天内完成未来100年的地球气候模拟,全面提升我国应对极端气候事件和自然灾害时的减灾防灾能力。”

秘密の太ライト:どのように純粋な国内のねぐらのTOP500?
大气模式实验框架(图片来自国家超级计算无锡中心)

  借助太湖之光,国家计算流体力学实验室对“天宫一号”返回路径进行了数值模拟计算,将为其返回提供精确预测;上海药物所开展的药物筛选和疾病机理研究,两周内就完成了原本需要10个月的计算,加速了白血病、癌症、禽流感等疾病的药物设计进度;此外,太湖之光还将在“高分辨率海浪数值模拟”和“钛合金微结构演化相场模拟”方面做出巨大贡献。截至目前,国家超级计算无锡中心已经与北京大学、中科院软件所、中船重工702所、远景能源、清华大学、国家计算流体力学实验室等国内30多家机构或单位建立了应用合作关系。

  除了国家级研究机构的贡献,以联想、曙光等为代表的中国企业也在超算领域有着很好的表现。最新一期TOP500中,联想就以92套获得了全球超算份额第二、中国第一的成绩。未来,超算将朝着高性能、低功耗的方向继续拓展,芯片设计、任务分配、算法优化、应用范围、散热系统等依然是努力的重点。

  もちろん、喜び、中国のスーパーコンピューティングハードウェアおよび実用化を支援すると同時に、まだ改善の余地があり、達成太コースのバラ色の光が、アプリケーションの数は、天河-2と比較することはできません。ソフトウェアは、特定の分野での太光の問題は、結局、特にプロセッサシェン魏用に最適化されていることができますが、商用あるいは他の分野に関与していることが、あなたは互換性を考慮しなければなりません。現在では、開発のための国内のスーパーコンピュータR&D資金のアプリケーションソフトウェアは、米国しばらくより30%以上、10%未満を占めました。あなたは商用利用に統合することができない場合、それは実際には資源の無駄です。

  1983年以来、「天の川一つは」ブランクから、中国のスーパーコンピュータが生まれた、技術力になるための唯一の方法である賞賛驚異的な進歩の価値がある独立した研究開発の世界的リーダー、。そして道に沿って、挑戦の声が停止したことがない、しかし、どんなあらゆる技術革新は、学習プロセスを持っていないだろう、ではない完全な技術サポートをカスタマイズして後半開始、迂回路、そしてより困難の恐れ、太湖「ライト「中国はより輝きをスーパーコンピューティングになります。

(注:この記事は英語からの技術的な内容の一部であり、ほとんどの学術レポートユーザーショーン、元の趙を知って、見張りは戦車だけでなく、テネシー大学、オークリッジ国立研究所、博士はジャック・ドンガラが公開され、ハイテクレポートUT-EECS-16から742を考えます)

 

5付属書:光とTOP500にタイ詳細

 

ジャック・ドンガラからのレポートのスケジュール:(内容)

光の腕前タイのシステムパラメータ:

TaihuLight

太湖の光、天河-2、タイタンの比較:

TaihuLight

シックス・スーパーコンピュータの比較:

TaihuLight

太光とインテルKNC、KNL比較:

TaihuLight

トップ10 TOP 500スーパーコンピュータの最新の1:

TaihuLight

おすすめ

転載: www.cnblogs.com/jinanxiaolaohu/p/10990616.html