国内中国語大型言語モデル「Tianhe Tianyuan」発売

国家スーパーコンピューティング天津センターは、第7回世界インテリジェンス会議で、Tianhe Exascale Intelligent Computing Open Innovation Platformと中国国産大型モデルTianhe Tianyuanを発表した。

大規模な中国語モデルのデータセットは非常に不足しています。国立スーパーコンピューティング天津センターは、ウェブページデータ、さまざまなオープンソーストレーニングデータ、中国小説データ、古代中国データ、百科事典データ、ニュースデータ、および伝統的な中国医学、医学などの専門分野のさまざまなデータセットとトレーニングデータを収集および整理しています。 、相談、法律など。トークンの総数は350Bに達し、トレーニングは独自の大規模中国語モデルであるTianhe Tianyuan大規模モデルを作成しました。

天河の新世代スーパーコンピュータは、ハードウェアからソフトウェア環境に至るまで包括的かつ独立した情報技術応用革新を実現しており、関係者は展示エリアで天河の新世代スーパーコンピュータに使用されているコンピューティングチップやマザーボードなどのコア技術も展示した。

「Tianhe Eクラス インテリジェント コンピューティング オープン イノベーション プラットフォーム」は、エクサスケールを超えるクロスモーダル スーパーコンピューティングのコンピューティング パワーをもたらし、従来の科学技術コンピューティングをサポートし、インテリジェント ハイブリッド コンピューティングにサービスを提供し、与えられたあらゆるコンピューティング パワーを生み出すと報告されています。エネルギー革新とデジタル経済の質の高い発展を実現するキャリアです。

将来的には、国家スーパーコンピューティング天津センターも、「天河天源大型モデル」に基づいて、医療、産業、法律などの分野のプロフェッショナルモデルの徹底的なトレーニングを開始する予定だ。将来的には、この大規模モデルは、深層学習プラットフォームのサポートの下で産業インテリジェンスの基盤となるでしょう。

おすすめ

転載: www.oschina.net/news/241824