最も強力なオープンソース大規模モデル Llama 3 が Gitee AI 上で起動

はじめに: 4 月 18 日、Meta は、外部開発者が無料で使用できる 2 つのオープンソース Llama 3 8B モデルと Llama 3 70B モデルをリリースしました。このリリースは技術革新のショーケースであるだけでなく、オープンソースの精神の表明でもあり、AI アプリケーションの新たな章が始まろうとしていることを示しています。

今回、Meta は、Llama 3 8B と Llama 3 70B という 2 つのモデルをオープンソース化し、それぞれ事前トレーニングと命令の微調整の 2 つのバージョンを用意しました。

プラットフォームリンク

以下のリンクにアクセスしてプラットフォームに入り、体験してください (招待コード: llama3):

https://ai.gitee.com/hf-models/meta-llama/Meta-Llama-3-8B-Instruct

最大 4,000 億のパラメータ

Meta Llama 3 では、より長いコンテキスト ウィンドウのサポート、複数のモデル サイズ、パフォーマンスの向上など、多くの技術革新が導入されています。さらに、新しいモデルは、複数の業界ベンチマークでトップレベルのパフォーマンスを示し、特に論理的推論とプログラミング命令の追従性が向上しており、同様のオープンソース モデルの中でユニークなものとなっています。

Llama 3 のハイライトと特徴は次のとおりです。

  • 15T トークンを超えるトレーニングに基づくと、そのサイズは Llama 2 データ セットの 7 倍以上になります。

  • トレーニング効率は Llama 2 の 3 倍です。

  • 8K の長いテキストをサポートし、改良されたトークナイザーには 128K トークンの語彙があり、パフォーマンスが向上します。

  • 幅広い重要なベンチマークにおける最先端のパフォーマンス。

  • 推論とコーディングのスキルを強化します。

  • Llama Guard 2、Code Shield、Cyber​​Sec Eval 2 を備えた新しい信頼およびセキュリティ ツールは、セキュリティにおいて大きな進歩を遂げています。また、Llama 2 よりも優れた「エラー拒否パフォーマンス」を実現できます。

持続可能性とコミュニティへの関与

Meta Llama 3 は単なるテクノロジー製品ではなく、継続的な開発に対する Meta の取り組みを表しています。 Meta は、このモデルをオープンソースにすることで、世界の開発者コミュニティの革新的な可能性を刺激し、人工知能技術の進歩を共同で促進したいと考えています。この動きは、テクノロジーの普及を促進するだけでなく、開発プロセス中にコミュニティからのフィードバックが完全に考慮されることを保証します。

安全と倫理に関する先進的な考え方

Meta Llama 3 の開発において、Meta は安全性と倫理的責任に特別な注意を払いました。 Llama Guard 2 や Cyber​​Sec Eval 2 などの新しく導入されたツールは、開発者がこれらのモデルを責任を持って使用および展開するためのより多くのリソースを提供します。これは、AI の安全で信頼性の高い展開を確保する上で Meta が業界のリーダーであることを示しています。

Meta Llama 3 のリリースは、技術の進歩であるだけでなく、オープン イノベーションの精神の表れでもあります。開発者に強力な新しいツールを提供するだけでなく、グローバルな AI エコシステムの将来の発展のための新しい基準も設定します。 AI の波の中で、メタは Llama 3 を通じて協力とイノベーションの力を実証しており、このプラットフォームが人工知能のより革新的なアプリケーションを刺激することを期待しています。

おすすめ

転載: www.oschina.net/news/288516