Stability AI が最新の言語モデルをリリース: Stable LM 3B

Stability AI は昨日、ラップトップや携帯電話などのスマート デバイス上で実行できる最新の言語モデルである Stable LM 3Bをリリースしました

発表によると、Stable LM 3Bには30億個のパラメータが含まれており、これは業界で一般的に使用されている70億個のパラメータよりも小さく、効率的です。主な機能は次のとおりです。 

  • テキスト生成: テキストの生成に使用できます。
  • 自己回帰: トランスフォーマー デコーダー ベースのアーキテクチャ
  • 多様なトレーニング データ: 複数のオープンソースの大規模データセットが使用されます

安定した LM 3B の主な特徴:

  1. 高性能: パラメーターが 30 億しかないにもかかわらず、パフォーマンスは大規模なモデルと同等、場合によってはそれを超えます。
  2. 低消費電力: ポータブル デバイスで効率的に動作するように設計されているため、電力要件が低くなります。
  3. マルチプラットフォーム互換性: エッジデバイス、ホームコンピュータ、その他のポータブルデジタルデバイス上で動作します。
  4. 微調整可能: モデルは、プログラミング支援やその他の特殊なアプリケーションなど、特定のニーズに合わせて微調整できます。
  5. オープンソース: このモデルは、Hugging Face プラットフォーム ( https://huggingface.co/stabilityai/stablelm-3b-4e1t ) でオープンソース化されているため、開発者が簡単に使用および改善できます。
  6. トレーニングの詳細: モデルは、256 個の NVIDIA A100 40GB GPU (AWS P4d インスタンス) を使用して、Stability AI のクラスターでトレーニングされました。

詳細: https: //stability.ai/blog/

おすすめ

転載: www.oschina.net/news/260235/stable-lm-3b