ローカル環境での Llama 3 大規模モデルの実行: 実現可能性と実用的なガイド

ラマ3.png

導入:

Llama は、Meta (旧 Facebook) の人工知能研究チームによって開発およびオープンソース化された大規模言語モデル (LLM) であり、商用利用が可能であり、人工知能の分野全体に大きな影響を与えています。 4096 コンテキストをサポートする以前にリリースされた Llama 2 モデルに続き、Meta はさらに、8B (80 億パラメーター) モデルと 70B (700 億パラメーター) モデルを含む、より優れたパフォーマンスを備えた Meta Llama 3 シリーズの言語モデルを発売しました。 Llama 3 70B のパフォーマンスはGemini 1.5 Proに匹敵し、あらゆる面でクロード ビッグ カップを上回りますが、400B+ モデルはクロード エクストラ ラージ カップや新しいGPT-4 ターボと競合すると予想されます。

さまざまなテスト ベンチマークで、Llama 3 シリーズ モデルは、実用性と安全性の評価の点で、市場で人気のある他のクローズドソース モデルに匹敵し、いくつかの点ではそれを上回る優れたパフォーマンスを示しています。 Meta Llama 3 シリーズのリリースは、大規模言語モデルの分野での競争力を強化するだけでなく、研究者、開発者、企業に言語理解と生成技術のさらなる開発を促進する強力なツールを提供します。

プロジェクトアドレス:

https://github.com/meta-llama/llama3

ラマ2とラマ3の違い

ラマ3and3diff.webp

ラマ3とGPT4の違い

索引 電話3 GPT-4
モデルサイズ 70B、400B+ 100B、175B、500B
パラメータの種類 変成器 変成器
トレーニングの目的 マスクされた言語モデリング、複雑性 マスクされた言語モデリング、複雑性
トレーニングデータ 書籍、ウェブテキスト 書籍、ウェブテキスト
パフォーマンス SOTA(質疑応答、文章要約、機械翻訳など) SOTA(質疑応答、文章要約、機械翻訳など)
オープンソース はい いいえ

ラマ 3 のハイライト

  • 誰にでもオープン: Meta は、Llama 3 の軽量バージョンをオープンソース化することで、最先端の AI テクノロジーにアクセスできるようにします。あなたが開発者、研究者、または AI テクノロジーに興味のある友人であっても、自由に探索、作成、実験することができます。 Llama 3 は、研究者や開発者に使いやすい API を提供します。

  • 大規模なモデル規模: Llama 3 400B+ モデルのパラメータ規模は 4,000 億に達しており、これは大規模な言語モデルです。

  • まもなくさまざまなアプリケーションに統合される予定です。Llama 3 は現在、メタ AI を搭載しています。メタ AI エクスペリエンスのアドレス: https://www.meta.ai/

ラマ3-事前訓練済み.png

ラマ3-8b-70b.webp

llam3-15T-tokens.png

Windows で Ollama を使用し、Llama3 モデルを実行する

https://ollama.com/download/windowsページにアクセスして、OllamaSetup.exeインストール プログラムをダウンロードします。

インストール後、コンピュータの構成に応じて、インストールに対応するモデル パラメータを選択します (7B を実行するには少なくとも 8GB のメモリが必要で、13B を実行するには少なくとも 16GB のメモリが必要です)。

ここで実行しているのは Llama3:8b です。中国語に関してはまだいくつかの問題があることがわかります。

オラマ3.png

モデル パラメーター サイズ ダウンロード
電話3 8B 4.7GB ollama run llama3
電話3 70B 40GB ollama run llama3:70b
ミストラル 7B 4.1GB ollama run mistral
ドルフィン・ファイ 2.7B 1.6GB ollama run dolphin-phi
ファイ-2 2.7B 1.7GB ollama run phi
ニューラルチャット 7B 4.1GB ollama run neural-chat
ムクドリ 7B 4.1GB ollama run starling-lm
コードラマ 7B 3.8GB ollama run codellama
ラマ 2 無修正 7B 3.8GB ollama run llama2-uncensored
2 13B に電話してください 13B 7.3GB ollama run llama2:13b
2 70B に電話してください 70B 39GB ollama run llama2:70b
オルカミニ 3B 1.9GB ollama run orca-mini
溶岩 7B 4.5GB ollama run llava
ジェマ 2B 1.4GB ollama run gemma:2b
ジェマ 7B 4.8GB ollama run gemma:7b
太陽 10.7B 6.1GB ollama run solar

Hugging Face 使用

https://huggingface.co/chat/ にアクセスして切り替えますModels

複製使用

8B モデル: https://replicate.com/meta/meta-llama-3-8b

70B モデル: https://replicate.com/meta/meta-llama-3-70b

この記事はHeng Xiaopaiの記事の転載であり、著作権は元の著者に属します。この記事を転載するには、原文を参照することをお勧めします。

ライナスは、カーネル開発者がタブをスペースに置き換えることを阻止するために自ら問題を解決しました。 彼の父親はコードを書くことができる数少ないリーダーの 1 人であり、次男はオープンソース テクノロジー部門のディレクターであり、末息子は中核です。ファー ウェイ: 一般的に使用されている 5,000 のモバイル アプリケーションを変換するのに 1 年かかった Java はサードパーティの脆弱性が最も発生しやすい言語です。Hongmeng の父: オープンソースの Honmeng は唯一のアーキテクチャ上の革新です。中国の基本ソフトウェア分野で 馬化騰氏と周宏毅氏が握手「恨みを晴らす」 元マイクロソフト開発者:Windows 11のパフォーマンスは「ばかばかしいほど悪い」 老祥基がオープンソースであるのはコードではないが、その背後にある理由は Meta Llama 3 が正式にリリースされ、 大規模な組織再編が発表されました
{{名前}}
{{名前}}

おすすめ

転載: my.oschina.net/u/6851747/blog/11054408