クイック スタート。ChatGPT はどのようにプライベート ナレッジ ベースを構築しますか?

privateGPT は、ローカルおよびプライベートに展開できるオープン ソース プロジェクトであり、ネットワークを使用せずに会社または個人のプライベート ドキュメントをインポートし、ChatGPT を使用する場合と同様に自然言語でドキュメントに質問できます。

インターネット接続は必要ありません。LLM のパワーを利用して、ドキュメントについて質問できます。100% プライベートであり、いつでもデータが実行環境から流出することはありません。インターネットに接続していなくても、書類をインポートしたり、質問したりできます。LangChain、GPT4All、LlamaCpp、Chroma、SentenceTransformers で構築されています。

Chatgpt最新使用リンクポータル: https://pan.baidu.com/s/1TsZ78aMcbYXEY9IMXW7QDQ?pwd=pn1t 
抽出コード: pn1t 

privateGPT はどのようなドキュメントをサポートしていますか?

txt、CSV、word、html、mardown、PDF、PPTなど。

privateGPT プロジェクトのアドレス

https://github.com/imartinez/privateGPT

この記事は著者が数多くの落とし穴を踏んだ結果をまとめたものであり、手順に従えば正常にインストールできるはずです。記事は長いので、ブックマークしてから読むことをお勧めします。チュートリアルに必要なリソースは、 Baidu ネットワーク ディスクを使用してワンストップでダウンロードできます。公式アカウント「AI technology practice」をフォローし、「privateGPT」と返信してネットワーク ディスク リンクを取得します。展開プロセス中に質問がある場合は、公式アカウントで作者にプライベートメッセージを送信できます。

設置環境

Windows10/Windows11、少なくとも 20G の空きディスク容量。

1.モデルをダウンロードする

ダウンロードアドレス: https://gpt4all.io/models/ggml-gpt4all-j-v1.3-groovy.bin

このファイルは 4g 以上あり、ダウンロードを待っている間に次の操作を実行できます。

2. ソフトウェアをインストールする

2.1 Visual Studio 2022 のインストール

ダウンロード リンク: Visual Studio 2022 | 無料ダウンロード

ダウンロード後にクリックしてインストールします

注: 下の矢印の場所を選択してください

右下隅の「インストール」をクリックすると、インストールプロセスが遅くなります。最初に次の操作を実行できます。

2.2 Pythonをインストールする

Microsoft Store でpython3.10以降を検索してインストールします。筆者は 3.10 を使用しています。

2.3 gitをインストールする

ダウンロードアドレス:https: //git-scm.com/


2.4 Windows バージョンの GCC をインストールします。 MinGW
ダウンロード アドレス: MinGW - Minimalist GNU for Windows

ダウンロード後、ダブルクリックしてインストールします。しばらくお待ちください。

完了を待った後、「閉じる」ボタンをクリックして閉じます。

3. privateGPT ソースコードをダウンロードする

ディスク D のルート新しい aiworkspace ディレクトリを作成し、このディレクトリに入り、次のコマンドを実行します (独自の状況に応じて新しいディレクトリを作成することもできます。作業を容易にするために、作成者との一貫性を保つことをお勧めします)実行プロセスの比較)。

git clone [email protected]:imartinez/privateGPT.git

4. プロジェクトの依存関係をインストールする

cmd を管理者として実行します(その後 cmd を使用すると管理者として実行されます)

前の手順でダウンロードした privateGPT ディレクトリに入り、次のコマンドを実行します。

pip3 install -r requirements.txt

図に示すように、待ち時間が長くなります。

作成者は実行時に次のエラーを報告し、プロンプトに従って pip を更新し、上記のコマンドを再実行しました。

依存関係が正常にインストールされました:

5. モデルとドキュメントをインポートする

5.1 インポートモデル

privateGPT ディレクトリの下に新しいモデル ディレクトリを作成し、手順 1 でダウンロードしたモデル ファイルをこのディレクトリに配置します。

5.2 書類のインポート

privateGPT ディレクトリの下のsource_documents はソースドキュメントが置かれているディレクトリであり、質問したり答えたりしたい独自のドキュメントをここに置くことができます。ソース コードをダウンロードすると、source_documents ディレクトリにサンプル ドキュメント state_of_the_union.txt が作成されます。これを削除し、ネットワーク ディスクからダウンロードした Bryant の info.txt をここにコピーします。

文書の内容:

There is a man named Bryant who is Chinese. He was born in 1991 and works as a Java developer. He graduated in 2013 and worked at "Dev AI" for three years before moving to "Test AI" where he worked for another two years. In his free time, he enjoys watching movies, playing basketball, swimming, running, and hiking.

5.3 .envの変更

example.env をコピーし、名前を .env に変更します。

5.4 ドキュメントのインデックス作成

Cmd は privateGPT ディレクトリに入り、次のコマンドを実行して、privateGPT にドキュメントのインデックスを作成させます。

python ingest.py

最初の実行ではいくつかのものがダウンロードされ、その後の実行速度が速くなります。

インデックス作成が完了したときのスクリーンショットは次のとおりです。

インデックスが完了すると、privateGPT に db ディレクトリが自動的に生成されます。このディレクトリはprivateGPT のデータベース ディレクトリです。privateGPT はこのディレクトリ内のデータを使用し、source_documents 内のドキュメントは削除できます。

ソースドキュメントの内容を変更する場合は、まずsource_documents ディレクトリ内のファイルの内容を変更し、次に db フォルダーを削除し、上記のコマンドを再実行してデータベースを作成します。

6. GPTを使ったQ&A

これで、privateGPT とチャットし、自然言語で質問し、privateGPT ディレクトリで次のコマンドを実行できるようになります。

python privateGPT.py

Enter a query: が表示されたら、コマンド ラインに質問を入力できます。上で示したドキュメントを使用する場合は、次の質問テストの結果を直接コピーできます。

hello, you play my assitant, I'm gonna ask you some questions and you should reply briefly, if you don't know the answer, just say you don't know, do you understant?

GIF カバー

What's his job ?

単純な Web アプリケーションを作成し、Python スクリプトを呼び出して、単純な企業内部ナレッジ ベース システムを実装します。

おすすめ

転載: blog.csdn.net/qqerrr/article/details/132147623