0から1へ、入門から上級までAIを遊ぶ - Stable Diffusion 超詳細チュートリアル (1)

最先端

        現在市場にある AI は主に AI マッピング (代表的な製品: Midjourney と Stable-Diffusion) と AI 応答 (代表的な製品: ChatGPT) の 2 つの側面に集中していますが、本稿では主に AI マッピングについて説明します。

        Midjourney は有料製品であるため、Stable-Diffusion の最大の利点は、オープンソースで無料であることです。Stable-Diffusion はオープンソースで無料であるため、アクティブなコミュニティ ユーザーが多数おり、開発者コミュニティは無料で高品質な外部事前トレーニング モデル (微調整) とプラグインを多数提供しています。コミュニティのサポート Stable-Diffusion Midourneyと比べてパーソナライズ機能が豊富で、微調整の上、よりニーズに近い映像を生成したり、AI動画特殊効果などを生成することができます。

        Stable-Diffusion は実際には潜在拡散モデル (潜在拡散モデル) であり、テキストの記述を通じてグラフィックスを生成できるため、画像の復元、画像のレンダリング、テキストから画像への変換などのシナリオで使用できます。

ハードウェア要件

画像のレンダリングを実現するには大量の計算が必要となるため、コンピューター ハードウェアには次のような特定の要件があります。

1. N カード (Nvida 独立グラフィックス カード)、最小 4G ビデオ メモリ、RTX3050 グラフィックス カード以上の使用を推奨します。

「専用GPUメモリ」は[タスクマネージャー]-[パフォーマンス]-[GPU1](NVIDIA GeForce...)で確認できます。

2. 最小メモリは 8G です。

3. ハードディスク 50G 以上のソリッドステートハードディスク。

ソフトウェアを準備する

1.git : github 上のオープンソース ソフトウェアをダウンロードするためのツール

2.python-3.10.6: Python オペレーティング環境。ここでは、stable-diffusion-webui プロジェクトの依存関係要件のため、バージョン 3.10.6 である必要があります。

3.AUTOMATIC1111/stable-diffusion-webui: Stable-Diffusion 用の Gradio ライブラリベースの Web インターフェイスを提供します。このソフトウェアは、Stable-Diffusion および関連する依存関係を単独でダウンロードするためのワンクリック インストール プログラムを提供します。

ソフトウェアのインストール

Python環境のインストール

公式 Web サイトから Python 3.10.6 バージョンをダウンロードします。ダウンロード アドレス: Python Release Python 3.10.6 | Python.org

ダウンロードが完了したら、インストールできます。注意: インストールするときは、「Python 3.10 を PATH に追加する」にチェックを入れることを忘れないでください。また、ここでインストールするときは、カスタムの場所 (インストールのカスタマイズ) を選択しました (個人的な強迫性障害)。手間を省きたい場合は、「今すぐインストール」をクリックするだけでインストールすることもできます。

インストールプロセスについては多くは言いませんが、インストールが完了したら、下の画像「パスの長さの制限を無効にする」をクリックして、パスの長さの制限を無効にすることをお勧めします。

インストールが完了したら、コマンド python -V を使用して cmd ウィンドウを開いて、Python が正常にインストールされたことを確認します。

Gitツールのインストール

公式 Web サイト ( Git - Downloading Package (git-scm.com))から最新バージョンの Git をダウンロードします。

個人的な強迫性障害のため、64 ビットのポータブル バージョンをダウンロードしました (インストールする必要はありませんが、環境変数を手動で設定する必要があります)。ダウンロードが完了したら、対応する場所 (私の場所: D:\) に解凍します。環境\git)。

Path 環境変数を変更します。 [このコンピュータ] を右クリック - [プロパティ] - [システム] - [システムの詳細設定] - [詳細設定] - [環境変数] - 「システム環境変数」で「Path」を見つけ、ダブルクリックして編集 - 「D:\Environments\git\bin」を追加し、環境変数の設定を完了することを確認します。

注: コマンド ツールのポータブル バージョンがこのディレクトリにあるため、./git/bin パスは環境変数に配置する必要があります。

 新しい cmd ウィンドウを開き、git を確認して git を構成します

git バージョンを確認します: git -v

git 名と電子メールを構成します。

git config --global user.name "xxxxx"
git config --global user.email "[email protected]"

 これで git のインストールは完了しました

Stable-Diffusion-WebUI ツールをダウンロードしてインストールします

git ツールを介して github でソース コードをダウンロードします。ダウンロード アドレス: GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion Web UI

 1. ローカル ハードディスク上に Stable-Diffusion-WebUI を保存およびインストールする場所を作成し (私のパスは D:/Workspace)、フォルダーを右クリックして [Git Bash Here] を選択すると、git が開きます。自動的にターミナルになります。

 「小さな黒いウィンドウ」にコマンドを入力します。

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

Enter キーを押して Stable-Diffusion-WebUI のダウンロードを開始します

ダウンロードが完了すると、ダウンロードしたプログラム「stable-diffusion-webui」が表示されます。

 フォルダーに入り、一番下にある「webui-user.bat」を見つけて実行します。プロセス中に、関連する依存プラグインをダウンロードするための自動ダウンロード プログラムが開始されるため、ネットワークが正常であることを確認してください (約 6G ローカル)スペース)、ダウンロードしてインストールします。時間がかかります。しばらくお待ちください...

 注: インストール プロセスが失敗した場合は、失敗のフィードバック情報に従ってインストール プロセスを実行し (または、解決策を見つけるには以下の「FAQ」を参照)、実行が完了した後、完了するまで「webui-user.bat」を再度実行します。インストールは成功しました。

アクセスアドレス:http://127.0.0.1:7860

プロンプトの単語は、次の 2 つのサイトを指す場合があります。

Arthub.ai: AI が生成したアートを発見、アップロード、共有

ボキャブラリー

その他のパーソナライズされた操作については、次の記事の内容を参照してください。お役に立てれば幸いです。

よくある問題

致命的: 'xxxx' OpenSSL SSL_read にアクセスできません: 接続がリセットされました、エラー 10054

注: 上記の手順に従うと、プロンプト「致命的: 'xxxx' OpenSSL SSL_read: 接続がリセットされました、エラー 10054」が表示されます。このときの問題は、git が https 証明書を検証することです。次のコマンドを使用できます。 :

git config --global http.sslVerify false

 証明書の検証をオフにしてから、上記のダウンロード コマンドを実行して通常どおりダウンロードします。

「gfpgan のインストール」中に長時間停止する

「gfpganのインストール」を実行する際に長時間スタックする場合は基本的にインストールに失敗しますが、これはネットワークの都合でgithubからプログラムをダウンロードできないためです。科学的にオンラインであっても難しいので、手動インストール方法を使用することをお勧めします。操作手順は次のとおりです。

1) GitHub から GFPGAN を手動でダウンロードします - TencentARC/GFPGAN: GFPGAN は、現実世界の顔復元のための実用的なアルゴリズムを開発することを目的としています。

 2) ダウンロードした圧縮パッケージ GFPGAN-master を、stable-diffusion-webui ストレージ パスの下の venv/Scripts/ ディレクトリに解凍します (例: 私のパスは: D:\Workspace\stable-diffusion-webui\venv\ Scripts\GFPGAN) -マスター)

3) cmd を開き、パスをワークスペースに切り替えます。

cd /D D:\Workspace\stable-diffusion-webui\venv\Scripts

次に、コマンドを実行して gfpgan の依存プログラムをインストールします。

python.exe -m pip install --upgrade pip
python.exe -m pip install basicsr facexlib
cd GFPGAN-master
python.exe -m pip install -r requirements.txt

4) インストール完了後、再度「webui-user.bat」を実行すると、通常は gfpgan が正常にインストールされます。

ただし、クリップでも同じ問題が発生し、インストールが失敗する可能性があります。手動でインストールを続行してください。

1) open_clip を手動でダウンロードします。ダウンロード アドレス: GitHub - mlfoundations/open_clip: CLIP のオープン ソース実装。

2) 圧縮パッケージ open_clip-main を、stable-diffusion-webui ストレージ パスの下の venv/Scripts/ ディレクトリに解凍します (例: 私のパスは次のとおりです: D:\Workspace\stable-diffusion-webui\venv\Scripts\open_clip -主要)

3) cmd を開き、パスを open_clip-main ディレクトリに切り替えます (次にクリップをコンパイルしてインストールするため、必ず open_clip-main に切り替えてください)

cd /D D:\Workspace\stable-diffusion-webui\venv\Scripts\open_clip-main

4) Clipをインストールするコマンドを実行します(python.exeとclipのディレクトリレベルが異なるため、python.exeは絶対パスで指定する必要があり、Windowsでは面倒なので使えません。./)

D:\Workspace\stable-diffusion-webui\venv\Scripts\python.exe setup.py build install

5) オープンクリップをインストールした後、クリップを手動でインストールする必要があります

cd ..
pip install clip

5) インストール完了後、再度「webui-user.bat」を実行すると、gfpgan は正常にインストールできます。

注: インストールプロセスが失敗した場合は、失敗フィードバック情報に従ってインストールを実行できますが、実行完了後は、インストールが成功するまで再度「webui-user.bat」を実行してください。

「要件のインストール」で接続タイムアウト例外が表示される場合

「要件のインストール」を実行すると、下図のようなエラーが複数回発生する場合があり、接続タイムアウト異常、つまりネットワークが不安定であることを意味しますので、再度実行してください。 、手動で遅延を増やしてインストールできます。この問題は、関連するプラグインで解決できます。

上の図からわかるように、Accelerate プラグインと numpy プラグインのインストールにはタイムアウト例外があるため、コマンドを使用してこれらを手動でインストールし、タイムアウトを 1000 ミリ秒に設定すると、インストールが成功したことがわかります (他の同様の問題は、以下と同じ方法で処理できます)。

pip --default-timeout=1000 install accelerate

インストール完了後、再度「webui-user.bat」を実行すると正常にインストールが完了します。

おすすめ

転載: blog.csdn.net/Asgard_Hu/article/details/131003648