Window の下にデプロイし、Stable Diffusion AI オープンソース プロジェクトを使用して描画します

画像説明はこちら

  • この記事の風景写真はすべてStable Diffusion AIによって描画・生成されています。
  • Stable Diffusion は AI 描画に限定されず、スタイル変換、ポートレート復元、画像融合、画像ノイズ除去などの機能も備えています。興味のある友達は自分で調べて科学的に使用できます。

序文

前提条件

  1. Python 3.10.6をインストールします: https://www.python.org/downloads/release/python-3106/

  2. gitをインストールします: https://git-scm.com/download/win

関連紹介

  • Python はクロスプラットフォームのコンピューター プログラミング言語です。これは、解釈可能性、コンパイル性、対話性、およびオブジェクト指向を組み合わせた高レベルのスクリプト言語です。元々は自動化スクリプト (シェル) を記述するために設計されましたが、バージョンが継続的に更新され、新しい言語機能が追加されるにつれて、独立した大規模プロジェクトの開発に使用されることが増えています。
  • PyTorch はディープ ラーニング フレームワークであり、多くのネットワークおよびディープ ラーニング関連のツールをカプセル化しており、それらを 1 つずつ作成するのではなく、呼び出すことができます。CPU版とGPU版に分かれており、その他のフレームワークとしてはTensorFlowやCaffeなどがあります。PyTorch は、Torch に基づいて Facebook Artificial Intelligence Research Institute (FAIR) によって開始され、次の 2 つの高度な機能を提供する Python ベースの持続可能なコンピューティング パッケージです: 1. 強力な GPU アクセラレーション (NumPy など) を備えた Tensor コンピューティング、2. 自動微分ディープニューラルネットワークを構築する際の仕組み。
  • AIGC (Artificial Intelligence Generated Content) は、人工知能システムによって作成または生成されたコンテンツを指します。これには、機械学習、自然言語処理、コンピューター ビジョンなどの人工知能技術を使用して、テキスト、画像、ビデオ、音楽などを含むさまざまな形式のコンテンツを生成することが含まれます。
  • 安定拡散は、確率モデリングと画像処理で使用される手法です。これは拡散プロセスの理論に基づいており、重要な画像構造と詳細を維持しながら、画像を滑らかにしてノイズを除去することを目的としています。
    安定拡散法は、画像に非線形拡散演算子を適用することにより、スムージングとノイズ除去を実現します。従来の線形拡散法とは異なり、安定拡散では非線形項が導入され、画像のエッジと詳細がより良く保存されます。
    安定した拡散の中心的な考え方は、拡散プロセス中に勾配情報を考慮し、勾配のサイズと方向に応じて拡散速度を調整することです。これにより、画像を滑らかにしながら、エッジのぼやけやディテールの損失を効果的に抑制します。
    安定した拡散方法は、画像のノイズ除去、エッジの保存、テクスチャの強調などに幅広い用途があります。これは、画像構造の平滑化と保存のバランスをとる方法を提供し、コンピュータ ビジョン、画像処理、パターン認識などの分野に適用できます。

安定拡散AI描画

ダウンロードアイテム

ここに画像の説明を挿入
ダウンロードが完了し、解凍するとプロジェクトディレクトリは以下のようになります。
ここに画像の説明を挿入

環境要件

gitpython

の加速
basicsr
blendmodes clean -
fid
einops
gfpgan gradio
3.32.0
変曲
jsonmerge
kornia
lark
numpy
omegaconf open -
clip-torch piexif psutil
pytorch_lighting
realesrgan
requests
realesrgan
requests cikit - image 0.19 timmmeddeddeddeddeddeddeddeddedded








環境ダウンロード

pip install -r requirements.txt
或者
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple # 国内使用清华源,下载速度较快

プロジェクトを実行する

プロジェクト ディレクトリを入力し、cmd コマンド側で実行します。webui-user.bat

webui-user.bat

初めて実行するとき、このファイルはいくつかの関連する依存ファイルも自動的にダウンロードします。
ここに画像の説明を挿入
ここに画像の説明を挿入

正常に実行されると、ローカル アクセス用の URL が表示されます。http://127.0.0.1:7860
ここに画像の説明を挿入

URLを開いて体験してください

ここに画像の説明を挿入

テキストから画像を生成(txt2img)

廬山の滝

The Waterfall in Mount Lu Viewed from Afar
Li Bai
The sunlit Censer Peak exhales incenselike cloud;
Like an upended stream the cataract sounds loud.
Its torrent dashes down three thousand feet from high
As if the Silver River fell from the blue sky.

ここに画像の説明を挿入

ここに画像の説明を挿入

ここに画像の説明を挿入
ここに画像の説明を挿入
ここに画像の説明を挿入
ここに画像の説明を挿入
ここに画像の説明を挿入
ここに画像の説明を挿入
ここに画像の説明を挿入

ここに画像の説明を挿入

参考

[1] https://github.com/AUTOMATIC1111/stable-diffusion-webui
[2] https://github.com/camenduru/stable-diffusion-webui
[3] https://www.kaggle.com/code /camenduru/stable-diffusion-webui-kaggle

おすすめ

転載: blog.csdn.net/FriendshipTang/article/details/132368373