Window の下にデプロイし、Stable Diffusion AI オープンソース プロジェクトを使用して描画します
- この記事の風景写真はすべてStable Diffusion AIによって描画・生成されています。
- Stable Diffusion は AI 描画に限定されず、スタイル変換、ポートレート復元、画像融合、画像ノイズ除去などの機能も備えています。興味のある友達は自分で調べて科学的に使用できます。
序文
- 私のレベルが限られているため、間違いや漏れがあることは避けられませんが、批判と修正をお願いします。
- さらにエキサイティングなコンテンツについては、クリックしてYOLOシリーズのコラム、自然言語処理の
コラム、または私の個人ホームページに入ってご覧ください。- DETR に基づく顔のなりすまし検出
- YOLOv7 は独自のデータセットをトレーニングします (マスク検出)
- YOLOv8 は独自のデータセット (サッカー検出) をトレーニングします
- YOLOv5: TensorRT は YOLOv5 モデル推論を加速します
- YOLOv5:イオウ、ジオウ、ディオウ、シオウ、エイオウ
- Jetson Nano で遊ぶ (5): TensorRT は YOLOv5 ターゲット検出を加速します
- YOLOv5: SE、CBAM、CoordAtt、ECA アテンション メカニズムを追加
- YOLOv5: yolov5s.yaml 構成ファイルの解釈、小さなターゲット検出レイヤーの追加
- Python は、COCO 形式のインスタンス セグメンテーション データセットを YOLO 形式のインスタンス セグメンテーション データセットに変換します。
- YOLOv5: バージョン 7.0 を使用して、独自のインスタンス セグメンテーション モデル (車両、歩行者、道路標識、車線などのインスタンス セグメンテーション) をトレーニングします。
- Kaggle GPU リソースを使用して、Stable Diffusion オープンソース プロジェクトを無料で体験してください
前提条件
-
Python 3.10.6をインストールします: https://www.python.org/downloads/release/python-3106/
-
gitをインストールします: https://git-scm.com/download/win
関連紹介
- Python はクロスプラットフォームのコンピューター プログラミング言語です。これは、解釈可能性、コンパイル性、対話性、およびオブジェクト指向を組み合わせた高レベルのスクリプト言語です。元々は自動化スクリプト (シェル) を記述するために設計されましたが、バージョンが継続的に更新され、新しい言語機能が追加されるにつれて、独立した大規模プロジェクトの開発に使用されることが増えています。
- PyTorch はディープ ラーニング フレームワークであり、多くのネットワークおよびディープ ラーニング関連のツールをカプセル化しており、それらを 1 つずつ作成するのではなく、呼び出すことができます。CPU版とGPU版に分かれており、その他のフレームワークとしてはTensorFlowやCaffeなどがあります。PyTorch は、Torch に基づいて Facebook Artificial Intelligence Research Institute (FAIR) によって開始され、次の 2 つの高度な機能を提供する Python ベースの持続可能なコンピューティング パッケージです: 1. 強力な GPU アクセラレーション (NumPy など) を備えた Tensor コンピューティング、2. 自動微分ディープニューラルネットワークを構築する際の仕組み。
- AIGC (Artificial Intelligence Generated Content) は、人工知能システムによって作成または生成されたコンテンツを指します。これには、機械学習、自然言語処理、コンピューター ビジョンなどの人工知能技術を使用して、テキスト、画像、ビデオ、音楽などを含むさまざまな形式のコンテンツを生成することが含まれます。
- 安定拡散は、確率モデリングと画像処理で使用される手法です。これは拡散プロセスの理論に基づいており、重要な画像構造と詳細を維持しながら、画像を滑らかにしてノイズを除去することを目的としています。
安定拡散法は、画像に非線形拡散演算子を適用することにより、スムージングとノイズ除去を実現します。従来の線形拡散法とは異なり、安定拡散では非線形項が導入され、画像のエッジと詳細がより良く保存されます。
安定した拡散の中心的な考え方は、拡散プロセス中に勾配情報を考慮し、勾配のサイズと方向に応じて拡散速度を調整することです。これにより、画像を滑らかにしながら、エッジのぼやけやディテールの損失を効果的に抑制します。
安定した拡散方法は、画像のノイズ除去、エッジの保存、テクスチャの強調などに幅広い用途があります。これは、画像構造の平滑化と保存のバランスをとる方法を提供し、コンピュータ ビジョン、画像処理、パターン認識などの分野に適用できます。
安定拡散AI描画
ダウンロードアイテム
- 公式ソースアドレス: https://github.com/AUTOMATIC1111/stable-diffusion-webui
ダウンロードが完了し、解凍するとプロジェクトディレクトリは以下のようになります。
環境要件
gitpython
枕
の加速
basicsr
blendmodes clean -
fid
einops
gfpgan gradio
3.32.0
変曲
jsonmerge
kornia
lark
numpy
omegaconf open -
clip-torch piexif psutil
pytorch_lighting
realesrgan
requests
realesrgan
requests cikit - image 0.19 timmmeddeddeddeddeddeddeddeddedded
- このオープンソース プロジェクトで最も難しいのは環境構成であり、環境の要件は比較的高く、 GPU (この記事ではRTX 3060を使用) が必要です。該当する条件がない場合は、Stable Diffusion を無料で体験できる Kaggle GPU リソースオープンソース プロジェクト: https://blog.csdn.net/FriendshipTang/article/details/132238734
環境ダウンロード
pip install -r requirements.txt
或者
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple # 国内使用清华源,下载速度较快
プロジェクトを実行する
プロジェクト ディレクトリを入力し、cmd コマンド側で実行します。webui-user.bat
webui-user.bat
初めて実行するとき、このファイルはいくつかの関連する依存ファイルも自動的にダウンロードします。
正常に実行されると、ローカル アクセス用の URL が表示されます。http://127.0.0.1:7860
URLを開いて体験してください
テキストから画像を生成(txt2img)
廬山の滝
The Waterfall in Mount Lu Viewed from Afar
Li Bai
The sunlit Censer Peak exhales incenselike cloud;
Like an upended stream the cataract sounds loud.
Its torrent dashes down three thousand feet from high
As if the Silver River fell from the blue sky.
- ウェブサイトにはまだ多くの機能があり、興味のある友達は自分で探索できます。
- このオープンソース プロジェクトで最も難しいのは環境構成であり、環境の要件は比較的高く、 GPU (この記事ではRTX 3060を使用) が必要です。該当する条件がない場合は、Stable Diffusion を無料で体験できる Kaggle GPU リソースオープンソース プロジェクト: https://blog.csdn.net/FriendshipTang/article/details/132238734
参考
[1] https://github.com/AUTOMATIC1111/stable-diffusion-webui
[2] https://github.com/camenduru/stable-diffusion-webui
[3] https://www.kaggle.com/code /camenduru/stable-diffusion-webui-kaggle
- 私のレベルが限られているため、間違いや漏れがあることは避けられませんが、批判と修正をお願いします。
- さらにエキサイティングなコンテンツについては、クリックしてYOLOシリーズのコラム、自然言語処理の
コラム、または私の個人ホームページに入ってご覧ください。- DETR に基づく顔のなりすまし検出
- YOLOv7 は独自のデータセットをトレーニングします (マスク検出)
- YOLOv8 は独自のデータセット (サッカー検出) をトレーニングします
- YOLOv5: TensorRT は YOLOv5 モデル推論を加速します
- YOLOv5:イオウ、ジオウ、ディオウ、シオウ、エイオウ
- Jetson Nano で遊ぶ (5): TensorRT は YOLOv5 ターゲット検出を加速します
- YOLOv5: SE、CBAM、CoordAtt、ECA アテンション メカニズムを追加
- YOLOv5: yolov5s.yaml 構成ファイルの解釈、小さなターゲット検出レイヤーの追加
- Python は、COCO 形式のインスタンス セグメンテーション データセットを YOLO 形式のインスタンス セグメンテーション データセットに変換します。
- YOLOv5: バージョン 7.0 を使用して、独自のインスタンス セグメンテーション モデル (車両、歩行者、道路標識、車線などのインスタンス セグメンテーション) をトレーニングします。
- Kaggle GPU リソースを使用して、Stable Diffusion オープンソース プロジェクトを無料で体験してください