Stable Diffusion の背景除去ツール 「背景除去」は画像処理において非常に重要なツールです。従来のマットツールと比較して、このツールはよりインテリジェントであり、マットプロセスの効率と精度が大幅に向上します。このツールは、パラメーターを調整することで、さまざまなスケールや複雑さの画像に適応し、さまざまなマット タスクに適応できます。
記事ディレクトリ
プラグインの紹介
プラグインインターフェイスは中国語であり、便利で使いやすいです。このプラグインをインストールするには、「拡張機能」タブから実行できます。ここではすでにインストールしているので、インストール済みと表示されます。
プラグイン URL ダウンロード アドレス。
GitHub - AUTOMATIC1111/stable-diffusion-webui-rembg
インストール後、「Extras」追加機能タブの下部にこの機能が追加されます。
このツールを使用する場合Remove background
、切り取る画像をズームせずに、ズーム率を 1 に設定するだけで、純粋に画像を切り出すこともできます。
マッティングアルゴリズムの選択
デフォルトのスケーリング ツールには、u2net、u2netp、u2net_human_seg、u2net_cloth_seg、silueta アルゴリズムが付属しています。以下は、これらのアルゴリズムとそれに対応する効果の簡単な紹介です。
- u2net : U2-Net は、主に顕著なオブジェクトの検出、つまり画像内で最も視覚的な注意を引くオブジェクトを識別するために使用される深層学習モデルです。このモデルの名前は、浅いところから深いところまでの特徴を持ち、マルチスケールおよびマルチレベルのコンテキスト情報を取得できる、独特の入れ子型 U 字型構造に由来しています。
- u2netp : U2-NetP は、U2-Net モデルの軽量バージョンです。構造や機能は基本的に U2-Net と同じですが、モデルが小型で計算効率が高いため、コンピューティング リソースが限られた環境やアプリケーションに適しています。
- u2net_human_seg : U2-Net Human Seg は、U2-Net モデルの特別なバージョンであり、人間のセグメンテーション タスクに最適化および使用されます。ポートレートの輪郭や細部の処理に効果を発揮します。
- u2net_sloth_seg : U2-Net Cloth Seg は、衣服の画像情報を処理および抽出するために特別に使用される U2-Net モデルの特殊バージョンである可能性があります。これまでのところ、この名前の定義は学術文献やオープンソース プロジェクトで見つかっていないため、これは推測であることに注意してください。
- silueta : 名前はスペイン語で「シルエット」を意味し、おそらく画像の輪郭を処理するための何らかのアルゴリズムです。繰り返しになりますが、この名前の定義は、これまでのところ学術文献やオープンソース プロジェクトでは見つかっていません。
- isnet-general-use : これは別の深層学習モデルの名前である可能性がありますが、この名前の具体的な定義や説明は見つかりませんでした。おそらく一般的な画像処理タスク用のモデルだと思われます。
- isnet-anime : これはおそらく、アニメ スタイルの画像を処理するために特別に設計された ISNet モデルの特殊バージョンです。ただし、繰り返しになりますが、この名前の定義は学術文献やオープンソース プロジェクトには見つかりません。
必要な精度に応じて、これらのアルゴリズムの中から選択できます。
切り抜き方法 | エフェクトデモ1 | エフェクトデモ2 |
---|---|---|
元の画像 | ||
u2net | ||
u2netp | ||
u2net_human_seg | ||
u2net_sloth_seg | ||
シルエット | ||
isnet-汎用 | ||
イズネットアニメ |
追加パラメータ
上記のアルゴリズムの選択に加えて、Remove background
ツールにはReturn mask
との 2 つのオプションがありますAlpha matting
。アルファ マッティングは、前景オブジェクトを背景から分離するための技術です。分離は、前景オブジェクトと背景の間のアルファ値を計算することによって実現されます。
- FOREGROUND_THRESHOLD 前景しきい値: このパラメータは、どの部分を画像の前景として考慮するかを定義するために使用されます。アルファ値は通常、0 (完全に透明) から 255 (完全に不透明) の範囲でピクセルの透明度を表します。アルファ値が前景のしきい値よりも高い場合、それらのピクセルは前景として識別されます。この値の設定では、画像の特定のコンテンツと期待される効果を考慮する必要があります。
- Background_THRESHOLD 背景しきい値: このパラメータは前景しきい値と似ていますが、画像のどの部分を背景として考慮するかを定義するために使用されます。アルファ値が背景のしきい値よりも低い場合、それらのピクセルは背景として識別されます。同様に、この値の設定でも、画像の特定の内容と期待される効果を考慮する必要があります。
- ERODE_SIZE アルファマット侵食サイズ: 侵食は、主に画像内のノイズを除去したり、接続された 2 つのオブジェクトを分離したりするために使用される画像処理技術です。侵食操作のサイズは、侵食操作が適用される画像上の領域のサイズであり、通常は正方形の領域です。腐食サイズが大きいほど、腐食の影響はより顕著になりますが、腐食サイズが大きすぎると、重要な画像情報の一部が失われる可能性があります。
特定のパラメータの使用は、個人の好みやニーズに応じて調整できます。
推奨パラメータ | 価値 |
---|---|
-侵食サイズ | 10 |
前景のしきい値 | 220 |
バックグラウンドしきい値 | 40-100 |
テスト結果を比較するために、いくつかのパラメーターを以下に示します。
方法 | レンダリング |
---|---|
元の画像 | |
マスク | |
F-20 B-0 | |
F-100 B-0 | |
F-200 B-50 | |
F-220 B-100 | |
パラメータを微調整すると、文字切り抜きの黒い境界線が消え、使用効果が向上します。 |