オンライン環境 - 無料の Vinsen グラフ インターフェイスの展開 (テキストから画像への生成が可能)

アドレス
テキストから画像への合成https://project-iprj64b657264549ab788a4e41d1-8000.preview.node01.inscode.run/オンライン環境では 400 Bad Request が表示されます

ページが開ける場合は、まずhttp://project-iprj64b657264549ab788a4e41d1-8000.preview.node01.inscode.run/にアクセスしてください。

https://project-iprj64b657264549ab788a4e41d1-8000.preview.node01.inscode.run/にアクセスしてください。

序文

    「ベンセン図」とは、コンピュータ プログラムを使用してテキストを画像に変換するプロセスを指します。この手法は通常、Neural Text-to-Image Synthesis (NTIS) と呼ばれるニューラル ネットワークを使用して実行されます。NTIS アルゴリズムは、指定されたテキスト記述に従って、対応する画像を生成できます。この種のモデルは、ミームや映画ポスターの生成など、多くの興味深いことを行うために使用できます。

    現在の最先端のテキストから画像へのモデルは、高品質の画像を生成できる敵対的生成ネットワーク (GAN) に基づいたものです。GAN は、ジェネレーターとディスクリミネーターの 2 つの部分で構成されます。ジェネレーターの役割はテキストの説明に基づいて画像を生成することであり、ディスクリミネーターの役割は実際の画像と生成された画像を区別することです。ネットワークのこれら 2 つの部分をトレーニングすることにより、ジェネレーターによって生成される画像をますます本物の画像に近づけることができます。

    ChatGPT が普及する前、AI の分野で最も人気のあるトピックは AI 描画でした。普及モデルは生成 AI を大きく前進させ、テキストを入力してさまざまなスタイルの画像を生成する AI モデルが一時は多数登場しました。その後、画像から画像を生成したり、画像を指定したスタイルに変換したりする方法がさらに登場し、人々は生成 AI の魔法に驚き、驚嘆しました。

道具の使用

    このプログラムは、達磨学院が制作した文生図の大規模モデルであるAIプロジェクト「ai_artist」を利用しており、中国語のキーワードを入力することで対応するパターンを生成することができ、現在完全に無料で利用できる。記述子は最大 500 ワードまで追加できます。このモデルは、多段階のテキストから画像への生成拡散モデルに基づいており、中国語または英語の説明の入力をサポートし、ユーザー定義の説明テキストに従って対応するスタイル画像を生成できます。

    では、このツールの使い方を紹介しましょう。

関数 1: ヴィンセント図

    図に示すように、このページにはテキストから画像を生成する機能があり、ユーザーはこのページにテキストを入力し、対応する画像を生成できます。さらに重要なことは、このページは生成された画像をサーバー上でローカルに保存する機能もサポートしていることです (デフォルトでは ./upload/ に保存されます)。そのため、ユーザーはいつでもどこでも生成された画像にアクセスして使用できます。

    また、このページでは画像をクリックすると拡大する機能も提供しています。ユーザーがページ上の画像をクリックすると、画像が自動的に拡大され、詳細がより明確に見えるようになります。このような機能設計により、ユーザーは写真をより便利に閲覧したり表示したりできるようになり、ユーザー エクスペリエンスとインタラクティブ性が向上します。学術研究、デザイン制作、エンターテインメントメディアのいずれの分野であっても、このような機能は、ユーザーが生成された画像をより適切に使用し、鑑賞するのに役立ちます。

機能2: 自作API

API - 説明:Boy https://project-iprj64b657264549ab788a4e41d1-8000.preview.node01.inscode.run/generate_image_json.php?description=boy

     この API の「description」パラメータを使用して、画像の説明を指定できます。上記リンクでは「男の子」を例に説明しています。必要に応じて説明を変更できます。API を呼び出すと、画像リンクが生成され、JSON 形式で返されます。

    この機能を使用すると、説明付きの画像を自動的に生成し、さまざまなアプリケーションやシナリオをサポートできます。特定のニーズに応じて調整および統合して、よりカスタマイズされたアプリケーション機能を実現できます。

派生

    もっとバグを持ってきてくれることを願っています。

既知のバグ1:

    デフォルト値は 1024x1024、アスペクト比は 1 である必要があります。間違えて0.5と書いてしまいました。

修正する前に:

変更後:

既知のバグ2:

    モデルはカスタム サイズをサポートしていませんが、カスタム ロジックを書き込みます...再度開く必要があるため、次のバージョンではサードパーティの入力に応じて再描画のロジックが追加されます。 

おすすめ

転載: blog.csdn.net/RabbitTuzi/article/details/131769022
おすすめ