テキストの説明に基づいて画像を生成することは夢ではありません!

AIの能力はますます強くなり、これまで人間固有の能力と考えられていた分野も、AIによって次々と凌駕されています。創造性の欠如は、以前の AI の一般的な認識であり、硬直性と手続き化は AI の特徴であり、したがって、芸術的創造は一般的に AI に取って代わるものではないと考えられています。

しかし、その認識が壊れてしまったようで、以前、AIが描いた絵で絵をまったく知らない人が1等賞を受賞したというニュースが報道され、世間で話題になりました

この件についてはここでは触れませんが、この件からわかることは、AIが徐々に人間の創造性を所有している、あるいは徐々に人間の創造性を模倣しているということですが、いずれにせよ、AIのアートにおける創造力は徐々に向上していることは否定できません。 .

以前、画像生成技術音声技術個性的な「彼女」を作ることについて書きましたが、画像生成はAIの創作能力獲得の前段階の能力と言えます。

少し前に、Baidu は、誰でもアートを作成できるプラットフォーム「Yige」をリリースしました.独自の大ヒット作を作成することは夢ではなく、簡単な操作で独自の「夢の絵」を作成できます

Yige の使用には審査のための提出が必要ですが、通常 3 ~ 5 分で完了します. 生成された画像は、Yige のギャラリーに公開するか、審査に提出した後に自分でダウンロードできます.

ここに画像の説明を挿入

これは、自分で生成した私のお気に入りの結果の 1 つです - 蓮池の月明かり

これは、インターネット上のさまざまな「マスター」の結果よりもはるかに優れています

ここに画像の説明を挿入

最近、Baidu が新しい画像生成技術 ernie_vilg を paddlehua を通じてリリースしたことを知りました。ernie_vilg は「One Grid」に比べて技術オタクで、環境を構築することで自分でどんな絵も生成できる
巨大な白い城
かわいいねこ

環境構築は非常にシンプルで、Baidu が提供する aistudio や Google が提供する colab を使用できます。

import paddlehub as hub 
module = hub.Module(name="ernie_vilg") 
results = module.generate_image(text_prompts=["可爱的猫"])

上記の text_prompts の後に、画像の独自の説明を記述し、説明に一致する画像を 1 つのステップで直接生​​成します。

自分で環境を構築したくない場合は、 huaggingface の空間空間を通じて体験することもできますが、生成速度はより感動的です

Baidu の以前の「Yige」であれ、paddlehub の ernie_vilg であれ、テキストの説明に従って画像を変換することができ、テキストで生成された画像は、テキストで画像を生成してからアニメーションを合成する Disney によって紙にさかのぼることができ、DELL やGPT -3、ERNIE などは、テキストから画像を生成しようとしていますが、結果は比較的平均的です。

AI機能の継続的な強化により、ますます多くの驚きが見られることを願っています〜

おすすめ

転載: blog.csdn.net/wwlsm_zql/article/details/126915572