【AI绘图 丨 Midjourney 系列教程一】— 风靡全球的 Midjourney 到底是什么

一、Midjourney 的原理

由 2022 年 3 月,美国一家工作室首次推出一款 AI 制图工具,它就是 Midjourney。Midjourney 同样使用了类似于 GPT-4 的深度学习技术——“生成对抗网络”(Generative Adversarial Networks,简称 GAN)的技术。GAN 包含两个神经网络,一个生成器和一个判别器。生成器负责生成图像,而判别器则评估生成器的性能。两个网络通过反复对抗的方式进行训练,最终生成一副可以满足用户需求的作品。采用了,通过大量的图像数据进行训练,能够理解用户的输入信息,并在大量图像数据中寻找相似元素和特征,最终生成一幅满足用户需求的作品。

Midjourney 只需要通过输入关键字,用不到一分钟的时间就可以使用 AI 算法生成相应的图片。该工具不仅支持风格迁移、自动绘画、分层编辑等多种功能,还可以选择不同画家的艺术风格,如安迪华荷、达芬奇、达利和毕加索等,还能识别特定镜头或摄影术语。同时,Midjourney 在 2023 年更新的 V5 版本中成功“出圈”,其逼真的视觉效果令不少网友感叹:“AI 已经不逊于人类画师了。”

Midjourney 目前只能通过其官方 Discord 上的 Discord 机器人使用。用户使用“/imagine”命令生成图像,并像其他 AI 图像生成工具一样输入命令提示。然后机器人会返回一张图片。

二、Midjourney 的功能特点

  1. 人像卡通化:可以将人物照片转换成卡通形象,让照片更加有趣和生动。

  2. 轮廓生成:可以根据输入的文字描述生成对应的图像轮廓,方便用户在制图过程中进行参考和操作。

  3. 色彩生成:利用先进的 GAN 模型,可以生成具有艺术感和创意的彩色图像,为用户创作提供更多可能性。

  4. 人脸合成:可以将不同人物的面部特征进行合成,生成新的面孔,为用户提供更多创作灵感。

  5. 风格迁移:Midjourney 可以将不同艺术风格应用到作品上,例如梵高的星空风格、毕加索的立体主义等。只需上传一张图片和指定想要的艺术风格,Midjourney 就能快速地生成一幅具有该风格特点的作品。

  6. 自动绘画:Midjourney 提供了自动绘画功能,可以根据用户的简单描述生成一幅独特的画作。这对于缺乏绘画基础或时间有限的用户来说非常实用。

三、Midjourney 与其他 AI 绘画工具的区别

与谷歌的 Imagen 和 OpenAI 的 DALL·E 不同,Midjourney 是第一个快速生成 AI 制图并开放申请使用的平台。

这里用 Stable Diffusion 和 Disco Diffusion 做简单比较:

Midjourney 与 Stable Diffusion 的区别:

以下用 MJ 来代表 Midjourney,用 SD 代表 Stable Diffusion。

1.使用标准 MJ:需要科学上网,收费(免费体验有 25 次使用机会,但服务器负载时,免费体验会关闭),是共享服务器频道作图。 SD:对显卡有一定要求(N 卡,8g 显存入门),是用本地安装部署环境作图。 2.工具原理 MJ:通过大量学习和训练图像的特征和风格生成高质量、多风格作品,用户可以给出描述词来生成自己想要的风格图像。 SD:通过大规模模型反复迭代图像来生成高质量图像,用户可以给出描述词并借助模型的玩法,更精确地生成自己想要的图像内容并调整。 3.面向的使用对象 MJ:适合全行业艺术工作者,上手方便,更像是精确提供灵感素材来源的价值参考,适合提供灵感素材来源,但无法提供细节微调和协助创作。目前能否商用值得商榷,需要结合创作者本身的设计能力去改变和调整作品。 SD:适合项目制的艺术工作者协作,在工作中可以协同自己的设计能力一步步通过 SD 反复优化调整最终完成能够实际落地的作品,是提高效率的工具,但有一定学习成本(安装及软件入门的学习)。

Midjourney 与 Disco Diffusion 的区别:

以下用 MJ 来代表 Midjourney,,用 DD 代表 Disco Diffusion。

1.使用标准

MJ:在 Discord 平台搭建,免费版本只有 25 次使用机会(服务器负载时,免费体验会关闭),后续使用需要付费。

DD:在 google colab 平台搭建,程序本身免费,但是高级功能需要付费 colab pro (10$),colab pro+ (50$)

2.工具原理

MJ:快速模式下只需 50s 即可生成,但快速模式用完了就需要排队了;图片最大尺寸为(1664.1664);擅长所有类型的画面,但画面的具象真实感不如 DD,且目前不支持动画,其团队正在开发中。MJ 官方禁止在社交媒体发布他人的作品,如果通过 mid 进行商业变现达到 2w 美金/月以上,还需要给 mid 支付费用。

DD:生成速度根据付费情况来决定,免费状态 1 小时,pro 20min,pro+ 5min;免费模式的最大图片尺寸为 (1280.768);擅长大场景和抽象画面,画面如梦,凌乱破碎,不擅长人物以及具象的物体。但是支持生成动画,且功能齐全。另外,DD 属于开源软件,并没有明确的版权限制。

3.面向使用对象:

MJ:上手基本没有难度,任何人都可以学会使用。MJ 中可调整的参数较少,掌握大部分提示词就可以影响画面。

DD:上手难度较大,需要一定程度的代码知识,但是教程很多零基础也可以学会。并且,工具中有非常多的参数细节需要学习如何调整。

四、Midjourney 的发展

Midjourney 的最大优点是速度和效率。由于它使用了深度学习技术,可以在几秒钟内生成一张高质量的图像。此外,Midjourney 还具有高度的自定义性和灵活性,用户可以根据自己的需求调整各种参数,使生成的图像更符合自己的要求。

并且,Midjourney 可以应用于多个领域,包括广告制作、游戏开发、虚拟现实、电影制作等。例如,在游戏开发中,开发者可以使用 Midjourney 生成游戏角色、场景等元素;在广告制作中,广告公司可以使用 Midjourney 生成广告海报、产品图片等。

Midjourney 作为人工智能制图领域的领导者之一,未来的发展前景非常广阔。随着技术的不断进步和应用场景的不断拓展,Midjourney 将会在更多的领域发挥作用。同时,Midjourney 也将不断更新和升级,加入更多的功能和创意元素,让用户可以更加自由地创作出自己想要的作品。

五、结语

Midjourney 在 2023 年的发展非常迅速,已经成为了人工智能制图领域的领导者之一。除了创作出高质量的插画作品外,还可以应用于各种场景,例如自动化设计、虚拟现实、游戏开发、广告制作等。此外,Midjourney 还在不断地更新和升级,加入了更多的功能和创意元素,让用户可以更加自由地创作出自己想要的作品。它的出现将会改变人们对于制图的认识和方式,为广大用户带来更加便捷和高效的创作体验。

猜你喜欢

转载自blog.csdn.net/baiyefenglin/article/details/130650309