海睿思分享 | ChatGPT梦幻联动，解锁企业数字化转型新可能

在当今这个充满活力和变化的世界里，人工智能 (AI) 的迅速发展正在改变着我们的生活方式。它不仅提高了我们的工作效率，而且正在重新定义我们的日常生活，以前所未有的方式提高了我们的生活质量。其中，以ChatGPT为代表的语言生成模型横空出世，通过强大的机器学习能力，渗透于我们生活的方方面面。而Midjourney，则作为一个新兴的AI作画程序收到了世界各地的关注。这两款工具，一款聚焦语言交流，一款专注艺术创作，当它们发生碰撞的时候，又会发生什么呢？

本篇推文我们就来介绍一下以Midjourney为主、ChatGPT为辅的创作流程可以为企业工作数字化、智能化带来怎样的艺术火花。

Midjourney与AI作画

早在60年代，AI艺术的概念和相关系统就产生了，其中就包括绘画与音乐作品等，而使用文字生成画作的方式属于AI艺术的一种形式。Midjourney作为这样一种智能作画系统，使用深度学习和神经网络的技术，将输入的描述性词句转化为多种风格的画作呈现出来，与之类似的有OpenAI开发的DALL-E2，微软的NUWA-infinity，以及著名的Stable Diffusion开源模型。

Midjourney于2023年5月4日新发布的5.1版本支持对输入文本的自然语言理解，并提高了作画的精度，减少无关信息的生成。虽然其技术尚未公布，但公众推测与现有AI绘画系统相类似，如通过使用LDM渲染模型等对大量的图片样本进行机器学习后得出结果。

Midjourney详解

Midjourney人工智能程序嵌入于一个名叫Discord的交流平台，通过输入指令的方式支持语义理解、修改版本和风格、提升分辨率、效仿用户上传图片风格（喂图）等。

以下为利用Midjourney生成UI收入看板的演示：

指令：/imagine UI design for income board --s 250 --v 5.1

输出：（Midjourney一次性输出四张备选）

从以上范例我们不难发现：

1. Midjourney目前主要适合英文输入，中文输入会造成语义理解错误

2. 如果指令的描述不够具体，生成的四张图片会有较大差异，由于生成的随机性，可能无法呈现使用者想要的画面效果

3. Midjourney在指令正确且合理的情况下只可以给出图片格式的结果，但无法直接转换为矢量图用于编辑

针对以上几个特点，如果我们需要生成更为具体的内容或者包含特定的元素，如何写好指令是重点，这也是为什么我们在后续考虑使用ChatGPT辅助我们生成指令。

ChatGPT与Midjourney的联合运用

由于Midjourney的指令理解系统尚有缺陷，我们可以通过训练ChatGPT写出适用于Midjourney的指令，从而解决以下几个问题：

句段式语句要素提取与完善
搜索合适专业术语丰富指令内容
语言翻译
……

以上一部分的UI页面设计为例，如果我们需要ChatGPT从主体、场景、风格、质量等方面完善对“UI收入看板”的描述，首先可以通过举例的方式让ChatGPT了解生成指令的形式，之后只需输入我们的要求即可自动生成。

ChatGPT优化前：UI design for income board

ChatGPT优化后：Crisp, clean UI design for income board, sophisticated data visualization with interactive income graphs, delineation of various revenue streams, real-time data synchronization, professionally styled user profile, subdued corporate color palette, intuitive user-friendly navigation, tactile response on button selection, structured grid layout, high-definition, pixel-perfect icons, seamless transitions, high-quality 4K resolution, and state-of-the-art rendering

输出：

通过选择最满意的作品并利用Midjourney自带的优化功能，我们可以获得风格和内容更类似、精确度更高的四幅备选作品。而ChatGPT生成的指令加入了更多的描述性字句，如“对交互式收入图表进行数据可视化”“结构化网格布局”“高质量 4K 分辨率”等等。这些都使对图片生成的需求更为细致具体，从而逐渐还原理想中画作的布局和构造。

AI作画在未来的应用

从之前的例子中可以看出，类似于Midjourney的AI创作软件已经可以做出最基本的界面和配色设计，但是生成的例子无法直接使用，因此需要后续处理后才能投入使用。除此之外，从社会角度来说，AI作画软件给大多数人提供了一种易于创造的机会，从而激发创造力与相关产业。而AI作画软件本身仍有不足之处，优化语义理解功能、细节或绘画逻辑的完善等方面仍需要更多的研发投入。

海睿思分享 | ChatGPT梦幻联动，解锁企业数字化转型新可能

猜你喜欢