первый шаг

Здравствуйте, сегодня мы собираемся создать изображение, используя диффузионную модель. Я дам вам некоторую информацию. ХОРОШО?

Вставьте сюда описание изображения

Шаг 2

Вот как работает Midjourney: Midjourney — это еще один инструмент на основе искусственного интеллекта, который генерирует изображения на основе запросов пользователя. MidJourney превосходно адаптирует фактический художественный стиль для создания любой комбинации изображений по желанию пользователя. Он превосходно подходит для создания локаций, особенно фэнтезийных и научно-фантастических сцен, с драматическим освещением, которое выглядит как концепт-арт для видеоигр.

Как работает Midjourney Midjourney — это инструмент для создания изображений с использованием искусственного интеллекта, который принимает текстовые подсказки и ввод параметров, а также использует алгоритмы машинного обучения (ML), обученные на больших объемах данных изображений, для создания уникальных изображений. Работает на основе модели скрытой диффузии (LDM), передовой технологии синтеза текста в изображение. Прежде чем понять, как работает ldm, давайте сначала посмотрим, что такое диффузионная модель и зачем нам нужен ldm. Модель диффузии (DM) — это генеративная модель на основе преобразователя, которая берет фрагмент данных, например изображение, и постепенно добавляет шум с течением времени, пока он не станет неузнаваемым. После этого они пытаются восстановить изображение в его первоначальной форме, изучая при этом, как генерировать изображение или другие данные. Проблема с DM заключается в том, что мощный DM часто потребляет сотни дней графического процессора, а вывод очень дорог из-за последовательных вычислений. Чтобы обеспечить возможность обучения DM на ограниченных вычислительных ресурсах без ущерба для его качества и гибкости, DM применяется к скрытому пространству мощных предварительно обученных автокодировщиков. Обучение моделей диффузии на этом представлении может найти золотую середину между снижением сложности и сохранением деталей, что значительно улучшает визуальную точность. Введение слоев перекрестного внимания в архитектуру модели превращает модель диффузии в мощный и гибкий генератор для общих условных входных данных, таких как текст и ограничивающие рамки, что обеспечивает синтез высокого разрешения на основе свертки. Подождите, у меня есть дополнительная информация.

третий шаг

Версия Light Midjourney регулярно выпускает новые версии моделей для повышения эффективности, единообразия и качества. По умолчанию используется последняя модель, но можно использовать и другие модели. Разные модели хороши для разных типов изображений. Модель Midjourney V5 — новейшая и самая совершенная модель, выпущенная 15 марта 2023 года. Чтобы использовать эту модель, добавьте параметр -v 5 в конце приглашения или используйте команду /settings и выберите MJ версии 5. Эта модель очень последовательна, превосходно интерпретирует сигналы естественного языка, имеет более высокое разрешение и поддерживает расширенные функции, такие как шаблоны повторения фрагментов. Откройте введите -v 5 после запроса или выберите «V5» в /settings Что нового в базовой модели V5? Более широкий диапазон стилей, более быстрая реакция на запросы, более высокое качество изображения (в 2 раза выше разрешение) Улучшено Увеличенный динамический диапазон, более подробные изображения . Детали, скорее всего, будут верными. Уменьшите ненужный текст. Улучшена производительность подсказок в виде изображений, поддерживаются параметры бесшовной плитки (экспериментальная), поддерживаются соотношения сторон более 2:1 (экспериментальная), поддерживается iw, который используется для взвешивания подсказок в виде изображений и стилей текстовых подсказок, а также подсказок V5.

Сегодняшний тест в основном представлял собой модель в режиме «Pro».

Он более «беспристрастный», чем v3 и v4, настроен на обеспечение широкого разнообразия выходного сигнала и очень чувствителен к вашему входному сигналу. - Компромисс здесь в том, что его может быть сложнее использовать. Короткие подсказки могут не сработать. Вам следует попробовать написать более длинные и конкретные слова, описывающие то, что вы хотите (например: «кинематографические фотографии с ярким освещением»).

Пожалуйста, пообщайтесь друг с другом в оперативном чате, чтобы узнать, как использовать v5.

Мы хотели бы иметь «дружественный» стиль по умолчанию в версии 5, а затем переключиться на стиль по умолчанию позже. Когда это произойдет, мы все равно позволим вам выключить его и вернуться в «исходный» режим на сегодняшний день. Обратите внимание, что это альфа-тестирование, и все изменится. Не полагайтесь на то, что именно эта модель будет доступна в будущем. Когда мы выпустим полную версию V5, она будет существенно переработана.

В настоящее время нет повышающей частоты дискретизации V5, а разрешение V5 по умолчанию такое же, как и в обновленной версии V4. Если вы нажмете «Высокий», он сразу же выдаст вам изображение. Стандарт сообщества: эта модель создает более реалистичные изображения, чем все, что мы выпускали раньше.

Мы увеличили количество модераторов, улучшили инструменты модератора и будем более строго и строго обеспечивать соблюдение стандартов нашего сообщества. Не будьте придурком и не создавайте драму. Подробнее о V5: V5 — вторая модель, которую мы обучили на суперкластере ИИ и работаем уже 5 месяцев. Он использует существенно другие нейронные структуры и новые эстетические методы. V5 — не последний шаг, но мы надеемся, что вы все почувствуете развитие чего-то глубокого и непостижимого в нашем коллективном человеческом воображении. Подождите, у меня есть дополнительная информация.

Вставьте сюда описание изображения

четвертый шаг

Основные параметры соотношения сторон -Aspect или -ar изменяют сгенерированное соотношение сторон. Хаос: Хаос <число 0–100> изменяет степень изменения результатов. Более высокие значения дадут более необычные и неожиданные поколения. Нет – никаких негативных сигналов – никаких растений, пытающихся убрать растения с изображения. Качество—Качество<. 25, .5, 1 или 2> или -q <. 25, 0,5, 1 или 2> сколько времени вы готовы потратить на качественный рендеринг. Значение по умолчанию — 1. Более высокие значения стоят дороже, более низкие значения стоят меньше. Начальное значение — начальное число < целое число от 0 до 4294967295> Бот Midjourney использует начальное число для создания поля визуального шума, например статического ТВ-изображения, в качестве отправной точки для создания начальной сетки изображений. Начальное число генерируется случайным образом для каждого изображения, но его можно указать с помощью параметров --Seed или --sameseed. Использование того же исходного номера и подсказки приведет к созданию похожих финальных изображений. Stop — Stop <целое число от 10 до 100>. Используйте параметр --Stop, чтобы завершить задание в середине процесса. Остановка задания на более раннем проценте может привести к размытым и менее подробным результатам.

Стиль — Стиль <4a, 4b или 4c> Переключение между версиями модели Midjourney версии 4. Стилизация — параметр Stylize или -s влияет на то, насколько эстетический стиль Midjourney по умолчанию применяется к заданиям. При выборе кнопки U используется еще один «легкий» апгрейд. Результат ближе к исходному изображению сетки. Обновленное изображение имеет меньше деталей и более плавное. При выборе кнопки U используется дополнительное бета-обновление. Результат ближе к исходному изображению сетки. Увеличенное изображение добавляет значительно меньше деталей. По умолчанию (версия модели 5) Соотношение сторон Хаос Массовое затравочное число Остановить стиль Стилизованный По умолчанию 1:1 0 1 Случайный 100 4c 100 Диапазон Любой 0–100 ,25 ,5 1 или 2 целых числа 0–4294967295 10–100–0–1000 Соотношения сторон больше чем 2:1 являются экспериментальными и могут привести к непредсказуемым результатам.

Модель совместимости Версия и параметр Влияние совместимости Влияние начального поколения Изменение + ремикс Версия 5 Версия 4 Версия 3 Тест/ТестpNiji Макс. соотношение сторон ✓✓ 1:2 или 2:1 5:2 2:5 3:2 или 2:3 1:2 или 2:1 Хаос ✓✓✓✓✓✓Вес изображения✓✓✓✓Нет✓✓✓✓✓✓✓Качество✓✓✓✓✓Семена✓✓✓✓✓✓Семена ✓✓Стоп✓✓✓✓✓ ✓✓ Стиль 4 a и 4 b стилизованные ✓ По умолчанию 0–1000 = 100 0–1000 По умолчанию = 100 625–60000 По умолчанию = 2500) 1250–5000 По умолчанию = 2500) Плитки ✓✓✓✓Видео ✓✓ Количество сеток Картинки - - 4 4 4 2 (1, когда соотношение сторон ≠ 1:1) Но подождите, у меня есть еще информация.

пятый шаг

Хорошо, теперь я приведу вам несколько примеров подсказок, используемых в Midjourney V5. ХОРОШО?

Шаг 6

Подсказка 1: Суперширокоугольная современная фотография гавайских красавиц 1970-х годов. Эта фотография была сделана Мэри Шелли камерой Nikon D5100 с диафрагмой выключенной/2,8, ISO 800 и выдержкой 1/100 секунды. UHD dtm HDR 8k --ar 2:3 --v 5

Подсказка 2: футуристическая моторная лодка в стиле стимпанк, готовая к бою, скользит по воде с яростным видом. Замысловатые шестерни и латунные детали украшают его корпус, демонстрируя идеальное сочетание передовых технологий и викторианской эстетики. Этот шедевр реализма блестит на солнце и готов к действию. --ar 16:10 --s 50 --v 5 --q 2

Подсказка 3: эпический фон, простая хакерская тема, божественная цветовая схема, загадочные коды, буквенно-цифровые последовательности, магия, высокое качество 4K, значение рендеринга -v 5 -ar 9:16.

Подсказка 5: Красавица-блондинка в полный рост, в коричневой куртке, фотография, зеркальная камера Canon EOS 5D Mark IV, объектив EF 50 мм f/1,8 STM, разрешение 30,4 миллиона пикселей, чувствительность ISO: 32 000, выдержка 8 000 секунд — — 9:16 - -Масштабирование-- -v 5.

Подсказка 6: Фотография в полный рост Hasselblad 24 мм, великолепные и довольные африканские женщины, нежная и естественная кожа, без макияжа, нежные глаза, длинные косы – ar2:3–q5–v5–v4.

Подсказка 7: Красивый темно-красный закат ночью у моря, сложный, потрясающий, красивый, реалистичный, сверхвысокое разрешение, широкий угол, глубина резкости, динамическое освещение π -ar 1:2 -v 5

Теперь вы понимаете, как образуется слово-подсказка «Midjourney»? Да или Нет.

Вставьте сюда описание изображения

Шаг 7

Очень хороший. Вот еще несколько примеров подсказок Midjourney.

Подсказка 1: Фотография в полный рост на Hasselblad 24 мм, великолепные и довольные африканские женщины, нежная и естественная кожа, без макияжа, нежные глаза, длинные косы –ar 2:3 --q 5 --v 5 --v 4.

Подсказка 2: Красивый темно-красный закат ночью у моря, сложный, потрясающий, красивый, реалистичный, сверхвысокое разрешение, широкий угол, глубина резкости, динамическое освещение -ar 1:2 -v 5

Подсказка 3: потрясающая, ультрареалистичная фотография свирепого воина-викинга, тщательно затачивающего свой мощный клинок в дикой природе сурового, дикого скандинавского ландшафта. Эта сцена была снята камерой Nikon D850 с объективом 70–200 мм f/2,8, подчеркивающим каждую деталь обветренного лица викинга, потертых войной доспехов и искусного мастерства его оружия. Использовались следующие настройки: закрытая диафрагма/4, ISO 400, выдержка 1/200 секунды, баланс естественного света и тени, чтобы подчеркнуть интенсивность и решительность глаз викинга. Сочетая необузданную силу воина с безмятежной красотой окружающей среды, эта композиция отражает суть духа викингов в потрясающих изображениях с высоким разрешением, перенося зрителей обратно в легендарные битвы и нерассказанные истории. –ар 16:9 --q 1.5 --v 5.

Подсказка 4: Потрясающее и атмосферное нью-йоркское уличное кафе 1970-х годов выполнено в ностальгическом и кинематографическом стиле, напоминающем золотой век кинематографа. Эта ретро-сцена демонстрирует оживленную городскую жизнь: клиенты наслаждаются кофе за столиками на открытом воздухе в окружении классических автомобилей и ретро-архитектуры. Эта фотография была умело сделана с помощью дальномерной камеры Leica M3 в сочетании с объективом Summicron 35 мм f/2, известным своей четкостью и прекрасной цветопередачей. Фотография была снята на пленку Kodak Portra 400, что придает ей теплую и неподвластную времени цветовую палитру, усиливающую общую атмосферу. Фотограф умело использовал малую глубину резкости и диафрагму выкл./2,8, чтобы изолировать кафе и его посетителей от шумного городского фона. ISO было установлено на 400, а выдержка — 1/125 секунды, что позволило передать идеальный баланс света и движения. Мягкий рассеянный солнечный свет проникает сквозь знаменитый горизонт Нью-Йорка, отбрасывая теплые золотистые тона на сцену и подчеркивая богатые текстуры кирпичных зданий и мощеных улиц, еще больше улучшая композицию. –ар 3:2 --q 2.

Подсказка 5: Макрофотография высокого разрешения от первого лица реалистичного кота в светоотражающих очках, отдыхающего на тропическом острове, драматический свет — 2:3 — 750 — v 5 Спасибо за примеры советов по использованию в Midjourney V5. Эти советы являются хорошим примером того, насколько подробными и конкретными могут быть текстовые подсказки для создания изображений с желаемыми характеристиками. Эти советы также показывают использование различных параметров, таких как соотношение сторон, стилизация, версия и настройки качества. Эти примеры помогут понять, как использовать Midjourney V5 для создания эффективных подсказок для сгенерированных изображений.

Теперь вы понимаете, как образуется слово-подсказка «Midjourney»? Да или Нет.

Вставьте сюда описание изображения

Шаг 8

Очень хороший. Теперь я хочу, чтобы вы сыграли профессионального фотографа. Описывая подсказки к фотографиям, вы будете использовать богатый описательный язык, включая настройки камеры. Теперь первая подсказка, которую я хочу, чтобы вы создали, — это фотография влиятельной женщины 1930-х годов. Вдохновитесь форматированием примеров подсказок, не копируйте их, а используйте то же форматирование. Содержание слова-подсказки должно быть ограничено 399 словами.

Вставьте сюда описание изображения
Ха-ха, скопируй и вставь слово-подсказку в картину ИИ

Научите Вэнь Синь Ияна генерировать подсказки для рисования с помощью ИИ (Midjourney)

Каталог статей

первый шаг

Шаг 2

третий шаг

четвертый шаг

пятый шаг

Шаг 6

Шаг 7

Шаг 8

рекомендация