Создаем картинки в Midjourney. Базовый уровень

В уроке расскажем, как пользоваться сервером Midjourney. Вы научитесь составлять промпты для генерации картинок, которые подойдут и для других нейросетей. Узнаете, какие стили и форматы вам доступны: от фото и мультфильмов до аниме и картин в стиле Ван Гога. Разберетесь, какие лайфхаки сделают картинки еще лучше.
Нейродизайнер: Лев Переулков

Что вы узнаете

  1. Какие картинки создают нейросети.
  2. Как генерировать картинки в Midjourney.
  3. Как составить идеальный запрос для нейросети.
  4. Как улучшить запрос для Midjourney: лайфхаки.

Курс создан в 2023 году, но почти все советы актуальны

Мы писали этот курс летом 2023 года и учитывали функции и ограничения на тот момент. С тех пор появилось много нового: ChatGPT научился выходить в интернет, генерировать изображения. Еще ему можно отправлять картинки и голосовые сообщения. Но это касается платных сценариев, доступных по подписке. Почти все советы по базовому GPT-3.5 актуальны.

Какие картинки создают нейросети

Представьте, что вы стоите перед холстом, который рисует картину под вашим руководством и иногда добавляет непредсказуемые штрихи. Например, вы просите нарисовать рыбаков, а позади — деревянный дом. Раз — и они сразу появляются. А еще сельская местность с коровками, о которых вы не просили. Именно так нейросети генерируют картинки: вы объясняете идею через запрос (промпт), а робот ее реализует.

Если составить промпт правильно, вы получите картинку точно под свой запрос — будь то кадр из кукольного мультфильма, открытка с котами или картина в стиле Сальвадора Дали. Например, читательница Тинькофф Журнала сгенерировала карточки с временами английских глаголов в стиле сериала «Уэнсдэй».

В курсе мы будем работать с Midjourney — самой популярной нейросетью для таких задач.

Ей просто пользоваться, она хорошо генерирует изображения в разных стилях и форматах. При этом вам не нужно уметь программировать или иметь мощный компьютер. Но Midjourney доступна только по платной подписке и лучше всего понимает запросы на английском.

Чтобы пользоваться нейросетью, вам потребуется аккаунт в Discord и зарубежная карта для оплаты сервиса. О том, как быстро зарегистрироваться и оплатить подписку, мы подробно рассказали в инструкции — обязательно прочитайте ее, чтобы ничего не упустить.

Если хотите генерировать картинки бесплатно и на русском, рекомендуем Kandinsky — нейросеть от Сбера. Авторы курса рассказывали о ее особенностях в отдельном материале. А если хотите больше доступных вариантов на английском, посмотрите список бесплатных нейросетей.

Не пропускайте урок, даже если не будете пользоваться Midjourney!

В разделе «Как составить идеальный промпт» мы расскажем, как написать идеальный запрос для нейросети, чтобы сразу получить хорошую картинку. Эти принципы универсальны — подойдут и для Midjourney, и для других нейросетей.

Как генерировать картинки в Midjourney

В первый раз сервер Midjourney может запутать: там куча кнопок и чатов. Но стоит разобраться — и в следующий раз вы сразу перейдете к генерации картинок. Объясняем по порядку.

Выберите чат. Для генерации подойдет любой канал с названием #newbie — они предназначены для новичков. Здесь вы будете генерировать картинки одновременно с другими людьми, которые пользуются этим каналом.

Если хотите генерировать в одиночку, в любом канале с названием #newbie найдите бота Midjourney Bot → нажмите на него → найдите окно «Сообщение для @Midjourney Bot» → напишите любое сообщение.

Мы зашли в один из каналов #newbie для новичков и нашли там бота Midjourney
Мы зашли в один из каналов #newbie для новичков и нашли там бота Midjourney
Написали ему «Привет»
Написали ему «Привет»
И вот у нас личный чат с ботом, где можно генерировать
И вот у нас личный чат с ботом, где можно генерировать

Используйте команду /imagine и напишите промпт. В диалоге с Midjourney Bot введите «/» и выберите из выпадающего списка команду /imagine. Появится окно prompt — туда нужно написать запрос.

Описание картинки для нейросети лучше формулировать на английском языке. Другие языки Midjourney понимает, но гораздо хуже. Если не знаете английский, пользуйтесь нейросетевым переводчиком DeepL. Как формулировать запросы, мы расскажем чуть позже.

Начните генерацию. Когда сформулируете запрос, нажмите кнопку «Отправить» или Enter на клавиатуре. Бот начнет генерировать изображение: вы увидите, как смутные очертания превращаются в картинки. Обычно генерация занимает не дольше минуты, но все зависит от нагрузки на сервер и деталей конкретного запроса.

Пропишите команду /imagine
Пропишите команду /imagine
Так выглядит процесс генерации
Так выглядит процесс генерации

Когда закончится генерация, вы увидите четыре картинки и кнопки под ними. Вот что они делают.

U1 U2 U3 U4 — выбрать одну картинку из четырех. Выберите вариант, который вам понравился, и нажмите соответствующую кнопку. Бот отправит в чат эту картинку в полном размере.

V1 V2 V3 V4 — создать четыре варианта одной из сгенерированных картинок. Подойдет, если вам нравится один вариант, но хочется посмотреть, что еще сделает нейросеть в том же духе.

🔄 — заново сгенерировать картинку по тому же запросу. Получится четыре новых изображения.

Выбрали первый вариант
Выбрали первый вариант
Выбрали четвертый вариант
Выбрали четвертый вариант
Сгенерировали новую картинку
Сгенерировали новую картинку

Сохраните картинку, которая понравилась. Выберите изображение через кнопки U1 U2 U3 U4, затем нажмите на картинку, дальше на «Открыть в браузере». Так разрешение будет выше.

Посмотреть все свои генерации можно на сайте Midjourney — для этого нужно авторизоваться через Discord.

Сохранили картинку
Сохранили картинку

Как составить идеальный запрос для Midjourney

О нейросетях часто говорят так: «Достаточно нажать одну кнопку — и получится шедевр, который можно сразу публиковать, отправлять в печать или вешать на стену». В этом есть доля правды: изображения Midjourney даже побеждают на арт-выставках, но в реальности все не так просто.

Мы отправили в чат запрос «Открытка на Новый год с опоссумами». И получили жутковатую картинку. Снег есть, атмосфера вроде новогодняя… Но почему-то опоссумы с красными глазами, будто замышляют недоброе
Мы отправили в чат запрос «Открытка на Новый год с опоссумами». И получили жутковатую картинку. Снег есть, атмосфера вроде новогодняя… Но почему-то опоссумы с красными глазами, будто замышляют недоброе

Как и в случае с ChatGPT, чтобы получить результат точно под запрос, нужно правильно составить промпт.

Идеальный промпт для генерации картинки состоит из четырех элементов: формата, объекта, действия и стилистики. Рассмотрим каждый по отдельности.

🖼 Формат картинки — то, что вы хотите получить: фотографию, картину, постер, открытку, мозаику, вышивку. Можно придумать и более необычные варианты: набор «Лего», чертеж, трехмерную модель или оригами.

Первые элементы промпта влияют на результат сильнее всего. Формат изображения мы указываем первым, поэтому он определит, какой получится картинка.

Посмотреть, как выглядят разные форматы, можно в фанатской библиотеке стилей Midjourney — там почти 300 вариантов с примерами, и это не предел. Создатели нейросети не раскрывают все возможные форматы и техники, которые она может имитировать, а пользователи пока не перебрали все опции. Вы можете попробовать любой формат не из списка. В худшем случае он просто не сработает, в лучшем — вы найдете новый.

💁‍♀️ Объект — то, что должно быть на картинке. Например, пельмень, кот, скейтборд, девушка, астронавт, автомобиль, дракон, космический корабль, планета — варианты ограничены вашим воображением и базой данных нейросети.

Вы можете сочетать в запросе разные объекты, чтобы получить необычные концепты и реализовать любые идеи. К примеру, сделать дракона-астронавта, опоссума-скейтбордиста или космический дом.

Помимо реальных объектов нейросети могут генерировать абстрактные понятия вроде времени, судьбы, счастья или смысла жизни. Но не стоит сильно увлекаться абстракцией. Если вы напишете «мое любимое место в мире», то нейросеть не поймет, что вы имели в виду: свою спальню или кофейную недалеко от дома. И сгенерирует что-то свое.

🚶‍♀️ Действие — то, что должен делать объект на изображении. Например, идти, стоять, пить чай, украшать елку.

Формулируйте действие так, чтобы его можно было наглядно отобразить на картинке. Абстрактные действия лучше не использовать: нейросеть интерпретирует их по-своему. Например, «мечтает» может выглядеть как угодно, «сидит, погрузившись в мысли» — звучит конкретнее.

Примеры действий для нейросетей

❌ Плохое действие✅ Хорошее действие
УчитсяСидит за столом с книгами
ПутешествуетСтоит у памятника с рюкзаком
ОтдыхаетЛежит в гамаке
Занимается бизнесомСидит в офисе за столом в деловом костюме
Участвует в олимпиадеПерепрыгивает через шест на олимпийских соревнованиях

Примеры действий для нейросетей

❌ Плохое действие✅ Хорошее действие
УчитсяСидит за столом с книгами
ПутешествуетСтоит у памятника с рюкзаком
ОтдыхаетЛежит в гамаке
Занимается бизнесомСидит в офисе за столом в деловом костюме
Участвует в олимпиадеПерепрыгивает через шест на олимпийских соревнованиях

🎨 Стиль — художественный стиль, в котором будет выполнена картинка. Нейросеть обучена на образцах разных течений, эстетик, эпох. Это может быть киберпанк, ренессанс, кубизм, поп-арт, минимализм, баухаус. Чтобы использовать стиль, добавляйте в запрос in the style of — «в стиле таком-то».

Стилистика в меньшей степени повлияет на запрос, зато ее можно комбинировать с форматом. К примеру, формат «мультфильм» может быть в стиле «киберпанка» или «аниме», а формат «постер» — в стиле «поп-арта» или «минимализма».

Чтобы разобраться, что еще может нейросеть, загляните в библиотеку стилей Midjourney — там уже более 200 вариантов с примерами.

Вместо стиля можно указать имена: нейросети могут имитировать эстетику известных людей, например Винсента Ван Гога или Пабло Пикассо, современных художников, режиссеров или дизайнеров. Чтобы добавить имя артиста, добавляйте в запрос «by X», где X — художник.

Больше имен — в библиотеке стилей Midjourney. Там есть архитекторы, дизайнеры, режиссеры, иллюстраторы, художники, фотографы, скульпторы, уличные художники. Если вы укажете в промпте кого-то, кого нет в библиотеке, будет лотерея: может быть, нейросеть сгенерирует что-то удачное.

Еще вместо стиля можно указать название популярного фильма, сериала, видеоигры, комикса. Нейросети умеют повторять стиль «Симпсонов», «Звездных войн», «Матрицы». Но это будут не кадры оттуда, а общие мотивы, стиль рисовки, настроение. В библиотеке стилей Midjourney более 250 названий с примерами.

Мы разобрали все элементы формулы. Теперь давайте улучшим запрос для открытки с опоссумами. Напомним, что до доработки он звучал так: «Открытка на Новый год с опоссумами».

Если вы везде ответили правильно, у вас должен получиться конкретный запрос. Посмотрите, как он выглядит и что сгенерировала в ответ на него нейросеть.

Получилось мило! Любителю кубизма и опоссумов должно понравиться
Получилось мило! Любителю кубизма и опоссумов должно понравиться

Как улучшить запрос для Midjourney: лайфхаки

Мы научились генерировать простую картинку — и у нас вышла отличная открытка с опоссумами. Теперь расскажем о лайфхаках, которые помогут сделать изображение еще лучше.

Добавьте детали. В запросе их стоит указывать после стилистики. Например, можно описать сцену, композицию, цветовую гамму, освещение, материалы. Список неполный: указывайте все, что вам важно.

Например, опишем окружающую среду, композицию и цвет — поместим наших опоссумов в причудливый лес в пастельных тонах и заснимем их общим планом.

Получили картинку с проработанным стилем
Получили картинку с проработанным стилем

Вы можете сохранить наши идеи в формате PDF на свое устройство, а также отправить PDF-файл в телеграм-сообщении.

Исправляйте артефакты. Так называют неточности в сгенерированных картинках: кривые руки, косые глаза, незаконченные детали на фоне, уходящие в никуда линии.

Полностью избежать ошибок не получится, но можно уточнить запрос и добавить слова detailed и highly detailed возле объектов, которые нейросеть генерирует неправильно. Например, detailed eyes или detailed hands.

Укажите соотношение сторон. До этого в уроке все картинки были квадратные, 1:1, это формат по умолчанию. Если хотите получить другой, добавьте в конце запроса «--ar x:y», где x — ширина, y — высота. К примеру, параметр --ar 4:3 позволяет сгенерировать горизонтальную картинку, а --ar 3:4 — вертикальную.

Сначала у опоссума получились кривые лапки
С параметром detailed paws лапы сгенерировались в нужных местах
С помощью параметра --ar 3:4 сделали картинку вертикальной

Смешайте разные стили. В запрос можно добавить сразу два стиля, чтобы получить необычный результат. Например, хорошо сочетаются киберпанк и пиксель-арт.

Главное правило — не переборщить и не вписывать взаимоисключающие запросы. Нейросеть может сгенерировать открытку с киберпанк-аниме-опоссумом, но с неоновым и черно-белым опоссумом возникнут проблемы. Midjourney сгенерирует либо одно, либо другое.

Мультяшный опоссум в стиле «Бегущего по лезвию»
Мультяшный опоссум в стиле «Бегущего по лезвию»

Добавьте синонимы. Не бойтесь повторяться в запросах: так нейросеть поймет, к чему вы больше всего стремитесь.

Например, если хотите передать праздничное настроение, одновременно используйте слова «рождественский», «милый», «веселый», «праздничный».

Мы использовали синонимы — и получили очень ми-ми-милую картинку
Мы использовали синонимы — и получили очень ми-ми-милую картинку

Переставляйте слова в запросе местами. Нейросеть обращает внимание на порядок слов: те, что в начале, сильнее влияют на результат.

Скажем, если хотите очень милую картинку, то переставьте «милый» в начало. А если слегка милую — уберите в конец.

Вот что мы получили, переставив «милая» и «милейшие» ближе к началу
Вот что мы получили, переставив «милая» и «милейшие» ближе к началу

Вдохновляйтесь чужими промптами. Нет ничего зазорного в том, чтобы изучать чужие запросы. Совмещайте детали из разных промптов, удаляйте ненужное, добавляйте свое — так результаты будут разнообразнее.

Вот чем можно вдохновляться:

  • промпт-буками. Они состоят из сотен картинок с подробными запросами на английском. В них есть десятки похожих примеров с немного разными параметрами — это поможет увидеть, как одно слово меняет все. Например, есть промпт-бук для нейросети DALL-E — но он подходит и для других;
  • галереями генеративного искусства. Там можно найти картинки с промптами от других пользователей. Можно гуглить выбранные стили. Для начала посмотрите галереи Lexica Art и OpenArt;
  • промптерами — небольшими сервисами, которые помогают сформулировать запрос. Работают они так: вы составляете промпт, а сервисы предлагают дополнительные параметры, которые вы можете добавить. Например, на английском доступны Prompter, Promptomania или Phraser.

Наберитесь терпения. Если нейросеть вас не понимает и генерирует что-то не то, попробуйте еще раз, используйте синонимы, меняйте порядок слов, переформулируйте. В общем, попытайтесь понять, почему нейросеть создает именно такое изображение, а потом найдите ту самую формулировку.

Помните о стоп-словах и авторском праве

У нейросети есть список слов и выражений, при использовании которых она откажется генерировать. В основном эта лексика связана с эротикой. Пользователи Midjourney составили список таких слов — в России он недоступен.

Теперь разберем вопрос об авторском праве на любые сгенерированные изображения. Если вы создаете картинки для себя, то можете использовать их как хотите. Но если картинки нужны для рабочих задач и ваша компания зарабатывает более миллиона долларов в год, придется купить подписку Pro или Mega.

Вы можете сохранить нашу инструкцию в формате PDF на свое устройство, а также отправить PDF-файл в телеграм-сообщении.

Запомнить

  1. Midjourney доступна только платно. Чтобы во всем разобраться, прочитайте инструкцию, которая поможет получить доступ к нейросетям быстро и без проблем.
  2. Принципы генерации картинок в Midjourney применимы и к другим нейросетям. Как только вы освоите их, то сможете создавать качественные иллюстрации и в Stable Diffusion или Kandinsky.
  3. Основа общения с Midjourney — промптинг. Короткие запросы работают, но вряд ли помогут воплотить задумку. Зато поможет формула промпта: формат картинки → объект → действие → стиль.
  4. Как только освоитесь и будете уверенно генерировать картинки по формуле, пробуйте экспериментировать: добавлять детали, смешивать стили, использовать параметры. Не стесняйтесь искать вдохновения у других.

Что дальше

В следующем уроке мы выведем генерацию картинок на новый уровень. Научимся использовать новые кнопки и функции для генерации, создавать картинки по референсам и реалистичные фото.

Делимся лайфхаками и главным из курсов Учебника Т⁠—⁠Ж про деньги и жизнь в нашем телеграм-канале. Подписывайтесь: @t_uchebnik

Как вам урок?