Как пользоваться Midjourney для генерации рисунков и правильно составлять запросы

Подробный гайд с советами и лайфхаками

140
Как пользоваться Midjourney для генерации рисунков и правильно составлять запросы
Аватар автора

Евгений Кузьмин

25 раз сгенерировал корги-байкера и ни о чем не жалеет

Страница автора

Midjourney — одна из главных нейросетей для рисования и повод в очередной раз убедиться в прогрессе технологий.

Dall-E 2 все еще закрыта для большинства пользователей, а работа в Stable Diffusion требует мощного железа. На этом фоне Midjourney выделяется своей доступностью и впечатляющими результатами. Картинки, которые она генерирует по текстовому описанию, можно спутать с «человеческими» артами. С недавнего времени нейросеть еще и славится своими фотореалистичными картинками.

В Midjourney огромное количество параметров, и до многих из них можно дойти только опытным путем. Тут возникает проблема: количество бесплатных попыток ограничено 25. Поэтому рассказываем, как правильно формулировать запрос к нейросети и не исчерпать лимит на не очень качественные результаты.

Как зарегистрироваться в Midjourney

Как получить доступ к Midjourney. Сейчас Midjourney можно пользоваться в виде бота в «Дискорде». Так что вам придется зарегистрироваться на платформе и присоединиться к официальному серверу команды нейросети. Сейчас на сервере уже несколько миллионов пользователей, доступ открыт для всех по ссылке-приглашению. Там удобно не только генерировать картинки, но и в целом вовлекаться в жизнь нейросетевого сообщества: участвовать в конкурсах, подбирать вместе идеальные запросы, проверять работу новых версий.

В августе разработчики разрешили добавлять бота на сторонние серверы. Главное, чтобы на них было до 10 тысяч подписчиков. Так что можно добавить бота в собственное сообщество или на другой сервер, где вы в числе администраторов.

Нажмите на бота Midjourney в правой части экрана и найдите кнопку «Добавить на сервер»
Нажмите на бота Midjourney в правой части экрана и найдите кнопку «Добавить на сервер»

Как пользоваться Midjourney через телеграм-бота. Официально Midjourney в «Телеграме» нет. Разработчики не открывали доступ к API, но тематические боты все равно есть. И некоторые из них даже генерируют похожие по качеству картинки.

Но к таким ботам нужно относиться осторожно: за названием Midjourney в «Телеграме» может скрываться любая нейросеть или вообще уже готовая база сгенерированных картинок. Тем более что боты преимущественно платные — после пары тестовых попыток появляются предложения купить премиум.

Как генерировать картинки в Midjourney

Как устроен дискорд-сервер Midjourney. Главных каналов несколько: в Announcements размещают объявления от разработчиков, в Status сообщают о технических проблемах. Советую заодно ознакомиться с правилами в канале Rules, чтобы не возникало вопросов, если вас вдруг за что-то забанят.

В основе сервера — пространства для генерации изображений. В «Дискорде» есть каналы Newcomer Rooms, внутри которых — сотни чатов Newbies. Именно в них создают картинки пользователи. Выбирайте любой из чатов, в идеале — чтобы одновременно с вами там сидело не очень много людей. Вы будете видеть все их попытки создать картинку при помощи нейросети, а они — ваши.

Первым делом я попытался сгенерировать корги на мотоцикле в стилистике сериала «Очень странные дела»
Первым делом я попытался сгенерировать корги на мотоцикле в стилистике сериала «Очень странные дела»

В активные часы в канале могут появляться сотни сообщений в час, и ваши работы явно затеряются. Тут поможет кнопка «Почта» в правом верхнем углу «Дискорда»: бот упоминает вас при каждой генерации картинки, все уведомления от него можно посмотреть в отдельном окне.

Как сгенерировать свое первое изображение. Зайдите в один из чатов Newbies и введите в поле для отправки сообщения команду /imagine. Появится плашка Prompt: все, что вы напишете после нее, станет частью запроса. Описание картинки для нейросети лучше формулировать на английском языке. Другие языки Midjourney понимает гораздо хуже.

Когда сформулируете запрос, нажмите кнопку «Отправить». Бот начнет генерировать изображение. Вы буквально в прямом эфире увидите, как смутные очертания превращаются в четыре картинки. Обычно генерация занимает не дольше минуты, но все зависит от нагрузки на сервер «Дискорда» и деталей конкретного запроса. Кстати, некоторые параметры заданы ботом изначально — например, скорость генерации. Посмотреть или изменить настройки можно, отправив команду /settings.

Да, все попытки я потратил на вариации запроса «корги-байкер на мотоцикле»
Да, все попытки я потратил на вариации запроса «корги-байкер на мотоцикле»

Четыре получившиеся картинки — не итоговый результат. Под коллажом появятся кнопки «U1, U2, U3, U4» и «V1, V2, V3, V4». Первый параметр — апскейлинг. Выберите наиболее удачную картинку из четырех, и нейросеть улучшит ее разрешение, а заодно добавит деталей. Второй параметр позволяет создать еще четыре вариации конкретной картинки из коллажа — на случай, если вам нравится результат, но хочется посмотреть, что еще сделает нейросеть в том же духе.

Как сохранить картинку. Первый совет: не сохраняйте картинку или коллаж прямо из чата. Нажмите на нее и выберите «Открыть оригинал». Так разрешение изображения будет выше, какое именно — зависит уже от заданных вами параметров. Лучше всего сохранять целый коллаж, если вы хотите поделиться всеми вариантами, или уже картинкой с максимальным уровнем апскейла.

Второй совет: можно попросить бота отправить вам картинки в личные сообщения. Для этого отреагируйте на пост с результатом от бота эмодзи в виде письма. Его можно легко найти в поиске по запросу :envelope:.

А еще ваши результаты хранятся на сайте — нужно авторизоваться через «Дискорд».

Попросил прислать мне оригами-корги
Попросил прислать мне оригами-корги

Как пользоваться Midjourney бесплатно и купить подписку

Какие есть ограничения у бесплатной версии. В «Дискорде» есть лимит на бесплатную генерацию изображений — 25 штук для одного пользователя. Важно, что в это число входят не только оригинальные запросы, но и просьбы улучшить детализацию или сделать вариации уже полученной картинки. Бот в «Дискорде» предупредит вас, когда попытки начнут подходить к концу.

Так что в случае, если вы истратили все попытки, придется просить друзей или регистрировать новый аккаунт в «Дискорде». Помните, что к номеру телефона можно привязать не больше одного профиля.

Самый простой способ иметь постоянный бесплатный доступ к Midjourney:

  1. Создать свой сервер в «Дискорде».
  2. Добавить туда бота.
  3. Пользоваться ботом, а как только попытки закончились — добавлять на сервер новый аккаунт с новыми попытками.

Однако есть риск, что вас заблокируют за нарушение правил «Дискорда».

Обновление: 31 марта Midjourney приостановила доступ к генератору изображений для бесплатных пользователей. Среди причин в компании назвали «абьюз пробного периода». Создатели нейросети пообещали улучшить систему модерации в скором времени.

Как пользоваться Midjourney платно. У Midjourney есть платная подписка с несколькими уровнями. На любом уровне подписки можно пользоваться не стартовыми каналами Newbies, а General. Также можно генерировать картинки прямо в личных сообщениях бота: для этого найдите его и нажмите «Написать сообщение».

Вот тарифные планы. Важно обращать внимание на часы «быстрой генерации»: после того как они закончатся, картинки будут создаваться медленнее.

Пользователи с российскими картами из-за ограничений не смогут оплатить премиум-версию. Стоит найти знакомого с иностранной картой.

Платная подписка Midjourney

ПланСтоимостьВремя «быстрой генерации»
Базовый10 $⁣ (772 ₽) в месяц, 96 $⁣ (7408 ₽) в год3,3 часа в месяц
Стандартный30 $⁣ (2315 ₽) в месяц, 288 $⁣ (22 225 ₽) в год15 часов в месяц
Профессиональный60 $⁣ (1 ₽) в месяц, 576 $⁣ (1 ₽) в год30 часов в месяц

Платная подписка Midjourney

Базовый
Стоимость10 $⁣ (772 ₽) в месяц, 96 $⁣ (7408 ₽) в год
Время «быстрой генерации»3,3 часа в месяц
Стандартный
Стоимость30 $⁣ (2315 ₽) в месяц, 288 $⁣ (22 225 ₽) в год
Время «быстрой генерации»15 часов в месяц
Профессиональный
Стоимость60 $⁣ (1 ₽) в месяц, 576 $⁣ (1 ₽) в год
Время «быстрой генерации»30 часов в месяц

Как правильно составлять запросы к нейросети

В пользу нейросетей часто говорят, что достаточно подобрать правильный запрос и нажать кнопку «Сделать шедевр». Это правда лишь отчасти: технически все верно, вот только на подбор идеального запроса могут уйти часы. Особенно это актуально в случае Midjourney — ограничение на 25 бесплатных генераций сильно увеличивает цену каждой ошибки. Не успеваешь оглянуться, как лимит исчерпывается.

Поэтому разработчики нейросети и сообщество в «Дискорде» и на «Реддите» занимаются тем, что составляют правила и советы при составлении запроса. Часть из них сформулировали разработчики на своем официальном сайте, до других лайфхаков пользователи дошли опытным путем. Вот некоторые из них.

Помните, что разговариваете с нейросетью. Это должно отражаться в запросе. Не пишите «Любимое место в Москве в 2100 году», а укажите конкретнее, например «Красная площадь в Москве в 2100 году». Если можно уточнить формулировку и добавить описательности — сделайте это. Разработчики приводят в пример запрос «Обезьяны занимаются бизнесом» — гораздо проще написать «Обезьяны сидят в офисе в деловых костюмах».

Еще избегайте слов «не», «без», «исключая», «кроме» и подобные. Нейросеть запутается в запросе «Человек не в синей шляпе», а вот «Человек в красной шляпе» сгенерируется без проблем.

Тут получилось передать конкретные цвета для картинки
Тут получилось передать конкретные цвета для картинки

Указывайте параметры правильно. Сообщество пришло к определенным правилам, как составлять запрос к нейросети. Не пытайтесь сформулировать сложное предложение с художественным описанием картинки. Гораздо эффективнее отделять части запроса запятыми. Выделяйте так основные объекты, стилистику, параметры и короткие команды для алгоритма.

Полезные короткие команды, которые стоит учитывать

--iw. В Midjourney можно загружать картинки в качестве референса. Можно указать ее «вес» — чем больше, тем сильнее она влияет на результат. Значение по умолчанию — 1.

--ar. Быстрая команда для параметра aspect ratio, или «соотношение сторон». По умолчанию картинки генерируются в соотношении 1:1, но это можно поменять — например, на 3:2 или 16:9.

--s. Уровень стилизации. Достаточно абстрактный параметр, который можно установить в диапазоне от 0 до 60 000.

--q. Уровень качества. По умолчанию стоит на отметке 1, можно установить 2, тогда будет больше деталей у картинки. Раньше был максимальный параметр 5, но его убрали из-за высокой нагрузки.

--chaos. Уровень «хаоса» при обработке изображения, можно увеличить до 100.

--wallpaper. Так нейросеть понимает, что вам нужно детальное и качественное изображение. Эта команда удобнее и эффективнее, чем параметры «4k», «ультрадетализированное» и другие.

--v. Позволяет задать, какая версия Midjourney будет генерировать картинку по запросу. По умолчанию стоит четвертая версия. Менять на ранние нет никакого смысла: они сильно отстают по качеству. Но в настройках или командой --v 5 можно включить альфа-версию пятого поколения.

--video. Сохраняет видео процесса генерации картинки. Добавьте к запросу, а потом попросите бота прислать ролик в личные сообщения с помощью эмодзи письма.

Идеальная последовательность запроса примерно такая: формат картинки, описание объекта, детали объекта, основная стилистика, дополнительные параметры, --короткие команды». В моем примере с корги обычно получалось примерно так: photo of a corgi biker on a red motorcycle, soviet mosaic --ar 4:3 --q 2 --v 5.

Если вы только знакомитесь с нейросетью, лучше начать с обычного описания объекта, а потом постепенно усложнять формулировки и искать удачные сочетания.

Я особенно полюбил добавлять к запросам «японская гравюра»
Я особенно полюбил добавлять к запросам «японская гравюра»

Стоит отметить, что с каждым новым поколением Midjourney все лучше работает с естественным языком в запросах. Еще полгода назад приходилось вбивать все детали через запятую: «Фотография девушки, красивая, молодая, в синем платье, держит сумочку». А теперь нейросеть спокойно понимает запрос «Фотография красивой молодой девушки в синем платье, которая держит в руках сумочку».

Задайте стилистику. Нейросеть обучена на огромном количестве художественных стилей, работах конкретных людей, различных эстетиках и временных эпохах. Многое зависит от фантазии пользователей. Не бойтесь добавлять детали: цвета, освещение, материалы. В моем случае корги превращался то в фотореалистичный портрет, то в 3D-рендер, то в оригами, то в татуировку, то в часть советского плаката.

Стилистических деталей, влияющих на итоговое изображение, тысячи. Часть из них описана на «Гитхабе»: есть даже более-менее наглядный пример со сферой, которая изменяется в зависимости от параметров. Если этого недостаточно — ищите идеи для стилистик и форматов в тематических интернет-сообществах.

Посмотрите, как меняется сфера в зависимости от разных панк-стилистик в запросе
Посмотрите, как меняется сфера в зависимости от разных панк-стилистик в запросе

Если вы увлекаетесь фотографией, попробуйте применить навыки при составлении запроса. Вы можете задать тип камеры, объектива, расстояние до объекта, фокусное расстояние, выдержку. Кстати, в попытках подражать фотографиям пользователи часто пишут параметр Photorealism. На «Гитхабе» советуют вместо этого писать Photograph или 35mm photograph. Еще один вариант — написать имя любимого известного фотографа.

В целом относительно стилей команда Midjourney советует такие формулировки:

  • in the style of — если вы хотите добавить какую-то стилистику или эстетику;
  • by x, где x — художник, чьими работами будет вдохновляться нейросеть.

Не бойтесь смешивать разные стили, главное — не переборщить и не вписывать взаимоисключающие запросы. Нейросеть может сгенерировать нарисованного от руки киберпанк-корги, но вот с одновременно неоновым и черно-белым корги возникнут проблемы.

Фигурка лего-корги на байке
Советская мозаика корги на байке
Восьмибитный корги на байке
Оригами-корги на байке
Античная скульптура корги на байке

Периодически отпускайте ситуацию. Что я заметил, пока пользовался нейросетью: если поначалу пользователи обходились короткими формулировками, то теперь преобладают многоуровневые запросы на несколько строк. Да, так выходит гораздо ближе к тому, что вы представили у себя в голове, но теряется элемент нейрокреатива.

Не раз и не два я приходил к тому, что простой запрос из трех-пяти слов мне в итоге нравится гораздо больше, чем описание из десятка параметров.

Это просто корги на мотоцикле, все
Это просто корги на мотоцикле, все

Где искать промпты для Midjourney

Сложно запомнить все фильтры, параметры и рекомендации. Поэтому энтузиасты принялись создавать «промптеры» — небольшие сервисы, помогающие сформулировать запрос. Работают они примерно одинаково: пользователь сам составляет базовое описание, что должна нарисовать нейросеть, а дополнительные параметры выбирает уже из готового списка.

Важно: сервис выдаст вам только готовый запрос, который затем нужно передать боту. На сайтах-промптерах нельзя сразу сгенерировать изображение.

Promptomania. На первый взгляд, самый продвинутый из промптеров. Огромное количество параметров: они удобно разбиты по категориям, почти каждая настройка проиллюстрирована.

Но в таком подробном редакторе запроса легко запутаться, а огромное количество деталей приводит к невнятным результатам. Зато инструмент станет мощным помощником, если в нем разобраться.

Все параметры проиллюстрированы — удобно
Все параметры проиллюстрированы — удобно

Phraser. Библиотека сгенерированных изображений с описаниями промптов.

Поможет для вдохновения: можно посмотреть картинку и понять, как получился такой результат.

На сайте можно посмотреть чужие работы и вдохновиться.
На сайте можно посмотреть чужие работы и вдохновиться.

Noonshot. Довольно подробный редактор запроса.

Помимо настроек стиля, камеры и цветов можно задать «интенсивность» параметра. С этим больше всего сложностей: слайдер довольно неочевидно меняет итоговое изображение.

На сайте можно составить запрос не только к Midjourney, но и к Dall⁠-⁠E
На сайте можно составить запрос не только к Midjourney, но и к Dall⁠-⁠E

Как скрещивать картинки в Midjourney

В обновленной версии алгоритма Midjourney v4 сильно улучшили функцию «скрещивания» картинок-референсов в новое изображение. Как это работает: не нужно даже формулировать запрос к нейросети, достаточно ввести команду /imagine в «Дискорде» и в поле Prompt вставить ссылки на две картинки в формате JPG. После этого нейросеть сгенерирует изображение, которое возьмет что-то от обоих источников.

Тут уже не до корги на мотоцикле
Тут уже не до корги на мотоцикле
Тут уже не до корги на мотоцикле

Можно скрестить двух персонажей или использовать комбинацию «персонаж + картинка с атмосферой». У авторов работ различается мнение, влияет ли очередность ссылок на результат: одни говорят, что первый референс выступает базой для нейросети, другие — что в любом случае заимствование идет в пропорции 50 на 50.

При желании к ссылкам можно добавить и текстовые уточнения.

Как и зачем пользоваться Midjourney v5

С марта 2023 года это поколение нейросети находится в стадии тестирования, но уже доступно пользователям официального «Дискорда». Главная фишка пятой версии — фотореализм. К четвертой версии Midjourney научилась очень хорошо генерировать арты и довольно сносно — фото. Но для последнего приходилось экспериментировать с промптами: добавлять пометки «уличная фотография» или прописывать конкретного фотографа.

Теперь же фотореализм — стиль по умолчанию в v5. Если вы хотите рисунок, то это придется прописывать отдельно. Вот и мой корги на байке в пятом поколении нейросети получился вполне настоящим.

Главное — не забудьте активировать версию нейросети v5. Сделать это можно двумя способами: дописать в запросе «--v 5» или ввести в чате команду /settings, а затем выбрать версию движка.

В целом можно выбрать первые версии Midjourney и посмотреть, чего достигли технологии всего за год.

Midjourney v1
Midjourney v2
Midjourney v3
Midjourney v4
Midjourney v5

Итоговая памятка

  1. Midjourney бесплатно доступен для пользователей «Дискорда». Лучше всего тестировать бота в официальном сообществе нейросети — получится заодно посмотреть, что делают другие. Но бота можно и добавить к себе на сервер.
  2. Помните про ограничение в 25 бесплатных генераций. Можно взять платную подписку, но российские карты не поддерживаются. Альтернатива: создать новый профиль в «Дискорде», но если администрация сообщества узнает — вас забанят.
  3. Картинки генерируйте в одном из чатов Newbies. Вводите команду /imagine и формулируйте запрос.
  4. Определитесь с объектом — что или кто станет главным героем изображения. Сразу пропишите детали, которые вам нужны: цвет, параметры камеры, материалы. Добавьте стилистику, лучше всего сделать это через такие команды: in style of или artwork by.
  5. Запомните короткие команды, с их помощью можно задать детализированность картинки, соотношение сторон и другие параметры.
  6. Составить хороший запрос можно с помощью сервисов-промптеров. Они наглядно демонстрируют, какие возможности скрывает нейросеть.

Генерировали картинки в нейросетях? Поделитесь своими результатами и расскажите, какой запрос использовали

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult.

Уже пробовали Midjourney? Поделитесь результатами:
Комментарии проходят модерацию по правилам журнала
Загрузка

Сообщество