Midjourney — главная нейросеть лета и повод в очередной раз убедиться в прогрессе технологий.

Dall-E 2 все еще закрыта для большинства пользователей, а Dall-E Mini — скорее развлекательный сервис, чем серьезный инструмент. На этом фоне Midjourney выделяется своей доступностью и впечатляющими результатами. Картинки, которые она генерирует по текстовому описанию, можно спутать с «человеческими» артами, и все больше людей начинают пользоваться нейросетью.

В Midjourney огромное количество параметров, и до многих из них можно дойти только опытным путем. Тут возникает проблема: количество бесплатных попыток ограничено 25. Поэтому рассказываем, как правильно формулировать запрос к нейросети и не исчерпать лимит на не очень качественные результаты.

Как попробовать нейросеть самому

Как получить доступ к Midjourney. Сейчас Midjourney можно пользоваться только в виде бота в «Дискорде». Так что вам придется зарегистрироваться на платформе и присоединиться к официальному серверу команды нейросети. Сейчас там уже почти миллион пользователей, доступ открыт для всех по ссылке-приглашению. Но с недавнего времени из сообщества удаляют пользователей, которые давно не проявляли активность: возможно, со временем придется вступать заново.

В августе разработчики разрешили добавлять бота Midjourney на сторонние серверы. Главное, чтобы на них было до 10 тысяч подписчиков. Так что можно добавить бота в собственное сообщество или на другой сервер, где вы в числе администраторов.

Нажмите на бота Midjourney в правой части экрана и найдите кнопку «Добавить на сервер»
Нажмите на бота Midjourney в правой части экрана и найдите кнопку «Добавить на сервер»

Как устроен дискорд-сервер Midjourney. Главных каналов несколько: в Announcements размещают объявления от разработчиков, в Status сообщают о технических проблемах. Советую заодно ознакомиться с правилами в канале Rules, чтобы не возникало вопросов, если вас вдруг за что-то забанят.

Но в основе сервера — пространства для генерации изображений. В «Дискорде» есть каналы Newcomer Rooms, внутри которых — сотни чатов Newbies. Именно в них создают картинки пользователи. Выбирайте любой из чатов, в идеале — чтобы одновременно с вами там сидело не очень много людей. Вы будете видеть все их попытки создать картинку при помощи нейросети, а они — ваши.

Первым делом я попытался сгенерировать корги на красном мотоцикле в стилистике сериала «Очень странные дела»
Первым делом я попытался сгенерировать корги на красном мотоцикле в стилистике сериала «Очень странные дела»

В активные часы в канале могут появляться сотни сообщений в час, и ваши работы явно затеряются. Тут поможет кнопка «Почта» в правом верхнем углу «Дискорда»: бот упоминает вас при каждой генерации картинки, все уведомления от него можно посмотреть в отдельном окне.

Как сгенерировать свое первое изображение. Зайдите в один из чатов Newbies и введите в поле для отправки сообщения команду /imagine. Появится плашка Prompt: все, что вы напишете после нее, станет частью запроса. Описание картинки для нейросети лучше формулировать на английском языке. Другие языки Midjourney понимает гораздо хуже.

Когда сформулируете запрос, нажмите кнопку «Отправить». Бот начнет генерировать изображение. Вы буквально в прямом эфире увидите, как смутные очертания превращаются в четыре картинки. Обычно генерация занимает не дольше минуты, но все зависит от нагрузки на сервер «Дискорда» и деталей конкретного запроса. Кстати, некоторые параметры заданы ботом изначально — например, скорость генерации. Посмотреть или изменить настройки можно, отправив команду /settings.

Да, все попытки я потратил на вариации запроса «корги-байкер на красном мотоцикле»
Да, все попытки я потратил на вариации запроса «корги-байкер на красном мотоцикле»

Четыре получившиеся картинки — не итоговый результат. Под коллажом появятся кнопки «U1, U2, U3, U4» и «V1, V2, V3, V4». Первый параметр — апскейлинг. Выберите наиболее удачную картинку из четырех, и нейросеть улучшит ее разрешение, а заодно добавит деталей. Второй параметр позволяет создать еще четыре вариации конкретной картинки из коллажа — на случай, если вам нравится результат, но хочется посмотреть, что еще сделает нейросеть в том же духе.

Как сохранить картинку. Первый совет: не сохраняйте картинку или коллаж прямо из чата. Нажмите на нее и выберите «Открыть оригинал». Так разрешение изображения будет выше, какое именно — зависит уже от заданных вами параметров. Лучше всего сохранять целый коллаж, если вы хотите поделиться всеми вариантами, или уже картинкой с максимальным уровнем апскейла.

Второй совет: можно попросить бота отправить вам картинки в личные сообщения. Для этого отреагируйте на пост с результатом от бота эмодзи в виде письма. Его можно легко найти в поиске по запросу :envelope:.

А еще ваши результаты хранятся на сайте Midjourney — нужно авторизоваться через «Дискорд».

Этот 3D-рендер корги на мотоцикле вышел откровенно неудачным, но я все равно попросил бота прислать результаты в личку
Этот 3D-рендер корги на мотоцикле вышел откровенно неудачным, но я все равно попросил бота прислать результаты в личку

Какие есть ограничения. Есть лимит на бесплатную генерацию изображений — 25 штук для одного пользователя. Важно, что в это число входят не только оригинальные запросы, но и просьбы улучшить детализацию или сделать вариации уже полученной картинки. Бот в «Дискорде» предупредит вас, когда попытки начнут подходить к концу.

У Midjourney есть платная подписка: за 10 $⁣ (600 Р) в месяц вы получите 200 попыток на генерацию изображения, подписка за 30 $⁣ (1799 Р) убирает все лимиты. Но пользователи с российскими картами из-за ограничений не смогут оплатить премиум-версию. Так что в случае, если вы истратили все попытки, придется просить друзей или регистрировать новый аккаунт в «Дискорде». Помните, что к номеру телефона можно привязать не больше одного профиля, а за обход ограничений вас могут и забанить.

Из других ограничений: есть стоп-слова, с которыми генерация не работает. Сообщество собирает их в отдельном месте.

Как правильно сформулировать запрос нейросети

В пользу нейросетей часто говорят, что достаточно подобрать правильный запрос и нажать кнопку «Сделать шедевр». Это правда лишь отчасти: технически все верно, вот только на подбор идеального запроса могут уйти часы. Особенно это актуально в случае Midjourney — ограничение на 25 бесплатных генераций сильно увеличивает цену каждой ошибки. Не успеваешь оглянуться, как лимит исчерпывается.

Поэтому разработчики нейросети и сообщество в «Дискорде» и на «Реддите» занимаются тем, что составляют правила и советы при составлении запроса. Часть из них сформулировала команда Midjourney на своем официальном сайте, до других лайфхаков пользователи дошли опытным путем. Вот некоторые из них.

Помните, что разговариваете с нейросетью. Это должно отражаться в запросе. Не пишите «Любимое место в Москве в 2100 году», а укажите конкретнее, например «Красная площадь в Москве в 2100 году». Если можно уточнить формулировку и добавить описательности — сделайте это. Разработчики приводят в пример запрос «Обезьяны занимаются бизнесом» — гораздо проще написать «Обезьяны сидят в офисе в деловых костюмах».

Еще избегайте слов «не», «без», «исключая», «кроме» и подобные. Нейросеть запутается в запросе «Человек не в синей шляпе», а вот «Человек в красной шляпе» сгенерируется без проблем.

Один раз я переборщил с абстрактными деталями и потом еле нашел корги
Один раз я переборщил с абстрактными деталями и потом еле нашел корги

Указывайте параметры правильно. Сообщество пришло к определенным правилам, как составлять запрос к нейросети. Не пытайтесь сформулировать сложное предложение с художественным описанием картинки. Гораздо эффективнее отделять части запроса запятыми или двумя двоеточиями «::». Выделяйте так основные объекты, стилистику, параметры и короткие команды для алгоритма.

Полезные короткие команды, которые стоит учитывать

--iw. В Midjourney можно загружать картинки в качестве референса. Можно указать ее «вес» — чем больше, тем сильнее она влияет на результат. Значение по умолчанию — 0,25.

--ar. Быстрая команда для параметра aspect ratio, или «соотношение сторон». По умолчанию картинки генерируются в соотношении 1:1, но это можно поменять — например, на 3:2 или 16:9.

--s. Уровень стилизации. Достаточно абстрактный параметр, который можно установить в диапазоне от 0 до 60 000.

--q. Уровень качества. По умолчанию стоит на отметке 1, можно установить 2, тогда будет больше деталей у картинки. Раньше был максимальный параметр 5, но его убрали из-за высокой нагрузки.

--chaos. Уровень «хаоса» при обработке изображения, можно увеличить до 100.

--wallpaper. Так нейросеть понимает, что вам нужно детальное и качественное изображение. Эта команда удобнее и эффективнее, чем параметры «4k», «ультрадетализированное» и другие.

--v. Позволяет задать, какая версия Midjourney будет генерировать картинку по запросу. По умолчанию стоит последняя версия, третья. Большого смысла менять ее я не увидел.

--video. Сохраняет видео процесса генерации картинки. Добавьте к запросу, а потом попросите бота прислать ролик в личные сообщения с помощью эмодзи письма.

«Пражская медиашкола» советует такую последовательность в запросе: «Описание объекта :: основная стилистика :: дополнительные параметры :: --короткие команды». В моем примере с корги обычно получалось примерно так: «Corgi biker on red motorcycle :: in soviet style, mosaic :: --q2».

Если вы только знакомитесь с нейросетью, лучше начать с обычного описания объекта, а потом постепенно усложнять формулировки и искать удачные сочетания.

Я особенно полюбил добавлять к запросам «советская мозаика»
Я особенно полюбил добавлять к запросам «советская мозаика»

Задайте стилистику. Midjourney обучена на огромном количестве художественных стилей, работах конкретных людей, различных эстетиках и временных эпохах. Многое зависит от фантазии пользователей. Не бойтесь добавлять детали: цвета, освещение, материалы. В моем случае корги превращался то в фотореалистичный портрет, то в 3D-рендер, то в оригами, то в татуировку, то в часть советского плаката.

Стилистических деталей, влияющих на итоговое изображение, тысячи. Часть из них описана на «Гитхабе»: есть даже более-менее наглядный пример со сферой, которая изменяется в зависимости от параметров. Если этого недостаточно — сообщество собирает в таблице различные визуальные стили с примерами.

Посмотрите, как меняется сфера в зависимости от разных панк-стилистик в запросе
Посмотрите, как меняется сфера в зависимости от разных панк-стилистик в запросе

Если вы увлекаетесь фотографией, попробуйте применить навыки при составлении запроса. Вы можете задать тип камеры, объектива, расстояние до объекта, фокусное расстояние, выдержку. Кстати, в попытках подражать фотографиям пользователи часто пишут параметр Photorealism. На «Гитхабе» советуют вместо этого писать Photograph или 35mm photograph. Еще один вариант — написать имя любимого известного фотографа.

В целом относительно стилей команда Midjourney советует такие формулировки:

Не бойтесь смешивать разные стили, главное — не переборщить и не вписывать взаимоисключающие запросы. Нейросеть может сгенерировать нарисованного от руки киберпанк-корги, но вот с одновременно неоновым и черно-белым корги возникнут проблемы.

Периодически отпускайте ситуацию. Что я заметил, пока пользовался Midjourney: если поначалу пользователи обходились короткими формулировками, то теперь преобладают многоуровневые запросы на несколько строк. Да, так выходит гораздо ближе к тому, что вы представили у себя в голове, но теряется элемент нейрокреатива.

Не раз и не два я приходил к тому, что простой запрос из трех-пяти слов мне в итоге нравится гораздо больше, чем описание из десятка параметров.

Это просто корги на мотоцикле, все. Пожалуй, надо было еще попросить у нейросети глаза
Это просто корги на мотоцикле, все. Пожалуй, надо было еще попросить у нейросети глаза

Какие есть сервисы для составления идеального запроса

Сложно запомнить все фильтры, параметры и рекомендации. Поэтому энтузиасты принялись создавать «промптеры» — небольшие сервисы, помогающие сформулировать запрос. Работают они примерно одинаково: пользователь сам составляет базовое описание, что должна нарисовать нейросеть, а дополнительные параметры выбирает уже из готового списка.

Важно: сервис выдаст вам только готовый запрос, который затем нужно передать боту. На сайтах-промптерах нельзя сразу сгенерировать изображение.

Prompter. Сервис, который развивает сторонний разработчик Шейн Макгиан. В отличие от остальных ресурсов, это буквально открытая для всех гугл-таблица, которую постоянно улучшают и обновляют. Почти у каждого параметра есть краткое объяснение, можно выбирать из огромного количества стилей. Но, в отличие от аналогичных сервисов, настройкам не хватает наглядности.

Разработчик обещает скоро выпустить версию 3.0
Разработчик обещает скоро выпустить версию 3.0

Promptomania. На первый взгляд, самый продвинутый из промптеров. Огромное количество параметров: они удобно разбиты по категориям, почти каждая настройка проиллюстрирована.

Но в таком подробном редакторе запроса легко запутаться, а огромное количество деталей приводит к невнятным результатам. Зато инструмент станет мощным помощником, если в нем разобраться.

Все параметры проиллюстрированы — удобно
Все параметры проиллюстрированы — удобно

Phraser. Самый удобный сервис. У него не очень много настроек, зато их можно выбирать в пошаговом режиме. Из-за этого глаза не разбегаются, но со временем сказывается небольшое количество параметров.

Чтобы пользоваться сервисом, необходимо для начала зарегистрироваться на сайте.

Шаги по оформлению запроса сделаны так, чтобы не добавлять взаимоисключающие категории
Шаги по оформлению запроса сделаны так, чтобы не добавлять взаимоисключающие категории

Noonshot. Довольно подробный редактор запроса.

Помимо настроек стиля, камеры и цветов можно задать «интенсивность» параметра. С этим больше всего сложностей: слайдер довольно неочевидно меняет итоговое изображение.

На сайте можно составить запрос не только к Midjourney, но и к Dall-E
На сайте можно составить запрос не только к Midjourney, но и к Dall-E

Как скрещивать картинки в Midjourney

В обновленной версии алгоритма Midjourney v4 сильно улучшили функцию «скрещивания» картинок-референсов в новое изображение. Как это работает: не нужно даже формулировать запрос к нейросети, достаточно ввести команду /imagine в «Дискорде» и в поле Prompt вставить ссылки на две картинки в формате JPG. После этого нейросеть сгенерирует изображение, которое возьмет что-то от обоих источников.

Тут уже не до корги на мотоцикле
Тут уже не до корги на мотоцикле

Можно скрестить двух персонажей или использовать комбинацию «персонаж + картинка с атмосферой». У авторов работ различается мнение, влияет ли очередность ссылок на результат: одни говорят, что первый референс выступает базой для нейросети, другие — что в любом случае заимствование идет в пропорции 50 на 50.

При желании к ссылкам можно добавить и текстовые уточнения. Главное — не забудьте активировать версию нейросети v4. Сделать это можно двумя способами: дописать в запросе «--v 4» или ввести в чате команду /settings, а затем выбрать версию движка.

Заодно можно ознакомиться и с другими настройками
Заодно можно ознакомиться и с другими настройками

Итоговая памятка

  1. Midjourney бесплатно доступен для пользователей «Дискорда». Лучше всего тестировать бота в официальном сообществе нейросети — получится заодно посмотреть, что делают другие. Но бота можно и добавить к себе на сервер.
  2. Помните про ограничение в 25 бесплатных генераций. Можно взять платную подписку, но российские карты не поддерживаются. Альтернатива: создать новый профиль в «Дискорде», но если администрация сообщества узнает — вас забанят.
  3. Картинки генерируйте в одном из чатов Newbies. Вводите команду /imagine и формулируйте запрос.
  4. Определитесь с объектом — что или кто станет главным героем изображения. Сразу пропишите детали, которые вам нужны: цвет, параметры камеры, материалы. Добавьте стилистику, лучше всего сделать это через такие команды: in style of или artwork by.
  5. Запомните короткие команды, с их помощью можно задать детализированность картинки, соотношение сторон и другие параметры.
  6. Составить хороший запрос можно с помощью сервисов-промптеров. Они наглядно демонстрируют, какие возможности скрывает нейросеть.

Генерировали картинки в нейросетях? Поделитесь своими результатами и расскажите, какой запрос использовали

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult.