Вышла Midjourney v5: нейросеть теперь создает фотореалистичные картинки

Больше деталей, выше разрешение, отзывчивее к запросам

33
Вышла Midjourney v5: нейросеть теперь создает фотореалистичные картинки
Аватар автора

Даша Лейзаренко

нагенерировала фотографий

Страница автора

Разработчики Midjourney выпустили пятую версию нейросети, которая генерирует намного более реалистичные изображения.

В модели v5 используется иная нейронная архитектура, а также новые технологии генерации стилей и эстетики. Работа над новой версией Midjourney велась пять месяцев. Об этом разработчики рассказали на официальном дискорд-сервере проекта.

Пятое поколение пока в стадии альфа-тестирования. Разработчики предупреждают, что к полноценному релизу нейросеть может сильно измениться. Но для пользователей уже открыли генерацию. Мы протестировали модель и рассказываем, что в ней нового.

Что такое Midjourney и почему нейросеть настолько популярна

Она генерирует картинки по текстовому описанию, и их вполне можно спутать с «человеческими» артами. Midjourney гораздо доступнее своих конкурентов: к Dall-E нет публичного доступа, а для запуска Stable Diffusion нужен хороший компьютер.

Midjourney так популярна, потому что может генерировать красивые картинки по простому запросу. Чтобы получить похожие результаты в Stable Diffusion, нужно пробовать разные модели и долго подбирать промпты.

В Midjourney огромное количество настроек. С их помощью можно менять детализированность картинки, соотношение сторон и другие параметры. Подробнее о том, как пользоваться нейросетью, мы рассказывали в большом гайде.

В бесплатной версии 25 попыток. Этого вполне достаточно, чтобы сгенерировать десяток качественных картинок. Ограничения можно убрать, если оплатить подписку, но сделать это российской банковской картой нельзя. Второй способ — создавать новые аккаунты в «Дискорде», но есть риск получить бан.

Как включить Midjourney v5

По умолчанию Midjourney все еще использует четвертую версию нейросети. Пятую можно активировать двумя способами:

  1. в текстовом поле «Дискорда» пропишите команду /settings и выберите опцию MJ, нажмите кнопку ввода. В открывшихся настройках нажмите на MJ version 5;
  2. при генерации картинки припишите к текстовому запросу --v 5.

В пятой версии Midjourney могут не работать некоторые функции, к которым пользователи привыкли в четвертом поколении. Например, популярный параметр --niji для генерации аниме. Также придется адаптировать текстовые запросы: не все работают так, как обычно.

Рассылка о том, как жить и богатеть
Лучшая статья недели — в вашей почте каждую среду. Бесплатно

Что изменилось в Midjourney v5

Вот что сильно изменилось в сравнении с четвертой версией.

Стилистика. У пятой версии более широкий стилистический диапазон, она лучше считывает запросы. Эффект от указания имени артиста или художественного стиля стал заметнее. Если не указывать стили, то нейросеть по умолчанию будет генерировать фотореализм.

Качество. Разрешение увеличено в два раза, улучшен динамический диапазон. Картинки теперь генерируются сразу в высоком качестве. В четвертой версии нужно было апскейлить каждое изображение вручную и ждать, пока запрос обработается. Теперь кнопка Upscale моментально открывает увеличенную картинку.

Детализация. Нейросеть лучше справляется с мелкими деталями. Например, генерирует по пять пальцев на руках и не добавляет сто ровных зубов. Также разработчики сообщили, что «драматически» улучшили детализацию лиц.

Работа с запросами. Разработчики предупреждают, что короткие запросы в пару слов могут работать не так хорошо, как раньше, поэтому рекомендуют придумывать длинные и детальные промпты.

Запросы лучше писать в форме предложений, а не перечисления. Например, фраза «астронавт, летящий в открытом космосе» даст более предсказуемые результаты, чем «астронавт, летит, открытый космос».

Примеры Midjourney v5

Лучше всего разница заметна в сценариях, когда нейросеть пытается нарисовать реальность: фотографии, пейзажи, интерьеры. Пятая версия гораздо лучше генерирует людей, особенно знаменитостей и персонажей поп-культуры. Если написать «Илон Маск играет в гольф», то вы моментально узнаете основателя Tesla. Корректное количество пальцев и зубов тоже придает эффект реалистичности.

Также Midjourney научилась довольно качественно отрисовывать картинки с большим количеством персонажей. Раньше нейросеть не справлялась с несколькими людьми на одном изображении. Сейчас артефакты все еще видны, но уже на втором-третьем плане.

Мы сгенерировали картинки по одинаковым запросам в четвертой и пятой версии Midjourney, чтобы показать разницу. Слева — v4, справа — v5.

Девушка в киберпанк-городе
Девушка в киберпанк-городе
Фото из оживленного московского метро
Фото из оживленного московского метро
Пожилая женщина проводит время с ретривером в парке
Пожилая женщина проводит время с ретривером в парке
Девушки на вечеринке, фото на «Полароид»
Девушки на вечеринке, фото на «Полароид»
Киберпанк-город
Киберпанк-город
Илон Маск играет в гольф
Илон Маск играет в гольф

Какие функции добавили в Midjourney v5

Разработчики в экспериментальном режиме добавили три новые функции, но предупредили, что они могут не всегда работать правильно.

Поддержка бесшовных картинок. Для генерации текстуры в конце запроса нужно добавить --tile.

Эта опция плохо справляется с реалистичными изображениями, но хорошо генерирует минималистичные рисунки для фона и текстуры.

Неудачная генерация летающих денег и удачная генерация рыбок
Неудачная генерация летающих денег и удачная генерация рыбок

Любые соотношения сторон. Четвертая версия Midjourney поддерживала разрешение от 1:2 до 2:1. В пятой можно попробовать сгенерировать картинки с любым соотношением сторон, даже 1:100.

Благодаря такой опции нейросеть неплохо справляется с панорамами и 360-градусными фотографиями.

Панорама с московскими панельками
Панорама с московскими панельками

«Весы» для картинок. В пятой версии можно настроить то, насколько сгенерированное изображение будет похоже на картинку-референс. Для этого в конце нужно указать параметр --iw. Можно ввести значение от 0,5 до 2. По умолчанию используется значение 1.

Чтобы сгенерированная картинка была меньше похожа на вводное изображение, используйте --iw 0.5. Если хотите добиться обратного результата, то попробуйте прописать --iw 2.

Оригинальное фото
Запрос по картинке с параметром --iw 2
Запрос по картинке с параметром --iw 1
Запрос по картинке с параметром --iw 0.5

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult.

Даша ЛейзаренкоУже попробовали пятую версию Midjourney? Показывайте, что получилось:
  • Туманный туманКак то через чур бурно это развитие пошло19
  • ТимофейПятую еще не приходилось, но бегу затестить!0
  • Даша ЛейзаренкоПухоспинка, это пример генерации в четвертой версии. на соседней картинке, сгенерированной в пятой версии, пять пальцев27
  • Карина МальцеваПопользовалась недолгое время и сложилось такое впечатление: существует какая-то гигантская база настоящих бытовых фотографий, сделанных людьми, из Фейсбука или каких фотобанков, не знаю этой внутренней кухни, на эти оттегированные безмолвными нигерийцами за 2 доллара в час фотографии на выходе накладывают заданные параметрами фильтры. Просишь картину в стиле Ван Гога типа двое мужчин и одна женщина сидят / стоят / лежат — получаешь явную фотографию людей, "раскрашенную" под Ван Гога (что умели еще обычные программы для рисования для обычного компьютера в 2005-м году). Нет подходящей фотографии в базе — нет подходящего результата на выходе.4
  • horoshii nerusskiiКарина, ваше впечатление ошибочно13
  • Пухоспинка ЦарственнаяДаша, ооо, блин, вот это я невнимательная) спасибо3
  • ВениаминИ это только начало7
  • BMOПока не пробовал но примеры из статьи выглядят очень круто!0
  • nevaznoШикарный апдейт генерит круто4
  • Никита ПлучевскийЗапрос с пальцами удалось реализовать, давайте теперь обучим её выдавать читабельный "настоящий" текст?0
  • ласковый майВетер, так это же супер!2
  • ласковый майЯ надеюсь, что исправили проблему с пальцами - их вечно там было по 6 по 8 штук)2
  • горе луковоеласковый, да судя по работам - прогресс есть5
  • горе луковоеВетер, пользуется спросом, а значит нужно развивать0
  • Lexa LexaВетер, а некоторые до сих пор искренне верят, что GPT и нейросети никак не повлияют на их рабочие места.11
  • Владимир ВоваSorry, the v5 alpha isn't available to trial members at this time. Вот какое сообщение появляется у меня при попытки использовать пятую версию.2
  • Константин РыбаковВладимир, да, у меня то же самое:(0
  • Долорес БастаГлавное, во время считать пальцы и зубы)0
  • D.deliriumУра, наконец-то появилась возможность создавать реалистичного Шрека, чтобы сделать алтарь! The future is now!0
  • МитяйКруто, что нейросети развиваются, качество огонь0
  • BadalafukaДаа, пятая версия огонь! Поделюсь парой удачных творений3
  • BadalafukaBadalafuka,2
  • BadalafukaBadalafuka,0
  • omega_red_wolfСтранно но у меня пишет что сервис перегружен, и нужна либо подписка, либо ждать следующий день0
  • Света КравченкоСпасибо за статью! Я в восторге от результатов, бегу тестить!! 🏃‍♀️0
  • user1382085Владимир, я два дня пытаюсь и вижу «попробуйте завтра»0
  • Вадик ТаранковУ Илона Маска, кот. играет в гольф, 7 пальцев на левой руке. Я не удивлюсь если 6 версия нарисует у людей по 2 головы0
  • Вадик ТаранковУ Илона Маска, кот. играет в гольф, 7 пальцев на левой руке и я не удивлюсь если в 6 версии Midjourney у человека будет нарисовано 2 головы0
  • Владимир Чичварингоре, похоже нейросеть знает о Маске что-то, чего не знаем мы. )0
  • Андрей Валовhoroshii, чем же? нейросеть не порождает новое, не более чем искуссно мультиплексирует из имеющихся данных комбинации.0
  • Golden Artistочень странно всё с этой 5-кой, у меня и раньше в 4 версии изображения создавались квадратами в 2к пикселей, теперь при переключении на 5 версию изображения выдает в 1к пикселей, как-то нелогично, что качество урезалось в 2 раза, хотя заявлено же наоборот. Да и проблемы с пальцами никуда не делись, хотя опять же заявили что она решена, а по факту оно и дальше генерирует кривые руки и пальцы...0
  • ОльгаРебят, а что делать, если бот выдает сообщение: Sorry, the v5 alpha isn't available to trial users at this time, и ничего не генерирует?0