Как я сгенерировал в нейросети 50 обложек для Т⁠—⁠Ж

Как я сгенерировал в нейросети 50 обложек для Т⁠—⁠Ж

Рассказ нейродизайнера
20

Это история из Сообщества. Редакция задала вопросы, бережно отредактировала и оформила по стандартам журнала

Аватар автора

lev

делает Т⁠—⁠Ж еще красивее

Страница автора

За полгода кое-что изменилось. С лета я официально перешел на должность нейродизайнера в Т⁠—⁠Ж.

В течение июля и августа я сгенерировал более 50 обложек, хотя когда-то начинал с одной картинки в месяц. Расскажу, как я работаю, объясню, почему мне приходится использовать сразу пять нейросетей, и покажу свои лучшие генерации. А заодно поразмышляю о том, сможет ли искусственный интеллект заменить людей.

Мой подход

У каждой рубрики Т⁠—⁠Ж свой стиль. Обычно мы выбираем его вместе с командой дизайнеров — каждый раз это уникальный процесс. Мне могут предоставить референс, чтобы я сделал нечто похожее, или дать полную творческую свободу.

Для материалов о сомнительных концепциях из психологии взяли генерации моей модели по картинам московских концептуалистов. Она дает масляный эффект, но при этом экспериментирует с пространством холста.

Обложки для рубрики «Что не так»
Обложки для рубрики «Что не так»
Обложки для рубрики «Что не так»

Я не всегда использую старые модели или дообучаю их дополнительными референсами. Для изображений к рубрике «Нейросказки» я просто нашел хороший промпт, после чего использовал его с небольшими доработками.

С этой задачей Stable Diffusion и Midjourney справились по-разному: у них различается стиль, поэтому мы брали картинки из обеих нейросетей.

Иллюстрация от Stable Diffusion
Иллюстрация от Stable Diffusion
Иллюстрация от Stable Diffusion
Иллюстрация от Midjourney
Иллюстрация от Midjourney
Иллюстрация от Midjourney

Где-то приходилось готовить референс и использовать ControlNet — расширение, которое помогает генерировать по контуру или карте глубины. Так мы выработали стиль для рубрики «Бюджеты родителей»: обложками становятся нейрорисунки на основе фотографий читателей.

Если в материале нет удобного кадра, я выдумываю его в Midjourney и использую как референс.

Генерация Midjourney на короткий и несложный запрос
Контур на основе этой картинки
Генерация Stable Diffusion под детский рисунок

Сложности

Обложки на мобильных устройствах. У материалов Т⁠—⁠Ж стоят широкоформатные обложки, которые чаще всего обрезаются на мобильных устройствах в соотношении 2:3. Из-за этого нужно генерировать картинки с объектами по центру. Здесь возникает проблема: нейросети плохо создают очень широкие изображения — на них чаще появляются артефакты.

Чаще всего я генерирую картинки в разрешении 1344 × 768 и растягиваю их с помощью тех же самых нейросетей. Такой подход помогает оставить весь сюжет изображения в центре и сделать так, чтобы он не пострадал из-за обрезки на смартфонах.

Иллюстрация к рубрике «Уроки финансовой грамотности» — все за пределами линий я сгенерировал отдельно
Иллюстрация к рубрике «Уроки финансовой грамотности» — все за пределами линий я сгенерировал отдельно

Ручные корректировки. У нейросетей есть и другие слабости — не только артефакты, но и технические ограничения или слабый контроль за процессом. Если я хочу определенную композицию, мне придется исправить картинку руками. Это может растянуть выполнение задачи на несколько часов.

Для одной из обложек ежемесячной рубрики «Новости для бизнеса» я сгенерировал десятки мужчин в офисе с борщевиками. Даже итоговый вариант пришлось дорабатывать: я иначе выстроил кадр, убрал лишние элементы на фоне и долго правил руку, чтобы она в итоге касалась соцветия. Следы нейросети все равно заметны, но хотя бы ошибки не бросаются в глаза.

Главное — не смотреть на мелкие детали
Главное — не смотреть на мелкие детали

Бывает, трачу дополнительное время ради маленькой детали. Когда я генерировал картинку к материалу о скуфах, не удержался и добавил на экран скриншот главной Т⁠—⁠Ж. Это заняло полчаса — ни о чем не жалею.

Если потратить много времени, можно исправить даже неудачную генерацию. В этом помогает функция генеративной заливки в Photoshop, а еще техники коллажирования. Можно сшить разные картинки вместе, передвинуть объекты в кадре, а что-то сгенерировать по-новому.

Неудачная генерация в Stable Diffusion
Она же после сильной доработки

Фактически я использую в работе целый комплекс нейросетей: Stable Diffusion, Midjourney, Generative Fill в Photoshop, разные модели Esrgan для увеличения картинок, MiDaS в ControlNet для карты глубины.

Вместе с ними можно сгенерировать убедительные обложки в сотнях разных стилей. Да, в процессе нужно дорабатывать картинки, но это все равно быстрее и эффективнее, чем делать все самому традиционными методами.

Дообучение моделей. В самых трудных случаях можно дообучить новую модель или подготовить референсы для генераций. Так мы поступили для нашего курса о нейросетях. Сначала с командой подготовили датасет, потом я несколько раз дообучил модель, а затем для каждой обложки подготовил коллажи в виде «объект плюс фон» — так удалось получить единый стиль генераций.

Референс на основе фотографии и 3D
Референс на основе фотографии и 3D
Генерация дообученной Stable Diffusion
Генерация дообученной Stable Diffusion
1/2
Референс на основе фотографии и 3D

Будущее нейросетей

Я уверен, что на наших глазах вовсю идет технологическая революция. Нейросети продолжат развиваться и станут еще лучше. Даже за последний год многое изменилось. Вышли новые модели Stable Diffusion и Midjourney, которые генерируют изображения лучше и разнообразнее, чем когда-либо.

Идеи становятся важнее рутинного процесса. Порой придумываешь скучные обложки в духе «Бизнесмен в золотом костюме», а иногда удается найти ироничный образ наподобие борщевика в руках. Нейросети дают возможность создавать все — и обычные картинки в стоковом стиле, и даже настоящее искусство.

В личных проектах я замечаю настоящий талант нейросетей
В личных проектах я замечаю настоящий талант нейросетей
В личных проектах я замечаю настоящий талант нейросетей
В личных проектах я замечаю настоящий талант нейросетей
В личных проектах я замечаю настоящий талант нейросетей
В личных проектах я замечаю настоящий талант нейросетей

Уверен, когда человечество научится пользоваться новой технологией и создаст удобные продукты на ее основе, визуальная культура и рынок труда изменятся. Развитие повлияет на коммерческих художников и дизайнеров, фотостоки и агентства, компании и блогеров. Для этого понадобится от 10 до 20 лет. То же самое произошло со смартфонами и интернетом.

Можно представить, как таргетированная реклама подстраивается под интересы пользователя и генерируется в момент показа, маленькие издания экономят на иллюстраторах и нанимают всего одного нейродизайнера, а картинки в соцсетях автоматически расширяются под разные соотношения сторон.

При этом я считаю, что искусственный интеллект не заменит людей полностью. Конечно, кто-то останется без работы, но в целом просто появится другой вид конкуренции. Пускай не все прямо сейчас чувствуют революцию, но она однозначно уже началась.

levКак вам обложки, которые сгенерировала нейросеть?
  • Олег БарановИнтересно1
  • Благоустройство со сносомФотка травы в зеркале: у каждого хипстерофотографа 10 лет назад, теперь умеет и искусственный интеллект!14
  • Da Da DaБлагоустройство, у них и научился =)4
  • Игорь БушуевПодскажи, какой Промпт ввести, чтобы генерить эти "вышитые" пикчи?0
  • levИгорь, промпт сильно менялся от случая к случаю, так что здесь нужно экспериментировать. убирать фразы или добавлять новые в зависимости от сцены. в среднем так: wooly [такой-то объект там-то], sewn on rug, from wool, embroidery, flat image, rug иногда я добавлял синонимы, если нейросеть делала объект слишком объёмным или ошибалась с вышивкой. ещё нужен негативный промпт: в нём я, как обычно это бывает, указывал low quality, lowres, 3d, photo и так далее. думаю, важно ещё использовать модель sdxl4
  • РусланЛев, я помню еще как ты делал классные фото с архитектурой Казани. Рад, что ты работаешь в Т-Ж. Удачи тебе. Нравится твое творчество.20
  • levРуслан, спасибо-спасибо, неожиданно и приятно! кстати, опыт съёмки помог работать с нейросетями (особенно те моменты, когда я из плохих кадров делал приличные с помощью обработки и цветокоррекции).7
  • Hey_sister, go_sisterПо иллюстрациям к сказкам сразу было понятно, что их делала нейросеть. Интересно, может ли нейронка заменить фотографа обложек для дневников трат? И заметим ли мы это.6
  • Aleksandr DudkinAleksandr, понимаю тех кто минусит, а ещё помню "мастеров фотошопа" из начала века, сейчас "мастер фотошопа" как отдельный навык может вызвать только улыбку, а от художника в тех же гейм студиях как требовалась артовая база так и требуется. и фотошоп, в длинном ряду прочих программ. потому что многовековую теорию никто не отменял, и при прочих равных, в условиях когда нейродизайнеров будет слишком много, выиграет тот, кто знаком с композицией, теорией цвета и так далее6
  • DmitryБлагоустройство, а чего ты взял что это зеркало? это может быть и просто рамка, ведь за рамкой может находится тоже самое, фишка этого изображение что нельзя понять зеркало это или обычная деревянная рама1
  • Анастасия ОбломоваА как с авторским правом у нейросетей? Кто автор изображения по итогу?2
  • what?Очень понравилось фото женщины напротив избы в снежном пейзаже. Наверное, единственное из всей статьи, по которому с первого взгляда не скажешь, что сгенерировано нейронкой. Впрочем, я не вглядывалась) А иллюстрации к нейросказкам напомнили мне о том, что мой дед, художник на пенсии, сейчас генерит в простых нейросетках картинки различного дпи (керамика и тд), которое потом с подругой создают в реальной жизни. Даже поколение 70+ уже приобщилось)6
  • Михаил ВоробьевКрасавчик! Невероятная адаптация под изменения рынка труда!2
  • JessiПривет, Лев. Была на твоем воркшопе по stable diffusion на конфе. Я так понимаю, статья по мотивам. Очень круто).0
  • Максим ПудовHey_sister, боюсь что мы не заметим даже если статью написала нейронка.1
  • Андрей ИвановМаксим, https://journal.tinkoff.ru/this-article-was-written-by-ai/1
  • Павел МилашевскийПривет! Очень нравится твой обстоятельный подход. Дирижёр ансамбля нейросетей!1
  • Павел ГайдуковБлагодарю вас, Лев, за такой мощный и полезный материал! Ваши картинки, сгенерированные нейросетью - настоящее искусство, вы абсолютно правы, цитирую: Идеи становятся важнее рутинного процесса.0