Я сгенерировал в нейросети рекламу кроссовок Nike, которую хотел бы увидеть сам

Обсудить

Этот текст написан в Сообществе, в нем сохранены авторский стиль и орфография

Выбор нейросети и составление запроса

Я использовал нейросеть MidJourney 4 версии. Очень удобно было затащить его на личный сервер в Discord и не выискивать свои генерации среди чужих.

Я пробовал сгенерировать разные изображения на разные тематики. Как и многие, в первую очередь я решил зарендерить киберпанк тематику — различных киборгов, локации в духе постапокалипсиса. Пробовался в архитектуре — решил особо не напрягаться и генерировал бетонный модерн с окнами в пол. Получилось красочно, но не хватало реалистичности — путались линии, поверхности. Для MJ рендер оказался сложноватым. Очень понравилось генерировать иллюстрации-постеры, что-то из поп-арта, естественные пейзажи.

Мне захотелось реализовать концепт рекламы для Nike, основанный на органике и природных явлениях. Что-то очень оживленное. Давно мы такого не наблюдали в промо-материалах.

Путем проб и ошибок, я примерно понял, как формулировать запросы, какие ключевые слова использовать, чтобы получить что-то соответствующее первоначальной идее. Запрос был в духе «Nike Air Jordan, promo, organic, 4k, unreal engine” и еще несколько ключей для световой обработки, сейчас не вспомню.

Впечатления

Я ожидал немного другого результата — чтобы нейросеть глубже поработала над деталями кроссовок, создала новые формы. Но тем не менее результат меня впечатлил, и я получил тот самый живой концепт, который в реальной кампании Nike мне бы зашёл.

Трудности с использованием нейросети

Проблем с генерациями особо не возникло, достаточно быстро разобрался, как взаимодействовать с нейросетью. Понял одно — нужно больше практиковаться, чтобы по-настоящему оценить возможности MidJourney.

Вот какие тезисы я могу вывести из своего опыта использования:

1. Ключи запроса делятся на два типа — те, что описывают саму композицию, и те, что помогают поработать над светом, качеством, рисовкой, и т.д.

2. Нейросеть лучше обрабатывает те тематики, материала по которым больше всего в интернете. Сама способность нейросети воспроизводить определенные иллюстрации основывается на том, на чем ее обучили. Материалом для обучения служат как раз картинки из интернет-ресурсов — различные стоки, разделы поисковых систем, в частности сервис Google Earth со снимками, сделанными специальным автомобилем, возможно социальные сети. Соответственно, если в нейросеть загрузили 10 000 000 изображений автомобиля и 100 изображений полевой душицы, очевидно она лучше справится с задачей отрисовать автомобиль.

3. Чем больше в запросе ключей, тем ниже потенциальная валидность генерации. Таким образом большое количество ключевых слов в запросе создает шанс появления артефактов (по моему опыту до 25%, то есть одна генерация из четырех внутри одного сета)

4. Для меня коммерческое применение нейросети — до сих пор открытый вопрос. В определенных сферах достаточно широкий простор для креатива, в других отрендерить что-то здравое можно, если сломать голову, просидев несколько дней. Например сгенерировать технологичные иллюстрации для онлайн-школы, каких десятки и сотни — вопрос пяти минут.

Придумать что-то для компании-девелопера не так просто. Нужно взять существующие референсы в виде проектных 3D рендеров и каким-то образом их обработать. Детали ландшафта потребуют точной прорисовки, что влечет за собой риск появления артефактов (допустим сгенерировать пешеходов будет сложно, так как у MidJourney бывают проблемы с отрисовкой человека с анатомической точки зрения). Таким образом в коммерции на данный момент скорее возможны ассоциативные иллюстрации, нежели материальные, собранные на основе чего-то реального.

Подводя итог, можно отметить довольно широкий потенциал как для применения, но так же и для развития в этом направлении.

Реакцию коммьюнити можно отметить как положительную, вызван очень большой интерес к ИИ-генераторам. По этой причине команда MidJourney не так давно представила 5 версию своей нейросети. Эту версию я еще не успел протестировать, возможно в обновлении подъехали те самые улучшения по детализации. Будем дальше следить за развитием событий.

    Вот что еще мы писали по этой теме