Уже несколько лет говорят: «Еще чуть-чуть — и нейросети окончательно заменят художников».

За это время генеративные картины прошли путь от причудливых абстракций до качественных изображений, которые создаются за считаные минуты. Главным прорывом стала модель DALL-E от OpenAI: разработчики научили алгоритм довольно точно «рисовать» по текстовому описанию. Второе поколение нейросети совсем недавно перешло в стадию бета-теста: в ближайшее время доступ к технологии получит миллион человек.

Но и без DALL-E достаточно примечательных сервисов, которые можно протестировать уже сейчас. Мы проверили их и попытались дать всем программам одну и ту же задачу: нарисовать Бэтмена в Москве. Исключение — сервисы, у которых нет возможности сгенерировать супергероя.

С ПОМОЩЬЮ ТЕКСТА
DALL-E Mini

Где попробовать: сайты Dall-e Mini и Craiyon, телеграм-бот
Простота освоения: 🤖🤖🤖🤖
Качество генерации: 👨‍🎨👨‍🎨
Фан-эффект: 😎😎😎😎😎

На миниатюрах сразу считывается задумка, а еще не видно проблем с разрешением и артефактами
На миниатюрах сразу считывается задумка, а еще не видно проблем с разрешением и артефактами

DALL-E Mini, несмотря на название, напрямую не связана с DALL-E от OpenAI. Американский разработчик Борис Дайма вдохновился нейросетью и попытался воспроизвести ее результаты с помощью моделей с открытым кодом. Первую версию он выпустил еще в июле 2021, но настоящая слава к нему пришла год спустя.

В мини-версии DALL-E привлекает простота: не нужно авторизовываться и разбираться в настройках, нет требований к вычислительным мощностям. Достаточно сформулировать запрос на английском языке и нажать на кнопку.

Нейросеть генерирует по описанию сразу девять картинок — так можно увидеть разные попытки изобразить задумку. Это идеальный формат, чтобы визуализировать любую безумную идею. Именно поэтому сервис настолько полюбился в соцсетях и стал очень популярным.

Коллаж из девяти миниатюр еще и скрывает недостатки нейросети. DALL-E Mini проигрывает в качестве многим аналогам: лица получаются смазанными, видны артефакты — искажения после обработки нейросетью. Но все это перекрывается тем, что алгоритм хорошо подстраивается под запрос, а результаты часто получаются очень смешными.

С ПОМОЩЬЮ ТЕКСТА
ruDALL-E

Где попробовать: сайт, приложение «Салют», discord-канал, телеграм-бот
Простота освоения: 🤖🤖🤖🤖🤖
Качество генерации: 👨‍🎨👨‍🎨
Фан-эффект: 😎😎😎

В Discord генерируется не 9, а сразу 16 картинок за раз
В Discord генерируется не 9, а сразу 16 картинок за раз

ruDALL-E — сервис от разработчиков «Сбера», поэтому он умеет генерировать картинки по описанию на русском языке. Есть две версии ruDALL-E: первое поколение под названием «Малевич» и второе, более продвинутое — «Кандинский».

«Малевич» генерирует одно изображение за раз. У итоговой картинки высокое разрешение, а вот с точностью генерации есть проблемы: нейросеть не всегда понимает, что от нее хотят. Например, во время тестового запроса ruDALL-E то «терял» Бэтмена, то никак не изображал хоть что-то похожее на Москву. Поэтому лучше отправлять запрос несколько раз подряд, чтобы добиться приемлемого результата.

У «Малевича» есть официальный бот в «Телеграме». Там не нужно вводить капчу для каждого запроса, а за то же время генерируются сразу три картинки. Но есть и свой минус — водяной знак по центру каждого изображения.

Результаты «Кандинского» на порядок лучше: нейросеть довольно узнаваемо генерирует сразу девять картинок и у любой можно увеличить разрешение. Нейросеть интегрировали в экосистему «Сбера», так что воспользоваться сервисом можно на умных устройствах компании или в мобильном приложении «Салют» — вход осуществляется через Sber ID. Альтернатива — вступить в официальное discord-сообщество и генерировать картинки там.

С ПОМОЩЬЮ ТЕКСТА
Midjourney

Где попробовать: discord-сервер проекта
Простота освоения: 🤖🤖🤖
Качество генерации: 👨‍🎨👨‍🎨👨‍🎨
Фан-эффект: 😎😎😎😎

Некоторые результаты впечатляют проработанностью
Некоторые результаты впечатляют проработанностью

Midjourney совсем недавно перешла в стадию бета-теста: любой может присоединиться к каналу разработчиков в Discord и протестировать алгоритм прямо в чате. Для этого достаточно ознакомиться с правилами сообщества, затем ввести команду /imagen, после чего сформулировать запрос на английском языке. Сервис сгенерирует четыре варианта: у каждого можно увеличить разрешение или попросить нейросеть переделать в том же духе.

Картинки получаются достаточно качественными и узнаваемыми, хоть и не без промахов. Бесконечно генерировать изображения не выйдет: есть лимит на каждого человека. Когда он будет исчерпан, можно остаться в сообществе и смотреть, что генерируют другие пользователи.

С ПОМОЩЬЮ ТЕКСТА
Dream by WOMBO

Где попробовать: сайт, приложения для iOS и Android
Простота освоения: 🤖🤖🤖🤖
Качество генерации: 👨‍🎨👨‍🎨
Фан-эффект: 😎😎😎😎

За счет абстракции все проблемы нейросети можно списать на то, что так и было задумано
За счет абстракции все проблемы нейросети можно списать на то, что так и было задумано

Это популярный сервис для создания вертикальных обложек. Арты делаются легко: нужно сформулировать текстовый запрос, выбрать стилистику, а при желании — еще и прикрепить картинку-референс. Веб версия-бесплатная, а вот в приложениях стили доступны только по подписке.

Результат выглядит очень абстрактно, но почти всегда красиво. Особо примечательный арт можно купить в высоком качестве в виде реального постера. В «Тиктоке» был флешмоб, где пытались угадать сгенерированные в Dream обложки фильмов и альбомов.

В июне научный журнал университета Emory вышел с обложкой, созданной в приложении. Источник: news.emory.edu
В июне научный журнал университета Emory вышел с обложкой, созданной в приложении. Источник: news.emory.edu

С ПОМОЩЬЮ ТЕКСТА
Starryai

Где попробовать: сайт, приложения для iOS и Android
Простота освоения: 🤖🤖🤖🤖
Качество генерации: 👨‍🎨👨‍🎨👨‍🎨
Фан-эффект: 😎😎😎

Мрачный стиль из настроек очень подошел Бэтмену
Мрачный стиль из настроек очень подошел Бэтмену

Нейросеть создает арты на основе текстового описания, но с дополнениями. Можно сразу задать стилистику изображения, прикрепить картинку-референс, добавить дополнительные параметры. Прогресс виден практически в прямом эфире: алгоритм на глазах превращает размытое нечто в полноценный арт.

Программа устроена как тематическая соцсеть: там доступны и чужие работы, чтобы вдохновиться или подсмотреть наиболее эффективные запросы. Для генерации используется система кредитов, которые можно не только купить за деньги, но и заработать, выполняя разные задания: например, посмотреть рекламу или поделиться работой в соцсетях.

Результаты получаются разные, от абстракций в духе ранних ИИ-моделей до качественных работ, почти неотличимых от настоящих картин. Готовое изображение можно пропустить через нейросеть еще раз или увеличить разрешение — за дополнительные кредиты.

С ПОМОЩЬЮ ТЕКСТА
Pixray

Где попробовать: сайт
Простота освоения: 🤖🤖
Качество генерации: 👨‍🎨👨‍🎨
Фан-эффект: 😎😎😎

Получилось не очень качественно, но при желании Бэтмена узнать можно
Получилось не очень качественно, но при желании Бэтмена узнать можно

Это не столько самостоятельный сервис, сколько адаптация сразу нескольких моделей с открытым исходным кодом. Работает только в веб-версии, зато бесплатно и без ограничений или встроенных покупок.

Для генерации достаточно ввести текстовое описание на английском языке и выбрать одну из моделей для рендера: среди вариантов есть как популярные VQGAN и CLIPDraw, так и менее востребованные алгоритмы. Третьим пунктом можно ввести дополнительные настройки по приложенной инструкции либо оставить поле пустым.

Результаты зависят от модели и настроек. Обычно работы далеки от реализма, но, как правило, передают запрос пользователя. Генерируются изображения от нескольких минут, а в процессе можно увидеть промежуточные варианты итоговой версии.

ПО НАБРОСКАМ
Pix2pix

Где попробовать: Где попробовать: демо-сайт разработчика
Простота освоения: 🤖🤖🤖🤖
Качество генерации: 👨‍🎨
Фан-эффект: 😎😎😎😎😎

Получился вот такой котобэтмен
Получился вот такой котобэтмен

Pix2pix — это не конкретный сервис, а название модели в основе множества небольших сайтов. Она может имитировать стиль оригинального рисунка, дорисовывать кадры или превращать рисунки в реалистичные изображения. С помощью pix2pix, например, продолжали ролики и преобразовывали старые карты в снимки со спутников.

Исследователи представили модель еще в 2017 году. Тогда же разработчик OpenAI Кристофер Хессе создал демосайт, чтобы любой желающий мог протестировать Pix2pix. В четырех демонстрационных модулях нейросеть рисует объект по наброскам пользователя: кота, фасад здания, сумку или обувь. Алгоритм буквально на лету пытается понять задумку и подстраивается под каждый новый штрих.

Результат сложно назвать реалистичным, зато можно нарисовать кота в форме хлеба или здание, которое полностью состоит из дверей. Пространство для фантазии гораздо шире, а результат нагляднее, чем при текстовом запросе.

По нынешним меркам это устаревшая нейросеть: демоверсиям уже несколько лет, а технологии с тех пор сделали огромный шаг вперед. Но можно попробовать и другие сервисы на основе Pix2pix: разработчики-энтузиасты сделали сайты, где можно нарисовать портрет человека или Пикачу.

ПО НАБРОСКАМ
GauGAN

Где попробовать: программа Canvas для Windows, демосайт
Простота освоения: 🤖
Качество генерации: 👨‍🎨👨‍🎨👨‍🎨👨‍🎨👨‍🎨
Фан-эффект: 😎😎😎

Если немного посидеть на сайте GauGAN, то разобраться можно и интуитивно
Если немного посидеть на сайте GauGAN, то разобраться можно и интуитивно

GauGAN — нейросеть, разработкой которой занимается компания NVIDIA. Главная фишка — умение превращать даже не очень умелые наброски пользователей в фотореалистичные пейзажи. Во второй версии ИИ научился делать то же самое на основе текстового описания.

У GauGAN есть набор «материалов»: можно прямо указать нейросети, где должны быть облака, вода, солнце, деревья или здания. Смена инструментов может за пару штрихов полностью изменить пейзаж — но он останется таким же реалистичным. Модель уже встроена в сервис NVIDIA под названием Canvas: бета-версию программы можно бесплатно скачать с сайта разработчика. Но системные требования у нее солидные: Windows 10 или 11, видеокарта с поддержкой RTX, жесткий диск SSD.

Есть вариант проще: демосайт с ограниченными функциями. Сервис генерирует пейзаж на основе рисунка, заранее загруженного изображения или текстового описания — либо всех инструментов одновременно.

Из-за большого количества настроек с ходу разобраться на сайте может быть трудно. При первом запуске активируется инструкция, а на «Ютубе» есть обучающие ролики. Рекомендуем сначала ознакомиться с ними.

СМЕШИВАЕТ КАРТИНКИ
Artbreeder

Где попробовать: сайт
Простота освоения: 🤖🤖
Качество генерации: 👨‍🎨👨‍🎨
Фан-эффект: 😎😎😎

Вместо Бэтмена пришлось тестировать нейросеть на Роберте Паттинсоне — тут он повзрослее и повеселее
Вместо Бэтмена пришлось тестировать нейросеть на Роберте Паттинсоне — тут он повзрослее и повеселее

С Artbreeder можно создавать уникальные изображения с помощью «смешивания» уже существующих. Как это работает: пользователи могут загрузить любую картинку, чаще всего — портрет. Ее при желании можно редактировать с помощью нейросети: сменить возраст, пол, добавить волосы или улыбку. Настроек достаточно много, но главное — не увлекаться: в противном случае узнаваемое лицо быстро превратится в абстрактное месиво.

Самое интересное начинается при добавлении второй картинки — тогда алгоритм уже покажет «ребенка» двух людей. Его внешность тоже можно менять: к стандартным настройкам добавляется слайдер «На кого больше похож». При серьезном подходе можно добиться очень реалистичных результатов: некоторые художники таким образом воссоздают внешность литературных персонажей или исторических личностей.

Главная проблема — бесплатно можно загрузить три свои картинки. После исчерпания лимита остается только брать стандартные изображения и работы других пользователей.

БЕЗ УЧАСТИЯ ЧЕЛОВЕКА
This X Does Not Exist

Где попробовать: погенерировать людей, животных, кроссовки, резюме и идеи для стартапов
Простота освоения: 🤖🤖🤖🤖🤖
Качество генерации: 👨‍🎨👨‍🎨👨‍🎨👨‍🎨
Фан-эффект: 😎

Этого ночного неба не существует
Этого ночного неба не существует

Если у вас нет конкретного запроса или времени, можно зайти на один из сайтов с общей концепцией «Этого X не существует». На таких страницах вообще не придется ничего настраивать, вводить и даже кликать — после каждого обновления выводится уникальное сгенерированное нейросетью изображение. Причем довольно качественное: порой нужно долго всматриваться, чтобы заметить артефакты.


Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult.