Уже несколько лет говорят: «Еще чуть-чуть — и нейросети окончательно заменят художников».
За это время генеративные картины прошли путь от причудливых абстракций до качественных изображений, которые создаются за считаные минуты. Главным прорывом стала модель DALL-E от OpenAI: разработчики научили алгоритм довольно точно «рисовать» по текстовому описанию. Второе поколение нейросети совсем недавно перешло в стадию бета-теста: в ближайшее время доступ к технологии получит миллион человек.
Но и без DALL-E достаточно примечательных сервисов, которые можно протестировать уже сейчас. Мы проверили их и попытались дать всем программам одну и ту же задачу: нарисовать Бэтмена в Москве. Исключение — сервисы, у которых нет возможности сгенерировать супергероя.
Выбирайте, как будете генерировать
С ПОМОЩЬЮ ТЕКСТА
DALL-E Mini
Где попробовать: сайты Dall-e Mini и Craiyon, телеграм-бот
Простота освоения: 🤖🤖🤖🤖
Качество генерации: 👨🎨👨🎨
Фан-эффект: 😎😎😎😎😎
DALL-E Mini, несмотря на название, напрямую не связана с DALL-E от OpenAI. Американский разработчик Борис Дайма вдохновился нейросетью и попытался воспроизвести ее результаты с помощью моделей с открытым кодом. Первую версию он выпустил еще в июле 2021, но настоящая слава к нему пришла год спустя.
В мини-версии DALL-E привлекает простота: не нужно авторизовываться и разбираться в настройках, нет требований к вычислительным мощностям. Достаточно сформулировать запрос на английском языке и нажать на кнопку.
Нейросеть генерирует по описанию сразу девять картинок — так можно увидеть разные попытки изобразить задумку. Это идеальный формат, чтобы визуализировать любую безумную идею. Именно поэтому сервис настолько полюбился в соцсетях и стал очень популярным.
Коллаж из девяти миниатюр еще и скрывает недостатки нейросети. DALL-E Mini проигрывает в качестве многим аналогам: лица получаются смазанными, видны артефакты — искажения после обработки нейросетью. Но все это перекрывается тем, что алгоритм хорошо подстраивается под запрос, а результаты часто получаются очень смешными.
С ПОМОЩЬЮ ТЕКСТА
ruDALL-E
Где попробовать: сайт, приложение «Салют», discord-канал, телеграм-бот
Простота освоения: 🤖🤖🤖🤖🤖
Качество генерации: 👨🎨👨🎨
Фан-эффект: 😎😎😎
ruDALL-E — сервис от разработчиков «Сбера», поэтому он умеет генерировать картинки по описанию на русском языке. Есть две версии ruDALL-E: первое поколение под названием «Малевич» и второе, более продвинутое — «Кандинский».
«Малевич» генерирует одно изображение за раз. У итоговой картинки высокое разрешение, а вот с точностью генерации есть проблемы: нейросеть не всегда понимает, что от нее хотят. Например, во время тестового запроса ruDALL-E то «терял» Бэтмена, то никак не изображал хоть что-то похожее на Москву. Поэтому лучше отправлять запрос несколько раз подряд, чтобы добиться приемлемого результата.
У «Малевича» есть официальный бот в «Телеграме». Там не нужно вводить капчу для каждого запроса, а за то же время генерируются сразу три картинки. Но есть и свой минус — водяной знак по центру каждого изображения.
Результаты «Кандинского» на порядок лучше: нейросеть довольно узнаваемо генерирует сразу девять картинок и у любой можно увеличить разрешение. Нейросеть интегрировали в экосистему «Сбера», так что воспользоваться сервисом можно на умных устройствах компании или в мобильном приложении «Салют» — вход осуществляется через Sber ID. Альтернатива — вступить в официальное discord-сообщество и генерировать картинки там.
С ПОМОЩЬЮ ТЕКСТА
Midjourney
Где попробовать: discord-сервер проекта
Простота освоения: 🤖🤖🤖
Качество генерации: 👨🎨👨🎨👨🎨
Фан-эффект: 😎😎😎😎
Midjourney совсем недавно перешла в стадию бета-теста: любой может присоединиться к каналу разработчиков в Discord и протестировать алгоритм прямо в чате. Для этого достаточно ознакомиться с правилами сообщества, затем ввести команду /imagen, после чего сформулировать запрос на английском языке. Сервис сгенерирует четыре варианта: у каждого можно увеличить разрешение или попросить нейросеть переделать в том же духе.
Картинки получаются достаточно качественными и узнаваемыми, хоть и не без промахов. Бесконечно генерировать изображения не выйдет: есть лимит на каждого человека. Когда он будет исчерпан, можно остаться в сообществе и смотреть, что генерируют другие пользователи.
С ПОМОЩЬЮ ТЕКСТА
Dream by WOMBO
Где попробовать: сайт, приложения для iOS и Android
Простота освоения: 🤖🤖🤖🤖
Качество генерации: 👨🎨👨🎨
Фан-эффект: 😎😎😎😎
Это популярный сервис для создания вертикальных обложек. Арты делаются легко: нужно сформулировать текстовый запрос, выбрать стилистику, а при желании — еще и прикрепить картинку-референс. Веб версия-бесплатная, а вот в приложениях стили доступны только по подписке.
Результат выглядит очень абстрактно, но почти всегда красиво. Особо примечательный арт можно купить в высоком качестве в виде реального постера. В «Тиктоке» был флешмоб, где пытались угадать сгенерированные в Dream обложки фильмов и альбомов.
С ПОМОЩЬЮ ТЕКСТА
Starryai
Где попробовать: сайт, приложения для iOS и Android
Простота освоения: 🤖🤖🤖🤖
Качество генерации: 👨🎨👨🎨👨🎨
Фан-эффект: 😎😎😎
Нейросеть создает арты на основе текстового описания, но с дополнениями. Можно сразу задать стилистику изображения, прикрепить картинку-референс, добавить дополнительные параметры. Прогресс виден практически в прямом эфире: алгоритм на глазах превращает размытое нечто в полноценный арт.
Программа устроена как тематическая соцсеть: там доступны и чужие работы, чтобы вдохновиться или подсмотреть наиболее эффективные запросы. Для генерации используется система кредитов, которые можно не только купить за деньги, но и заработать, выполняя разные задания: например, посмотреть рекламу или поделиться работой в соцсетях.
Результаты получаются разные, от абстракций в духе ранних ИИ-моделей до качественных работ, почти неотличимых от настоящих картин. Готовое изображение можно пропустить через нейросеть еще раз или увеличить разрешение — за дополнительные кредиты.
С ПОМОЩЬЮ ТЕКСТА
Pixray
Где попробовать: сайт
Простота освоения: 🤖🤖
Качество генерации: 👨🎨👨🎨
Фан-эффект: 😎😎😎
Это не столько самостоятельный сервис, сколько адаптация сразу нескольких моделей с открытым исходным кодом. Работает только в веб-версии, зато бесплатно и без ограничений или встроенных покупок.
Для генерации достаточно ввести текстовое описание на английском языке и выбрать одну из моделей для рендера: среди вариантов есть как популярные VQGAN и CLIPDraw, так и менее востребованные алгоритмы. Третьим пунктом можно ввести дополнительные настройки по приложенной инструкции либо оставить поле пустым.
Результаты зависят от модели и настроек. Обычно работы далеки от реализма, но, как правило, передают запрос пользователя. Генерируются изображения от нескольких минут, а в процессе можно увидеть промежуточные варианты итоговой версии.
ПО НАБРОСКАМ
Pix2pix
Где попробовать: Где попробовать: демо-сайт разработчика
Простота освоения: 🤖🤖🤖🤖
Качество генерации: 👨🎨
Фан-эффект: 😎😎😎😎😎
Pix2pix — это не конкретный сервис, а название модели в основе множества небольших сайтов. Она может имитировать стиль оригинального рисунка, дорисовывать кадры или превращать рисунки в реалистичные изображения. С помощью pix2pix, например, продолжали ролики и преобразовывали старые карты в снимки со спутников.
Исследователи представили модель еще в 2017 году. Тогда же разработчик OpenAI Кристофер Хессе создал демосайт, чтобы любой желающий мог протестировать Pix2pix. В четырех демонстрационных модулях нейросеть рисует объект по наброскам пользователя: кота, фасад здания, сумку или обувь. Алгоритм буквально на лету пытается понять задумку и подстраивается под каждый новый штрих.
Результат сложно назвать реалистичным, зато можно нарисовать кота в форме хлеба или здание, которое полностью состоит из дверей. Пространство для фантазии гораздо шире, а результат нагляднее, чем при текстовом запросе.
По нынешним меркам это устаревшая нейросеть: демоверсиям уже несколько лет, а технологии с тех пор сделали огромный шаг вперед. Но можно попробовать и другие сервисы на основе Pix2pix: разработчики-энтузиасты сделали сайты, где можно нарисовать портрет человека или Пикачу.
ПО НАБРОСКАМ
GauGAN
Где попробовать: программа Canvas для Windows, демосайт
Простота освоения: 🤖
Качество генерации: 👨🎨👨🎨👨🎨👨🎨👨🎨
Фан-эффект: 😎😎😎
GauGAN — нейросеть, разработкой которой занимается компания NVIDIA. Главная фишка — умение превращать даже не очень умелые наброски пользователей в фотореалистичные пейзажи. Во второй версии ИИ научился делать то же самое на основе текстового описания.
У GauGAN есть набор «материалов»: можно прямо указать нейросети, где должны быть облака, вода, солнце, деревья или здания. Смена инструментов может за пару штрихов полностью изменить пейзаж — но он останется таким же реалистичным. Модель уже встроена в сервис NVIDIA под названием Canvas: бета-версию программы можно бесплатно скачать с сайта разработчика. Но системные требования у нее солидные: Windows 10 или 11, видеокарта с поддержкой RTX, жесткий диск SSD.
Есть вариант проще: демосайт с ограниченными функциями. Сервис генерирует пейзаж на основе рисунка, заранее загруженного изображения или текстового описания — либо всех инструментов одновременно.
Из-за большого количества настроек с ходу разобраться на сайте может быть трудно. При первом запуске активируется инструкция, а на «Ютубе» есть обучающие ролики. Рекомендуем сначала ознакомиться с ними.
СМЕШИВАЕТ КАРТИНКИ
Artbreeder
Где попробовать: сайт
Простота освоения: 🤖🤖
Качество генерации: 👨🎨👨🎨
Фан-эффект: 😎😎😎
С Artbreeder можно создавать уникальные изображения с помощью «смешивания» уже существующих. Как это работает: пользователи могут загрузить любую картинку, чаще всего — портрет. Ее при желании можно редактировать с помощью нейросети: сменить возраст, пол, добавить волосы или улыбку. Настроек достаточно много, но главное — не увлекаться: в противном случае узнаваемое лицо быстро превратится в абстрактное месиво.
Самое интересное начинается при добавлении второй картинки — тогда алгоритм уже покажет «ребенка» двух людей. Его внешность тоже можно менять: к стандартным настройкам добавляется слайдер «На кого больше похож». При серьезном подходе можно добиться очень реалистичных результатов: некоторые художники таким образом воссоздают внешность литературных персонажей или исторических личностей.
Главная проблема — бесплатно можно загрузить три свои картинки. После исчерпания лимита остается только брать стандартные изображения и работы других пользователей.
БЕЗ УЧАСТИЯ ЧЕЛОВЕКА
This X Does Not Exist
Где попробовать: погенерировать людей, животных, кроссовки, резюме и идеи для стартапов
Простота освоения: 🤖🤖🤖🤖🤖
Качество генерации: 👨🎨👨🎨👨🎨👨🎨
Фан-эффект: 😎
Если у вас нет конкретного запроса или времени, можно зайти на один из сайтов с общей концепцией «Этого X не существует». На таких страницах вообще не придется ничего настраивать, вводить и даже кликать — после каждого обновления выводится уникальное сгенерированное нейросетью изображение. Причем довольно качественное: порой нужно долго всматриваться, чтобы заметить артефакты.
лично меня сейчас веселит Midjourney V4 где есть Remix mode, в ней скрещивают две картинки и вот что получается 😆
И это только начало, у меня целый альбом моих генераций в дали 2
Иван,
Chikirao, какая же крипота у меня получилась
Nana, Hamster painting on a small easel, realistic photo
Chikirao, а как получить доступ к DALL-E 2?
Павел, оставить заявку на беру на сайте
Chikirao, а как вы авторизировались в дали 2? Мне пишет, что в моей стране запрещено, не подскажите пожалуйста?
Елена, какая красота! В какой программе это сделано?
Наталья, midyourney
Конечно, только этим и занимаюсь :))))
Миджорни меня капец как пугает, что-то подспудное, будто из моих знакомых снов. Особенно когда видишь не картинку в целом, а ее косяки с пальцами, глазами и другими мелочами - мозг понимает, что что-то не так, это крипово, но завораживает
Путешественница ест пиццу в России
Татьяна, видимо, пицца не очень вкусная...
Эльвира, просто это Россия - страна для грустных.
V, в Японии в университете преподают цифровое искусство, и думаю не зря
Александр, remaster прекрасная функция, советую, картинки приобретают вид законченности и завораживают, особенно хорошо это получается в портретах и еще советую команду bokeh, на заднем плане размытые огни, хороший эффект
Уже 2 дня играю с Midjorney, первый запрос это микс моего фото и гигачада.
Midjourney, душа
Максим, вы жестко нагенерировали целый альбом или не жестко?
Саша, определённо жёстко
Максим, ставлю класс!
Воздушные шары над городом Starryai
Генри, если бы мы знали что это, но мы не знаем что это...
Farisey, не плохое приложение, качество уступает midyourney, но иногда выдает прекрасные картинки
Вадим, а как это сделано? Можете показать пример запроса для подобных картинок? И в какой это программе?
Увы, но хорошие изображения получаються только в платных приложениях и то одно из сотни. А в целом, пока увы, это хрень
Супер, будет учиться у других нейросетей :)
Гроза в метавселенной. Dall
Красавица и чудовище. Нейросеть DALL
как я понял, пока нет ни одного сервиса, который может генерить новые изображения на основе нескольких загруженных пользователем. многие представленные в статье ориентируются только на свою базу
Пока ещё не пробовал, но есть желание поучаствовать
Фнаф
Фнаф