Нейросети для генерации изображений в России: мой топ-3
Этот текст написан в Сообществе, в нем сохранены авторский стиль и орфография
Достойных сервисов по генерации изображений не так и мало в современном мире, полном технологий. Но из-за блокировки многих систем и попросту несоответствия качеству выбрать что-то для постоянного пользования сложно. Но мне удалось найти для себя топ-3 площадки, которым можно доверять.
Для начала стоит рассказать немного предыстории: я копирайтер. Пишу тексты и статьи для блогов на различные тематики, облекаю слова в предложения уже более пяти лет. Сфера журналистики и авторских текстов для меня не новая, но вот нейросеть в моей жизни появилась не так давно и уже успела занять особое положение. Стало значительно проще (что объяснимо) создавать красивые, яркие картинки, которые цепляют с первого взгляда.
Самое главное: на генерацию изображений через нейросеть не уходит много времени — это происходит моментально. Притом подобный контент уникален, его можно использовать для своих работ, дополнять статьи, вести блог, вдохновляться новыми идеями. Есть одно “но” — сложности в эксплуатации многих сервисов из-за постоянной блокировки VPN.
Приходилось преодолевать немало трудностей, чтобы пользоваться площадками, особенно бесплатно. Постоянные “шаманские танцы” надоедают и хочется стабильного и легкого рабочего процесса — тем более нейросеть призвана упростить жизнь копирайтера, маркетолога или блогера, а не наоборот.
Некоторые сервисы оказались не совсем подходящими для моей работы и не устраивали по качеству иллюстраций, хотя они совершенно бесплатны и просты в использовании. В моем списке были Bing Image Creator, Midjourney, Stable Diffusion. Все 3 крутые, топовые; картинки, прямо скажем, достойные и сочные. Минусов тоже немало, правда. В первом случае были частые косяки в плане техничности изображений и адекватности полученного результата: не всегда удавалось сгенерировать с первого раза картинку без дефекта, “поплывших” элементов или недостающих пальцев. Сервис бесплатный, хотя поплясать придется: функционал ограничен для российских пользователей.
В случае с Midjourney все еще понятнее: он стал платным, ощутимо. Кроме того, случилась весьма неприятная ситуация: мой личный аккаунт заблокировали летом 2023 года. Поскольку оплачен он был не с моей карты, а через посредников, то восстановить утраченные 30 долларов предоплаты не удалось.
Stable Diffusion — уникальный сервис, преобразует текст в оригинальные картинки, иллюстрации в разных стилях, дорисовывает за вас. Все, вроде, супер, но в России становится все сложнее находить применение подобным площадкам, хотя она и является бесплатной по задумке создателя. Нужно проделать нехитрую схему — и можно генерировать картинки с удовольствием. В принципе, подходит, если не учитывать, что идеального качества изображений достичь так и не удалось. Можно испробовать немало настроек, однако разрешение не на высоте. И мне захотелось идти дальше и в итоге я смогла остановить свой выбор на трех сервисах по генерации изображений для постоянной работы. Каждый из них несет какую-то свою функцию, подходит для разных целей и отвечает требованиям: уникальность, яркость, качество. Итак, что это за сервисы у меня в топе?
Kandinsky
Нейросетевой сервис от компании “Сбер”, который отлично сгенерирует вам творческую картинку, оригинальную иллюстрацию, нарисует пейзаж или портрет. Для регистрации просто вводите свой номер телефона и полученный СМС-код используйте в качестве подтверждения. Галочка “запомнить меня” избавит от необходимости ввода данных при каждом посещении системы. Также можно зарегистрироваться по Сбер ID: сканируете QR-код при помощи камеры смартфона, далее вам также необходимо нажать галочку для запоминания вашего профиля и принять все условия использования сервиса в Сбере. Вам придет официальное оповещение о регистрации, нужно будет нажать кнопку “подтвердить”.
Сервис понимает текст на 101 языке, генерирует быстро и точно считывает запрос пользователя, что позволяет ему создавать и реалистичные изображения. Безопасность Сберовской площадки продумана до мелочей — никто не использует ваши картинки, не применит их в своем блоге.
Что может “Кандинский”?
- создавать неповторимые, масштабные изображения с нуля, опираясь на запрос пользователей;
- генерировать иллюстрации на основе выбранных из галереи фото или картинок;
- совмещать разные картинки;
- дорисовывать изображения и дополнять нужными элементами, штрихами.
Можно выбрать размер изображения, стиль и скачать полученную работу. Если вы выйдете с сайта и закроете страницу — вернуть картинку уже не получится. Поэтому при удачном результате советую сразу сохранять.
При условии, если вам необходимо изображение помасштабнее — то сначала вы создаете его в формате “по умолчанию”, а потом, отодвинув рамку, продолжаете дорисовывать остальное пространство. Здесь есть еще несколько функций, например, можно добавить референс, воспользоваться ластиком и стереть что-то ненужное, а потом дополнить рисунок недостающими деталями. Давайте введем промт и посмотрим на результат. Наш запрос выглядит так: “Горная река в отблесках солнца на фоне гор и голубого неба”. Мы не будем на данном этапе выбирать стиль, просто оценим художественные способности нейросети и уже потом позволим себе немного доработать изображение.
У нас получился красивый пейзаж. Попробуем создать натюрморт в стиле “Хохлома”. А теперь масштабируем его, растянув рамку. У нас вышла настоящая картина — произведение искусства.
Для ведения социальных сетей, например, такой стиль не подходит (если вы, конечно, не продвигаете галерею или свои услуги художника).
Попробуем создать более реалистичное изображение — портрет девушки в шляпе с черными волосами и карими глазами в стиле “Портретное фото”. Потрясающе миловидная особа смотрит на нас с портрета, как будто рука истинного мастера кисти коснулась холста.
А что, если сгенерировать картинку для обзора товаров или карточки на “ВБ”? Посмотрим, что выйдет. Промт: “Кроссовки Найк белые, товар” и “Туфли бежевые на каблуке”. Нейросеть даже поняла наш запрос по конкретному бренду — логотип узнаваем. Но чего-то не хватает, правда? Деталей. Для получения точного, необходимого вам результата нужно дополнить описание (промт): указать размер, фон, цвета, высоту каблука или подошвы.
Как создать четкий и правильный запрос:
- указать дополнительные детали и элементы, которые должны быть на рисунке: цвет, фасон, тона, действия героев, одежда персонажей и т.д.;
- написать место действия (если речь идет о каком-то моменте или пейзаже): лес, река, парк и прочие;
- выбрать подходящий стиль;
- не использовать обилие эпитетов и разных дополнений — соблюдайте меру, иначе нейросеть запутается, разбирая ваши сложноподчиненные предложения;
- избегать отрицаний — они тоже не понятны сервису.
На самом деле, приведенный выше мини-список советов для построения промта можно применять и при работе с другими сервисами генерации изображений — он универсален, но будет дополнен несколькими индивидуальными пунктами для каждой онлайн-площадки.
Gerwin AI
Новый сервис генеративного контента, запущенный в начале 2022 года. В конце 2023 он модернизируется и становится максимально удобным для широкого круга пользователей. Помимо появления новых стилей письма улучшается качество изображений, появляются новые возможности, а неточности и помарки сводятся к минимуму. Наверное, один из малочисленных минусов сервиса — его полностью платное использование. Правда, цены у ребят очень демократичные и оправданные: вы платите за более высокое качество и креативность.
Для регистрации в личном кабинете вам нужно придумать логин и пароль. Далее вы приобретаете один из пакетов услуг и можете использовать все возможности онлайн-площадки. Также система предусматривает дополнительную постоянную скидку по подписке “Вечный PRO” — все пакеты услуг будут по сниженной цене. Оплата производится онлайн: сразу после выбора пакета кредитов вы получаете на счет необходимую сумму. Все просто и понятно.
Что умеет “Гервин” в сфере генерации картинок?
- создавать изображения по текстовому описанию с нуля, учитывая все описанные детали и пожелания;
- генерировать проектные работы и модели зданий в срезе;
- генерировать реалистичные фото, в том числе и селфи.
Благодаря мощной модели GPT-4 и умению команды Gerwin адаптировать контент под использование в коммерческих целях сервис стал одним из топовых в России. Качество сгенерированных картинок действительно высокое — не придраться. Конечно, это не реализм в высшей степени, но достойное исполнение почти любого запроса. Для блога, аккаунта в соцсети, маркетинговой кампании, брендирования и многих других целей я порекомендовала бы данный сервис. Для полного понимания и сравнения с другими площадками (с вышеописанным “Кандинским”) нарисуем несколько примеров.
Начнем также с пейзажа. Хочется посмотреть, что выдаст нам “Гервин” по запросу “Холодный голубой океан окутывает волнами серый песок пляжа”. Здесь необходимо выбрать формат — это уже на ваше усмотрение, я оставлю стандартный 1:1. Из стилей выберу Mineral — мне понравилась превью. На мой взгляд, данный стиль отлично должен показать природу. Отмечу, что картинка-превью как раз помогает понять, какой из стилей наиболее подходит под конкретный запрос: портрет, природа, фото животного и прочие.
Сервис всегда предлагает вам 4 картинки. Вы можете их масштабировать под необходимые параметры, скачать, повторить генерацию по тому же запросу. Все созданные изображения сохраняются в вашем личном кабинете — доступ к нему только у пользователя. Каждый раз изображение получается уникальным и оригинальным и больше не повторяется.
Как вам волны океана? Мне очень даже “в кайф” — атмосферно, светло и по-летнему.
Создадим натюрморт, как и на примере с “Кандинским”.
При создании красочной фруктовой тарелки я остановила выбор на стиле Detailed View (слишком сочный и яркий капустный лист привлек мое внимание). Вообще программа умна: автоматически предлагает стили, подходящие для генерации натюрморта.
Создадим портрет с точно таким же промтом, какой использовали для “Кандинского”: “портрет девушки в шляпе с черными волосами и карими глазами”. Стиль Look подходит для более реалистичных картинок, но в нашем запросе было написано: “портрет”, поэтому иллюстрации получились, как с холста. Давайте просто попробуем сгенерировать девушку.
На втором скрине видно, что мы убрали слово “портрет”, чтобы добиться реалистичности фото, и поменяли стиль на Perfect. Гервин создал для нас снимки красивой девушки-ковбоя, похожей на модель, нежели на рисунок нейросети.
Теперь пришла очередь оценить Gerwin в качестве генератора фотоконтента для обзоров товаров и карточек онлайн-коммерции (“ВБ”, “Озон” и другие).
Итак, хорошие, качественные фото товаров для обзоров и продающих карточек готовы. Считаю, что сервис ребят хорош уникальностью и по-настоящему качественными изображениями, которые соответствуют запросам клиента, блогера, маркетолога, журналиста (специалиста своего дела, если обобщить).
Шедеврум
Нейросетевой сервис от “Яндекса”, работающий на основе YandexART (ранее функционировал на YandexGPT). Более напоминает социальную сеть: пользователи могут ставить друг другу лайки, выкладывать в ленту свои сгенерированные изображения, скачивать картинки, оставлять комментарии друг другу. На сайте вы сможете лишь посмотреть ленту публикаций пользователей сервиса. Для использования в полном объеме необходимо загрузить приложение — оно бесплатное. Количество генераций издатели не ограничили.
У “Шедеврума” и Gerwin есть общая особенность создания картинок: одна генерация дает 4 изображения, а вы уже выбираете наиболее подходящее.
Я сама довольно часто люблю воспользоваться данным сервисом даже для простой перезагрузки, вдохновения, появлений новых идей и образов в голове.
Примерно так выглядят результаты запроса: “Голубой океан на фоне неба касается волнами песочка на пляже” и “Лесная тропа возле речки”. Именно такой “Шедеврум” видит природу.
Сгенерирую натюрморт, чтобы показать сравнение с двумя предыдущими. В считанные секунды получились подобные изображения. Они отличаются сочностью, яркостью цветов, неповторимым исполнением. Мне нравится данный сервис, хотя бы потому что он удобен, мобилен, очень быстро генерирует и в большинстве случаев понимает запрос (не на 100%, но результат обычно лучше ожидаемого). Как правило, из 4 картинок можно выбрать одну действительно цепляющую.
Как обстоит дело с реалистичными изображениями? Проверим на практике.
Интересно, что “Шедеврум” за одну генерацию предлагает и портрет, и реалистичное фото, и иллюстрацию в стиле романтизма. Если бы я поменяла запрос на более конкретный и описала (как говорилось выше в памятке) детали, то, вероятнее всего, изображения были бы более идентичными друг другу. Но так даже интереснее.
Напоследок давайте с вами сгенерируем картинки для товарных карточек. Стоит учитывать, что у каждой платформы есть свои требования к фото (формат, разрешение, фон), поэтому мы не будем стараться подстроиться под каждую. Примеры будут для наглядности.
Нейросеть от “Яндекс” понимает четкость запроса, создает достойные изображения — их вполне можно использовать как дополнения в онлайн-коммерции, разумеется, не заменяя основного фотографа. “Шедеврум” не любит лишних слов и выражений (как и прочие сервисы), поэтому старайтесь быть конкретнее, опишите стиль, детали и цвета, без отрицаний. Нейросеть все понимает буквально — с этим тоже осторожнее, так как крылатые выражения вам сгенерируют не совсем так, как вы можете представить. Система российская, поэтому VPN вам для использования не нужен, обходные пути тоже искать не нужно — заходите в приложение и вперед.
Я подхожу к концу своего небольшого повествования-сравнения, в котором я попыталась рассказать на примерах про российские сервисы генерации картинок. Надеюсь, было полезно и информативно. На самом деле, это хорошо, когда вы сами начнете пробовать разное: где-то вас зацепит интерфейс и удобство, где-то — качество картинок, другая будет генерировать максимальный креатив. Возможно, вы найдете для себя сервис (даже из 3 названных), который вас устроит по всем параметрам.
Экспериментируйте! Благодаря собственному опыту и множествам попыток можно достичь небывалых высот в любой сфере. Все три проекта, на мой взгляд, являются творцами, служат отличным примером того, что оригинальность и креатив иногда могут быть там, где их не ожидаешь увидеть. Совмещая работу сразу 3 сервисов, можно не только менять стили и характеристики картинок, но и проследить руку “художника”, ведь каждая нейросеть обучалась разными людьми. Арт-зарисовки, карикатуры, портреты, живописные пейзажи на любой вкус и под любой промт.
Сама я организую работу примерно так: для более бюджетных проектов и сео-материалов буду использовать сервисы от Яндекс и Сбера — быстро, бесплатно, качественно и свежо. Если мне предстоит серьезный, дорогой проект, то отдаю, как правило, предпочтение Gerwin. Заплатить примерно 50 рублей за топовую картинку, которая станет идеальным оформлением шикарной статьи — почему и “да”.
Не бойтесь использовать генеративные фото в работе — качественные картинки никто не забанит, вас не высекут на площади и не закидают помидорами. Это прогрессивное решение каждого автора, маркетолога и прочих специалистов, которые ценят свое время, живут на волне изменений мира и любят эволюционировать.
Единственный совет: обращайте внимание на возможные дефекты генерации (шесть пальцев на руке, недорисовка ног, размытые очертания или детали, третий глаз). Иногда на просторах интернета новички или просто невнимательные авторы размещают не самые удачные публикации, этого можно легко избежать, просто сгенерировав заново.
Я оставляю вас со своими размышлениями наедине и желаю удачных генераций и громких проектов!