Как пользоваться нейросетью «Шедеврум» для генерации рисунков на русском языке
В «Шедевруме» можно генерировать картинки, короткие тексты и даже видео.
В отличие от большинства аналогичных сервисов, «Шедеврум» хорошо понимает русскоязычные запросы и учитывает их при генерации. «Фильтрумы» позволяют перерисовать изображение в одном из предустановленных стилей — например, сделать из фото картинку с вязаной игрушкой.
Также в «Шедеврум» добавили генерацию текстов с YandexGPT. То есть можно написать короткую историю и в том же приложении ее проиллюстрировать. А еще «Шедеврум» — это целая соцсеть для авторов нейрокартинок.
Рассказываем, почему стоит обратить внимание на нейросеть и как она справляется с генерацией.
Что собой представляет «Шедеврум»
«Шедеврум» основан на нейросети YandexART. Она генерирует изображения методом каскадной диффузии: сначала создает картинки в соответствии с запросом, затем поэтапно увеличивает их разрешение и добавляет детали.
Нейросеть учитывает пожелания. Например, «фотореализм» или «высокая детализация».
«Шедеврум» генерирует качественные и детализированные изображения без артефактов на уровне предыдущих версий Midjourney или Stable Diffusion. Чем точнее вы опишите запрос, тем лучше получится результат: нейросеть хорошо следует промпту. Правда, настоящего фотореализма тут не добиться.
Ключевое отличие «Шедеврума» от конкурентов в том, что это не просто сервис для генерации картинок, а полноценная соцсеть для нейрохудожников, напоминающая «Инстаграм». Здесь можно подписаться на пользователей, ставить лайки и оставлять комментарии под сгенерированными картинками. В сервисе также есть алгоритмическая лента, которая предлагает интересные посты.
Под каждой опубликованной картинкой можно посмотреть запрос, по которому она сгенерирована. Это удобно: «Шедеврум» позволяет учиться промптингу на популярных в сообществе картинках и адаптировать чужие запросы для своих изображений.
За несколько месяцев в сообществе «Шедеврума» появились свои звезды и их подражатели. Некоторые авторы выработали собственный стиль — воспроизвести его по тем же запросам в других нейросетях не всегда возможно.
Как генерировать картинки в «Шедевруме»
Приложение доступно в российских магазинах на iOS и Android. Генерация работает только в мобильном приложении, на сайте такой возможности нет. Можно только посмотреть чужие картинки.
На главной странице нажмите на плюсик, выберите в меню «Изображение» и введите запрос на русском или английском. В промпте опишите, что хотите видеть на картинке: объект, действие, цвета, атмосферу, стиль изображения.
Различий в результатах в зависимости от языка нет. Но стоит помнить, что нейросеть обрабатывает запрос через перевод на английский. Это может быть важно, если у слов в запросе есть несколько вариантов перевода: «площадь» и «квадрат» — square, «ногти» и «гвозди» — nails. Результат может быть неожиданным.
Генерация занимает около одной минуты в зависимости от загруженности сервера. Затем приложение предложит четыре варианта картинки, как Midjourney. Выбранное изображение можно опубликовать в ленте и сохранить. Без публикации это сделать не получится.
В общей ленте все изображения публикуются рядом с именем автора. Другие пользователи могут лайкать ваши публикации, а в ленте появляются посты с наибольшим количеством лайков.
Популярным пользователям доступна и генерация четырехсекундных видео. В общем доступе такой возможности пока нет. Как ее получить, неизвестно.
Какие результаты получаются в «Шедевруме»
«Шедеврум» генерирует картинки в разрешении 1024 × 1024 пикселя. Других вариантов пока нет.
Нейросеть неплохо справляется с художественным стилем, но фотореализм у нее не получается. Хотя в новых версиях искажений и артефактов почти нет, все равно по картинке видно, что это пусть и фотореалистичный, но цифровой арт.
Редакция Т—Ж протестировала работу «Шедеврума». Показываем, что у нас получилось.
Что делают «фильтрумы»
«Шедеврум» может не только генерировать картинки, но и стилизовать изображения, загруженные пользователем. Например, представить человека с фото в виде вязаной игрушки или сделать брутального кота романтичным. Для этого используют «фильтрумы» — обученные на конкретном стиле модели нейросети YandexART.
Пока «фильтрумов» восемь:
- Зима — на картинке появляются точки снежинок или лежащий снег.
- Плюш — центральный объект с фото или рисунка становится мягкой игрушкой, причем не всегда похожей на оригинал.
- Неон — сиренево-фиолетовый киберпанк, причем людям почти всегда подрисовывают очки.
- Мульт — больше похож на аниме с не очень детальной прорисовкой.
- Пряжа — персонаж с фото становится игрушкой из ниток, цвета меняются, общая поза остается.
- Кисть — нейросеть перерисовывает фото в каком-нибудь подходящем художественном стиле.
- Цветы — изображение становится ближе к романтичному аниме, черты лица или морды мягче, моложе, нежнее и иногда с цветочками.
- Блоки — попытка стилизовать фото то ли под Lego, то ли под «Майнкрафт».
Чтобы воспользоваться «фильтрумами», нажмите плюсик на главном экране приложения и выберите один из них: каждый обозначен картинкой в меню. Если такая возможность не появилась, обновите «Шедеврум» до последней версии. А если и это не помогло, найдите в ленте пост, под которым стоит отметка «сделано в фильтруме», тапните на нее, а затем на поле «Использовать фильтрум».
Обработать можно любое изображение, в том числе сгенерированное, а результат — скачать без обязательной публикации в ленте. Если все же решите показать работу, помните, что оригинал тоже увидят все — по нажатию на картинку.
Не всегда работа фильтра хорошо заметна или устраивает по качеству. Зачастую лучше выбрать другое фото для обработки, сделать несколько попыток или поменять «фильтрум».
Мы применили «фильтрумы» к сгенерированной в «Шедевруме» картинке с котом и фотографии утки. Некоторые меняли изображение почти незаметно, другие — почти до неузнаваемости.
Как генерировать тексты в «Шедевруме»
В «Шедеврум» встроена также текстовая нейросеть YandexGPT. Можно с ее помощью создавать истории и сразу же их иллюстрировать. Или использовать другим привычным способом: решать задачи, составлять рецепты или просить объяснить термины.
На главном экране приложения нажмите плюсик на нижней панели, выберите пункт «Текст» и сформулируйте текстовый запрос.
Через минуту приложение выдаст текст и предложит выбрать к нему обложку. Отредактировать текст нельзя, можно только сгенерировать заново, при необходимости поправив запрос. За это отвечает иконка с карандашом. Можно добавить к тексту хэштеги или вовсе удалить результат.
Чаще всего к тексту будет предложено несколько вариантов обложки. Правда, они редко соответствуют написанному, хотя иногда перекликаются с запросом или заголовком текста. Откуда алгоритм берет предложенные изображения, неизвестно. Но если пролистать галерею до конца, будет возможность сгенерировать свой вариант картинки или опубликовать произведение без обложки.
У нейросети и приложения есть некоторые особенности, которые стоит учитывать.
Тексты нельзя сохранить до публикации. Как и картинки. Когда сочинение появится в ленте, можно будет нажать три точки в правом верхнем углу поста и скопировать текст или скачать картинку обложки.
В запросе лучше сразу указать действие, формат, сюжет или персонажа и стиль. Так результаты будут ближе к ожидаемым. Например, если просто написать в запросе «правило буравчика», нейросеть придумает историю про него или другой текст — всегда разный. А если конкретизировать — «объясни правило буравчика в физике так, чтобы понял пятилетний ребенок», — расскажет требуемое.
Результаты надо проверять, нейросеть активно галлюцинирует. Если вы пишете историю про приключения гусят, это некритично. А вот если просите что-то посчитать или объяснить, YandexGPT не предупредит, что не знает ответ и придумывает его на ходу.
Мы рассказываем разные истории о популярной культуре и тех, кто ее создает. Подписывайтесь на наш телеграм: @t_technocult