Как пользоваться ботами нейросетей ChatGPT и Midjourney в «Телеграме» — и стоит ли это делать
В «Телеграме» все чаще можно наткнуться на ботов, которые предлагают сгенерировать текст или картинки.
Разработчики обещают простой доступ к нейросетям без навыков программирования, необходимости устанавливать сторонний софт и с оплатой российскими картами. Таких ботов можно найти по прямому поиску, через рекламу или в многочисленных статьях в сети. Возникает вопрос: что скрывается за очередным сервисом с названием ChatGPT Bot или Midjourney Bot?
Мы разобрались, что обещают авторы нейросетевых ботов в «Телеграме», и что на самом деле получают пользователи.
Стоит ли искать нейросетевых ботов в «Телеграме»
Официальных ботов в «Телеграме» нет. У нейросетей Midjourney, Stable Diffusion и ChatGPT нет своего сервиса в мессенджере. Пользоваться ими можно только на официальных сайтах этих нейросетей — они указаны в конце нашего материала.
Разработчики ботов могут вводить в заблуждение. Многие боты называются так же, как официальные нейросети, хотя «под капотом» может скрываться что угодно. Разработчики не раскрывают версии моделей или выдают устаревшие версии нейросетей за актуальные.
Спустя несколько бесплатных попыток многие боты просят деньги за подписку. Расчет на то, что вы купите подписку, думая, что подписываетесь на официальный сервис. На деле вы получите модель нейросети неизвестного происхождения.
Для подключения нейросети к боту у нее должен быть открыт API — набор инструментов для разработчиков, с помощью которых одна программа может использовать другую. Встроить нейросеть в «Телеграм» можно, если разработчик имеет доступ к коду нейросети.
API открыт только у Stable Diffusion. Доступа к API Midjourney нет, а у ChatGPT и Dall-E 2 — платный и только для разработчиков.
Это означает, что Midjourney невозможно полноценно встроить в «Телеграм», а ChatGPT и Dall-E 2 — только по договоренности с компанией OpenAI.
Как работают боты ChatGPT в «Телеграме»
В «Телеграме» есть десятки ботов, которые выдают себя за ChatGPT: указывают сервис в названии, используют брендинг компании OpenAI. И на первый взгляд кажется, что все соответствует истине: боты, как и ChatGPT, генерируют посты, сценарии, тексты песен.
Неизвестно, что скрывается за ботом. У OpenAI доступно несколько языковых моделей для разработчиков. Доступ к API у них платный, при расчете тарифов используется система токенов. Работает она так: разработчики платят определенную сумму за тысячу токенов — сгенерированных частей слов. Тысяча токенов равна примерно 750 словам. Например, в этом абзаце около 60 токенов.
Пользователи ботов генерируют текст и таким образом тратят токены, за которые заплатили разработчики. Из-за этого во многих ботах есть лимиты на сообщения, множество рекламы или платная подписка. Вряд ли найдутся альтруисты, готовые предоставить сервис и платить за него из своего кармана. Зато можно сделать бота с ChatGPT для личного использования.
Самая дешевая модель Ada стоит 0,0004 $ за тысячу токенов, самая дорогая и продвинутая Davinci — 0,02 $ за тысячу токенов. GPT-3.5 — доступ к ее API открыли недавно, — на которой работает ChatGPT, стоит в десять раз дешевле Davinci — 0,002 $ за тысячу токенов.
Доступ к API GPT-4 обычным разработчикам пока получить непросто: нужно записываться в лист ожидания и дожидаться ответа от OpenAI. Модель самая дорогая из всех — 0,03 $ за тысячу токенов.
ChatGPT хуже GPT-4?
Open AI выпустила четыре версии языковой модели GPT, которая обучается на текстах из интернета и может генерировать осмысленные ответы на вопросы.
Базовый ChatGPT работает на версии GPT-3,5. Основное отличие от версии GPT-3 — наличие «памяти». Модель запоминает детали разговора и может строить ответы, основываясь на информации, которую ей уже сообщил пользователь. Работает с русским языком, но с английским справляется намного лучше.
GPT-4 лучше учитывает контекст, умеет распознавать изображения, хорошо работает с русским языком и сдает сложные экзамены на уровне отличников. В бытовом общении и простых задачах разница между GPT-3,5 и GPT-4 может быть едва заметной. Однако разрыв между версиями становится очевидным по достижении определенного порога сложности задачи. GPT-4 доступна по подписке на ChatGPT.
Я попыталась проверить несколько ботов, на какой версии GPT они работают: спрашивала об этом в самом чате. Боты отвечали, что используют GPT-3, то есть уже устаревшую языковую модель OpenAI.
GPT-3 генерирует связный текст на русском и английском языках, но не на том уровне, что ChatGPT. Модель не распознает контекст и создает менее креативный текст.
Есть ли боты именно с ChatGPT. Неизвестно. Боты в «Телеграме» — это черные ящики. Возможно, они используют модели OpenAI, а возможно, какие-то другие. Убедиться в этом на 100% нельзя, поскольку разработчики сами не раскрывают, на каком API работает бот
Я сталкивалась с ботами, генерирующими похожие на ChatGPT ответы. Возможно, они действительно работают на модели GPT-3.5. А может, это было совпадением. Но довольно часто боты генерировали ответы, которые по качеству и связанности на порядок хуже ChatGPT, хотя выдавали себя за нее.
Ботам с GPT-4 в названии сразу не верьте. OpenAI представила GPT-4 только 14 марта. Компания делилась наработками только со считаным числом тестеров, включая приложение Duolingo, банк Morgan Stanley и правительство Исландии. Разработчики смогут получить доступ к API GPT-4 в будущем — открыт лист ожидания.
А пока даже на официальном сайте ChatGPT с оплаченной подпиской Plus возможности GPT-4 ограничены — можно сгенерировать по 25 сообщений каждые три часа, лимиты могут время от времени меняться.
Вывод: пользоваться текстовыми ботами в принципе можно. Но вы не будете знать, какая языковая модель у вашего бота и за что вы платите.
Как работают боты для рисования картинок в «Телеграме»
В основном они работают по одному и тому же принципу — запускаете бота, вводите текстовую команду и получаете в ответ сгенерированное изображение. Разработчики ботов заявляют, что предоставляют легкий доступ к популярным нейросетям. Вот они:
- Midjourney — оригинальной нейросетью можно пользоваться через официального бота в «Дискорде». Но бесплатная версия ограничена 25 попытками, а оплатить премиум с помощью российской карты нельзя.
- Stable Diffusion — это нейросеть с открытым исходным кодом, при желании каждый может себе поставить сборку для генерации и пользоваться на компьютере. Но для этого необходимо мощное железо.
- Dall-E 2 — эту нейросеть создала компания OpenAI, разработчики ChatGPT. Доступ к ее API платный.
Главная проблема в том, что под ботами с названием Midjourney Bot или Dall-E 2 Bot может скрываться что угодно. Сложно с ходу сказать, какую модель использует тот или иной сервис в «Телеграме».
Проще всего со Stable Diffusion. В «Телеграме» действительно есть несколько рабочих ботов на основе нейросети. Они используют вычислительные мощности, которые предоставляют разработчики, и модель OpenJourney, имитирующую результаты генерации Midjourney.
Вероятно, выбирают именно эту модель, потому что Midjourney по простому запросу генерирует красивые картинки, а в Stable Diffusion нужно прописывать большие и детальные промпты, чтобы получить нечто похожее.
Но не нужно от таких ботов ожидать качества «настольной» Stable Diffusion, поскольку, как правило, они используют старые модели — новые выходят буквально каждую неделю. Картинки получаются в лучшем случае средние. По уровню они близки к Dream Studio — браузерной облегченной версии Stable Diffusion.
У Midjourney нет открытого API. Но в теории нейросеть можно как-то связать с «Телеграмом» через «Дискорд». Я обнаружила бота, генерирующего такие же картинки, как в нейросети, и по стилистике, и по деталям.
Но разрешение у получившихся в «Телеграме» картинок очень низкое. Бот дает одну бесплатную генерацию в сутки. Чтобы сделать апскейл картинки — увеличить ее разрешение — придется ждать следующего дня. После этого бот требует 199 ₽ в месяц за пять запросов в сутки. При этом в официальном Midjourney есть 25 бесплатных генераций, а минимальная подписка стоит 10 $ (772 ₽) и дает 3,3 часа генерации в месяц. За это время можно сгенерировать сотни картинок.
Опять же: скорее всего, мне еще повезло, что я наткнулась на бота с Midjourney в названии, который действительно рисует как Midjourney. С большей вероятностью под ботами-аналогами будет скрываться та же OpenJourney или другие бесплатные модели.
У Dall-E 2 платный API. Для разработчиков генерация одной картинки разрешением 512 × 512 пикселей стоит 0, 018 $. Расходы покрывать придется либо навязчивой рекламой, либо платной подпиской. К тому же нет гарантий, что бот действительно использует модель Dall-E 2, а не одну из версий Stable Diffusion. Бесплатно Dall-E 2 можно попробовать на сайте OpenAI.
Из официального есть разве что бот Сбера под названием Malevich, который использует модель ruDall-E. Из плюсов: Malevich, в отличие от остальных нейросетей, понимает запросы на русском языке.
Но ruDall-E уже сильно устарела: она выходила во времена, когда можно было удивить размытыми картинками с артефактами, лишь издалека похожими на изначальный запрос. Результаты не сравнятся с тем, что сейчас можно сгенерировать даже в бесплатных браузерных версиях.
Вывод. Ботам, которые работают на основе Stable Diffusion, можно доверять. Например, бесплатному Stable Diffusion Generator с неограниченным числом генераций, который поддерживает русский язык. Боты по Midjourney выглядят намного более сомнительными — не рекомендуем ими пользоваться. Dall-E 2 в теории можно встроить в «Телеграм», но гарантий вы не получите.
Как работают «мультимодальные» боты в «Телеграме»
Мультимодальными называют модели, умеющие обрабатывать разные типы данных и выполнять разноплановые задачи. В «Телеграме» как раз встречаются боты, у которых якобы есть доступ ко всем нейросетям сразу: они генерируют и картинки, и текст.
В меню обычно предлагают выбрать, какую модель вы хотите использовать. Один из вариантов будет бесплатным, но для использования остальных бот сразу потребует оплатить подписку.
Вывод: не стоит пробовать. Используемые модели неизвестны, а с вас будут требовать деньги.
С чем вы можете столкнуться при использовании ботов
Нейроботов в «Телеграме» десятки. И если вы все же решили воспользоваться одним из них, к выбору сервиса нужно отнестись аккуратно. Перечислю основные раздражающие моменты.
Требование подписаться на сторонние каналы. Для генерации недостаточно просто запустить бота. Многие предлагают подписаться на один или несколько каналов сразу, и только потом предоставляют доступ к функциям. Если сразу отписаться от канала, то доступ к боту пропадет.
Обычно каналы связаны с тематикой ИИ и нейросетей, но их качество оставляет желать лучшего. В таких случаях боты становятся способом для набора подписчиков и продвижения целой «сетки».
Постоянные уведомления. Боты присылают навязчивые уведомления с рекламой каналов. Частота таких сообщений у всех разная: может быть раз в сутки, может быть несколько раз в час. Отключить уведомления можно, только если остановить самого бота.
Неизвестное происхождение API. Часто боты утверждают, что они работают на определенной версии нейросети, но убедиться в этом наверняка нельзя. Разработчики телеграм-ботов либо вообще не предоставляют данные, либо вводят пользователей в заблуждение.
Требование оплатить подписку. Многие боты разрешают сгенерировать несколько картинок или текстов бесплатно, а затем требуют оплатить подписку. Учитывая, что API нейросети, как правило, неизвестно, вы покупаете кота в мешке.
Очереди. В бесплатных ботах очередь на генерацию картинки или текста может составлять от нескольких минут до часа. Иногда разработчики предлагают оплатить подписку, чтобы купить первые места в очередях.
Нестабильная работа. Боты с разной скоростью отвечают на запросы, но узнать о том, когда вам ответят, нельзя. Бывает такое, что отправляешь запрос, а получаешь ответ спустя час.
К тому же нет гарантии, что бот будет работать продолжительное время — часто они перестают отвечать на команды, если разработчики прекращают их обслуживать.
Сложность с определением, кому поступают данные. Внимательно смотрите, что отправляете в чат. Не стоит загружать картинки и писать текст с конфиденциальной информацией.
Как просто и удобно пользоваться нейросетями
Мы рекомендуем пользоваться официальными ресурсами.
ChatGPT — на официальном сайте. Требуется регистрация через почту и нероссийский номер телефона. ChatGPT также встроен в чат-бот Poe, поисковик Bing и сервис Notion AI. Альтернативы, использующие другую языковую модель: Writesonic, Neeva, Jasper.
Midjourney — при помощи дискорд-бота. Зарегистрируйтесь в «Дискорде», присоединитесь к серверу и начинайте генерировать. Дается 20 бесплатных попыток.
Stable Diffusion — облегченные версии доступны на бесплатных сайтах Dream Studio, PlaygroundAi или Visualise Studio. Либо можно воспользоваться нашей инструкцией и установить Stable Diffusion на компьютер.
Менее популярные нейросети — Different Dimension Me, Character AI, StarryAI, Perplexity, Dream By Wombo.
Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult.