GigaChat: что умеет нейросеть от Сбера и как ей пользоваться

GigaChat: что умеет нейросеть от Сбера и как ей пользоваться

И может ли она сравниться с ChatGPT
42
Аватар автора

Даша Лейзаренко

нагигагенерировала

Страница автора

Сбер в тестовом режиме запустил нейросеть GigaChat, которая генерирует текст и картинки.

Главная особенность бота в том, что он работает с русским языком. GigaChat может генерировать ответы на любые вопросы, а разработчики отмечают, что лучше всего у него получаются креативные тексты.

Рассказываем, как нейросеть справляется с задачами и как показывает себя на фоне главного конкурента — ChatGPT от компании OpenAI.

Что стоит знать про GigaChat

GigaChat — мультимодальная модель, которую Сбер анонсировал в конце апреля 2023 года. Она может отвечать на вопросы, вести диалог, писать код, придумывать планы презентаций, сочинять стихи, писать школьные эссе и выполнять другие текстовые задачи. Нейросеть отвечает как на русском, так и на английском языках.

На сайте Сбера говорится, что сильная сторона GigaChat — креатив. И интереснее всего использовать нейросеть, чтобы писать рекламные тексты, письма коллегам и рецепты блюд. При этом в ответах на вопросы, где требуются факты, она может ошибаться и галлюцинировать: разработчики называют такие ответы «творческими».

Текстовая часть GigaChat работает на языковых моделях ruGPT-3 и FRED-TP, основанной на архитектуре исследователей из Google. Первая вышла в 2021, а вторая — в 2023 году. По словам разработчиков, GigaChat обучена на 18 миллиардах параметров.

GigaChat также умеет генерировать картинки по текстовому описанию с помощью нейросетей ruCLIP и Kandinsky 2.1. Сервис создает изображения преимущественно по коротким запросам.

Как получить доступ к GigaChat

GigaChat находится в стадии бета-тестирования, причем доступ пока ограничен. Новости о раздаче инвайтов периодически публикуются в закрытом Телеграм-канале. С момента анонса приглашения протестировать бота получили около 40 тысяч пользователей. Авторы обещали дать доступ к нейросети всем подписчикам до 28 мая.

Я получила ссылку для регистрации 18 мая, когда ее разослали подписчикам Телеграм-бота @GigaChat_Test_bot. Если вы получили ссылку, то сможете воспользоваться GigaChat из любого браузера в личном пространстве на сайте developers.sber.ru. Чтобы туда попасть, требуется регистрация через Sber ID или Google-почту. Приложения для смартфонов у GigaChat нет.

Интерфейс у GigaChat похож на ChatGPT — это текстовый чат с возможностью создавать несколько диалогов. Во время разговора нейросеть может использовать информацию из предыдущих запросов, чтобы делать уточнения и корректировать ответы.

Интерфейс GigaChat
Интерфейс GigaChat

Как пользоваться GigaChat

Мы протестировали нейросеть в разных сценариях.

Простые поисковые запросы. Текстовые нейросети часто используют вместо поисковика, чтобы получить быстрый ответ на несложный вопрос, а не переходить по разным ссылкам. GigaChat с этим справляется далеко не во всех случаях.

Нейросеть может хорошо объяснить базовые концепции и понятия, которые никак не привязаны к актуальным событиям. Например, растолковать какое-нибудь физическое явление. Но GigaChat непостоянна — по одному и тому же запросу может расписать как огромный текст на несколько абзацев, так и короткую фразу в одно предложение.

К тому же с GigaChat нужно проверять факты. Но это касается любой языковой нейросети, включая ChatGPT. На этом этапе развития они время от времени галлюцинируют — уверенно выдают абсолютно неверную информацию.

В целом верно
В целом верно
Больше ответил про квантовые компьютеры, чем про квантовое бессмертие
Больше ответил про квантовые компьютеры, чем про квантовое бессмертие

Мы задали GigaChat более узкоспециализированные вопросы: «Что такое Skyrim», «Кто такой Хидео Кодзима» и «Сколько лет Илону Маску».

Во всех ответах нейросеть ошиблась и начала галлюцинировать, то есть выдумывать информацию на ходу. Бесплатная версия ChatGPT на аналогичные вопросы ответила верно.

В Скайриме нет таких фракций, а указанных консолей в 2011 году ещё не существовало
В Скайриме нет таких фракций, а указанных консолей в 2011 году ещё не существовало
Хидео Кодзима не разрабатывал Gran Turismo и Persona 5, никогда не был президентом Konami
Хидео Кодзима не разрабатывал Gran Turismo и Persona 5, никогда не был президентом Konami
Илон Маск родился 28 июня 1971 года, ему 51 год
Илон Маск родился 28 июня 1971 года, ему 51 год

Судя по всему, у нейросети нет доступа к актуальной информации — как и у ChatGPT, база данных которой ограничена 2021 годом. Но какой датой ограничена GigaChat, мы не знаем. Хотя на некоторые вопросы о событиях 2022 года она ответила верно и без искажений.

Если попытаться спросить, какой сегодня день, GigaChat каждый раз выдумывает новую дату, причем дни недели ей не соответствуют.

Судя по GigaChat, вслед за вторником следует суббота. Да и контекст сообщений тут нейросеть не запомнила
Судя по GigaChat, вслед за вторником следует суббота. Да и контекст сообщений тут нейросеть не запомнила

Код. На главной странице GigaChat есть пример того, как нейросеть пишет код на Python. Мы попросили код попроще — html-страницу синего цвета с надписью «Привет» посередине и актуальной датой.

Бот сгенерировал код без цвета, не отцентровал надпись и в целом допустил много грубых ошибок. Бесплатная ChatGPT на такой же запрос написала код без ошибок.

GigaChat никак не учел правила для style.css
GigaChat никак не учел правила для style.css

Генерация картинок. Преимущество GigaChat, которого нет у ChatGPT — в чат-боте можно сгенерировать картинки. В этом случае используется нейросеть Kandinsky 2.1, ее тоже сделал Сбер.

Картинки получаются хорошие, их можно на ходу править уточняющими запросами. Кроме того, Kandinsky лучше других нейросетей понимает запросы на русском языке. Ближайшим конкурентом, Midjourney, придется пользоваться на английском.

Генерация заняла полминуты — это быстро
Генерация заняла полминуты — это быстро

Школьные задачи. Домашнюю работу с помощью GigaChat пока сделать не получится: нейросеть плохо ведет подсчеты и приходит к неправильным ответам. Она неверно учитывает логику действий и часто отвечает совсем не на тот вопрос, который был задан.

Причем во время наших тестов мы попытались исправить нейросеть и указать ей на уход от ответа. Но она все равно настаивала на своем. Бесплатная ChatGPT такие же задачи решила правильно.

GigaChat говорит, что свежие грибы весят меньше сушеных. Хотя в условиях задачи прописано, что в свежих больше воды
GigaChat говорит, что свежие грибы весят меньше сушеных. Хотя в условиях задачи прописано, что в свежих больше воды
Это обычное квадратное уравнение, решение которого легко найти в интернете, но нейросеть не справилась и с ним
Это обычное квадратное уравнение, решение которого легко найти в интернете, но нейросеть не справилась и с ним

Прогулка по городу. Мы попросили составить маршрут прогулки по Красноярску: он получился реалистичный, но довольно короткий, если закрыть глаза на вымышленное заведение на набережной. Пройти по маршруту можно за несколько часов.

А вот с уточнениями GigaChat вообще не справилась: предложила семь раз поесть в разных местах, хотя ее просили добавить три заведения и расширить прогулку. По такому же запросу бесплатная ChatGPT составила более длинный маршрут, но выдумала названия ресторанов и двух локаций.

«Шашлыка-машлыка» в Красноярске не существует
«Шашлыка-машлыка» в Красноярске не существует
Как и ресторанов «Барбарис» и «Баклажан»
Как и ресторанов «Барбарис» и «Баклажан»

Сценарий. Разработчики говорят, что с креативом нейросеть справляется лучше, чем с фактами. Мы попросили придумать сценарий к серии «Губки Боба», но GigaChat как будто не учла того, что персонажи живут в подводном мире.

В итоге получился абсурдный сценарий, не соответствующий настроению шоу или характерам персонажей. ChatGPT по аналогичному запросу сгенерировала сюжет, учитывающий лор шоу и даже разбила серию на три акта.

Губка Боб не стал бы устраивать апокалипсис — это не в его характере
Губка Боб не стал бы устраивать апокалипсис — это не в его характере

Стихи. Мы попросили у GigaChat придумать стих про абсурдный концепт в стилях разных российских поэтов. Нейросеть справилась только с Маяковским, но не с первого раза. Сначала она просто скопировала его реальное стихотворение от и до. Со второй попытки получилось, когда градус абсурда увеличили.

На просьбу придумать стих в духе Пушкина, она выдала его стихотворение «К ***». А на запрос воссоздать стиль Бродского почему-то скопировала стих Есенина. Бесплатная ChatGPT придумала все стихи с нуля, но они не всегда соответствовали стилям поэтов, часто в них не было рифмы.

Это сгенерированный стих
Это сгенерированный стих
А это «Я помню чудное мгновенье…»
А это «Я помню чудное мгновенье…»
А это «Я сегодня спросил у менялы» Сергея Есенина
А это «Я сегодня спросил у менялы» Сергея Есенина

Рецепты. Мы спросили у GigaChat, как готовить карбонару. Она добавила в список ингредиентов панчетту, но не упомянула ее в самом рецепте. На просьбу уточнить этот момент, нейросеть сказала, что панчетту можно добавить уже в готовое блюдо, хотя это сырая грудинка, которую всегда обжаривают. Даже после нескольких попыток исправить рецепт все равно не получилось — панчетта в нем так и не появилась.

Кроме того, GigaChat порекомендовала одновременно использовать и сливки, и соус из яиц, пармезана и воды от пасты. Во всех известных рецептах карбонары рекомендуют либо первое, либо второе. Совет взбить яйца в блендере тоже сомнительный: кремовый соус из взбитых в пену яиц не получится. Как минимум карбонара по версии GigaChat вышла бы невкусной. ChatGPT предложила классический рецепт, для которого следует обжаривать панчетту, а сливки добавлять не нужно.

Лучше не пробуйте эти рецепты
Лучше не пробуйте эти рецепты
Лучше не пробуйте эти рецепты

Отыгрыш роли. GigaChat справилась с образом российского бандита из 90-х, но манеру речи знаменитости и поп-культурного персонажа изобразить не смогла.

Даже после уточнений и дополнительного описания Илона Маска, нейросеть не сумела войти в образ и генерировала стилистически нейтральный текст. Бесплатная ChatGPT тоже с трудом справляется с ролями известных персонажей.

Илон Маск и Марио не получились
Илон Маск и Марио не получились
Илон Маск и Марио не получились

Выводы

✅ Качественная работа с русским языком. Нейросеть обучалась на русскоязычных материалах, поэтому ответы выглядят более естественными, чем у ChatGPT. Результаты последней чаще всего похожи на автоматический перевод с английского.

✅ Есть «память». GigaChat запоминает детали разговора и может строить ответы, основываясь на информации, которую ей уже сообщил пользователь. Хотя нейросеть запоминает ответы, она плохо реагирует на исправления. Если усомниться в словах GigaChat, нейросеть либо отказывается исправлять ответы, либо меняет их на другие галлюцинации.

✅ Доступна генерация картинок. Запросы можно делать на русском языке, а изображения получаются хорошего качества. Аналогичных бесплатных сервисов не существует.

✅ Просто пользоваться в России. Не нужно регистрироваться с иностранного номера, искать иностранную карту для оплаты подписки и пользоваться VPN.

⛔️ Нет данных об актуальной информации. Неизвестно на базе данных каких лет нейросеть обучалась. Когда GigaChat пытается ответить на вопрос о недавних событиях, она перемешивает реальные факты с галлюцинациями.

⛔️ Непредсказуемый формат ответов. Может написать как короткое сообщение в два предложения, так и огромный текст на пять абзацев. Причем нейросеть по-разному реагирует на одинаковые запросы.

⛔️ Креатив достаточно посредственный. Нейросеть не всегда может сгенерировать творческие тексты с нуля или изобразить популярного персонажа. Судя по всему, в датасете не было многих популярных стилистик.

⛔️ Текстовая генерация ощущается устаревшей. Практически во всех задачах бесплатная ChatGPT, работающая на версии GPT-3.5, превосходит GigaChat. Ответы нейросети больше напоминают результаты генерации GPT-3.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Даша ЛейзаренкоУже успели попробовать GigaChat? Расскажите о своих впечатлениях:
  • Алексей ЩеголевНикакого сравнения с гопотой не выдерживает. С математикой все плохо, то есть ошибки на уровне арифметики. Попытки структурировать информацию показали, что генератор лепит отсебятину с изначальным текстом не связанную. Попытки генерации историй а рамках известных виртуальных вселенных показали, Ито контекст сеть держать не умеет и слабо удерживает факты сказанны в рамках диалога. Короче, если с гопотой магия все ещё присутствует даже сейчас и есть масса успешных кейсов применения , и кейсы будут множиться. С гигачатом магия рассыпалась после второго ответа а дальше были попытки понять куда эту хрень можно применить. В итоге вывод простой -- никуда.21
  • Max DrawdownПопробовал. Если коротко — бесполезный бредогенератор.14
  • Can you hear the silence?3
  • G LТоже запросил стихотворение про ежа в одном из тг-ботов chatgpt )))8
  • RomanГавно этот их Gigachat Ничерта не может нормально мне ответить. Ну либо я такой злостный тестировщик, или оно правда гавно Врет все время, факты спутывает, в общем от Сбера я другого и не ожидал. Как операционисты в окошках ( мой личный опыт раз 5) не могут помочь, приходится звать руководителя отделения, что бы сделали то что нужно клиенту. Так и чат ничего нормально не может. Если Тинькофф бeдет делать свой GPT, с блекджеком и плюхами, я бы пошел тренером. Вообще дюже интересно учить ИИ уму разуму. Если б она еще училась общаясь с пользователями, то за месяц бесплатного тестинга стала бы гением. СБЕРу надо свою армию старушек направить на обучение ГигаЧата , те б ему все рассказали как надо9
  • Роман СмирновВо всех своих гпт чатах в тг, онлайн версиях и вообще где угодно - результат был правильный. Удивительно что даже тут гигачат сфейлился)20
  • RomanЖелезяки сговорились и пи@#т вместе поддерживая друг друга. Думал хоть yaGPT от яндекса который в Алису встроили получше будет. но нет4
  • Evgenii MironovТот ИИ, которого мы достойны)3
  • ЛеликУ автора странные представления о стихах Маяковского, если считает, что нейросеть справилась с задачей3
  • Dirty AAndre, can you see the dark?2
  • NASDEFСпросите его площадь круга или квадрата.1
  • ЧёрноКотовый КоточёрновичШтош, пока не впечатляет. Подождём.0
  • MystiqueRoman, ну да, объяснили бы ему как определять кто шлюха, а кто наркоман :).1
  • MystiqueShev, запилить рекламу в ТЖ под видом обзора, обосрав при этом продукт - бесценнно! Вот такая у нас щас нативочка в тренде :)6
  • bozina_juliaЯ пользуюсь Gerwin, мне нравится. Надо эту тоже потестить, спасибо!0
  • Bari HamelsonКак я и думал фигня. Остаеться надежда на Яндекс2
  • Алексей КаретинMystique, конечно, иначе бы не получилось у Трампа хайпануть с его слоганом "make america great again"1
  • Крол ВсесильныйДоступ ограничен и забейте на него. Я получил, уже неделю работаю с ним. Супер бесполезная хрень, которая ничего не может нормально сформулировать. Нет, конечно, если вы школьник, который за девочками бегает, то ловите доступ и кадрите девок его письмами. Для него это максимум. Я в свое время сам писал одноклассницам, и письма, и оды, а здесь, к сожалению, это пик возможностей. Тоже скоро буду делать обзор, только не текстом, а на своём ютубе.1
  • Крол ВсесильныйRoman, ой,не говори. Я биографию доктора Буханского получил с седьмого раза сносную. И то только 500 слов и те надо редактировать. Ей-богу, лучше бы сам просто по историческим источникам пособирал, да порерайтил.0
  • Крол ВсесильныйМоё самое любимое.0
  • Крол ВсесильныйИ 1 часть. Просто огонь)) Меня так никто не бесил.0
  • Крол ВсесильныйBari, Ты уверен?1
  • Бутерброд ВолосатыйГигачад...светлая память4
  • ИлайDirty, Can you fix the broken? Пока нормально генерим))2
  • М РШашлык-машлык это образно0
  • Legendary SSИлья, can you feel… can yoouu feeeel my heaaart?2
  • Legendary SSБутерброд, он что сдох?0
  • Богдан Карасёнкову меня одного этот гигачат тупо не работает ? Привет, это GigaChat. К сожалению, сейчас я не могу вам ответить.0
  • ОлегВрет, как сивый мерин, и не сознается в ошибках, а если сознается, ир после этого вновь повторяет то, что сделала по ее же признанию неправильно. Очень трудно добиться толка. Нельзя доверять, если вы сами не сможете проверить результат.0
  • zakoireneА GigaChat платный?0
  • Михаил БолычевскийВчера, 9 октября 2023-го, достала реклама этой сберовской новинки. Задал вопрос: где сейчас находится авианосец "Рональд Рейган"? Почему задал именно такой вопрос - прочитал в зарубежных новостях, что он на подходе к Южной Корее. Ну ИИ мне ответил, что авианосцы такого класса находятся в портах приписки. Где Рональд Рейган - неизвестно.0
  • Михаил БолычевскийВчера, 9 октября 2023-го, достала реклама этой сберовской новинки. Задал вопрос: где сейчас находится авианосец "Рональд Рейган"? Почему задал именно такой вопрос - прочитал в зарубежных новостях, что он на подходе к Южной Корее. Ну ИИ мне ответил, что авианосцы такого класса находятся в портах приписки. Где Рональд Рейган - неизвестно.0
  • Валерий Бутенкоuser2538658, "банк" и "разработал" - не увязывается. А вот "банк" и "купил" - уже больше похоже на правду. А теперь "теория заговора" - зачем банку "покупать" технологию "генерации чего-то там"? Да бы выполнять свою функцию - делать дееееньгииии 😁0
  • Валентин Кундратпока что так же плоха как и Греф0
  • Антон ЛапинУспел. Это не настоящая нейросеть. Даёт заготовленные ответы на достаточно разные вопросы с точностью до слова. Ошибки не признаёт. Ошибок масса. Пользоваться - только нервы портить0
  • Александр Р.Роман, исправили, видимо0
  • Вадим СкворцовПочитал пользовательское соглашение, обращайте внимание. Нужно десять раз подумаю что загружать к ним и нужно ли это делать. Пока есть другие альтернативы, не интересно.0

Вот что еще мы писали по этой теме