Интернет
90K

Как пользоваться GPT-4 и что умеет актуальное поколение нейросети

14
Как пользоваться GPT-4 и что умеет актуальное поколение нейросети
Аватар автора

Евгений Кузьмин

написал этот текст сам — или нет

Страница автора
Аватар автора

Катя Лебедева

еще и рисует

Страница автора

14 марта компания OpenAI представила ИИ-модель GPT-4 — и сразу объявила о ее внедрении в приложения и сервисы.

GPT-4 — мощная мультимодальная модель от OpenAI. Она умеет писать качественные тексты даже на русском, лучше предыдущих поколений придерживается заданной роли, а главное — может работать с картинками и данными в других форматах. В ChatGPT модель доступна только по платной подписке..

Рассказываю, чем интересна GPT-4 и где ее можно попробовать бесплатно, в том числе с российского IP-адреса.

Что может GPT-4

Языковая модель известна в первую очередь по ChatGPT — прорывному ИИ-боту, с которым можно общаться, просить его написать тексты любой сложности и искать информацию.

GPT-4 намного мощнее GPT-3.5 — нейросети предыдущего поколения, на которой и сейчас работает бесплатная версия ChatGPT. Новая модель не только запоминает контекст и подстраивается под запросы пользователя, но и обладает мультимодальностью. То есть, может, например, анализировать изображения и выходить в интернет. А еще «демонстрирует уровень человека» в ряде академических и профессиональных тестов.

Вот чем она лучше GPT-3.5.

Анализирует изображения. Модель научилась считывать изображения, понимать их контекст и работать с запросами на основе картинок. Можно отправить нейросети фото, график, скриншот или мем, а потом уже строить от этого текстовый запрос. Например, сфотографировать содержимое холодильника и предложить составить блюдо из продуктов в наличии.

Обработка изображений в GPT-4 — пример OpenAI

Пользователь: что забавного в этой картинке? Опиши кадр за кадром.

GPT-4: на картинке — три панели с упаковкой адаптера Lightning.

Первая панель: смартфон с воткнутым VGA-адаптером (большой синий 15-контактный штекер, который обычно используют для компьютерных мониторов).

Вторая панель: упаковка от кабеля Lightning с изображением VGA-адаптера.

Третья панель: крупный план VGA-адаптера с небольшим штекером Lightning (используется для зарядки Айфонов и других устройств Apple) на конце.

Юмор — в абсурдности подключения большого и устаревшего VGA-адаптера к маленькому и современному порту для зарядки смартфона.

У работы с картинками есть и другие сценарии. Еще на презентации GPT-4 сооснователь OpenAI Грег Брокман сфотографировал лист своего блокнота с наброском макета сайта: название My Joke Website и страница с двумя «действительно смешными шутками», самая смешная часть которых должна показываться по нажатию кнопки.

Брокман загрузил фото в нейросеть и попросил: «Напиши код HTML/JS, чтобы превратить этот макет в красочный веб-сайт, где шутки заменены двумя настоящими шутками». Та написала код для простого сайта с учетом пожеланий.

Простой макет тестового сайта от руки. Источник: @gdb / X Corp.
Простой макет тестового сайта от руки. Источник: @gdb / X Corp.
Сайт по сделанному от руки наброску. Источник: @gdb / X Corp.
Сайт по сделанному от руки наброску. Источник: @gdb / X Corp.

В чате с GPT-4 можно не только проанализировать картинку, но и нарисовать ее. Благодаря мультимодальности нейросеть может взаимодействовать с Dall-E 3. Она отлично понимает запросы на естественном языке, сама превращает идею пользователя в подробный промпт и генерирует изображения — от логотипов до комиксов. Профессиональные фоторедакторы так заменить пока не получится, а вот быстро визуализировать идеи — да.

Вносить правки можно так же, как и в тексты: в диалоге с чат-ботом. Например, вы можете попросить переодеть персонажа или обратить внимание на детали в запросе, которые нейросеть проигнорировала.

Расширяет возможности работы с текстом. В OpenAI предупреждают: в бытовом общении и простых задачах разница между GPT-3.5 и GPT-4 может быть едва заметной. Однако разрыв между версиями становится очевидным по достижении определенного порога сложности задачи. Модель GPT-4 на фоне предшественника более надежна, креативна и способна работать с «тонкими сценариями».

GPT-4 гораздо гибче подстраивается под пользователя, когда тот просит нейросеть отыгрывать определенную роль и придерживаться конкретной стилистики ответов. Также языковая модель лучше учитывает контекст, который ей дает человек. Теперь нейросеть помнит до 25 тысяч слов беседы. Это значит, что GPT-4 можно отправлять целые документы и большие отрывки произведений — в том числе приложенными файлами в форматах PDF, DOCX, XSLX и других, не копируя текст вручную.

Сдает сложные экзамены на уровне отличников. Это как раз результат того, что новая версия лучше справляется с нетривиальными задачами. Например, языковая модель могла бы поступить в Стэнфордский университет или победить на олимпиаде по биологии. За американский адвокатский экзамен Bar нейросеть получила оценку, сравнимую с результатами 10% лучших участников-людей.

Результаты различных экзаменов — сравнение GPT⁠-⁠4 и GPT⁠-⁠3.5. Источник: openai.com
Результаты различных экзаменов — сравнение GPT⁠-⁠4 и GPT⁠-⁠3.5. Источник: openai.com

Гораздо лучше работает с русским языком. Разработчики OpenAI отмечают, что GPT-3.5 хорошо справлялась с заданиями преимущественно на английском языке. С ним она показывала результат 70,1% точности в бенчмарке MMLU — специальном тесте для языковых моделей, который состоит из 14 тысяч задач по 57 предметам.

Чтобы проверить GPT-4, разработчики перевели бенчмарк на 26 языков. В 24 случаях четвертое поколение модели показало результат выше, чем было у предшественника на «родном» английском. Согласно отчету OpenAI, результат для русского языка — 82,7%, это восьмое место в общем рейтинге. Лучший результат у нейросети на английском — 85,5%.

Что такое GPT-4 Turbo и что она может

Все ли проблемы ChatGPT решили в GPT-4

Нет, не все. Сооснователь OpenAI Сэм Альтман признается: модель все еще «несовершенна и лимитирована». Новая версия кажется гораздо более впечатляющей при первом использовании, чем после активной работы с ней. Вот две главные проблемы, которые пока не решили.

Нейросеть все еще галлюцинирует. Галлюцинациями называют ошибки языковых моделей, когда те уверенно пишут полную неправду и выдают ее за факт. Поэтому в OpenAI советуют проводить дополнительную проверку всех ответов.

Нейросеть не всегда оперирует актуальными данными. Набор данных, на которых обучали предыдущую версию, был ограничен осенью 2021 года, затем диапазон расширили до января 2022. То есть о любых новостях и фактах, которые появлялись после этого, GPT-3.5 не знала и не могла учитывать новую информацию при ответах. Для модели GPT-4 эту дату постепенно приближают к текущей. Плюс в некоторых сервисах, включая собственно ChatGPT, нейросеть может выходить в интернет, поэтому актуальные данные из интернета часто все же доступны.

Как пользоваться GPT-4

Уже на старте было объявлено, что модель используют даже власти Исландии для сохранения своего языка.

Вот где можно попробовать GPT-4:

ChatGPT — бесплатная версия продолжит работать на GPT-3.5, а GPT-4 появился в платной подписке Plus. Пока количество запросов к новой модели ограничено. Лимиты со временем меняются, но ориентировочно можно делать от 20 до 50 запросов каждые три часа.

Microsoft Copilot — OpenAI и Microsoft тесно сотрудничают, последняя даже сделала для развития GPT суперкомпьютер. В ИИ-ассистента встроены GPT-модели, в том числе GPT-4. Доступ к ним бесплатный, но периодически сервис переключается на нейросеть предыдущего поколения.

Poe — это приложение от создателей популярного англоязычного ресурса с вопросами и ответами Quora. В приложении можно общаться и задавать вопросы чат-ботам, в том числе ChatGPT. GPT-4 появился в платной подписке сервиса.

Perplexity.ai — сервис, который можно использовать как нейросетевой поисковик или ИИ-ассистента. Генерирует ответы и дает ссылки на источники, а в платной версии предоставляет доступ к последним моделям нейросетей, в том числе GPT-4 и Claude 3. В режиме Pro пять запросов в день можно сделать бесплатно. Сервис доступен в России.

Chatbot Arena — сервис для сравнения ответов из разных нейросетей, в том числе GPT-4 и GPT-4 Turbo. Доступен из России, но с ограничениями по количеству запросов в день.

YesChat — дает доступ к самым новым моделям основных нейросетей. Сервис доступен из России, есть бесплатный тариф с ограниченным числом запросов: для GPT-4 — до 10 в день.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult.

Что думаете про GPT-4?
Комментарии проходят модерацию по правилам журнала
Загрузка

Сообщество