Как пользоваться GPT-4 и что может новое поколение нейросети

13
Как пользоваться GPT-4 и что может новое поколение нейросети

14 марта компания OpenAI представила ИИ-модель GPT-4 — и сразу объявила о ее внедрении в приложения и сервисы.

Языковая модель известна в первую очередь по ChatGPT — прорывному ИИ-боту, с которым можно общаться, просить написать тексты любой сложности и искать информацию. GPT-4 намного мощнее нейросети в основе ChatGPT, которая работала на предыдущей версии, GPT-3.5. Новое поколение не только запоминает контекст и подстраивается под запросы пользователя, но и умеет обрабатывать изображения, а также «демонстрирует уровень человека» в ряде академических и профессиональных тестов.

Рассказываю, чем интересна GPT-4, которую уже начали внедрять в привычные сервисы вроде поисковика Microsoft Bing и приложения Duolingo.

Что может GPT-4

Обрабатывает не только текст, но и изображения. Это самое заметное отличие от привычного GPT-3.5. Новая мультимодальная модель научилась считывать изображения, понимать их контекст и работать с запросами на основе картинок. Можно отправить нейросети фото, график, скриншот или мем, а потом уже строить от этого текстовый запрос. Например, сфотографировать содержимое холодильника и предложить составить блюдо из продуктов в наличии.

Отвечает GPT-4 все еще только в текстовом виде, нельзя попросить нарисовать что-то. Также возможность обработки картинок пока есть только для ограниченного числа бета-тестеров и компаний. OpenAI обещает более широкое внедрение функции позже.

Обработка изображений в GPT-4 — пример OpenAI

Пользователь: что забавного в этой картинке? Опиши кадр за кадром.

GPT-4: на картинке — три панели с упаковкой адаптера Lightning.

Первая панель: смартфон с воткнутым VGA-адаптером (большой синий 15-контактный штекер, который обычно используют для компьютерных мониторов).

Вторая панель: упаковка от кабеля Lightning с изображением VGA-адаптера.

Третья панель: крупный план VGA-адаптера с небольшим штекером Lightning (используется для зарядки Айфонов и других устройств Apple) на конце.

Юмор — в абсурдности подключения большого и устаревшего VGA-адаптера к маленькому и современному порту для зарядки смартфона.

У работы с картинками есть и другие сценарии. Во время трансляции OpenAI выступил сооснователь компании Грег Брокман. Он сфотографировал лист своего блокнота с наброском макета сайта: название My Joke Website и страница с двумя «действительно смешными шутками», самая смешная часть которых должна показываться по нажатию кнопки.

Брокман загрузил фото в нейросеть и попросил: «Напиши код HTML/JS, чтобы превратить этот макет в красочный веб-сайт, где шутки заменены двумя настоящими шутками». Та написала код для простого сайта с учетом пожеланий.

Простой макет тестового сайта от руки. Источник: твиттер-аккаунт @gdb
Простой макет тестового сайта от руки. Источник: твиттер-аккаунт @gdb
Простой макет тестового сайта от руки. Источник: твиттер-аккаунт @gdb
Простой макет тестового сайта от руки. Источник: твиттер-аккаунт @gdb

Расширяет возможности работы с текстом. В OpenAI предупреждают: в бытовом общении и простых задачах разница между GPT-3.5 и GPT-4 может быть едва заметной. Однако разрыв между версиями становится очевидным по достижении определенного порога сложности задачи. GPT-4 на фоне предшественника более надежна, креативна и способна работать с «тонкими сценариями».

GPT-4 гораздо гибче подстраивается под пользователя, когда тот просит нейросеть отыгрывать определенную роль и придерживаться конкретной стилистики ответов. Также языковая модель лучше учитывает контекст, который ей дает человек. Для этого лимит на сообщение с текстовым запросом увеличили до 25 тысяч слов. Это значит, что GPT-4 можно отправлять целые документы и большие отрывки произведений.

Сдает сложные экзамены на уровне отличников. Это как раз результат того, что новая версия лучше справляется с нетривиальными задачами. Например, языковая модель могла бы поступить в Стэнфордский университет или победить на олимпиаде по биологии. За американский адвокатский экзамен Bar нейросеть получила оценку, сравнимую с результатами 10% лучших участников-людей.

Результаты различных экзаменов — сравнение GPT⁠-⁠4 и GPT⁠-⁠3.5. Источник: openai.com
Результаты различных экзаменов — сравнение GPT⁠-⁠4 и GPT⁠-⁠3.5. Источник: openai.com

Гораздо лучше работает с русским языком. Разработчики OpenAI отмечают, что GPT-3.5 хорошо работала преимущественно на английском языке. С ним она показывала результат 70,1% точности в бенчмарке MMLU — специальном тесте для языковых моделей, который состоит из 14 тысяч задач по 57 предметам.

Чтобы проверить GPT-4, разработчики перевели бенчмарк на 26 языков. В 24 случаях четвертое поколение модели показало результат выше, чем результат предшественника на «родном» английском. Согласно отчету OpenAI, результат для русского языка — 82,7%, это восьмое место в общем рейтинге. Лучший результат у нейросети на английском — 85,5%.

Все ли проблемы ChatGPT решили в GPT-4

Нет, не все. Сооснователь OpenAI Сэм Альтман признается: модель все еще «несовершенна и лимитирована». Новая версия кажется гораздо более впечатляющей при первом использовании, чем после активной работы с ней. Вот две главные проблемы, которые пока не решили.

Нейросеть все еще галлюцинирует. Галлюцинациями называют ошибки языковых моделей, когда те уверенно пишут полную неправду и выдают ее за факт. Поэтому в OpenAI советуют проводить дополнительную проверку всех ответов.

В то же время разработчики заявляют, что четвертое поколение на 40% лучше предыдущей версии по внутренней шкале «оценки фактов». Наибольшего прогресса нейросеть достигла в темах истории и точных наук. Больше всего ошибок проявляется при просьбе сгенерировать код и в целом при работе с кодом.

Результаты GPT⁠-⁠4 при решении задач на платформе Leetcode. Источник: openai.com
Результаты GPT⁠-⁠4 при решении задач на платформе Leetcode. Источник: openai.com

Нейросеть все еще не оперирует актуальными данными. Набор данных, на которых обучали предыдущую версию, был ограничен осенью 2021 года. То есть о любых новостях и фактах, которые появлялись после этого, GPT-3.5 не знала. И не могла учитывать новую информацию при ответах. В новой версии ситуация не изменилась.

Как пользоваться GPT-4

Вместе с презентацией технологии в ChatAI объявили, что GPT-4 появится или уже появился в ряде сервисов. Разработчики отметили, что модель используют даже власти Исландии для сохранения своего языка.

Вот где заявлена поддержка обновленной версии.

ChatGPT — бесплатная версия продолжит работать на GPT-3.5, а GPT-4 появился в платной подписке Plus. Пока использовать нейросеть можно с ограничениями — не более 100 запросов в течение четырех часов.

Bing — OpenAI и Microsoft тесно сотрудничают, последняя даже сделала для развития GPT суперкомпьютер. В поисковике Bing технологии OpenAI появились совсем недавно, и теперь компания подтвердила, что сервис работает на GPT-4. Bing — пока единственный способ попробовать нейросеть, которая располагает актуальными данными о мире.

Duolingo — у популярного приложения для изучения языков появилась специальная подписка Duolingo Max. Она добавляет две функции: Explain my Answer помогает разобрать ошибки с чат-ботом, а в режиме Role Play можно общаться с ИИ-собеседником. Работает пока только с испанским и французским языками.

Для Duolingo с ИИ даже поменяли привычный облик совы. Источник: openai.com
Для Duolingo с ИИ даже поменяли привычный облик совы. Источник: openai.com

Poe — это приложение от создателей популярного англоязычного ресурса с вопросами и ответами Quora. В приложении можно общаться и задавать вопросы чат-ботам, в том числе ChatGPT. GPT-4 появился в платной подписке сервиса.

Мы будем обновлять список по мере новых анонсов. Также можно записаться в лист ожидания для доступа к API GPT-4 — инструментам для разработчиков.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult.

Что думаете про GPT-4?
Комментарии проходят модерацию по правилам журнала
Загрузка
0

Думаю стоит ли мне начинать учиться на Python или пока я выучусь нейросеть будет кодить лучше меня. 😢 Ушла плакать в подушку.

2

A.I., Попросил написать код боту, сделал это за 10-15 секунд хехе

2

Grand87, говорят бот еще не может писать сложный код. Я только собиралась начать учиться, поэтому сейчас вся в раздумьях. Тратить почти год жизни и около 100 тысяч рублей и уступить боту((( ну печаль капец

0

A.I., бот может писать только простейший код, и часто ошибается. В сложную логику бот не может - сложная логика каждый раз уникальна, не на чем тренировать.

0

A.I., а почему бы не учить Python c помощью Chat?

2
0
Герой

30.03.23, 17:43

Отредактировано

Я записался в лист ожидания к API GPT-4.

1

Тимур, и сколько будешь ждать?

0
0

"Новая" формула тригонометрии от GPT-4 : The equation x^3 + y^3 = a^3 can be written as x = a cos(t), y = a sin(t) where t is a parameter1. Therefore, the parametric equation for the curve is x = a cos(t), y = a sin(t) where t is a parameter.

0
0
Герой реалити

01.05.23, 17:25

К сожалению, эти языковые модели пишут ответы иногда неверные. Важно проверять ответы, чтобы повысить их точность. А это занимает много времени. Ждём 5-ю версию)

0
0

Я думаю, что развитие идёт в правильном направлении.

0

Misha, заменит !! иначе бы ты тут не писал эту чушь.

0
0

Спасибо за статью, помогло подключиться и протестировать)

0

Сообщество