14 марта компания OpenAI представила ИИ-модель GPT-4 — и сразу объявила о ее внедрении в приложения и сервисы.
Языковая модель известна в первую очередь по ChatGPT — прорывному ИИ-боту, с которым можно общаться, просить написать тексты любой сложности и искать информацию. GPT-4 намного мощнее нейросети в основе ChatGPT, которая работала на предыдущей версии, GPT-3,5. Новое поколение не только запоминает контекст и подстраивается под запросы пользователя, но и умеет обрабатывать изображения, а также «демонстрирует уровень человека» в ряде академических и профессиональных тестов.
Рассказываю, чем интересна GPT-4, которую уже начали внедрять в привычные сервисы вроде поисковика Microsoft Bing и приложения Duolingo.
Чем GPT-4 лучше предыдущей модели
Обрабатывает не только текст, но и изображения. Это самое заметное отличие от привычного ChatGPT. GPT-4 — мультимодальная модель, она научилась считывать изображения, понимать их контекст и работать с запросами на основе картинок. Можно отправить нейросети фото, график, скриншот или мем, а потом уже строить от этого текстовый запрос. Например, сфотографировать содержимое холодильника и предложить составить блюдо из продуктов в наличии.
Отвечает GPT-4 все еще только в текстовом виде, нельзя попросить нарисовать что-то. Также возможность обработки картинок пока есть только для ограниченного числа бета-тестеров и компаний. OpenAI обещает более широкое внедрение функции позже.
Обработка изображений в GPT-4 — пример OpenAI
Пользователь: что забавного в этой картинке? Опиши кадр за кадром.
GPT-4: на картинке — три панели с упаковкой адаптера Lightning.
Первая панель: смартфон с воткнутым VGA-адаптером (большой синий 15-контактный штекер, который обычно используют для компьютерных мониторов).
Вторая панель: упаковка от кабеля Lightning с изображением VGA-адаптера.
Третья панель: крупный план VGA-адаптера с небольшим штекером Lightning (используется для зарядки Айфонов и других устройств Apple) на конце.
Юмор — в абсурдности подключения большого и устаревшего VGA-адаптера к маленькому и современному порту для зарядки смартфона.
У работы с картинками есть и другие сценарии. Во время трансляции OpenAI выступил сооснователь компании Грег Брокман. Он сфотографировал лист своего блокнота с наброском макета сайта: название My Joke Website и страница с двумя «действительно смешными шутками», самая смешная часть которых должна показываться по нажатию кнопки.
Брокман загрузил фото в GPT-4 и попросил нейросеть: «Напиши код HTML/JS, чтобы превратить этот макет в красочный веб-сайт, где шутки заменены двумя настоящими шутками». Та написала код для простого сайта с учетом пожеланий.
Расширяет возможности работы с текстом. В OpenAI предупреждают: в бытовом общении и простых задачах разница между GPT-3,5 и GPT-4 может быть едва заметной. Однако разрыв между версиями становится очевидным по достижении определенного порога сложности задачи. GPT-4 на фоне предшественника более надежна, креативна и способна работать с «тонкими сценариями».
GPT-4 гораздо гибче подстраивается под пользователя, когда тот просит нейросеть отыгрывать определенную роль и придерживаться конкретной стилистики ответов. Также языковая модель лучше учитывает контекст, который ей дает человек. Для этого лимит на сообщение с текстовым запросом увеличили до 25 тысяч слов. Это значит, что GPT-4 можно отправлять целые документы и большие отрывки произведений.
Сдает сложные экзамены на уровне отличников. Это как раз результат того, что GPT-4 лучше справляется с нетривиальными задачами. Например, языковая модель могла бы поступить в Стэнфордский университет или победить на олимпиаде по биологии. За американский адвокатский экзамен Bar нейросеть получила оценку, сравнимую с результатами 10% лучших участников-людей.
Гораздо лучше работает с русским языком. Разработчики OpenAI отмечают, что ChatGPT хорошо работала преимущественно на английском языке. С ним она показывала результат 70,1% точности в бенчмарке MMLU — специальном тесте для языковых моделей, который состоит из 14 тысяч задач по 57 предметам.
Чтобы проверить GPT-4, разработчики перевели бенчмарк на 26 языков. В 24 случаях четвертое поколение модели показало результат выше, чем результат предшественника на «родном» английском. Согласно отчету OpenAI, результат для русского языка — 82,7%, это восьмое место в общем рейтинге. Лучший результат у GPT-4 на английском — 85,5%.
Все ли проблемы ChatGPT решили в GPT-4
Нет, не все. Сооснователь OpenAI Сэм Альтман признается: модель все еще «несовершенна и лимитирована». GPT-4 кажется гораздо более впечатляющей при первом использовании, чем после активной работы с ней. Вот две главные проблемы, которые пока не решили.
Нейросеть все еще галлюцинирует. Галлюцинациями называют ошибки языковых моделей, когда те уверенно пишут полную неправду и выдают ее за факт. Поэтому в OpenAI советуют проводить дополнительную проверку всех ответов.
В то же время разработчики заявляют, что GPT-4 на 40% лучше предыдущей версии по внутренней шкале «оценки фактов». Наибольшего прогресса нейросеть достигла в темах истории и точных наук. Больше всего ошибок проявляется при просьбе сгенерировать код и в целом при работе с кодом.
Нейросеть все еще не оперирует актуальными данными. Набор данных, на которых обучали ChatGPT, был ограничен осенью 2021 года. То есть о любых новостях и фактах, которые появлялись после этого, GPT-3,5 не знала. И не могла учитывать новую информацию при ответах. В GPT-4 ситуация не изменилась.
Где попробовать GPT-4
Вместе с презентацией технологии в ChatAI объявили, что GPT-4 появится или уже появился в ряде сервисов. Разработчики отметили, что модель используют даже власти Исландии для сохранения своего языка.
Вот где заявлена поддержка GPT-4.
ChatGPT — бесплатная версия продолжит работать на GPT-3,5, а GPT-4 появился в платной подписке Plus. Пока использовать нейросеть можно с ограничениями — не более 100 запросов в течение четырех часов.
Bing — OpenAI и Microsoft тесно сотрудничают, последняя даже сделала для развития GPT суперкомпьютер. В поисковике Bing технологии OpenAI появились совсем недавно, и теперь компания подтвердила, что сервис работает на GPT-4. Bing — пока единственный способ попробовать нейросеть, которая располагает актуальными данными о мире.
Duolingo — у популярного приложения для изучения языков появилась специальная подписка Duolingo Max. Она добавляет две функции: Explain my Answer помогает разобрать ошибки с чат-ботом, а в режиме Role Play можно общаться с ИИ-собеседником. Работает пока только с испанским и французским языками.
Poe — это приложение от создателей популярного англоязычного ресурса с вопросами и ответами Quora. В приложении можно общаться и задавать вопросы чат-ботам, в том числе ChatGPT. GPT-4 появился в платной подписке сервиса.
Мы будем обновлять список по мере новых анонсов. Также можно записаться в лист ожидания для доступа к API GPT-4 — инструментам для разработчиков.
Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult.
Feron, chat gpt 3, не подключен к интернету и обладает данными до 2021 года, о чем постоянно уведомляет. К чему ваш скриншот тут?
Ivan, мне он написал вполне рабочий скрипт для автоматизации моих повседневных дел на незнакомом мне языке. Пришлось повозиться с ним конечно, но он выполняет все, о чем я систему просила. Сама я б ни за что за полдня такое не написала. Это не уровень шестилетки, это самое что ни на есть будущее 🤷🏻♂️
Ради неё купил подписку на ChatGPT про. Думаю, что развитие идет с бешеной скоростью. Через год, боюсь представить себе возможности. Особенно классно, что увеличили доступный размер контекста, значит можно будет скармливать нейросети длинные тексты, что раньше было затруднительно
BMO, как купил-то? Я тоже хочу, но не получается
Р, нужна иностранная карта, подключенный VPN и иностранный номер телефона, на который можно смс получить (я использовал Twilio).
BMO, а у вас чаты пропадают? У меня постоянно с ними ошибка, так было и до подписки и с ней :(
Убийца всех текстовых проф, скриньте.
(а потом просто всех)
Lexa, нейросети не убьют текстовые профессии(остальные тоже), а станут ещё одним удобным инструментом для текстовых профессий, а потом просто для всех. Скриньте
kurtsojn, нейросети значительно поднимут производительность труда т.е. условный копирайтер сможет писать с помощью нейросети в десять раз больше текстов. Вопрос - а нужно ли нам в десять раз больше текстов? Нет, соответственно потребность рынка в данных специалистах будет сокращаться. И не факт, что появятся новые профессии куда можно будет перебраться т.к. нейросети будут бить по очень широкому фронту.
Sergey, вы сначала почитайте, какой текст пишет нейросеть.
Лиса, будто живые копирайтеры не пишут тексты, которые без слез, ужаса и смеха читать можно? 😂🤣
Лиса, тут недавно она кому-то дипломный проект написала. Для меня это значит, что она пишет лучше 95% копирайтеров которые клепают бестолковые шаблонные описания к товарам в интернет магазинах.
Sergey, а кто-то читает дипломы?)))
Кроме шаблонных описаний, копирайтеры пишут огромное количество всего, в том числе, например, пуши, которые всплывают в приложениях. И тут важен контекст, целевая и еще 100 факторов. Можно нейросетке предложить написать несколько вариантов, но выбирать будет человек, у которого компетенции, насмотренность и т.д.
а насчет описаний для сайтов - согласна, их нейросеть напишет даже лучше)
Лиса, у меня читали диплом. И даже релевантные вопросы задавали. Так что да, где-то да читают, но не знают насчет того конкретного случая.
Лиса, А вы читали? Кажется, что ваши познания об ии остались на уровне Сири и гугл ассистента. Думаете почему их ии обрёл такую взрывную популярность? Потому что на порядок "умнее" и общаться может лучше многих людей.
Lexa, срочно переучиваюсь на дворника! Или эти тоже попадут в мясорубку?
Ветер, Дворники вечны! Переучивайся.
Александр, надеюсь на Яндекс практикуме есть соотвествующий курс, возьму кредит, пока не поздно
Ветер, за дворниками уже давно выехали
Ivan, жизнь боль
Lexa, ну настоящие писатели-то останутся? Да и допуск подобных сгенерированных текстов до SEO целиком и полностью отдан на усмотрение Гугла. Стоит этим ребятам так решить — и ни один сгенерированный текст попадать в выдачу не будет 🤷🏻♂️ А что есть SEO как не попытка надурить систему?
Карина, почти все профессии останутся, вопрос количества людей в них. Кучеры и наборщики тоже остались кое-где. А вот вычислители и телефонисты - всё.
Ivan, да не, телефонисты где-нибудь в скалах сидят, несут боевую службу 🤔 Коротковолновая связь у военных никуда не делась 🤔
Ivan, вчера с помощью ChatGPT собрал себе кастомный виджет на Qt5, получился на 90% рабочий вариант, допиливать минимально
BMO, генератор бойлерплейтов получился. Но он и так давно был уже, называется гугл плюс стековерфлоу. Смысл в том, что надо понимать, как допилить оставшиеся 10%. Хотя готов поверить, что фронт оно нормально напишет)
Ivan, попробуйте попросить рассказ на Английском. Выходит на порядок лучше, чем на русском. Ну и важный вопрос, вы какую версию использовали? 3.5 или 4? Четвертая очень сильно ушла вперёд
BMO, 3.5 ессно. На английском и спрашивал, на русском вообще полная белиберда выходила)
Лиса, попробуйте попросить GPT-4 написать текст на Английском. И обязательно в запросе уточните про синонимы, юмор и образы.
Отлично, 20 баксов в месяц того стоят. Пользуюсь для рутинной работы в духе "а перепиши-ка мне этот древний ангуляр на vue с компонентами", "напиши мне пример js скрипта с такими-то функциями". Глючит в неожиданных местах, но пользу приносит.
Жаль, новые апи не знает, выдает старые данные.
В деле написания тестов справляется получше Copilot.
Ivan, Хотя, если посмотреть с другой стороны, он вполне на уровне стажера-джуна. С них тоже получаю кривой нерабочий код. Если сможет научиться до мидла - я б его взял на работу.