Новая модель o3, бесплатные функции ChatGPT, Sora: главные анонсы с декабрьских презентаций OpenAI

Даша Лейзаренко

открыла 12 подарков

20 декабря завершились «12 дней OpenAI» — большая конференция компании.

Каждый рабочий день сотрудники OpenAI показывали новые функции ChatGPT и других сервисов. Расскажу про самые важные и интересные анонсы.

Анонсировали модель o3, которая умеет рассуждать еще лучше, чем o1

Компания показала, как работают модели o3 и o3-mini, которые умеют строить сложные цепочки рассуждений. OpenAI не смогла назвать их o2, потому что этот товарный знак уже занят. Пользоваться новыми моделями пока могут только ученые и исследователи безопасности. Доступ к младшей версии o3-mini откроют в январе 2025 года. Когда можно будет протестировать полную версию, пока неизвестно.

По подсчетам OpenAI, o3 работает на уровне доктора наук. Модель проверили на тесте ARC. Он определяет способность нейросетей решать задачи «на лету» с помощью абстрактного мышления так же, как думает человек.

Тест выглядит как набор визуальных задач, где нужно распознать закономерность, понять ее логику и применить на новом примере. Модель o3 прошла тест на 87,5%. Для сравнения: обычный человек показывает результат около 85%, а ИИ до этого набирали 50%.

Презентация модели o3

Главная особенность o3 — умение проверять свои ответы с помощью внутренней цепочки рассуждений. Благодаря этому модель может планировать свои действия, анализировать ошибки и объяснять решения.

Также o3 позволяет устанавливать время, которое она потратит на «размышления». Чем больше времени выделяется на обработку задачи, тем точнее и качественнее будет результат.

Выпустили Sora — нейросеть для генерации видео

OpenAI открыла доступ к Sora, которую представила еще в марте 2024 года. Нейросеть создает реалистичные видео высокого качества и точно следует запросу. Генерировать можно по текстовому промпту, картинке или ролику.

В Sora также есть продвинутые инструменты: возможность режиссировать ролики, создавать начало и концовки, смешивать разные видео. Нейросеть доступна по платной подписке на ChatGPT, но не внутри чат-бота, а на отдельном сайте. Он не откроется в России, понадобится иностранный IP-адрес.

Ролик, сгенерированный в Sora

В бесплатную версию ChatGPT добавили продвинутые функции

Режим Canvas стал доступен всем пользователям. Это интерфейс ChatGPT для удобной работы с текстом и кодом. Он позволяет генерировать контент в отдельном окне, которое выглядит как обычный редактор для текста или кода. Рядом находится чат с нейросетью, где можно попросить ее найти ошибки и самостоятельно их исправить.

Кроме того, Canvas стал совместим с пользовательскими ботами GPTs. А также теперь в нем можно запускать код на Python. Еще в Canvas появились горячие клавиши, которые позволяют мгновенно вставить текст в ChatGPT и открыть его в интерфейсе.

Как пользоваться режимом Canvas в ChatGPT для удобной работы с текстом и кодом

Улучшенный поисковик в ChatGPT теперь тоже доступен для всех пользователей, а также на мобильных устройствах. Изначально его представили в начале ноября 2024 года только для платных подписчиков.

Раньше нейросеть выходила в интернет по своему усмотрению, если пользователь спрашивал о чем-то актуальном. Теперь ChatGPT «гуглит» любой запрос, если выбрать режим Search. В нем есть удобные виджеты с погодой, результатами спортивных матчей или котировками компаний с графиками.

Кроме того, поиск по интернету внутри ChatGPT стал доступен в голосовом режиме, в том числе на русском языке. Можно также установить расширение для Chrome, которое сделает поисковик нейросети основным по умолчанию в браузере.

Показали новые функции ChatGPT для платных подписчиков

Полная версия модели o1, которая умеет «рассуждать». Она отвечает медленнее, чем остальные версии, потому что «думает» пошагово. Ход мыслей можно посмотреть после того, как ChatGPT сгенерирует ответ. Превью модели показали в сентябре 2024 года, теперь она доступна в полном формате.

Благодаря навыку «рассуждений» модель o1 лучше анализирует данные, суммаризирует тексты, генерирует код и решает сложные научные задачи. В OpenAI позиционируют ее как вариант для студентов и профессионалов.

Поддержка распознавания видео в голосовом режиме. Продвинутый голосовой режим в ChatGPT получил «зрение». Нейросеть может понять, что находится на экране устройства, или «посмотреть» видео с камеры. Например, можно попросить оценить технику заваривания кофе или вместе сделать домашнее задание.

Как работает функция видео в голосовом режиме в ChatGPT

Проекты в ChatGPT упрощают работу, которая требует нескольких диалогов и загрузки разных файлов. Несколько чатов с нейросетью можно объединить в одну рабочую область.

В каждом проекте можно задать отдельные инструкции и загрузить файлы, чтобы нейросеть учитывала их контекст. Проекты поддерживают режим Canvas, анализ данных, генерацию картинок в Dall-E 3 и поиск в интернете.

Как работают проекты

Работа с приложениями на macOS. ChatGPT теперь может работать напрямую с большим количеством аппов для разработки и создания заметок, например Warp или Notion. Полный список доступен на сайте OpenAI. Отправлять запросы можно как текстом, так и в продвинутом голосовом режиме.

Работает это так: ChatGPT считывает контент из открытого на компьютере приложения и генерирует ответы на его основе. Например, можно попросить исправить часть кода из редактора, не копируя весь кусок в чат с нейросетью.

Добавили дорогую подписку за 200 $

OpenAI представила тарифный план ChatGPT Pro за 200 $⁣ (20 300 ₽) в месяц. Он дает безлимитный доступ к моделям o1, o1-mini, GPT-4o и голосовому режиму. На более дешевых планах есть суточные ограничения, которые постоянно меняются.

Подписка Pro также включает 500 быстрых генераций в месяц в нейросети для видео Sora. Младшие тарифы предполагают генерацию только 50 роликов в месяц, поэтому для полноценной и активной работы с Sora придется покупать дорогую подписку.

Еще за 200 $ пользователи получают доступ к эксклюзивной модели o1 Pro, которая использует больше вычислительных мощностей и дает лучшие ответы.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

сервисы актуальное интернет приложения нейросети

Даша ЛейзаренкоОжидали большего от презентаций «12 дней с OpenAI»? Расскажите в комментариях:

Забаненый за правдуНе знаю что все так восторгаются o1, рассуждает она так себе, мне кажется результат даже хуже чем 4о. На практике конечно можно будет только понять, на презентации любые данные можно специально давать4
Дмитрий РодионовЗабаненый, ты сильно недооцениваешь рассуждения, я многократно протестировал эту модель, делюсь своими выводами. Для повседневных или даже будет лучше сказать типовых задач, конечно лучше 4o, однако в случае когда тебе надо в чем то разобраться, лучше o1. Приведу пример, я писал приложение оно получилось большим, так что уже полностью ему не сможешь скормить весь код со всех взаимосвязанных файлов и когда ты даёшь кусок кода 4o и просишь его выполнить определенную задачу он выполняет поставленную задачу, однако при этом ломает общую целостность всего кода, когда ты дашь версии o1 ту же задачу, он начнет рассуждать, он видит ссылки и поймет что наверное где-то это используется ещё и не будет сильно изменять код, он добавит нужные функции не нарушая общую целостность, его рассуждения очень полезны в этом плане. Его рассуждения полезны везде где есть какие-то цепочки, думаю это не лучший пример, но самый простой, если посадить 4o за шахматную доску, он выберет лучший ход в данной ситуации, когда o1 начнет рассуждать о дальнейших действиях и выберет лучший ход на будущее12
stufently TЗабаненый, вообще отлично рассуждает там где надо, просто ему нужны соответствующие запросы, на который чо ответить не может3
ТучаОбычной подписки за 20$ прекрасно хватает для выполнения ежедневных рабочих задач)1
Петр Магера«Sora не откроется в России, понадобится иностранный IP-адрес» Сайт из Бельгии или Австралии тоже не откроется, нужен IP США2
stufently TЗабаненый, она охренеть как высока, то есть она выше чем у большей части разумного населения0
Алёна ИгоревнаЗабаненый, поддержу. На примере самых разных текстов и форматов (от технических задач до «запили мне пересказ лора вахи в стиле треда из твиттера) 4о справляется лучше и не имеет голову на тему «А не кажется ли вам что этот чат неэтичен».1
AlorasКак бы не хорош был ChatGPT, но как же он любит придумывать факты! Изучать информацию с помощью него тяжко, постоянно нужно прописывать условия что бы выдавал достоверное. Пофиксили бы это)5
marymaryВроде в новогодних шапочках сидят, а настроение совсем не то...0
Туманный туманmarymary, бедолага, что у тебя произошло1
АлексейЗабаненый, код пишет на много лучше. Как минимум длиннее в два раза. И более правильно пишет. Практически всегда (90%) код пишет с первого раза без синтаксических ошибок.0
Дмитрий ИлюхинAloras, Чтобы это пофиксить, придётся делать новую модель. Эта в принципе не может иначе, она всегда останется (бредо)генератором, это её сущность.0
Дмитрий ИлюхинНе понял. У меня например $20-подписка и где о3? Все о ней говорят, а у меня её нет. Она только в $200 что ли?0