Новая модель o3, бесплатные функции ChatGPT, Sora: главные анонсы с декабрьских презентаций OpenAI
20 декабря завершились «12 дней OpenAI» — большая конференция компании.
Каждый рабочий день сотрудники OpenAI показывали новые функции ChatGPT и других сервисов. Расскажу про самые важные и интересные анонсы.
Анонсировали модель o3, которая умеет рассуждать еще лучше, чем o1
Компания показала, как работают модели o3 и o3-mini, которые умеют строить сложные цепочки рассуждений. OpenAI не смогла назвать их o2, потому что этот товарный знак уже занят. Пользоваться новыми моделями пока могут только ученые и исследователи безопасности. Доступ к младшей версии o3-mini откроют в январе 2025 года. Когда можно будет протестировать полную версию, пока неизвестно.
По подсчетам OpenAI, o3 работает на уровне доктора наук. Модель проверили на тесте ARC. Он определяет способность нейросетей решать задачи «на лету» с помощью абстрактного мышления так же, как думает человек.
Тест выглядит как набор визуальных задач, где нужно распознать закономерность, понять ее логику и применить на новом примере. Модель o3 прошла тест на 87,5%. Для сравнения: обычный человек показывает результат около 85%, а ИИ до этого набирали 50%.
Главная особенность o3 — умение проверять свои ответы с помощью внутренней цепочки рассуждений. Благодаря этому модель может планировать свои действия, анализировать ошибки и объяснять решения.
Также o3 позволяет устанавливать время, которое она потратит на «размышления». Чем больше времени выделяется на обработку задачи, тем точнее и качественнее будет результат.
Выпустили Sora — нейросеть для генерации видео
OpenAI открыла доступ к Sora, которую представила еще в марте 2024 года. Нейросеть создает реалистичные видео высокого качества и точно следует запросу. Генерировать можно по текстовому промпту, картинке или ролику.
В Sora также есть продвинутые инструменты: возможность режиссировать ролики, создавать начало и концовки, смешивать разные видео. Нейросеть доступна по платной подписке на ChatGPT, но не внутри чат-бота, а на отдельном сайте. Он не откроется в России, понадобится иностранный IP-адрес.
В бесплатную версию ChatGPT добавили продвинутые функции
Режим Canvas стал доступен всем пользователям. Это интерфейс ChatGPT для удобной работы с текстом и кодом. Он позволяет генерировать контент в отдельном окне, которое выглядит как обычный редактор для текста или кода. Рядом находится чат с нейросетью, где можно попросить ее найти ошибки и самостоятельно их исправить.
Кроме того, Canvas стал совместим с пользовательскими ботами GPTs. А также теперь в нем можно запускать код на Python. Еще в Canvas появились горячие клавиши, которые позволяют мгновенно вставить текст в ChatGPT и открыть его в интерфейсе.
Улучшенный поисковик в ChatGPT теперь тоже доступен для всех пользователей, а также на мобильных устройствах. Изначально его представили в начале ноября 2024 года только для платных подписчиков.
Раньше нейросеть выходила в интернет по своему усмотрению, если пользователь спрашивал о чем-то актуальном. Теперь ChatGPT «гуглит» любой запрос, если выбрать режим Search. В нем есть удобные виджеты с погодой, результатами спортивных матчей или котировками компаний с графиками.
Кроме того, поиск по интернету внутри ChatGPT стал доступен в голосовом режиме, в том числе на русском языке. Можно также установить расширение для Chrome, которое сделает поисковик нейросети основным по умолчанию в браузере.
Показали новые функции ChatGPT для платных подписчиков
Полная версия модели o1, которая умеет «рассуждать». Она отвечает медленнее, чем остальные версии, потому что «думает» пошагово. Ход мыслей можно посмотреть после того, как ChatGPT сгенерирует ответ. Превью модели показали в сентябре 2024 года, теперь она доступна в полном формате.
Благодаря навыку «рассуждений» модель o1 лучше анализирует данные, суммаризирует тексты, генерирует код и решает сложные научные задачи. В OpenAI позиционируют ее как вариант для студентов и профессионалов.
Поддержка распознавания видео в голосовом режиме. Продвинутый голосовой режим в ChatGPT получил «зрение». Нейросеть может понять, что находится на экране устройства, или «посмотреть» видео с камеры. Например, можно попросить оценить технику заваривания кофе или вместе сделать домашнее задание.
Проекты в ChatGPT упрощают работу, которая требует нескольких диалогов и загрузки разных файлов. Несколько чатов с нейросетью можно объединить в одну рабочую область.
В каждом проекте можно задать отдельные инструкции и загрузить файлы, чтобы нейросеть учитывала их контекст. Проекты поддерживают режим Canvas, анализ данных, генерацию картинок в Dall-E 3 и поиск в интернете.
Работа с приложениями на macOS. ChatGPT теперь может работать напрямую с большим количеством аппов для разработки и создания заметок, например Warp или Notion. Полный список доступен на сайте OpenAI. Отправлять запросы можно как текстом, так и в продвинутом голосовом режиме.
Работает это так: ChatGPT считывает контент из открытого на компьютере приложения и генерирует ответы на его основе. Например, можно попросить исправить часть кода из редактора, не копируя весь кусок в чат с нейросетью.
Добавили дорогую подписку за 200 $
OpenAI представила тарифный план ChatGPT Pro за 200 $ (20 300 ₽) в месяц. Он дает безлимитный доступ к моделям o1, o1-mini, GPT-4o и голосовому режиму. На более дешевых планах есть суточные ограничения, которые постоянно меняются.
Подписка Pro также включает 500 быстрых генераций в месяц в нейросети для видео Sora. Младшие тарифы предполагают генерацию только 50 роликов в месяц, поэтому для полноценной и активной работы с Sora придется покупать дорогую подписку.
Еще за 200 $ пользователи получают доступ к эксклюзивной модели o1 Pro, которая использует больше вычислительных мощностей и дает лучшие ответы.
Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult