Нейросети для рас­шифровки аудио: 6 бесплат­ных сервисов

4
Аватар автора

Даша Лейзаренко

транс-кри-би-ру-ет

Страница автора

ИИ умеет не только генерировать картинки и текст, но и транскрибировать аудио. Конечно, нейросети делают это не так хорошо, как люди: придется подправить знаки и некоторые ошибки. Но если нужно расшифровать небольшую запись, а не трехчасовой доклад, то такие сервисы вполне подойдут. Собрали несколько бесплатных нейросетей для расшифровки аудио.

Whisper

Лимиты: на бесплатных моделях нет
Стоимость: 9,99 $⁣ (800 ₽) в месяц за продвинутые модели — более быстрые и качественные
Поддерживает ли русский: да

Приложение для macOS, которое работает на нейросети Whisper от компании OpenAI. Бесплатно доступны две модели, их нужно предварительно скачать. Язык определяется автоматически. Сервис качественно и быстро транскрибирует, расставляет знаки препинания и разделяет текст на абзацы

Riverside

Лимиты: 2 часа аудио
Стоимость: больше — от 15 $⁣ (1400 ₽) в месяц; российской картой не оплатить
Поддерживает ли русский: да

Достаточно перетащить файл на сайт, выбрать один из 100 языков и дождаться транскрибации. Корректно расшифровывает русскую речь и расставляет знаки препинания. Из минусов — не разделяет спикеров в диалоге и не поддерживает популярный формат M4A

Otter.AI

Лимиты: 300 минут в месяц, 30 минут записи разговора за раз
Стоимость: больше — от 8,33 $⁣ (800 ₽) в месяц; российской картой не оплатить
Поддерживает ли русский: нет

Создан для расшифровки онлайн-встреч. Записывать звонки не придется: сервис можно подключить напрямую к Google Meets или Zoom. Разделяет речь спикеров, но поддерживает только английский язык

Salute Speech Bot

Лимиты: до 200 000 символов
Стоимость: от 1000 ₽ в год за дополнительные символы
Поддерживает ли русский: да

Телеграм-бот от Сбера работает на нейросети Salute Speech. В нем можно расшифровывать чужие голосовые сообщения и таким образом заменить ботом функцию из платной подписки Telegram Premium. Недостаток — не до конца расшифровывает длинные сообщения

Teamlogs

Лимиты: 15 минут
Стоимость: дальше — 6 ₽ за минуту
Поддерживает ли русский: да

Онлайн-сервис с интерфейсом на русском. Поддерживает 13 форматов аудио, разделяет речь спикеров, позволяет отредактировать расшифровку перед скачиванием. Дополнительно с помощью ИИ может составить конспект и выделить ключевые слова

Писец

Лимиты: 10 минут бесплатно, потом — расшифровка на низких скоростях
Стоимость: 1290 ₽ за 5 часов быстрой расшифровки
Поддерживает ли русский: да

Сайт разделяет текст до пяти спикеров, расставляет знаки препинания и тайм-коды, но может ошибаться в отдельных словах. С бесплатным тарифом расшифровка иногда занимает несколько часов в зависимости от очереди

👾 Еще больше о нейросетях

В рассылке «Капча». Рассказываем про новые ИИ и полезные сервисы, разбираемся в интернет-культуре, делимся актуальными мемами и трендами

Что еще можно делать с помощью нейросетей:

Даша ЛейзаренкоКакими сервисами для расшифровки аудио пользуетесь?
  • Boris KölnГугл-переводчик на смартфоне умеет расшифровывать аудио, а также распознавать текст фото0
  • Наталья БурикЕсть бесплатные методы!! Пользуюсь иногда, рассказывать не хочу, гугл в помощь! Но тоже с ошибками часто, приходится корректировать. Почему автор не расскажет про бесплатные методы раз в такой теме вариться? Ааа??? Или статья тоже ИИ написана?0
  • Денис ЛюбскийНаталья, конечно, написано ИИ!0