Нейросети для озвучки текста на русском языке: 8 программ с бесплатными опциями

1
Нейросети для озвучки текста на русском языке: 8 программ с бесплатными опциями
Аватар автора

Валерия Алексеева

озвучила текст про котенка

Страница автора

ИИ проговорят текст разными голосами.

Конечно, нейросети не заменят профессиональную живую озвучку, но помогут в несложных задачах. Почти во всех сервисах можно найти приятный голос, который не похож на типичного робота.

Я протестировала онлайн-сервисы, которые поддерживают русский язык. Для чистоты эксперимента все проговаривали один и тот же текст про котенка. Оценивала по пятибалльной шкале.

Качество озвучки: 📣📣📣📣📣
Лимит: один текст — до 5 тысяч символов, всего 10 тысяч символов
Платные функции: больше — от 5 $⁣ (478 ₽) в месяц, российской картой оплатить нельзя

Так выглядит сервис ElevenLabs внутри
Так выглядит сервис ElevenLabs внутри

ElevenLabs — крупнейшая площадка, которая специализируется на создании ИИ для синтеза речи. Их нейросети используют для озвучки аудиокниг, дубляжа видео и создания голосовых ассистентов. Сайт доступен только через иностранный IP-адрес.

Чтобы генерировать на русском, выберите режим Advanced и модель Eleven Multilingual v2. В ней доступно 17 голосов, которые поддерживают 29 языков, они распознаются автоматически. Перед генерацией есть несколько настроек:

  • Similarity — насколько близко генерируемая речь должна быть к образцу голоса;
  • Style Exaggeration — насколько выразительной должна быть речь. Может быть полезно для озвучки героев мультфильмов;
  • Speaker boost — тумблер усиливает характеристики голоса.

Вариант голоса можно выбрать по клику на выпадающее меню, там же можно послушать примеры. После ввода текста нажмите Generate speech — результат будет готов через несколько секунд. Чтобы скачать, нажмите на кнопку сохранения. Сервис сразу покажет, сколько символов у вас осталось.

Результат ElevenLabs

Голоса очень живые и звучат как актеры озвучки аудиокниг. Каждый читает будто с нужными эмоциями, интонацией и паузами.

Но у некоторых есть странные нюансы. Например, голоса Callum и Alice читают знак «—» как букву «А». Chris вообще прочитал знак тире на каком-то другом языке.

👍 Плюсы:

  1. Простой и удобный сайт.
  2. Живые голоса.
  3. Щедрые лимиты.

👎 Минусы:

  1. Некоторые голоса странно читают знаки и буквы.

Качество озвучки: 📣📣📣
Лимиты: за раз — один абзац текста, бесплатно — всего 20 попыток
Платные функции: чтобы снять лимиты, нужно купить пакет минут — он стоит от 0,05 $⁣ (4 ₽) за минуту, оплатить российской картой нельзя

Интерфейс Narakeet
Интерфейс Narakeet

Narakeet предлагает не только озвучку текста, но и инструменты для создания видео. Например, можно написать сценарий, а сервис автоматически озвучит его с помощью разных голосов и добавит изображения.

Чтобы озвучить текст, достаточно ввести его в поле для ввода или загрузить файл. Лимиты жесткие: 1 Кб текста — это примерно 1000 символов. Если указать в тексте ударения, то сервис это учтет.

Результат из Narakeet

Предварительно можно послушать, как звучат голоса. Русскоговорящих всего 24, но они роботизированные — не хватает выразительности и эмоциональности. Из всех мне понравились только три: Ольга, Владимир и Галина. Помимо голоса по кнопке «Больше опций» можно настроить параметры: выбрать громкость, скорость и формат аудио — M4A, MP3, WAV.

Сервис подойдет, если нужно озвучить несколько коротких отрывков, а требований к качеству голоса нет. Если попытаться загрузить большой файл, то Narakeet предложит оплатить подписку.

👍 Плюсы:

  1. Много голосов на выбор.
  2. Легко использовать.

👎 Минусы:

  1. Роботизированные голоса.
  2. Жесткие лимиты.
  3. Мало настроек.

Качество озвучки: 📣📣📣📣
Лимиты: 10 минут аудио
Платные функции: больше — от 2,7 ₽ за минуту

Ниже плашки с текстом появится кнопка «Синтезировать речь»
Ниже плашки с текстом появится кнопка «Синтезировать речь»

Минималистичный российский сервис. Можно выбрать из 10 разных голосов, настроить скорость, расставить паузы и ударения. Доступны обычные и про-голоса. Последние отличаются тем, что звучат более эмоционально и естественно.

Изначально сервис предлагает озвучить только 100 символов — это очень мало, примерно одно предложение. После регистрации вам начислят 5 бонусных рублей, которых хватит на 10 минут аудио обычным и 2 минуты про-голосом.

Рекомендую про-голос Дмитрия — его приятно слушать, он похож на человека и делает паузы в нужных местах. Из обычных приемлемо звучат Алиса и Джейн, хотя они достаточно роботизированные.

Результат из Robivox

Чтобы озвучить текст, скопируйте его в поле, выберите голос и настройки, а потом нажмите «Синтезировать речь». Результат сохраняется в MP3 или WAV.

Мне понравились премиум-голоса — звучат очень естественно и живо. Даже без платной подписки сервис можно использовать, чтобы озвучить небольшой ролик для соцсетей.

👍 Плюсы:

  1. Легко использовать.
  2. Есть настройки паузы и ударений голоса.

👎 Минусы:

  1. Жесткие лимиты.
  2. Мало бесплатных голосов.

Качество озвучки: 📣📣📣📣
Лимиты: до регистрации есть ограничение в 250 символов, после регистрации сервис дает 10 минут, которые тратятся каждый раз после озвучки текста
Платные функции: за 19 $⁣ (1816 ₽) в месяц сервис дает 24 часа озвучки, российской картой оплатить нельзя

Так выглядит интерфейс Murf
Так выглядит интерфейс Murf

Сервис просит создать аккаунт, чтобы бесплатно озвучить текст с настройками. После регистрации появляется возможность использовать 4 русских голоса — 2 мужских и 2 женских.

Чтобы озвучить, выберите язык и голос, вставьте текст и нажмите Play. Внутри сервиса удобно сравнивать результаты друг с другом — можно создавать блоки, выбирать хоть 10 голосов сразу и слушать по очереди.

После озвучки сервис предлагает скачать один или сразу все 10 файлов, выбрать канал, качество и формат: MP3, WAV, FLAC, A-LAW, μ-LAW. Но результат можно сохранить только после оплаты подписки.

Из настроек есть: высота, скорость, паузы. Также в личном кабинете можно сохранять голоса в избранное. Мне показалось, что сервис больше подходит для личного использования. Например, прочитать анекдот и отправить это друзьям или поиграться с настройками голоса и понять, что вам нравится.

Более натурально и живо звучат Владимир и София. Вместе с этим их голоса похожи на дикторские, поэтому создается ощущение, что ты слушаешь чтение книги перед сном. Иван и Ирина, напротив, читают довольно роботизированно. В их голосе слышится такой звук синтеза, который выдает робота.

👍 Плюсы:

  1. Живые и зрелые голоса.
  2. Много настроек.

👎 Минусы:

  1. В бесплатной версии нельзя сохранить результат.
  2. Мало русских голосов.
  3. Сервис просит создать аккаунт.

Качество озвучки: 📣📣📣📣
Лимиты: за раз — один абзац текста, бесплатно — только одна попытка
Платные функции: от 3,9 $⁣ (372 ₽) за 50 тысяч символов, чтобы увеличить количество символов, нужно купить подписку

Так выглядит интерфейс Voicer
Так выглядит интерфейс Voicer

В бесплатной версии есть ограничения только на озвучку. Максимальный размер текста — 1000 символов, а еще у голосов нет эмоциональной окраски. Это значит, что они будут озвучивать текст нейтрально, даже если поиграться с функционалом. Например, можно поменять бас, эхо, скорость, высоту, частоту и громкость.

Можно использовать 20 бесплатных голосов, среди которых есть 3 более-менее интересных — Оксана, Александр и Владислав. Как мне кажется, они звучат лучше остальных за счет интонации.

Чтобы озвучить, пишите текст, меняйте настройки будущего голоса и нажимайте «Озвучить». Результат можно скачать в MP3, WAV, OGG.

Результат из Voicer

Если вы хотите пойти дальше и работать с более длинными текстами, а еще и добавлять к ним эмоции, придется зарегистрироваться. Правда, после сервис попросит вас оплатить хотя бы минимальное количество символов, чтобы озвучить текст. Из интересного — можно сохранять голоса в избранное и менять их эмоцию. Доступно всего два варианта: Neutral и Robot.

Голоса на сайте звучат сыро. Многим сложно придумать применение. Но если вы разбираетесь в музыке и голосе, наверное, сможете классно его настроить. Я совсем не разбираюсь в басах и высоте озвучки, поэтому не смогла настроить голос приемлемо.

👍 Плюсы:

  1. Много бесплатных голосов.
  2. Есть разные настройки голоса — от скорости до баса и эхо.

👎 Минусы:

  1. В бесплатной версии у голосов нет эмоций.

Качество озвучки: 📣📣📣📣
Лимиты: за раз — 2000 символов, количество попыток — бесконечное
Платные функции: нет

Простой интерфейс Freetts
Простой интерфейс Freetts

Полностью бесплатный российский сервис. Озвучивать можно сколько угодно, есть только ограничение на количество символов за одну попытку. Однако за это придется заплатить качеством — голоса достаточно роботизированные.

Всего доступно 29 русскоязычных голосов. Они достаточно разнообразны, текст озвучивается без ошибок и даже с правильной интонацией, но сильно ощущается неестественность. Есть даже отдельный Максим-бот, чей голос вам точно знаком по сотням роликов с YouTube и TikTok. Мои фавориты — Захар, Полина, Дария.

Результат в Freetts

Чтобы озвучить текст, скопируйте его в поле, выберите голос и нажмите «Преобразовать в речь». Никаких дополнительных настроек нет. Результат можно скачать только в MP3.

Мне понравилась минималистичность и отсутствие рекламы. Идеально подходит для озвучки мемов или забавных видео, тем более что прогонять текст можно бесконечно.

👍 Плюсы:

  1. Большой выбор голосов.
  2. Легко использовать.
  3. Нет рекламы и платных подписок.

👎 Минусы:

  1. Роботизированные голоса.
  2. Нет никаких настроек.

Качество озвучки: 📣📣📣
Лимиты: от 500 до 1000 символов
Платные функции: от 0,6 ₽ за 1000 символов

Панель с кучей настроек Apihost
Панель с кучей настроек Apihost

Российский сервис с семью версиями нейросети, которые различаются лимитом по символам и количеством голосов. Например, в V1 — 1000 символов и 17 голосов, в V2 — уже 500 символов и 20 голосов. Модели различаются по качеству генерации, набору эмоций, скорости обработки.

Предварительно можно задать настройки: сделать голос нейтральным, дружеским или раздраженным. А еще выбрать высоту, скорость и длину паузы. Если хотите получить хорошую озвучку, обязательно ставьте ударения и знаки препинания. Без них не будет интонации и пауз.

Результат из Apihost

Чтобы озвучить текст, напишите или скопируйте его, выберите настройки и нажмите «Озвучить». Результат можно скачать в MP3 и WAV. Не рекомендую регистрироваться на сайте, потому что Apihost сразу потребует оплатить подписку. Бесплатные попытки доступны только без регистрации.

Понравилось, что сервис позволяет изменять голос как угодно — делает его детским или, наоборот, чересчур роботизированным. Однако из-за лимитов и постоянного требования оплатить подписку пользоваться им неудобно.

👍 Плюсы:

  1. Много настроек голоса — от скорости до высоты.
  2. Есть живые голоса и супер­роботизированные.

👎 Минусы:

  1. Жесткие лимиты.

Качество озвучки: 📣📣📣📣
Лимиты: 10 тысяч символов
Платные функции: от 150 ₽ за 30 тысяч символов

Так выглядит интерфейс Zvukogram
Так выглядит интерфейс Zvukogram

Российский сервис с огромным количеством разных голосов. Создатели предлагают использовать Zvukogram для озвучки ютуб-видео, бизнес-презентаций или сказок.

Действует система токенов. За один токен можно озвучить 1000 символов обычным голосом либо около 200 символов про-голосом. На сайте есть таблица, где сравниваются разные свойства голосов — интонация, эмоции, скорость.

Есть в том числе платные варианты: у них более высокая средняя оценка сообщества и больше опций для естественной имитации речи. Но мне показалось, что обычные голоса не звучат сильно хуже премиума. Мои фавориты — Денис, Катя, Оксана.

Результат Zvukogram

Без регистрации доступно пять токенов, после регистрации выдают десять. Однако они не суммируются, поэтому лучше сначала потратить первые пять, потом уже регистрироваться.

Чтобы озвучить текст, введите его в поле, выберите язык, голос и настройки — высоту, частоту, паузу предложений, параграфов и скорость. Под полем для ввода есть подробные инструкции, как размечать текст, — воспользуйтесь ими. Можно даже сгенерировать диалог между разными голосами. Нажмите на «Озвучить текст».

Токены будут списываться с баланса в реальном времени, так что вы сразу можете понять, на сколько озвучек вам хватит. Результат можно скачать в MP3, WAV, OGG, OPUS.

Сервис идеально подходит для озвучки сообщений и шуток. Если озвучивать небольшие тексты, то десяти токенов хватит надолго.

👍 Плюсы:

  1. Можно использовать для озвучки видео.
  2. Можно озвучить большие тексты.

👎 Минусы:

  1. Мало бесплатных голосов.
  2. Сложная система с токенами.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Валерия АлексееваКотенок — это маленький комочек счастья?
  • LeoВы за SteosVoice забыли. Сотни говорящих по-русски голосов и бесплатный телеграм бот0