лучшие русские голосовые движки

синтезаторы речи с русскими голосами

Все чаще в повседневной жизни стали использовать синтезаторы речи. Синтезаторы речи, как становится видно уже по одному названию, осуществляют синтез речи, то есть форматируют письменный текст в устный.

Благодаря этому можно учить новые иностранные слова с правильным произношением, читать книги не отвлекаясь от своих дел или озвучить текст презентации реалистичными голосами. Изначально разработкой таких программ занимались организации, специализирующиеся на технике для людей с проблемами зрения.

Сейчас же, любой пользователь может скачать одну из программ, установить ее на свой компьютер или телефон и синтезировать речь, в том числе и русскую.

Для этого было разработано множество различных программ, приложенный и даже целых систем. К сожалению, не все из них предназначены для русскоязычной аудитории.

Список синтезаторов речи:

1. Acapela

Acapela — один из самых распространенных речевых синтезаторов во всем мире. Программа распознает и озвучивает тексты более, чем на тридцати языках. Русский язык поддерживается двумя голосами: мужской голос — Николай, женский — Алена.
Женский голос появился значительно позднее мужского и является более усовершенствованным.

Прослушать, как звучат голоса, можно на официальном сайте программы. Достаточно лишь выбрать язык и голос, и набрать свой небольшой текст.

Кстати, для мужского голоса был разработан отдельный словарь ударений, что позволяет достичь еще большей четкости произношения.

Установка программы проходит без проблем. Разработаны версии для операционных систем Windows, Linux, Mac, а также для мобильных ОС Android u IOS.

Программа платная, скачать ее можно с официального сайта Acapela.

2. Vokalizer

Вторым в нашем списке, но не по популярности является движок Милена от разработчика программы Vocalizer компании Nuance.
Голос звучит очень естественно, речь чистая. Есть возможность установить различные словари, а также подкорректировать громкость, скорость и ударение, что не маловажно.
Как и в случае с Акапелой, программа имеет различные версии для мобильных, автомобильных и компьютерных приложений. Прекрасно подходит для чтения книг.

Скачать все версии Vokalizer и русскоязычный движок Милена можно на официальном сайте производителя программы.

3. RHVoice

Синтезатор речи RHVoice был разработан Ольгой Яковлевой. Программа озвучивает русские тексты тремя голосами: Елена, Ирина и Александр. Подробнее об установке и применении, а также прослушать голоса Вы сможете в прошлой статье

Код синтезатора открыт для всех, программы же абсолютно бесплатны.
RHVoice выпущена в двух вариантах: как отдельная программа, так и как приложение к NVDA.
Все версии можно скачать с официального сайта разработчика.

4. ESpeak

Первая версия бесплатного синтезатора речи eSpeak была выпущена в 2006 году. С тех пор компания-разработчик постоянно выпускает все более усовершенствованные версии. Последняя версия была представлена в конце весны две тысячи тринадцатого года.

eSpeak можно установить под следующие операционные системы:

Возможна также компиляция кода для Windows Mobile, но делать ее придется самостоятельно.
А вот с мобильной ОС Android программа работает без проблем, хотя русские словари еще не до конца разработаны. Русскоязычных голосов много, можно выбрать на свой вкус.

Для разработчиков будет интересно узнать, что C++ код программы доступен в сети. Скачать программу, а также посмотреть ее код можно на официальном сайте.

5. Festival

Festival — это целая система распознавания и синтеза речи, которая была разработана в эдинбургском университете.
Программы и все модули абсолютно бесплатно и распространяются по системе open source. Скачать их и ознакомиться с демо-версиями можно на официальном сайте университета Эдинбурга.

Русский голос представлен в одном варианте, но звучание довольно хорошее и ясное, без акцента и с правильной расстановкой ударений.
К сожалению, программа пока может быть установлена только в среде API, Linux. Также есть модуль для работы в Mac OS, но русский язык пока поддерживается не очень хорошо.

Вместо послесловия

Стоит отметить, что любой из вышеприведённых синтезаторов отлично исполнен, но выбор программы индивидуален. Всё объясняется различным произношением голосов. Смею посоветовать второй вариант с голосом Милена. ОЧень выразительный голос, насыщенное звучание и приятная во всех смыслах интонация голоса!

Источник

Мы Опубликовали Качественный, Простой, Доступный и Быстрый Синтез Речи

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Вокруг темы синтеза речи сейчас много движения: на рынке есть огромное число тулкитов для синтеза, большое число закрытых коммерческих решений за АПИ (как на современных технологиях, так и на более старых, т.е. «говорилки») от условных GAFA компаний, большое количество американских стартапов, пытающихся сделать очередные аудио дипфейки (voice transfer).

Но мы не видели открытых решений, которые бы удовлетворяли одновременно следующим критериям:

Мы попытались учесть все эти пункты и представить комьюнити свое открытое некоммерческое решение, удовлетворяющее этим критериям. По причине его публичности мы не заостряем внимание на архитектуре и не фокусируемся на каких-то cherry picked примерах — вы можете оценить все сами, пройдя по ссылке.

Краткий Обзор Решений

Данная статья не ставит своей целью глубокий технический обзор всех доступных решений. Мы хотим просто обрисовать некий ландшафт из доступных вариантов с минимальной степенью готовности. Понятно, что мы не рассматриваем многочисленные тулкиты, а смотрим в первую очередь какие есть более-менее готовые решения с ненулевой библиотекой голосов и подобием поддержки / комьюнити:

Конкатенативные модели (появившиеся до DL бума). Из того, что хоть как-то поддерживается и живо и можно запустить «as-is» без археологических раскопок, я нашел только rhvoice (я глубоко не копал, но есть целые форумы, посвященные использованию голосов из Windows, но вряд ли это можно назвать поддерживаемым решением). На момент, когда я пользовался проектом ради интереса, он по сути был заброшен, но потом у него появился новый «хозяин». К плюсам такого рода решений можно отнести их скорость и нетребовательность к ресурсам (исключая ресурсы, чтобы заставить это работать). Очевидный и основной минус — звучит как говорилка. Менее очевидный минус — довольно тяжело оценить стоимость обладания. Качество звучания: 3+ по пятибалльной шкале;

Tacotron2 + WaveNet (оригинальный WaveNet принимал на вход лингвофичи, но для такотрона поменяли на более удобные мелспектрограммы). Основная проблема — очень медленный инференс ввиду авторегрессионности модели и необходимость запретительно большого количества ресурсов и времени. Качество звучания: 4+;

Tacotron2 + WaveRNN (тоже с переходом от лингвофичей к спектрограммам). Вокодер заметно быстрее предыдущего: при использовании всех хаков можно получить даже риалтайм синтез без GPU, правда естественность звука несколько просядет. Качество звучания: 3.5-4;

Tacotron2 + Parallel WaveNet. Упомянутый выше медленный вокодер был использован в качестве учителя для получения новой довольно быстрой параллельной модели вокодера: с ней стал возможен синтез быстрее риалтайма, но все еще на мощных GPU. Из недостатков — дистилляция требует качественную учительскую модель и соответствующую схему обучения. Качество звучания: 4+;

Tacotron2 + multi-band WaveRNN. Тоже развитие предыдущих идей, тоже распараллеливание в некотором смысле — здесь доступен синтез быстрее риалтайма уже на CPU. Однако, не слишком популярная работа, меньше имплементаций и поддержки, хотя некоторые подходы хороши и были успешно использованы в более поздних моделях; Качество звучания: 3.5-4+;

Tacotron2 + LPCNet. Интересная идея про сочетание DL и классических алгоритмов, что может дать буст по скорости до подходящего для продакшена уровня и на CPU, но требует вдумчивого допиливания для качественных результатов. Качество звучания: 3.5-4+;

Многочисленные решения на базе Tacotron2 + Waveglow от Nvidia как нынешний стандарт для задачи синтеза речи. Никто не пишет про свой «секретный соус» (например как 15.ai делает голос по 15 минутам и сколько там моделей в цепочке). Есть много имплементаций и репозиториев, которые «копируют» чужой код. Может звучать на cherry-picked примерах неотличимо от живых людей, но когда смотришь реальные модели от комьюнити, качество заметно варьируется, а детали улучшенных решений не раскрываются. Архитектурно к такотрону и его аналогам по скорости и цене обладания претензий нет, но Waveglow очень прожорлив к ресурсам как на тренировке, так и в продакшене, что делает его использование по сути нецелесообразным. Качество звучания: 3.5-4+;

Замена Tacotron2 => FastSpeech / FastSpeech 2 / FastPitch, то есть уход к более простой сетке (на базе forced-align от такотрона и миллион более хитрых и сложных вариантов). Из полезного дает контроль темпа речи и высоты голоса, что неплохо, вообще упрощает и делает более модульной конечную архитектуру. Немаловажно, что сетка перестает быть рекуррентной, что открывает просторы для оптимизаций по скорости. Качество звучания: 3.5-4+;

Оценки Качества и Примеры Аудио

Чтобы не вдаваться в дебри, мы поступили максимально просто: синтезировали аудио из валидационной выборки датасетов (

200 файлов на спикера), смешали с оригинальными аудио этой же выборки и дали группе из 24 людей для оценки качества звучания по пятибалльной шкале. Для 8kHz и 16kHz оценки собирали раздельно, градация оценок — [1, 2, 3, 4-, 4, 4+, 5-, 5] — с большей детализацией для более качественного звука.

Всего было поставлено 37,403 оценок. 12 человек сделали оценку полностью. Еще 12 людей успели проставить только от 10% до 75% оценок. Дальше для каждого спикера мы просто посчитали среднее (в скобочках приведено стандартное отклонение). Расчет среднего от медиан по каждому аудио завышает средние оценки на 0.1 — 0.2 балла, но не влияет на отношения. Показательны естественно скорее отношения средних баллов друг к другу. Дисперсия довольно высокая, но оценки пользователей отличались сильно и мы решили не выбрасывать никакие, т.к. оценки одного пользователя были консистентными друг с другом. По ряду соображений мы провели такую оценку только на своих уникальных голосах:

СпикерОригиналСинтезОтношениеПримеры
aidar_8khz4.67 (.45)4.52 (.55)96.8%link
baya_8khz4.52 (.57)4.25 (.76)94.0%link
kseniya_8khz4.80 (.40)4.54 (.60)94.5%link
aidar_16khz4.72 (.43)4.53 (.55)95.9%link
baya_16khz4.59 (.55)4.18 (.76)91.1%link
kseniya_16khz4.84 (.37)4.54 (.59)93.9%link

Мы просили людей в первую очередь оценивать естественность звучания речи (а не качество звука). Нас удивило, что по расспросам обычные люди на своих ежедневных девайсах не особо слышат разницу между 8 kHz и 16 kHz (что подтверждается оценками)! Самые низкие абсолютные оценки и самое низкое отношение у Байи. Самые высокие абсолютные оценки — у Ксении, а относительные — у Айдара. Тут важно отметить, что у Байи меньше поставлен голос, но поэтому он звучит более по-человечески за счет этого. У Байи также выше дисперсия оценок.

Ручной просмотр аудио с большими расхождениями показывает ошибки спикеров, ошибки такотрона, ошибочные паузы (тоже вследствие ошибок такотрона), имена собственные и сложные слова, которые вообще непонятно как читать. Естественно 75% таких расхождений в синтезе (а не оригинале) и частота дискретизации особо не влияет.

Если мы пытались дать численную оценку естественности, то еще хорошо бы оценить «неестественность» или «роботизированность» голоса. По идее ее можно оценивать, давая людям пару аудио на выбор и прося выбрать между ними. Но мы пошли дальше и по сути применили «двойной слепой тест». Мы в случайном порядке дали людям поставить оценки «одному и тому же аудио» 4 раза — оригинал и синтез с разной частотой дискретизации. Для участников исследования, разметивших весь датасет, получается такая таблица:

СравнениеХужеОдинаковоЛучше
16k против 8k, оригинал95748111512
16k против 8k, синтез166840611551
Оригинал против синтеза, 8k81636972767
Оригинал против синтеза, 16k67434623144

Тут напрашивается несколько выводов:

Можете оценить сами, как это звучит, как для наших уникальных голосов, так и для спикеров из внешних источников (больше аудио для каждого спикера можно синтезировать в colab.

Если вы не дружите с колабом или глаза разбегаются от количества файлов в папках с примерами, то вот несколько случайных аудио:

Источник

Синтезаторы речи с русскими голосами как у робота

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Понадобилось нам сделать ролик с голосом как у робота из шедевра под названием «Месть «кожаным ублюдкам»: пародийное видео о роботах Boston Dynamics, которым надоело угнетение со стороны людей. Среди русскоязычных пользователей соцсетей видео от Boston Dynamics стали мемом из-за традиционных озвучек. В них роботы называют людей кожаными ублюдками и обещают однажды отомстить.

В пародии люди, играющие сотрудников Boston Dynamics избивают «робота», напоминающего модель ATLAS. В итоге машина устраивает бунт и атакует тех, кто его угнетал. Роль ATLAS тоже сыграл человек — подробнее о процессе создания пародии можно посмотреть в отдельном ролике.

Мы немного отошли от темы. Так вот, покопавшись в сети. Вот что мы нашли для себя:


Как записать голос Гугл Мужика / Ivona Maxim

Список синтезаторов речи:

1. Google Переводчик также можно использовать для синтезирования речи

Качество воспроизведения на довольно сносном уровне, но не более.

2. Text-to-speech — синтезатор речи онлайн

Ещё один ресурс, осуществляющий синтез речи нормального качества. Бесплатный функционал ограничен набором текста длиной 1000 символов.

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Альтернативные программы для ПК для перевода текста в речь

Также существует программы для синтеза речи, такие как TextSpeechPro AudioBookMaker, ESpeak, Voice Reader 15, ГОЛОС и ряд других, способные конвертируют текст в речь. Их необходимо скачать и установить на свой компьютер, а функционал и возможности данных продуктов обычно чуть превышает возможности рассмотренных онлайн-сервисов.

3. Ivona — лучший синтезатор речи

Голосовые движки данного онлайн сервиса отличаются очень высоким качеством, хорошей фонетической основой, звучат достаточно естественно и «металлический» компьютерный голос здесь чувствуется гораздо реже, нежели у сервисов-конкурентов.

Сервис Ivona имеет поддержку множества языков, в русском варианте присутствуют мужской голос (Maxim) и женский (Tatyana). К сожалению у них что-то с сайтом. И доступа нет. https://www.ivona.com/us/

4. Acapela

Acapela — один из самых распространенных речевых синтезаторов во всем мире. Программа распознает и озвучивает тексты более, чем на тридцати языках. Русский язык поддерживается двумя голосами: мужской голос — Николай, женский — Алена.
Женский голос появился значительно позднее мужского и является более усовершенствованным.

Максимальный размер текста для аудиопрочтения — 300 символов.

Прослушать, как звучат голоса, можно на официальном сайте программы. Достаточно лишь выбрать язык и голос, и набрать свой небольшой текст.

Установка программы проходит без проблем. Разработаны версии для операционных систем Windows, Linux, Mac, а также для мобильных ОС Android u IOS.

Программа платная, скачать ее можно с официального сайта Acapela.

5. Vokalizer

Вторым в нашем списке, но не по популярности является движок Милена от разработчика программы Vocalizer компании Nuance.
Голос звучит очень естественно, речь чистая. Есть возможность установить различные словари, а также подкорректировать громкость, скорость и ударение, что не маловажно.
Как и в случае с Акапелой, программа имеет различные версии для мобильных, автомобильных и компьютерных приложений. Прекрасно подходит для чтения книг.

Скачать все версии Vokalizer и русскоязычный движок Милена можно на официальном сайте производителя программы.

6. ESpeak

Первая версия бесплатного синтезатора речи eSpeak была выпущена в 2006 году. С тех пор компания-разработчик постоянно выпускает все более усовершенствованные версии. Последняя версия была представлена в конце весны две тысячи тринадцатого года.

eSpeak можно установить под следующие операционные системы:

Возможна также компиляция кода для Windows Mobile, но делать ее придется самостоятельно.
А вот с мобильной ОС Android программа работает без проблем, хотя русские словари еще не до конца разработаны. Русскоязычных голосов много, можно выбрать на свой вкус.

Для разработчиков будет интересно узнать, что C++ код программы доступен в сети. Скачать программу, а также посмотреть ее код можно на официальном сайте.

7. Festival

Festival — это целая система распознавания и синтеза речи, которая была разработана в эдинбургском университете.
Программы и все модули абсолютно бесплатно и распространяются по системе open source. Скачать их и ознакомиться с демо-версиями можно на официальном сайте университета Эдинбурга.

Русский голос представлен в одном варианте, но звучание довольно хорошее и ясное, без акцента и с правильной расстановкой ударений.
К сожалению, программа пока может быть установлена только в среде API, Linux. Также есть модуль для работы в Mac OS, но русский язык пока поддерживается не очень хорошо.

Использование мужского голоса Google для синтезированной речи на Android-устройства

Включение мужского голоса Google

На компьютере Гугл не предоставляет каких-либо легко доступных средств для озвучки текста за исключением Переводчика, в котором подбор голоса определяется автоматически и может быть изменен только путем смены языка. Однако для Android-устройств существует специальное приложение, которое по необходимости может быть загружено из магазина Google Play.

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Примечание: Если приложение было скачано вручную, сначала нужно загрузить языковой пакет.

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Вне зависимости от выбора тестовое воспроизведение происходит автоматически. Это позволит вам подобрать мужской голос с наиболее оптимальной интонацией и настроить его по желанию с помощью ранее указанных разделов настроек.

Источник

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движкиВсем здравия!

Кто бы что не говорил о современном цифровом мире, что бумага скоро вымрет и т.д. — всё-таки книги, на мой взгляд, еще долго будут полезны и актуальны. Наоборот, современные технологии помогают более быстро и легко найти те книги и информацию в них, которая вам нужна.

Сейчас в один планшет, кстати говоря, можно загрузить целую библиотеку, и знакомиться с ней в любом месте, например, по дороге на работу, дома, на учебе и т.д.!

Для того, чтобы приложения, представленные ниже, могли читать ваш текст книги (журнала, газеты и пр.) — необходим голосовой движок (синтезатор). Т.е. вам для работы нужна и программа для чтения, и движок!

От последнего, кстати, напрямую зависит качество чтения (чтобы не было «бэ-мэ», нужно выбрать хороший голосовой движок). О движках для ПК подробно во второй части этой статьи.

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Синтезаторы речи: что выбрать

Для телефона

Синтезатор речи Google

Этот продукт по умолчанию встроен во многие смартфоны (правда, не всегда он указан в качестве синтезатора, используемого по умолчанию). В разделе «Язык и ввод» перепроверьте, задан ли он у вас как предпочитаемый модуль (в моем случае использовался движок от Samsung, примеры на скрине ниже 👇).

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Что касается использования — то при помощи него вы сможете озвучивать тексты:

Voice Aloud Reader

Весьма добротное приложение, способное читать текст из самых разных источников: веб-страниц, статей (документов), электронные письма, SMS, PDF, FB2, MOBI, и т.д.

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Voice Aloud Reader — скрины работы приложения

Пользоваться приложением крайне легко и удобно: загружаете на телефон нужный документ, добавляете его в библиотеку Voice Aloud Reader, открываете и запускаете чтение. Всё!

Также хотелось бы отметить, что в приложение встроен собственный менеджер голосов (правда, его звучание оставляет желать лучшего и я бы порекомендовал его заменить на продукт от Google 👆).

Кстати, при желании можно использовать сразу несколько голосов (для этого нужно установить хотя бы пару разных синтезаторов: Acapela, Ivona Google TTS, SVOX TTS и др.). Всё это добро есть на Play Market.

TTS Reader (для книжек)

Универсальная программа для чтения книг (поддерживает форматы: TXT, FB2, PDF, DJVU, EPUB, RTF, HTML и др.).

Мне она больше всего нравится своей библиотекой: во-первых, у вас все книги будут отсортированы (и вы легко найдете нужную), а, во-вторых, вы можете прямо в программе искать новые книжки. Удобно?!

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Как запустить чтение в слух! TTS Reader

Кстати, если вам будет нужно прерваться и остановить чтение — в TTS Reader реализованы удобные закладки (т.е. вы всегда сможете продолжить с того места, где остановились).

Онлайн-сервисы

Весьма интересное решение от Яндекс позволяет озвучивать текст длинной в 5000 символов голосом Алисы. Отмечу, что несмотря на небольшой объем — само качество чтения весьма достойное: их движок хорошо делает интонации и ставит неплохо ударения.

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Yandex SpeechKit — скрин с офиц. сайта

Конечно, этот сервис не позволит прочитать целую книгу, но если вам нужно знакомится с какой-то статьей фоном — то почему нет.

Не многие обращают внимание, что помимо основной своей функции, онлайн-переводчики могут быть использованы для чтения небольших текстов (Яндекс в этом плане предпочтительнее, т.к. поддерживает до 10 тыс. символов).

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Скриншот с сайта Google

Бесплатно : только 300 символов (т.е. маленький текст)

Весьма неплохой синтезатор, но платный. На русском разговаривает голосом «Алёнки». Для тестирования можете воспользоваться небольшим текстом, загрузив в спец. форму на главной страничке сайта (👇).

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Acapela — чтение моей статьи

Впрочем, если вас не смущает ограничения бесплатной версии — то пользоваться можно и ей. 👌

Этот сервис, на мой взгляд, больше подходит тем, кто изучает иностранные языки. Он позволяет зачитывать вслух тексты как на русском, так и на английском, немецком, итальянском и др. языках.

Кстати, качество чтения у него всё-таки пониже, чем у вышеперечисленных решений.

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Скриншот с главной странички сайта

Для ПК/ноутбука (под Windows) ✌

Программы для чтения

( прим. : для чтения текста)

Govorilka

Совсем небольшая программа, предназначенная для чтения текстов голосом. Программа может прочитать текст на различных языках, в зависимости от того, какой голосовой движок подключите. Дает возможность создания MP3 файлов (например, создавать аудиокниги, так популярные в последнее время).

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Главное окно программы «Говорилка»

Demagog

Эта программа 2 в 1: это и текстовые редактор с поддержкой Юникода, и синтезатор речи (т.е. софт для озвучивания текста) с поддержкой SAPI4 / SAPI5 (прим.: о движках см. во второй части статьи). Программа отличается от многих своих конкурентов, т.к. при ее разработке были использованы специальные алгоритмы словарных замен, которые сказываются на правильности произношения читаемого текста. Так же в Demagog реализована бессловарная проверка орфографии.

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Основные возможности программы:

Balabolka

Основное предназначение программы «Балаболки» — это чтение «живым человеческим» голосом текстов книг, документов и т.д. Для чтения могут использоваться любые голосовые движки, которые установлены у вас на ПК.

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

ICE Book Reader

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Пример чтения книги

Ну и последнее, ICE Book Reader позволяет навести порядок на жестком диске с книгами: способа управлять информацией 250000 книг! Программа работает во всех популярных версиях Windows: XP, 7, 8, 10.

Говорун

Сайт разработчика: http://govorunplus.narod.ru/

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

RussAcc

Сайт разработчика: http://bzsoft.spb.ru/russacc.html

лучшие русские голосовые движки. Смотреть фото лучшие русские голосовые движки. Смотреть картинку лучшие русские голосовые движки. Картинка про лучшие русские голосовые движки. Фото лучшие русские голосовые движки

Главное окно программы // RussAcc

В настройках программы можно задать размер шрифта, указать цвет, которым выделять читаемый кусок. Можно указать и настроить параметры записи MP3: битрейт, кол-во бит и пр.

RussAcc поддерживает и работает со всеми популярными звуковыми движками. В своей же базе у программы для каждого слова есть особые его формы с ударениями в различных ситуациях (более 3 миллионов форм!).

Кстати, RussAcc поддерживает такой популярный формат электронных книг, как fb2 (а также может его конвертировать в обычный txt-файл). Поддерживает русский язык, совместимы с новыми ОС Windows 7, 8.1, 10.

Голосовые движки: мужские и женские

Движки синтеза речи — это специальное ПО, своего рода драйвера, необходимые для того, чтобы компьютер мог «заговорить» (т.е. для преобразования текста в речь). Движков сейчас в сети сотни: есть как платные, так и бесплатные. Наилучшее качество чтения, конечно же, показывают платные движки.

Важное замечание : движок синтеза речи не имеет никакого дизайна или интерфейса. После его установки в систему — вы не заметите ровным счетом никаких изменений! Чтобы работать с движком — вам нужна какая-нибудь программа для чтения текстов: Балаболка, Говорун, Ice Reader и пр., чуть выше я приводил те, которые «мне по душе» ✌).

Вот поэтому, кстати, часто пользователи ругают ту или иную программу, что она не может прочитать русский текст (или вообще не может). Просто они забывают о необходимости установки речевого движка.

Пару слов про стандарты.

Голосовые движки могут быть выполнены в разных стандартах (так называемых), самые основные три: SAPI 4, SAPI 5 или Microsoft Speech Platform (примечание: почти в каждой программе для чтения, вы можете выбрать речевой движок).

Добротный стандарт, был актуален десяток лет назад. На сегодняшний день устарел, и на современных компьютерах/ноутбуках его использование не оправдано.

Почти все современные голосовые движки построены на этом стандарте (как платные, так и бесплатные). Наиболее популярный стандарт, можно найти движок с мужским, женским, детским голосами.

Microsoft Speech Platform

Microsoft Speech Platform – большой набор инструментов для разработчиков, которые позволяют реализовывать возможность преобразования текста в речь.

это набор инструментов, позволяющих разработчикам различных приложений, реализовывать в них возможность преобразования текста в голос.

Примечание! Чтобы синтезатор речи работал, необходимо:

Несколько голосовых движков

Тext-to-speech engines Дигало // Николай

Очень популярный русский голосовой движок (голос мужской!). Подойдет для большинства программ, которые умеют читать текст голосом. На мой скромный взгляд, один из лучших общедоступных движков для синтеза речи (на русском языке). Кроме русского, кстати, на сайте разработчика доступны движки еще для нескольких языков. Минус : без регистрации работает всего две недели.

Acapela // Голосовой движок (модуль) Алена

Голосовой движок (модуль) Катерина 2

Компания разработчик: ScanSoft RealSpeak

Довольно неплохой речевой движок с женским голосом. После доработки движка, он стал сопоставим с «Николаем». Существенному обновлению подверглась фонетическая база движка, изменен алгоритм постановки ударений (что положительно сказалось на звучании), устранена проблема со скоростью произношения.

RHVoice

RHVoice — это многоязычный синтезатор речи с открытым исходным кодом. Можно использовать в ОС Windows и Linux. Синтезатор совместим с SAPI5. Разработчик синтезатора — Ольга Яковлева.

Кстати, движок основан на речевой базе, записанной дикторами. Русские голоса «Елена» и «Ирина» доступны для скачивания на официальном сайте.

IVONA Tatyana/Maxim

Очень интересные молодые голосовые движки (их 2: мужской и женские голоса). Многие считают голос Татьяны одним из лучших (если не самым лучшим!). По ссылке выше, можно заслушать как будут звучать ваши тексты, так сказать, портфолио (на мой взгляд, очень приятно звучат).

Станет ли движок самым используемым — не знаю, время покажет!

Кстати, как думаете, будет ли когда-нибудь разработан речевой движок, который не отличишь от голоса обычного человека? Или может он уже есть, а я о нем не слышал. (скиньте название!)

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *