Выбор языка
RSS
Новости
Помощь сайту
Если Вам понравилась программа "Балаболка", Вы можете поддержать ее автора с помощью ЮMoney.

Балаболка Голоса (синтезаторы речи)

Программа может использовать компьютерные голоса, поддерживающие Microsoft Speech API 4.x/5.x или Microsoft Speech Platform. Существуют бесплатные и платные (коммерческие) речевые движки.

Само приложение не содержит никаких голосов. Разработчик "Балаболки" не связан ни с одним из производителей речевых движков.



SAPI 4

Чтобы использовать голоса SAPI 4, загрузите и установите пакет функций Microsoft Speech API (827 КБ).

Бесплатные голоса, разработанные компанией Lernout & Hauspie:

  • L&H TTS Engine, версия 6 (25 МБ)
    Единый установщик для всех доступных языков: русский, американский английский, бразильский португальский, британский английский, испанский, итальянский, китайский, корейский, мексиканский испанский, немецкий, нидерландский, французский, японский. Вы можете выбрать нужные языки во время установки.


  • L&H TTS3000 (25 МБ)
    Архив с отдельными установщиками для разных языков: русский, британский английский, испанский, итальянский, корейский, немецкий, нидерландский, португальский, французский, японский. Эти установщики не работают в Windows 11 (после установки имена голосов отсутствуют в списке).


  • L&H TruVoice American English TTS Engine (1 МБ)
    Установщик для американского английского (10 голосов).
Все голоса, поддерживающие только SAPI 4, устарели и более не рекомендуются к использованию. Воспользуйтесь свежими версиями речевых синтезаторов.




SAPI 5

Ольга Яковлева разработала многоязычный синтезатор речи с открытым исходным кодом RHVoice (доступны русский, албанский, английский, вьетнамский, грузинский, испанский, киргизский, польский, португальский, сербский, словацкий, татарский, туркменский, узбекский, украинский, хорватский, чешский языки и эсперанто):



Ярослав Козак из Львова создал украинский синтезатор речи UkrVox. За основу был взят голос диктора украинского радио Игоря Мурашко.



Acapela Group Cepstral AlfaNum

Ссылки на сайты компаний, выпускающих коммерческие синтезаторы речи:


IVONA Nuance CereProc

Из коммерческих речевых движков интерес для русскоязычных пользователей представляют следующие голоса:

  • Alyona (Acapela Group)
  • Katya, Milena и Yuri (Nuance/Cerence)
  • Nicolai (Digalo - Acapela Elan Speech Cube)
  • Tatyana и Maxim (IVONA)

Приобрести русские компьютерные голоса от компаний IVONA и Nuance можно на сайте фирмы Harpo. Русский голос от фирмы Acapela Group входит в состав программного продукта Infovox 4: купить его можно на сайте российской компании «Элита Групп». Голос Nicolai доступен для скачивания на сайте «Мифотека».


 

Можно протестировать естественные голоса Silero: сейчас доступен для скачивания и установки дистрибутив для SAPI 5 (файл SileroTTS_Setup_1.x.x.exe). Установщик добавит более 50 голосов для русского, азербайджанского, белорусского, киргизского, таджикского, узбекского, украинского и других языков. К сожалению, при использовании этих голосов недоступно слежение за текстом (подсвечивание текущего слова во время чтения вслух). Также, при нажатии кнопок "Остановить" или "Приостановить" голос читает текущее предложение до конца.


 

В Windows 11 браузер Microsoft Edge содержит новые голоса. С помощью бесплатной утилиты NaturalVoiceSAPIAdapter можно добавить эти синтезаторы речи в список голосов SAPI 5. Более подробную информацию можно узнать на сайте утилиты. Так как программа "Балаболка" является 32-битной программой, надо установить 32-битную и 64-битную версии утилиты (раздел "Installation Status"). Загрузить свежую версию утилиты можно отсюда.

Утилита NaturalVoiceSAPIAdapter добавит голоса, для работы которых требуется доступ в интернет: на это указывает присутствие слова "Online" в имени голоса (например, "Microsoft Svetlana Online"). Существуют также версии некоторых из этих голосов, которые можно установить непосредственно на компьютер: синтезаторы речи будут работать без доступа в сеть ("Microsoft Dmitry Native", "Microsoft Svetlana Native").

Скачать установщики естественных (natural) голосов Microsoft, работающих без доступа в интернет:

Доступен для установки еще один русский голос, Microsoft Ekaterina (для него был создан отдельный дистрибутив из-за большого объема данных):


Для использования голосов Microsoft Online и Microsoft Native необходимо установить NaturalVoiceSAPIAdapter. Скачайте и распакуйте архив в папку (эту папку нельзя удалять, пока голоса используются). Запустите Installer.exe, активируйте настройку "Enable Microsoft Edge online voices", нажмите кнопки "Install 32-bit" и "Install 64-bit".





Microsoft Speech Platform

Microsoft Speech Platform (версия 11.0) – набор инструментов, позволяющих разработчикам строить решения с распознаванием голоса и преобразованием текста в речь.

Для работы синтезатора речи необходимо загрузить и установить следующие компоненты:

  1. Microsoft Speech Platform - Runtime – серверная часть платформы, предоставляющая API для программ (файл x86_SpeechPlatformRuntime\SpeechPlatformRuntime.msi).
  2. Набор языков для серверной части (файлы, чьи имена начинаются с "MSSpeech_TTS_").

Теги XML могут использоваться как для SAPI 5, так и для Speech Platform.

Утилита SAPI Unifier позволяет сделать голоса Microsoft Speech Platform доступными через SAPI 5.