Скачать tts движок на русском языке. Обзор синтезаторов речи для андроид

Год выпуска: 2011
Жанр: Распознавание речи, звука, синтез речи
Разработчик: Acapela Group
Сайт разработчика: http://www.acapela-group.com/
Язык интерфейса: Русский + Английский
Платформа: Windows XP, 2003, Vista, 2008, 7
Системные требования:
Процессор: Pentium Intel/AMD
Частота процессора от 450 МГц
Оперативная память: 64 Mb
Видео-карта: 16 Mb
Аудио-карта: PC Sound Card
Жесткий диск: 600 Мб свободного места

Описание: Text-to-speech engine или движки синтеза речи - это программы выполненные в виде системного драйвера, предназначенные для преобразования текста в речь. Движки синтеза речи не имеют внешнего интерфейса, поэтому для того, чтобы Ваш компьютер заговорил, недостаточно установить только движок. Для использования движка необходима программа синтеза речи (TextAloud, Cool Reader, Balabolka и т.д), которая выполняет роль интерфейса, позволяет работать с движком, изменять его настройки, звучание речи, использует дополнительные возможности.
Голосовые движки созданы для того, чтобы сделать чтение текстовых файлов (электронных книг) удобным и комфортным. Почему это важно? Чтение HTML страниц, документации или почты сильно отличается от чтения электронных книг. Чтение книг требует гораздо больше времени. Поэтому нагрузка на глаза гораздо сильнее. Кроме того, чтение книг это процесс обычно непрерывный. В то время как во время чтения HTML страниц, чтение постоянно чередуется с коротким отдыхом. Это означает, что для чтения книг следует создавать более комфортные условия. В противном случае глаза будут быстро уставать и появляется серьезный риск ухудшить свое зрение.

Голосовой движок Алёна
Компания Acapela разработчики популярного русскоязычного голосового модуля Николай, выпустили новый русский, женский голосовой движок, который получил название Алёна, работает на SAPI-5 с частотой 22 КГц, по качеству синтезируемой речи Алёна намного опережает Николая, тембр голоса и интонация по мнению пользователей приятней чем у движка Катерина от ScanSoft RealSpeak.

Acapela Elan Nicolai
Николай - немного устаревший вариант.
Голосовой движок Acapela ELAN Tempo Multimedia V5.1.0.0 Russian

Loquendo (Olga)
Описание: Первый русский голос от Loquendo

ScanSoft RealSpeak (Katerina)
Великолепный text-to-speech engine от создателей знаменитого Dragon NaturallySpeaking, просто не умеющих халтурно работать, - что и отразилось на общем уровне продукта. Электронные персонажи разговаривают почти естественно, и если бы не слабый эффект надрыва речи, иногда "всплывающий" на длинных фразах, то их вполне можно было бы спутать с живыми людьми. Вот что значит солидный словарь и запас фонем! Языков тоже поддерживается более чем достаточно - целых 21(!), включая даже такие экзотические, как китайский, норвежский и корейский. Русский представлен женским голосом "Катерина", причем работает он ничуть не хуже своих заграничных коллег и обеспечивает действительно отличное качество речи.

Digalo (Nicolai) Speech API 4.0
Говорилка нужна тому, кто больше любит слушать тексты, чем читать их с экрана монитора или бережет свое зрение и хочет читать тексты электронных книг сидя подальше от монитора, кто хочет узнать как звучат слова и фразы на иностранном языке. Говорилка нужна всем, кто хочет научить свой компьютер говорить и кому просто любопытно узнать, как это все работает
Дополнительные возможности:
изменение скорости чтения и высоты голоса; открытие больших файлов в DOS и Windows кодировке, а также чтение текста из файлов MS Word; запиcь речи в звуковой файл (wav или mp3); автоматическая прокрутка текста на экране, чтобы всегда был виден читаемый фрагмент; чтение текста, находящегося в буфере обмена, возможность изменять произношение (словарь).

Ukrvox (украинский)
Неофициальный дистрибутив украинского синтезатора речи UkrVox Igor. Это речевой движок был создан Ярославом Козаком из Львова.

В сборнике присутствуют все необходимые программы и дополнительные словари.

1) Установите Infovox Desktop 2.2 Engine
2) Установите голосовой модуль Алёна
3) С помощью генератора лицензий создайте лицензию, запустите License Manager - (Пуск - Все программы - Acapela Group - Infovox Desktop 2.2 - License Manager ) нажмите "импортировать лицензию" и укажите файл.
(Файл лицензии "Infovox.lic " копируется на рабочий стол (по умолчанию) при запуске генератора лицензий.)
4). Запустите программу для чтения.
5). В программе в "Настройки" "Голос" выберите один из голосов.
6). Откройте в программе любой текстовый файл
7). Нажмите кнопку "Play" и слушайте.


SVOX Classic Text To Speech Engine голосовой движок для платформы является программой, позволяющей воспроизводить любой текстовый документ в виде речевого потока. На каждом устройстве, работающем под управлением ОС Android имеется встроенная программа позволяющая, преобразовывать текст в человеческую речь. Однако недостатком этой программы является то, что она поддерживает только иностранные языки. Особенностью же SVOX Classic Text To Speech Engine как раз является то, что данная программа умеет "говорить" по-русски.


Использование SVOX Classic Text открывает массу новых возможностей. Благодаря ему вы сможете озвучивать различные программы, воспроизводить электронные книги и важные сообщения. SVOX Classic Text поддерживает работу с более чем 25-ю языками. Благодаря такому набору данная программа является уникальной в своём роде. Здесь также имеется возможность выбора голосового сопровождения - всего их здесь сорок вариантов. Для воспроизведения текста на русском языке необходимо скачать специальное дополнение к программе, которое легко найти в Интернете. Для дальнейшей работы достаточно установить программу вместе с этим дополнением и всё - ваш смартфон говорит по-русски!


Настройки SVOX Classic Text при воспроизведении текста позволяют установить использование этой программы по умолчанию. Для этого достаточно зайти в настройки приложения и перейти в раздел «голосовой ввод - вывод». Там нужно отметить галочкой пункт «система, устанавливаемая по умолчанию». После этого пользователь также может выбрать и голос, используемый по умолчанию.

На нашем сайте вы можете скачать русские голосовые движки на ваш Андроид смартфон. В комплекте сама программа, уже активированная ключом и не требует регистрации, а так же 40 мужских и женских голосов на 25 языках, естественно включая русский. Теперь ваш умный телефон по настоящему становится таковым, дайте ему любой текст или команду и он будет читать любой массив текста за вас, на нужном вам языке.

Если Ваш родной язык не английский и Вы не пишете приложения только для iPhone, то Вам придется достаточно трудно, если Вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.

В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine.

Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.

Для удобства разделим движки TTS на три класса:

  • коммерческие;
  • свободные (решения лицензированные по GPL, LGPL и более «мягким» лицензиям типа BSD License или wxWindows Licence, которые допускают коммерческую разработку продуктов);
  • встроенные (средства, предоставляемые самой операционной системой).

Коммерческие движки

SVOX Mobile TTS

Цена: n/a
Языки: 26, включая русский
высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, BREW

Компания SVOX имеет наиболее «вкусный» с технической точки зрения продукт - SVOX Mobile TTS . Однако, поскольку компания работает в основном в B2B сегменте, на мои два письма с запросом цены они так и не ответили.

Цена, указанная в шапке, относится к таким операционным системам как Windows Mobile и Symbian, однако бизнес-модель Acapela разнится в зависимости от выбранной ОС. К примеру, наиболее сильно они продвигают направление iOS, для которого сделан отдельный сайт . Там можно зарегистрироваться и бесплатно получить evaluation версию их движка. Цена голого SDK для бывшей iPhone OS составляет 250€. Так же с каждого проданного Вами в App Store приложения снимаются немалые проценты.

Отмечу, что Acapela предоставляет «облачный» синтез речи , а так-же портирование SDK под любую платформу.

Свободные движки

Flite
Цена: нет
Языки: английский плюс возможность компиляции языков FestVox
Субъективная оценка качества звучания: низкое
Мобильные ОС: Android, Windows CE/Windows Mobile, iOS, PalmOS
Возможность разработки коммерческих продуктов: есть (CMU licence)

В мире настольных систем хорошо известен синтезатор речи Festival. Он имеет порт под названием Flite для мобильных устройств и встраиваемых систем, который распространяется под их собственной X11-like лицензией, позволяющей свободно распространять данное ПО кому угодно, а так же строить на его основе как коммерческие, так и свободные приложения. Существуют порты для Windows CE/Windows Mobile , PalmOS, Android и .

Инструкция для компиляции движка под WM включена в дистрибутив, однако на этой платформе eSpeak имеет одно существенное ограничение – генерация голоса возможна только в WAV файл. Собранный TTS engine для Windows Mobile можно получить .

ESpeak портирован на Android . Самый простой способ его попробовать - это установить из Android Market’а приложение TTS Service Extended, которое позволяет переключаться между встроенным движком и eSpeak. Данный TTS движок распространяется на условиях GNU GPL.

Встроенные решения

Встроенные решения присутствуют только в Symbian и Android. По какой-то неизвестной причине Microsoft лишила свою мобильную ОС соответствующего программного интерфейса (MS SAPI).
Symbian

Цена: нет
Языки: английский
Субъективная оценка качества звучания: крайне низкое
Возможность разработки коммерческих продуктов: есть

Встроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотя в его ничего об этом не сказано, он все же позволяет синтезировать речь. К сожалению, русский язык не поддерживается. Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.

Дополнительные языковые пакеты можно загрузить , однако список поддерживаемых телефонов крайне мал. Установка пакетов для русского языка на устройство под управлением Symbain OS S60 5th не дала ожидаемых результатов, встроенный TTS так и не заговорил по-русски.

Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти