Синтезатор речи google что это за программа и нужна ли она

Speech Recognition and Synthesis from Google (Распознавание и синтез речи от Google, ex.Синтезатор речи Google, ex.Speech Services by Google, ex.Google text-to-speech)
Версия: googletts.google-speech-apk_20230904.02_p3.570190551

Последнее обновление программы в шапке: 04.10.2023

Прикрепленное изображение

Краткое описание:
Синтезатор речи Google.

Описание:
Синтезатор речи Google озвучивает текст, который виден на экране устройства. Где это может пригодиться?
• В Google Play Книгах можно пользоваться функцией «Чтение вслух».
• В Google Переводчике можно слушать произношение слов.
• При использовании TalkBack и других специальных возможностей озвучиваются ваши действия.
• Также в Play Маркете есть много других приложений, в которых применяется синтез речи.

Функция доступна на следующих языках: английский (Австралия, Великобритания, Индия, США), бенгальский (Бангладеш), венгерский, датский, индонезийский, испанский (Испания, США), итальянский, кантонский (Гонконг), корейский, мандаринский (Китай, Тайвань), немецкий, нидерландский, норвежский, польский, португальский (Бразилия), русский, тайский, турецкий, финский, французский, хинди и японский.

Инструкция по установке и использованию

Прикрепленное изображение

Как заставить читать выделенный текст в браузере?

Синтезатор речи Google читает только тогда, когда приложение позволяет сделать это.
Если браузер не поддерживает функцию запуска текста в речь, то и воспроизводиться ничего не будет.

Если хотите, чтобы браузер озвучивал выделенный текст, скачайте Яндекс браузер. Там есть такая функция

Для продвинутых

Как установить голосовой пакет вручную?

1. Скачать голосовой пакет (это zip-архив).
2. Извлечь содержимое архива в папку /data/data/com.google.android.tts/ . Для доступа к этой папке необходимы права root.

Как скачать голосовой пакет вручную?
В настоящее время адрес для скачивания языкового пакета (например, для русского языка) выглядит следующим образом https :// redirector.gvt1.com/edgedl/android/tts/v15/ru-ru-x-dfc-r .zvoice , где — это номер ревизии языкового пакета. Номер последней ревизии русского языкового пакета 41 . В дальнейшем (с выходом новых версий TTS) номер ревизии может увеличиваться (42, 43, . ). Адрес для скачивания также может измениться, начиная с какой-то новой версии. Скачанный файл, независимо от его расширения, является zip-архивом.

Примеры пакетов для других языков

English (GB):
https :// redirector.gvt1.com/edgedl/android/tts/v15/en-gb-x-rjs-r 43 .zvoice
https :// redirector.gvt1.com/edgedl/android/tts/v15/en-gb-x-fis-r 43 .zvoice

English (US):
https :// redirector.gvt1.com/edgedl/android/tts/v15/en-us-x-sfg-r 45 .zvoice

Deutsch:
https :// redirector.gvt1.com/edgedl/android/tts/v15/de-de-x-nfh-r 41 .zvoice

Franзais:
https :// redirector.gvt1.com/edgedl/android/tts/v15/fr-fr-x-vlf-r 42 .zvoice

Espaсol:
https :// redirector.gvt1.com/edgedl/android/tts/v15/es-es-x-ana-r 40 .zvoice
https :// redirector.gvt1.com/edgedl/android/tts/v15/es-us-x-sfb-r 42 .zvoice

Українська:
https :// redirector.gvt1.com/edgedl/android/tts/v15/uk-ua-x-hfd-r 9 .zvoice

Требуется Android: 8.0 и выше
Русский интерфейс: Да
Разработчик: Google Inc.
E-mail разработчика: tts-feedback@google.com
Домашняя страница: http://www.google.com
Google Play: https://play.google.com/store/apps/details?id=com.google.android.tts

Скачать: ˇ
Версия: googletts.google-speech-apk_20230904.02_p3.570190551 от 04/10/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230904.02_p2.569268105 от 04/10/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230807.02_p1.561746158 от 05/09/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230807.02_p0.554630146 от 23/08/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230724.01_p1.550978359 от 10/08/2023 (iMiKED)

Прошлые версии

Версия: googletts.google-speech-apk_20230710.01_p1.547324553 от 28/07/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230626.01_p2.550003324 от 28/07/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230626.01_p1.543879258 от 13/07/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230612.01_p2.546336717 от 12/07/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230612.01_p1.540072880 от 29/06/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230331.02_p2.527668048 от 29/06/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230515.01_p0.532123660 от 31/05/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230331.02_p1.527652614 от 31/05/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230331.02_p0.521040655 от 19/04/2022 (iMiKED)
Версия: googletts.google-speech-apk_20230313.02_p0.516257643 от 24/03/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230206.01_p4.513641198 от 23/03/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230206.01_p2.509666633 от 21/02/2023 (vladmira)
Версия: googletts.google-speech-apk_20230123.02_p4.510229437 от 21/02/2023 (vladmira)
Версия: googletts.google-speech-apk_20230123.02_p3.506463867 от 08/02/2023 (iMiKED)
Версия: googletts.google-speech-apk_20230109.02_p3.501693211 от 25/01/2023 (iMiKED)

Модификации

Сообщение отредактировал iMiKED — 04.10.23, 09:07

Причина редактирования: Обновление: новая версия googletts.google-speech-apk_20230904.02_p3.570190551 от 04/10/2023

Скрыть шапку
21.03.15, 18:39 | #102
●

Постоянный
Реп: ( 0 )

Как заставить озвучивать Окей Гугл в поиске, хотя синтез речи голоса воспроизводится в настройках, как исправить? Нигде не нашел ответа(

28.03.15, 14:28 | #103
●

Постоянный
Реп: ( 3 )
Alex0047 @ 19.03.2015, 00:52

Google Text-to-Speech v3.4.5.1772910
What’s New
• Hindi now supported
• Indonesian now supported
• Improved quality: our standard quality voices now surpass the quality of the high quality voices from our previous release

arm:
[attachment=»5985725:Google Text-to-speech Engine_3.4.5.1772910.arm.apk»]
x86:
[attachment=»5995645:Google_Text-to-speech_Engine_3.4.5.1772910.x86.apk»]

А она только гугл книги читает,или же сможет почитать допустим COOL READER что у меня стоит
28.03.15, 16:05 | #104
●

Постоянный
Реп: ( 2886 )
sidordroid @ 28.03.2015, 13:28
А она только гугл книги читает,или же сможет почитать допустим COOL READER что у меня стоит

она не читает гугл книги, это гугл книги используют её для синтеза речи. Если COOL READER, что у Вас стоит, умеет использовать синтезаторы речи, то и Google Text-to-Speech сумеет использовать :happy:

Сообщение отредактировал Leo64 — 28.03.15, 16:17

Синтезатор речи google что это за программа и нужна ли она

Синтезаторы речи. Каталог программ для чтения текста голосом
Метки темы: Озвучивание текста | Синтезатор речи | Текст в речь | Text to speech | TTS

Прикрепленное изображение

Краткое описание:
Программы для озвучивания текста голосом.

Описание:
Способность компьютера воспроизводить введенный текст в виде проговариваемых слов называется преобразованием текста в речь (text to speech — TTS).
В данной теме представлены наиболее популярные программы для озвучивания текста, опробованные и рекомендованные пользователями.

Синтезаторы речи:

Языки: 20+ (в том числе английский, русский)
Операционные системы: Android, Windows
Режим работы: offline
Редактирование словарей: отсутствует в программе, но можно отредактировать с помощью сторонних приложений
Оценка звучания: ★★★☆☆
Примеры звучания: пример 1, пример 2, online demo

В программе из Play Market качество голоса оставляет желать лучшего. Есть возможность подключить голоса лучшего качества, но неофициально
У Алёны наблюдается распространённая ошибка с отсутствием произношения отдельно стоящих русских беззвучных букв, таких как мягкий и твёрдый знаки.
Голос склонен к проглатыванию окончаний фраз, особенно на границе кириллического и латинского текстов, что можно заметить в вышеприведённом примере.

Acapela TTS Voices

Скачать Edge TTS Edge TTS original
Озвучка текстов
Google Text-to-Speech ★★★★☆

Языки: английский (Австралия, Великобритания, Индия, США), бенгальский (Бангладеш), венгерский, датский, индонезийский, испанский (Испания, США), итальянский, кантонский (Гонконг), корейский, мандаринский (Китай, Тайвань), немецкий, нидерландский, норвежский, польский, португальский (Бразилия), русский, тайский, турецкий, финский, французский, хинди и японский.
Операционные системы: Android
Режим работы: offline (работает без интернета)
Редактирование словарей: отсутствует в программе, но можно отредактировать с помощью сторонних приложений
Оценка звучания: ★★★★☆
Примеры звучания: пример 1, пример 2

Простота установки. Пакет устанавливается вместе с Google сервисами
Распространяется бесплатно

Достаточно механический голос
Нет встроенного редактора словарей

Ivona от Amazon.com ★★★★★

Языки: русский, английский, датский, голландский, французский, немецкий, итальянский, норвежский, польский, португальский, румынский, испанский, шведский, турецкий
Операционные системы: Android, Windows
Режим работы: offline
Редактирование словарей: отсутствует в программе, но можно отредактировать с помощью сторонних приложений
Оценка звучания: ★★★★★
Примеры звучания: пример 1, пример 2, Онлайн демо

Один из лучших голосов наряду с Vocalizer и Yandex SpeechKit
Работает без интернета

Последний голос от 18.04.2017 г., новые голоса только online.
Нет встроенного редактора словаря
Иногда путает ударения
Программа убрана из Google Play Market, поэтому поддерживается силами форумчан.

Скачать

Неофициальный TTS + Голоса Максим и Татьяна + Словари

Ivona русский (Tatjana, Maksim)ver.1.6.101.3

Скачать с облака mail.ru
Скачать с форума

Синтезаторы речи. Каталог программ для чтения текста голосом (Пост directorgeneral #96023241)

Словари от DamionSleeper (только для неофициального движка, уже включены в сборку с голосами Максима и Татьяны)

Rochfort — редактор пользовательских словарей Ivona на Android

IVONA voices 2+ Speech2Go
IVONA Reader 1.1.3 + голос Татьяна
Загрузка словарей PLS для Ivona 1.6.75 на PC

Инструкция по установке и настройке неофициального синтезатора Ivona

Скачиваем архив Ivona русский (Tatjana, Maksim)ver.1.6.101.3

Распаковываем этот архив и переносим папку ivona в основную память устройства

Если выполняете действия с помощью компьютера

Прикрепленное изображение

Если выполняете действия без компьютера

Прикрепленное изображение

Loquendo от Nuancе ★★★☆☆

Языки: русский, английский
Операционные системы: Android, Windows (через приложение Балаболка)
Режим работы: offline (работает без интернета)
Редактирование словарей: отсутствует в программе, но можно отредактировать с помощью сторонних приложений
Оценка звучания: ★★★☆☆
Примеры звучания: пример 1

Голос Дмитрия чем-то похож на голос Василия Ланового

Голос плоский, отсутствует интонирование
Нет встроенного редактора словарей
Программа убрана из Google Play Market. Проект восстановлен и пересобран нашими форумчанами. При заходе в настройки периодически появляются ошибки

Инструкция по установке

Прикрепленное изображение

Nefonit TTS ★★☆☆☆

Google PlayMarket
Скачать Nefonit TTS + Lexicon
Последнее обновление — 14 апреля 2015. Проект более не поддерживается

Brazilian-Portuguese (Новый)
Английский — English
Эспиранто — Esperanto
Грузинский — Georgian
Киргизский — Kyrgyz
Русский — Russian
Татарский — Tatar
Украинский — Ukrainian

Умеет автоматически переключаться с одного языка на другой. Удобно при изучении иностранных языков, когда нужно услышать слово на языке оригинала и сразу же перевод на русском.
Распространяется бесплатно

Отчетливо слышен механический голос
Отсутствует интонирование
Произношение английского диктора хромает

Sakrament TTS ★★☆☆☆

Ссылка на PlayMarket: https://play.google.co…rament.tts_hmm.service
Программа заброшена и не развивается. Последнее обновление было в 2016 году.

SamsungTTS от Samsung & SVOX ★★★★☆

Языки: русский, английский, испанский, итальянский, немецкий, португальский, французский и пр.
Операционные системы: Android
Режим работы: offline
Редактирование словарей: отсутствует
Оценка звучания: ★★★★☆
Примеры звучания: пример 1, пример 2

Устанавливается по умолчанию в телефоны Samsung. Для других же устройств установка довольно простая.
Большое количество голосов

Нет встроенного редактора словаря
Из-за отсутствия словаря некорректно произносит слова чаще других популярных движков: Vocalizer, Ivona, Yandex

Модуль TTS Samsung:

Модуль TTS Samsung.ver.3.0.04.4.build.300400004.apk

SamsungTTS Russian Male.ver.201911151.build.201911151.apk

SamsungTTS US English Male.ver.201911121.build.201911121.apk
SamsungTTS_Lisa_US_English_Female_ver_201911051_build_201911051.apk

Прикрепленное изображение

Vocalizer от Code Factory ★★★★☆

Языки: английский, русский
Операционные системы: Android
Режим работы: offline (работает без интернета, но иногда требует интернет, чтобы проверить лицензию)
Редактирование словарей: присутствует
Оценка звучания: ★★★★☆
Пример звучания: пример 1, https://www.nuance.com…vr/text-to-speech.html

Достаточно приличное качество звучания
Есть достаточно гибкие настройки, где можно задать правила обработки знаков препинания и пр.
Есть возможность добавления своих слов в словарь

Платные голоса
Качество голосов используется среднее, хотя в другом Vocalizer Expressive 2 от Nuance voices используются эти же голоса лучшего качества (подключить их нельзя, т.к. файлы шифруются)
При каждом запуске программе лезет в интернет, проверить лицензию. Если интернета нет, может в любой момент перестать работать, несмотря на то, что у вас купленная версия.
Неудобный редактор словаря

Vocalizer Expressive 2 от Nuancе ★★★★★

Языки: английский, русский + 8
Операционные системы: Android, Windows
Режим работы: offline (работает без интернета)
Редактирование словарей: встроенный редактор отсутствует, но отредактировать можно через сторонние инструменты
Оценка звучания: ★★★★★
Примеры звучания: пример 1, пример 2, https://www.nuance.com…vr/text-to-speech.html

Один из лучших голосов наряду с Ivona и Yandex SpeechKit
Работает без интернета

Нет встроенного редактора словаря
Частенько путает ударения
Иногда озвучивает знаки препинания и спец. символы
В Google Play Market проекта никогда не было, программа поддерживается силами форумчан.

Ссылки на скачивание + инструкция по установке и использованию

Устанавливаем программу на устройство:
vocalizer_e2.tts_1.0.2.3t3.apk ( 2.72 МБ )

Если выполняете действия с помощью компьютера

Прикрепленное изображение

Если выполняете действия без компьютера

Прикрепленное изображение

Больше голосов
Взято с блога kostenloserwarez.blogspot.com

Изначально голоса предназначены для Windows, поэтому ознакомьтесь с инструкцией ниже
скачать c GoogleDrive

American English — Allison, Ava, Joelle, Nathan, Noelle, Samantha, Susan, Tom, Zoe
Arabic — Laila, Maged, Tarik
Argentinian Spanish — Diego
Australian English — Karen, Lee
Basque — Miren
Belgian Dutch — Ellen
Bhojpuri India — Jaya
Brazilian Portuguese — Felipe, Fernanda, Luciana
British English — Daniel, Kate, Malcolm, Oliver, Serena
Bulgarian — Daria
Canadian French — Amelie, Chantal, Nicolas
Catalan — Jordi, Montserrat
Chilean Spanish — Francisca
Chinese Mandarin — Bin-Bin, Li-Li, Tian-Tian
Colombian Spanish — Carlos, Soledad
Croatian — Lana
Czech — Iveta, Zuzana
Danish — Magnus, Sara
Dutch — Claire, Xander
Finnish — Onni, Satu
French — Audrey, Aurelie, Thomas
Galician — Carmela
German — Anna, Markus, Petra, Viktor, Yannick
Greek — Melina, Nikos
Hebrew — Carmit
Hindi — Lekha, Neel
Hong Kong Cantonese — Sin-Ji
Hungarian — Mariska
Indian Bengali — Paya
Indian English — Rishi, Sangeeta, Veena
Indonesian — Damayanti
Irish English — Moira
Italian — Alice, Federica, Luca, Paola
Japanese — Ayane, Daisuke, Ichiro, Kyoko, Mizuki, Otoya, Sakura
Kannada — Alpana
Korean — Sora, Yuna
Malay — Amira
Marathi — Ananya
Mexican Spanish — Angelica, Juan, Paulina
Norwegian — Henrik, Nora
Polish — Ewa, Krzysztof, Zosia
Portuguese — Catarina, Joana, Joaquim
Romanian — Ioana
Russian — Katya, Milena, Yuri
Scottish English — Fiona
Slovak — Laura
South African English — Tessa
Spanish — Jorge, Marisol, Monica
Swedish — Alva, Klara, Oskar
Taiwanese Mandarin — Mei-Jia
Tamil — Vani
Telugu — Geeta
Thai — Kanya, Narisa
Turkish — Cem, Yelda
Valencian — Empar

Скачать с YandexDisk

American English — Allison, Ava, Joelle, Nathan, Noelle, Samantha, Susan, Tom, Zoe
Arabic — Laila, Maged, Tarik
Argentinian Spanish — Diego
Australian English — Karen, Lee
Basque — Miren
Belgian Dutch — Ellen
Bhojpuri India — Jaya
Brazilian Portuguese — Felipe, Fernanda, Luciana
British English — Daniel, Kate, Malcolm, Oliver, Serena
Bulgarian — Daria
Canadian French — Amelie, Chantal, Nicolas
Catalan — Jordi, Montserrat
Chilean Spanish — Francisca
Chinese Mandarin — Bin-Bin, Li-Li, Tian-Tian
Colombian Spanish — Carlos, Soledad
Croatian — Lana
Czech — Iveta, Zuzana
Danish — Magnus, Sara
Dutch — Claire, Xander
Finnish — Onni, Satu
French — Audrey, Aurelie, Thomas
Galician — Carmela
German — Anna, Markus, Petra, Viktor, Yannick
Greek — Melina, Nikos
Hebrew — Carmit
Hindi — Lekha, Neel
Hong Kong Cantonese — Sin-Ji
Hungarian — Mariska
Indian Bengali — Paya
Indian English — Rishi, Sangeeta, Veena
Indonesian — Damayanti
Irish English — Moira
Italian — Alice, Federica, Luca, Paola
Japanese — Ayane, Daisuke, Ichiro, Kyoko, Mizuki, Otoya, Sakura
Kannada — Alpana
Korean — Sora, Yuna
Malay — Amira
Marathi — Ananya
Mexican Spanish — Angelica, Juan, Paulina
Norwegian — Henrik, Nora
Polish — Ewa, Krzysztof, Zosia
Portuguese — Catarina, Joana, Joaquim
Romanian — Ioana
Russian — Katya, Milena, Yuri
Scottish English — Fiona
Slovak — Laura
South African English — Tessa
Spanish — Jorge, Marisol, Monica
Swedish — Alva, Klara, Oskar
Taiwanese Mandarin — Mei-Jia
Tamil — Vani
Telugu — Geeta
Thai — Kanya, Narisa
Turkish — Cem, Yelda
Valencian — Empar

Инструкция по установке голосов Windows на Android

Суть:

Находим в архиве папку languages и распаковываем ее.
Далее собираем в одно место все файлы, которые находятся в подпапках этой папки languages
Перекидываем на устройство папку с этим набором файлов

Прикрепленное изображение

Версия для Windows

Nuance Vocalizer Expressive Katya, Milena, Yuri, Allison, Susan 5.2.3 RePack by Zongot
Vocalizer_Expressive2_SAPI5_x64
Nuance Vocalizer SAPI5 для Windows XP/W7 + Редактор словарей User Dictionary Editor (RSUDE 2.1 & UDE 3.0) + Конвертер словарей

Дополнительная информация

Словари от DamionSleeper
MILAN — редактор словарей для Nuance Милены от SZ-Vtk
Miledi (sz) — редактор пользовательских словарей Nuance на Андроиде от SZ-Vtk
Vocalizer Express Studio — официальный редактор словарей на ПК от компании Nuance
Объединение словарей

Yandex SpeechKit ★★★★★

Языки

Операционные системы

Режим работы

Редактирование словарей

Оценка звучания

Примеры звучания

Один из лучших TTS наряду с Vocalizer и Ivona
Большое количество голосов

Для работы движка нужен стабильный скоростной интернет. Проблема частично решается переводом текста в формат mp3 через дополнительные программы. Не очень удобно, но работает.
Нет встроенного редактора словаря
Чрезмерное интонирование. Ощущение будто читают текст на утреннике.
Официальной адаптации под Android и Windows нет, поддерживается силами форумчан.
Неизвестно, как долго прослужит этот бесплатный способ прослушивания текста. Яндекс в любой момент может прикрыть лавочку.
Подробнее…

Инструкция по установке

Прикрепленное изображение

Синтез речи от ЦРТ ★★★★☆

Приложение «Читатель»:
Языки: русский
Операционные системы: Android, iOS
Режим работы: online (API) и offline (работает без интернета, но это программа, а не движок). Т.е. нужно загружать только в эту программу текст, в других приложениях работать не будет.
Редактирование словарей: встроенный редактор отсутствует, но отредактировать можно через сторонние инструменты
Оценка звучания: ★★★★☆
Примеры звучания: пример 1, пример 2, Онлайн демо

Очень хорошо читает текст (особенно Владимир)
Работает без интернета

Это программа, а не движок, о чем говорилось выше. А значит, что возможности для использования достаточны ограничены.
Разработчики прекратили поддержку приложения, сосредоточившись на корпоративном сегменте. Обновлений можно не ждать

Play_A_CRT — программа на андроид для генерации аудиокниг одним из голосов Центра Речевых Технологий
Облачный сервис синтеза речи «Облако ЦРТ»

Решение проблем и ответы на распространенные вопросы

Синтезатор речи не работает в фоне

Не могу выбрать никакой tts, кроме Гугла

Описание проблемы
Решение

Полезная информация

Приложения для чтения книг, поддерживающие функцию Text to speech (TTS)
AutoTTS — программа для автоматического переключения языка. Подойдет тем, кто читает тексты на двух и более языках.
Yorick — программа предназначена для групповой модификации FB2-книг в кодировках Windows-1251 и UTF-8. Замена «е» на «ё»происходит во всех FB2-книгах, находящихся в заданной директории, а также во всех вложенных поддиректориях
Контакты, звонки, SMS/MMS
Чтение, обучение и базы знаний
Записать txt в аудиоформат wav — txt_to_wav_light.tts
Улучшить качество звучания TTS с помощью редактирования эквалайзера
Fb2Epub — конвертирует FB2 в ePUB прямо на Android устройстве
Преобразование речи в текст

Информацию из старой шапки можно получить по ссылке

Сообщение отредактировал apokrifX — 25.03.23, 17:09

19.11.10, 13:16 | #2
●

Куратор темы
Разработчик
Реп: ( 2567 )

Старая версия шапки данной темы

Краткое описание:
TTS — чтение текста голосом для других приложений.

Для новобранцев
Сокращения

TTS: Text To Speech — чтение текста голосом
STT: Speech To Text — распознавание голоса (голос в текст)
ASR: Automatic Speech Recognition — тоже самое
SR: Speech Recognition — тоже самое

Берём файлы common-high.rar и любой из голосов Milena Premium-High или Embedded-High (несколько файлов — это многотомный архив)
common-high.rar (1 файл)
milena_premium-high_1-0-1.part*.rar (4 файла)
milena_embedded-high_1-0-1.part*.rar (2 файла)
* Если видите два файла (или больше) с одинаковым именем — ниже по списку более новые версии голосов.
Лучше распаковывать на компьютере, на Андроиде точно работает ZArchiver
Подключаем Android к PC по USB. «Внутренняя» sdcard Android-a появятся на PC как removable drive, media player или digital camera.
На внутренней sdcard создайте папку VocalizerEx2
Скопируйте в неё распакованные common-high.rar и голос Milena Premium-High или Embedded-High.
Отключите Android от PC: eject / safe remove drives
Берём последний вариант Vocalizer Expressive 2 vocalizer_e2.tts_1.0.2.3t2.zip
Распаковываем, как указанно выше
Устанавливаем.
* Не ищите VocalizerEx2 TTS в приложениях. Это сервис, такой же как Google TTS. В приложениях он НЕ появится.
На Андроиде заходим в «Настройки синтеза речи» и выбираем VocalizerEx2 TTS как TTS по умолчанию.
В настройках VocalizerEx2 откройте «Папка с голосами». Найдите папку VocalizerEx2, которую вы создали и выберите её.
Перезапустите VocalizerEx2. (спойлер «Как перезапустить TTS без перезагрузки Андроида»)
Нажимаем прослушать пример.
Если не работает, перегружаем Андроид, слушаем пример еще раз.
Опять не работает — спрашиваем в теме.

Устанавливаваем reader/читалку c поддержкой TTS, например Moon+ Reader PRO
Слушам любимые книжки.
* Иногда Милена произносит слово «запятая» или другую чепуху.
Лечится регексами. Как конкретно — сделайте поиск в этой теме по ключевому слову запятая.

Для лентяев
TTS НЕ работает И есть желание разобраться

Пишите по форме:
1. Устройство/прошивка/версия Андроида/есть ли рут доступ
2. Какой конкретно TTS engine, его версия + имя и версия голоса
3. Работает ли тест голоса в настройках Андроида
4. Детальное описание вашей проблемы
5. Лог logcat. Без логов можно решить только самые простые проблемы.
* Если выполнить 1..5 невозможно по какой-либо причине, задайте свой вопрос в этой теме

Yandex SpeechKit
Nuancе / Vocalizer

Программы постоянно развиваются, и сделать что-то приличное без документации и SDK практически нереально.
Благодаря EvilShrike удалось сделать Vocalizer TTS.
Если можете помочь с нижеперечисленными программами, ПМ apokrifX.
Заранее благодарю от имени всех участников темы.
Nuance Vocalizer Expressive SDK
Vocalizer Expressive Studio
Vocalizer for Automotive >v5.3
VoCon 3200 Embedded Development System >v3.3
Nuance Voice Ads SDK

Основные словари от Nuance встроены в голоса. Иногда в голосах есть дополнительные словари (от Nuance), обычно для расшифровки сокращений. Редакторы словарей есть в шапке. Попытки создать словари и их результаты вы можете найти в этой теме. Словаря, который «решает абсолютно все проблемы» нет и никогда не будет. Почему — читайте тему.
Словари от DamionSleeper
Словарь от 21aaa12
Объединение словарей

Amazon.com / Ivona
R. H. Voice from Olga Yakovleva 0.4 и 0.5, 0.7.1
Google Text-to-Speech
Code Factory / Vocalizer
Nuancе / Loquendo
SamsungTTS: Samsung & SVOX standard and high quality voices
Nuancе / SVOX

SVOX Classic Text To Speech Engine
На Android 7 SVOX не работает!

Если вам просто нужен любой TTS — прочтите самый первый пункт в шапке «Для новобранцев».

Если у вас не работает купленная версия или trial установленный с Google Play – обращайтесь в поддержку SVOX. Они помогут, вернут деньги или объяснят, почему trial не работает на вашем устройстве.
Озвучивание книг (txt, fb2) при помощи движка YandexTTS
FAQ
SVOX 3 (3.1.5_I для 4.X, September 28, 2012 и 3.1.4_Е для 2.X/3.X, September 10, 2012, 3.1.4 for all voices, September 11, 2012)
SVOX 2 (устар.)
Исправленные версии 313_I/313_E, не требующие прав root и несколько голосов к ним

Sakrament TTS

GooglePlay for Android 4.0.3 and up from sakrament.com
Sakrament TTS
Бета версия, 4 голоса: Ирина, Вячеслав (старые голоса) и Людмила, Максим (новые голоса).
Версия является демонстрационной, 30 дней с момента установки.

Nefonit TTS
GooglePlay for Android 4.0 and up from Nefonit, тут или тут
Полезные ссылки для всех TTS
Sound enhancers and boosters
ViPER’s Audio
В настройках TTS пример работает, а читалки молчат

На некоторых девайсах нужно разрешить TTS-у, читалке и плагину, если таковой используете (например, tts plugin для fb reader) работать в фоне (безопасность/разрешение/загрузка в фоне)

Как включить/отключить озвучку голосом смс оповещений?
Для распознавания/управления голосом
Примеры голосов
Чтение текста в Cool Reader
ЦРТ / Читатель
Читатель — Приложение, которое читает книги вслух качественным синтезированным голосом.

Сейчас ведется разработка «Читателя» под Android и мы планируем выложить его в Google Play уже к концу сентября.

Предложения по улучшения шапки и темы

Предложения по улучшения шапки и темы пишите в QMS apokrifX.
Заметили ошибку или есть предложения по посту, ссылка на который ведёт из шапки пишите в QMS автору поста.
Активность пользователей в теме

Прикрепленные файлы

Сообщение отредактировал apokrifX — 25.02.21, 05:00

Причина редактирования: Обновление: новая версия 1.0.1 RHVoice
19.11.10, 13:26 | #3
●

Куратор темы
Разработчик
Реп: ( 2567 )
Неофициальные голоса для Ivona
Работают только при установленном неофициальном движке
Русский — Russian
Предыдущие версии
Предыдущие версии
Английский — English
Предыдущие версии
Предыдущие версии
Предыдущие версии
Предыдущие версии
Немецкий — German
Французский — French
Предыдущие версии

fra.fra.celine.1.6.63.part1.rar ( 120 МБ )
fra.fra.celine.1.6.63.part2.rar ( 62.37 МБ )
— здесь всего 2 файла. Поэтому нужно объединять с fra.fra.celine.1.6.27-kindle1

Испанский — Spanish
Прошлые версии
Португальский (Бразильский) — Portuguese (Brasil)
Предыдущие версии
Предыдущие версии
Португальский — Portuguese
Предыдущие версии
Польский — Polish

Скачать голоса с уже добавленными файлами .pls можно по ссылке

19.11.10, 13:27 | #4
●

Супермодератор
Реп: ( 0 )
Официальные голоса Ivona ,
которые ранее были в Play Market-e

Amy — UK English
Nicole — Australian English
Gwyneth — Welsh English
Kendra — US English
Penélope — Spanish US
Conchita — Spanish
Marlene — German
Giorgio — Italian
Céline — French
Carmen — Romanian
Dóra — Icelandic
Maja — Polish

Скачать и установить по инструкции

Прикрепленное изображение

Amy — UK English — Скачать
Nicole — Australian English — Скачать
Gwyneth — Welsh English — Скачать
Kendra — US English — Скачать
Penélope — Spanish US — Скачать
Conchita — Spanish — Скачать
Marlene — German — Скачать
Giorgio — Italian — Скачать
Céline — French — Скачать
Carmen — Romanian — Скачать
Dóra — Icelandic — Скачать
Maja — Polish — Скачать

Прикрепленное изображение

Скачать:
https://cloud.mail.ru/public/3Gje/3tKEf7v5n

19.11.10, 13:36 | #5
●

Супермодератор
Реп: ( 0 )
Приложения для чтения книг, поддерживающие функцию Text to speech (TTS)

Moon+ Reader

Менее распространенные
11.02.11, 00:54 | #6
●

Постоянный
Реп: ( 105 )

как решить проблему? в настроиках при выборе синтеза речи Систему Svox Classic TTS выдает следущие: «Произошла неожиданная остановка приложения Настроики (процесс com.android.settings). Повторите попытку». Версия Androida 2.2 Сборка t&l_0.3d.14 . Модель Liquid

Возможно ещё актуально для некоторых пользователей сборки t&l совет по решению этой проблемы, ну или в шапку можно поднять.
В упомянутой сборке вырезаны два нужных для работы svox пакета: TtsService.apk и PicoTts.apk
Нужно просто установить, удобным вам способом эти две программы и всё будет работать.
Я делал так как мне привычней:
— Положил TtsService.apk и PicoTts.apk на флешку
— При помощи Root Explorer’а перенёс в /system/app
— Установил на файлы нужные права (rw-r—r—) и перезагрузил аппарат.

Вы можете использовать другие, известные вам, варианты установки системных программ. Удачи!

Чтобы далеко не ходить, вот эти файлы:
PicoTts.apk ( 13.48 КБ )

02.11.11, 17:10 | #7
●

Постоянный
Реп: ( 129 )
Редактирование словаря SVOX — расстановка ударений

Поставить пробел перед буквой, на которую должно быть ударение.
В некоторых словах двойная гласная, если ударение на «Я», за ней ставлю «а», «е» -> «еэ»
Например, в слове «безвести» ударение получилось поставить «бее з вести»

Картинки здесь
1) Открыть приложение катя и сразу открыть редактор
2) Не закрывая редактора (нажатие кнопки дом) перейти в меню и открыть читалку (я пользуюсь мун ридер)
3) Если при прослушивании обнаруживается неправильно произносимое слово:
Останавливаю чтение
Долгим нажатием на слово выделяю его и нажимаю копировать.
Долгим нажатием дом вызываю мэнэнджэр процесов выбираю открыть «Катя».
В поле ввода долгое нажатие, выбираю вставить, редактирую.
Сразу прослушиваю, как произносит и сохраняю.
С помощью мэнэнджэра процесов перехожу в мун ридер и продолжаю слушать.

Таким же образом я избавляюсь от акцента «его» ->«ево»
Сам файл словаря находиться /sdcard/svox/classic/ru-RU1/ppru-RU.txt

Прикрепленные файлы

Сообщение отредактировал apokrifX — 26.03.13, 23:54

19.01.12, 21:14 | #8
●

Постоянный
Реп: ( 194 )

выкладываю опять все.
TTS -установить
катя-установить(посылает в маркет-выйти)
юрий-установить(посылает в маркет-выйти)
пропатчить (только с рутом работает)
запустить голос-скачать компонент через маркет. пользоваться.

ставить на внутреннюю память
Применение:
Устанавливаем .apk программы. Только обязательно ту, которая кричит про лицензию и которую никто кривыми руками не трогал. Открываем патчер, находим в списке нужную программу.Долгий тап на ней и выбираем верхний пункт. Когда он там всё сделает, запускаем программу.
Особо сильно на глюки не жаловаться, но сообщать о них. Автор приложит все усилия для устранения таковых.
В крайних версиях добавлена возможность блокирования назойливой рекламы в приложениях, но не везде и всегда срабатывает. Перед применением патча рекомендуется сделать бэкап приложения! Если вы решили применить патч, то это сугубо ваше решение! Никто вас не заставлял.
Программы нет и не будет (по вполне понятным причинам) на маркете.

Причины, по которым кряк, сделанный этой программой, может слететь:
1. Обновление прошивки.
2. Очистка дэльвик-кэша в рекавери пользователем.
3. Установка модов изменяющих файлы в папке system/framework — батарейки, меню выключения — это также приводит к пересозданию дэльвик-кэша.
Если это произошло патч нужно применить повторно.

Результаты работы патча НЕ сохраняются с помощью Titanium Backup и любыми другими бэкаперами.
Ссылка где вы можете подробнее узнать о работе патчера ® LuckyPatcher by ChelpuS
добавил
голос
компонент
модуль
кто не может скачать через Маркет

Прикрепленные файлы

Сообщение отредактировал gundin59 — 30.03.12, 16:27

Причина редактирования: + от sashok33 + от Autumn grief
20.01.12, 16:05 | #9
●

Постоянный
Реп: ( 708 )
Редактирование словаря SVOX
arl_spb @ 02.12.2011, 18:28

На счет правил для словаря, все относительно Кати:
Русский алфавит она не знает, то есть как читать буквы алфавита.
Английский алфавит, что то знает, но не все или не так.

Правила какие то есть, вот что обнаружил методом научного тыка:
Перед словом
Точка — Ди
Запятая — Си
Двоеточие — Ил
Точка с запятой — Эс
Восклицательный — Экс
Вопросительный — Кю
Минус перед этими знаками убирает эти звуки
Ударение ставится знаками — ‘|

Сделать чтение приемлемым ,возможно .
1) исправляем в первую очередь «си» «ди» после знаков препинания. Правила такие:
Просто добавляем » сразу после «косячного» знака.

Сделайте правила, например
Самое простое и без потерь интонации, решение.

2) Берём книгу и слушаем , тут же исправляя «на ходу » слова. Работают так же и словосочетания . «все будет = всё будет «
Исправляем меняя буквы, удваивая буквы, делая пробелы, ставя знак —, например:
ненавистно= не на вист-н о
спешившись=спеш шившись и т.д. и т.п.
(через некоторое время приходит понимание, как быстро сделать правило, за секунды)
И так долго и нудно, прослушав книгу, можно добиться в итоге потом, очень хорошего качества.

Одни правила, внутри других не действуют.
Каждое правило нужно составлять с учетом всего. Упростить, потому что часть уже прописана в другом правиле — не получится.

На некоторых словах срабатывают внутренние правила программы . Например при каком то сочетании букв (иногда слов), читать одну букву как другую. И это приоритетно.
Но это тоже можно исправить, если слово(а) разбивать. Чтобы не срабатывало то сочетание. Порой приходится слово жестоко извращать.
Например у меня всегда читало что-то вроде: много лет= много лёт, хоть тресни. В правиле читало нормально. Я заподозрил, что есть системное правило, на которое срабатывает. И по этому сделал, что-то типа лет=ле-т. (точно уже не помню). Стало всё норм.
Всегда нужно проверять чтение. В правиле может быть всё отлично, а в тексте нет.

Сообщение отредактировал apokrifX — 31.05.13, 02:52

20.01.12, 20:12 | #10
●

Постоянный
Реп: ( 129 )
Как улучшить произношение

Прикрепленное изображение

Нажимаем на картинку с карандашом, запускаем редактор словаря.
В первую строку (Input) копируем слово или словосочетание.
Во второй строке (Pronounced As) редактируем.
Дальше прослушать как будет звучать (обозначено красным)
Если устраивает — сохранить (кнопка обозначена жёлтым)

SvoxPron.zip — пример cловаря, включает 465 слов из 250.000 русских по Ожегову.

Прикрепленные файлы

Сообщение отредактировал apokrifX — 31.05.13, 03:02

14.03.12, 12:46 | #11
●

Постоянный
Реп: ( 257 )
Если нет пункта «Настройки синтеза речи» вариант I

[b]1. Что делать если в Настройки —> Голосовой Ввод и Вывод нет пункта «Настройки синтеза речи»?
Сначала смотрим может данный пункт по другому называется (зависит от производителя и переводчика пунктов меню). Возможные варианты: Синтез речи, Голосовой вывод, Результаты преобразования (в разделе РЕЧЬ) или как то так. Если же все таки нет — возможны варианты:
— перепрошиваемся на другую прошивку или устанавливаем Свокс версию 3.1.1
— Скачиваем любую официальную прошивку, потрошим её и вытаскиваем из system/app/ файлы TtsService.apk и PicoTts.apk (для андроида 4.0 и выше лишь PicoTts.apk). Далеко ходить не надо, можно скачать их ниже.
— При помощи Root Explorer’а переносим данные файлы в /system/app (смонтировав предварительно R/W — сверху должна быть надпись «Права на чтение/запись» или «информация о памяти, r/w» возле кнопки «Права R/O») — Устанавливаем на файлы нужные права (rw-r—r—), для чего делаем долгое нажатие на файл, выбираем «Разрешения», выставляем галки

Прикрепленное изображение

и после установки разрешений на обоих файлах (для андроида 4.0 и выше нужен только PicoTts.apk) перезагружаем наш аппарат.

Если нет пункта «Настройки синтеза речи» вариант II

Если нет настроек TTS в меню
1. Для Андроид 2.Х и 3.Х установить TtsService.apk (можно также установить PicoTts.apk)

2. Если «Настройки TTS» в меню не появились, попробуйте любой способ, какой для вас проще:
A. Из adb shell:
am start -a com.android.settings.TTS_SETTINGS
или
am start -a android.intent.action.MAIN -n com.android.settings/.Settings\$TextToSpeechSettingsActivity

B. Установить Apex Launcher, затем
меню/настройка Apex/Расширенные настройки/Настройки меню/Настройки/поставить значение «показать»

C. Использовать setting.tts (в этом посте)

D. Поставить бесплатный движок Acapela, без голоса, можно с маркета. В нем есть кнопка «настройки», при нажатии на которую появляется стандартное окно настроек tts android.

Как сделать, чтобы reader не переставал читать текст, когда блокируется экран телефона?

Можно поменять режимы работы процессора на SmartassV2
System Tuner
SetCPU
Или поставить другую версию мунридера.
В Кулридере выставить в настройках ДЛИТЕЛЬНОСТЬ ПОДСВЕТКИ ЭКРАНА > УСТАНОВЛЕННАЯ В СИСТЕМЕ. Теперь экран отключается или отключаю принудительно, а говорение не прирывается.

Хочу купить, а не поставить снова ломанную

Нашел решение:
без ROOT прав (мой случай)
с ROOT правами
Совместил оба способа и все произошло.

Если кому-то пригодится, то делал так:
1) Установливаем «ломанную» программу (если ранее была удалена)
2) Удаляем «хвосты»:Настройка(телефона)>Управление приложениями>Тап по приложению>Очистить данные
3) Удаляем программу из «Управления приложениями»(телефона).
4) Чистим кэш Маркета. Настройки(телефона)>Управление приложениями>Маркет>Очистить данные.
5) Удаляем все обновления Маркета (у меня он вернулся к версии 2.3.6)
6) Дальше очень быстро заходите в маркет и находите свое приложение (очень быстро, т.к. маркет быстро обновится и вылетет, а после уже будет последней версии). Если у вас маркет обновился, то опять удаляем обновления и повторяем процесс.
7) О ЧУДО! есть цена и можно купить!

Инструкции по продлению триального срока
Инструкция 1

Необходимое условие: Root(SuperUser), RootExplorer (либо аналог), DroidWall (или аналог).
1. Качаем TTS Svox Classic 3.0
2. Скачиваем TTS Svox Katja/Yurij Trial (желательно через TTS Svox Classic 3.0, т.е. запускаем выбираем российский флаг, тапаем по Katja или Yuriij -> Get trial)
3. Выкачиваем чемоданы с маркета.
4. Видим срок триала (примерно 14 суток)
4.1 Запрещаем доступ в инет для TTS Svox Katja/Yurij Trial
5. Файловым менеджером копируем с заменой файл settings.xml.xml в data/data/com.svox.classic.langpack.rus_rus_fem(male)_trial/shared_prefs/
6. Присваиваем Permissions точно такие же как и у остальных файлов в этой директории.
7. Выходим, запускаем TTS Svox Katja/Yurij, видим срок триальности до 2265 года (или типа того)
P.S.: Чтобы обновить движки заходим в Маркет->Мои приложения если есть надпить «Обновление» — нажимаем «Обновить»

Прикрепленное изображение

Инструкция 2

1. Ставим из маркета Svox и голос Юрия к нему.
2. Переключаемся на него и проверяем чтобы все работало
3. Останавливаем Svox (переключившись на PicoTTS, например) открываем rootexplorer’ом файл /data/data/com.svox.classic.language.rus_mail_trial/shared_pres/settings.xml.xml и правим там начальные цифры со 123 на 163 (это будет 2021 год). К примеру:
1234723024
на
1634723024
4. Сохраняем файл, возвращаем пермишны (если они изменились) как и на других файлах
5. Отключаем инет и идем в настройки синтеза речи и активируем SVOX.
6. Запускаем Svox Yuri russian видим что триал до 2021 года
7. Пользуемся

Примечание — главное не запускать Svox Yuri russian при включенном интернет соединении, т.к. он проверяет лицензию в сети и обновляет если она отличается. Можно вообще закрыть доступ в инет SVOX, например, с помощью Droid Wall.

Не забываем что на момент выхода последней версии SVOX в то время самая свежая версия андроид на устройствах была 4.4 . В то время PicoTts было системным во всех официальных прошивках, а в неофициальных это приложение часто было удалено. Движок SVOX использует внешние библиотеки TTS, которые в то время были в PicoTts . Поэтому в инструкциях было указано что в случае когда не работает SVOX необходимо установить PicoTts.apk .

Прикрепленные файлы

Сообщение отредактировал alsv70 — 22.02.22, 22:39

Причина редактирования: Объяснил причину установки PicoTts.apk в инструкциях
15.03.12, 10:34 | #12
●

Постоянный
Реп: ( 48 )
den182 @ 14.03.2012, 18:44
Ребята дайте плийз Svox Uk English Victoria v3

1. отрубить инет
2. поставить
3. запустить lucky patcher, пропатчить
4. врубить инет
5. запустить
профит

Прикрепленные файлы

Сообщение отредактировал EvilShrike — 15.03.12, 10:35

19.03.12, 21:04 | #13
●

Постоянный
Реп: ( 257 )
SVOX Classic Text To Speech Engine

Прикрепленное изображение

Дополнительная информация

1. Как её запустить, чтоб читала? или она по умолчанию начнет сама?
TTS Engine это только «движок» TTS. Читает книгу или воспроизводит голосом СМС какая-то другая программа с помощью движка(Engine) TTS
2. Не подскажете где взять другие языки для него?
Смотри ссылки в шапке на SVOX 2 и SVOX 3.
SVOX 2 уже устарел.
3. Какой движок нужно поставить?
для андроида 4.0 (ICS) и выше (JB) версия 3.1.1_I, для других версий андроида (ниже андроида 4.0) версия 3.1.2_E. Обратите внимание на букву в конце (они разные для разных версий андроида) лучше ставить с маркета — он бесплатен и маркет автоматически проверяет ошибки). Более новые движки смотрите ссылки в шапке на SVOX 3. Там же можно найти голоса для SVOX.
4. Как улучшить произношение?
редактиравание словаря svox (splavon)
правила для словаря (contradictor)
5. Установлен SVOX Classic TTS и голос Юрий, но в Moon+ Reader не появился пункт Speak
Нужна версия Moon+ Reader PRO. Или FBreader с TTS.
6. А можно поставить два языка (например Английский + Русский) ?
В SVOX есть настройка, какой голос по умолчанию каждого языка (Русский — можно выбрать Катю или Юру)
Settings | Language & keyboard | Text-to-speech output | в поле SVOX Classic TTS — тап на настройки (справа) | Settings for SVOX Classic TTS | Select preferred voice per Language | Russian voice
Katja
Yuri
Эта настройка работает, когда программа знает, как запросить конкретный язык, например iGo.
Если программа этого делать не умеет, например Coolreader, то можно установить голос так:
Settings | Language & keyboard | Text-to-speech output | в поле SVOX Classic TTS — тап на настройки (справа) | Language (Sets the language-specific voice for the spoken text)
Здесь будут показаны все установленные голоса (всех языков)
Russian (Russia, Katja)
Russian (Russia, Yuri)
English (United States, Grace)
И .т.д.
6.1. Как переключать языки, на версии Android 4.0.3 (ICS)?
Идем в Настройки>Язык и ввод>Вывод функции текста в речь (Синтез речи)>SVOX Classic TTS>Язык. Там выбираем нужный язык. После всех действий нужно перегрузить телефон.
Скрин : http://sdl1.4pda.ru/1918805.png
6.2. Как переключать языки, на версии Android 2.3?
Настройки -> Язык и клавиатура -> Настройки синтеза речи -> SVOX Classic TTS (Настройки SVOX Classic TTS) -> Select preferred voice per language (Выбор предпочтительного голоса для языка — перевод от меня) -> Russian Voices (Русские голоса — перевод от меня)-> Select preferred voice for this Language (Выберите предпочтительный голос для этого языка -перевод от alsv70).
Напомню русские названия меню в настройках зависят от того кто переводил данные пункты меню и самой прошивки.
7. Хочу установить, но пишет что нет свободного места, что делать?
Почистите Dalvik Cache (перезагружаемся в рекавери (CWM), затем пункт Advanced, потом Wipe Dalvik Cache)
8. Как настроить читалку Moon Reader Pro для чтения голосом?
SVOX Classic Text To Speech Engine (Пост #12117924)
9. Как посмотреть какая версия движка стоит?
Настройки -> Приложения -> Управление приложениями -> «Название голоса»
10. Что делать если зависает, на проверке лицензии при запуске приложения голоса?
В начале удаляем фиксацию изменений в лакипатчере длинный тап по приложению голоса-> Фиксация изменений->Удалить фиксацию (для обновления приложения). Если такого пункта нет смотрите тему LuckyPatcher by ChelpuS. Потом удалить голоса и движок свокс. Удалить папку svox (по способу установки от alsv70 можно не удалять). После этого надо заново установить движок (желательно с маркета — он бесплатен) и голос(а) согласно инструкции по установке.
11. Происходит остановка после каждого прочитанного предложения в читалках. Как наладить непрерывное чтение?
В словаре корректировки произношения прописать правила
.=.»
,=,»
!=!»
?=?»
(Как делать корректировку см. пункт №4.)
12. Что надо делать если не получается купить? Ответ найденный Shatan:
1) Установливаем «ломанную» программу (если ранее была удалена)
2) Удаляем «хвосты»:Настройка(телефона)>Управление приложениями>Тап по приложению>Очистить данные
3) Удаляем программу из «Управления приложениями»(телефона).
4) Чистим кэш Маркета. Настройки(телефона)>Управление приложениями>Маркет>Очистить данные.
5) Удаляем все обновления Маркета (у меня он вернулся к версии 2.3.6)
6) Дальше очень быстро заходите в маркет и находите свое приложение (очень быстро, т.к. маркет быстро обновится и вылетет, а после уже будет последней версии). Если у вас маркет обновился, то опять удаляем обновления и повторяем процесс.
7) О ЧУДО! есть цена и можно купить!

Инструкции по установке

Внимание! Мы не вынуждаем вас устанавливать крякнутую версию программы и советуем покупать ее из маркета! Мы не несем никакой ответственности за вред причиненный вашему аппарату. Все, что вы делаете, вы делаете на свой страх и риск.

Инструкция от under_oid

Читаем инструкцию до конца,потом приступаем к установке!
Внимание! Для установки таким способом, нужен доступ к Root, если у вас его нет, можете не читать дальше.
1. Скачиваем движок SVOX из ниже (из шапки) или из маркета (для андроид 2.2, 2.3 желательно версию 3.1.4_E) , устанавливаем, запускаем.
Внимание! Если у вас ранее стояла любая версия SVOX, но потом вы удалили ее и теперь хотите установить заново, то обязательно надо проделать процесс из спойлера Инструкция по удалению. (К тем кто делал Hard Reset — это не относится, только удаляем фиксацию изменений в Lucky Patcher-е из той же инструкции по удалению и продолжаем дальше)

Инструкция по удалению

(!)В начале удаляем фиксацию изменений в лакипатчере длинный тап по приложению голоса-> Фиксация изменений->Удалить фиксацию (для обновления приложения) далее идем в sdcard —> удаляем директорию svox ,открываем Root Explorer или ADB, идем в data —> data —> находим там com.svox.classic и com.svox.classic.langpack.rus_rus_(тут male или fem) и удаляем их (долгий тап по папке а потом Delete) (если папка com.svox.classic.langpack.rus_rus_fem или male отсутствует не обращаем внимания и продолжаем процедуру дальше).

2. Идем в Настройки —> Голосовой ввод и вывод —> Настройки синтеза речи —> в самом низу ставим галочку около SVOX Classic TTS.
2.Скачиваем Lucky Patcher отсюда и устанавливаем.
3. Выключаем интернет.
4. Скачиваем голос из ниже (из шапки), устанавливаем , быстро выходим из таблички «Приложение Установлено», открываем Lucky Patcher ждем пока Lucky Patcher просканирует программы следим за табличкой где написано название , если вместо Lucky Patcher написалось название голоса, не даем открыться голосу и пока экран черный, нажимаем много раз кнопку «Назад», чтобы выйти, открываем заново Lucky Patcher (теперь у вас есть немного времени в запасе) ждем сканирование, потом перед вами предстанет табличка со списком установленных программ, находим среди них файл нашего голоса, долгий тап по нему, жмем :
Инструкция для патчера:
версии 0.4+ Жмем «Удалить проверку лицензии!», потом выбираем «Автоматический Режим», далее откроется табличка жмем ОК.
версии 1.0.19+ Жмем «Пользовательский Патч!» и ждем результата процесса.
За развитием Lucky Patcher-а, а также за подробной инструкцией идем в эту тему —> R LuckyPatcher by ChelpuS (Пост #10727871)
5. Включаем интернет ,идем в меню открываем файл голоса, жмем Download, ждем загрузку кеша, кеш загрузился и все пользуемся на здоровье! 🙂

Если не хотите или не получается скачать кеш голоса

Достаточно развернуть архивы с ними вот из этого сообщения на SD-карту sdcard/svox/classic. При первом запуске они подхватяться автоматом. Cпасибо AnVn за это.

Инструкция по установке от alsv70 (также подходит для ICS

Данная инструкция также подходит для всех типов андроида и годится для первичной установки и для установки после перепрошивки без удаления папки svox
(Инструкция по установке от alsv70 (также
подходит для ICS)
Данная инструкция также подходит для всех
типов андроида и годится для первичной
установки и для установки после
перепрошивки без удаления папки svox
1) нужны права рут , аккаунт в маркете
должен быть активным, интернет должен
быть включён на протяжении всей установки,
должны быть установлены лакипатчер и
Autostarts , при повторной установке в папке
svox должен быть рабочий голос или голоса
версии не ранее 3.0 (у меня одна Катя
версии 3.1.0).
2) устанавливаем движок — для ics версия
3.1.1_I, для других версий андроида версия
3.1.2_E (я ставил с маркета), не открывая
после установки.
3) заходим в Autostarts , находим вкладку
Программа установлена -> нажимаем SVOX
Classic TTS -> выбираем запретить.
4) устанавливаем голос или голоса (те что
стояли) , не боясь их автозапуска.
5) заходим в лакипатчер , длинный тап по
приложению голоса -> нажимаем
Пользовательский патч! и ждём пока
появится результат патча. Если не один
голос — потом повторяем для других голосов.
6) заходим в Autostarts , находим вкладку
Программа установлена -> нажимаем SVOX
Classic TTS -> выбираем -> выбираем
разрешить.
7) заходим в приложение голоса (любого из
установленных). Голос проходит проверку
лицензии, проверку установленных
компонентов (кеша и файлов приложения). В
случае отсутствия кеша выскакивает
сообщение с кнопкой Download (в случае
рабочего голоса в папке svox это сообщение
не выскакивает), после нажатия которой
происходит скачивание кеша. Потом
выскакивает сообщение с предложением
перейти в настройки TTS ( Go to settings TTS ),
нажимаем на него и попадаем в настройки
синтеза речи (на андроид ics 404
выскакивало сообщение что данные
настройки не найдены ( To open Text-to-
Speech Settings please open Settings and Input
-> Text-to-Speech ), нажав на это сообщение
попадаем в настройки телефона и вручную
переходим: Язык и ввод -> Синтез речи ).
8) в настройках синтеза речи (Голосовой
вывод) выставляем галку напротив SVOX
Classic TTS
9) для андроида 2.3 в настройках синтеза
речи напротив Только мои настройки ставим
галку для высокоуровневых устройств , для
низкоуровневых устройств ставить галку не
надо — иначе появятся искажения. Если не
знаете какое у вас устройство — попробуйте и
так и так.
10) в настройках синтеза речи нажимаем
Прослушать пример и убеждаемся что svox
работает.
Всё установка закончена. Осталось
проверить работу TTS в приложениях.
Для улучшения качества звучания
используйте словарь коррекции
произношения (смотри FAQ в шапке пункт 5),
но при большом словаре начинает
тормозить. Замечу качество звучания
зависит ещё и от других нюансов: режима
процессора (рекомендую поставить
SmartassV2), влияет то что кеш голосов
лежит на карте памяти, а следовательно
зависит от её быстродействия и качества.
Ну и конечно зависит от настроек
программы использующей TTS (например
мунридер).
На момент установок стояли Autostarts версии 1.7.5 , Lucky Patcher
версии 1.5.0 .

Инструкция по установке ломанной версии не требующая прав Root , на Android ICS (4.0.X)

Инструкция была создана apokrifX , за что, говорим ему спасибо , при поддержке ув. alsv70 .
SVOX Classic Text To Speech Engine (Пост #14637879)

Инструкция по продлению триального срока.

Необходимое условие: Root(SuperUser), RootExplorer (либо аналог), DroidWall (или аналог).
Инструкция:
1. Качаем TTS Svox Classic 3.1.2 или 3.1.1 для своей версии андроида (из маркета или из темы, без разницы)
2. Скачиваем TTS Svox Katja/Yurij Trial (желательно через саму программу, т.е. запускаем выбираем российский флаг, тапаем по Katja или Yuriij -> Get trial)
3. Выкачиваем чемоданы с маркета.
4. Видим срок триала (примерно 14 суток)
4.1 Отключаем инет выключив wifi/gprs или запрещаем доступ DroidWall’ом для TTS Svox Katja/Yurij Trial
5. Файловым менеджером копируем с заменой файл settings.xml.xml в data/data/com.svox.classic.langpack.rus_rus_fem(male)_trial/shared_prefs/
6. Присваиваем Permissions точно такие же как и у остальных файлов в этой директории.
7. Выходим, запускаем TTS Svox Katja/Yurij, видим срок триальности до 2265 года (или типа того)
P.S.: Чтобы обновить движки заходим в Маркет->Мои приложения если есть надпить «Обновление» — нажимаем «Обновить»
http://4pda.to/forum/dl/post/1315958/settings.xml.xml

Инструкция от gundin59

Прикрепляю версию свокс..SVOXClassicTTS312E.apk
SVOXKatjaRussian310.apk
для тех у кого не получается
устанавливаем TTS
устанавливаем голос(его и патчим)
Устанавливал несколько раз. Проблем с проверкой лицензии не возникает.
Сегодня перепрошил девайс. Установил тоже без проблем.
Ссылка на оригинальный пост автора патчера вновь даю
http://dimonvideo.ru/smart/forum/topic_1728149047/91/0/

Я выложил файлы с купленого svox потому и должно работать.
удалять старую папку и программу обязательно.
ставим TTS svox Classic
ставим голос
патчим
запускаем Svox Katja
загружаются ресурсы
пользуемся.
прикрепляю папку svox.
прикрепляю голос Yuri
Внимание! Для работы патчера необходим Root!

TTS -установить
катя-установить(посылает в маркет-выйти)
юрий-установить(посылает в маркет-выйти)
пропатчить (только с рутом работает)
запустить голос-скачать компонент через маркет. пользоваться.

Результаты работы патча НЕ сохраняются с помощью Titanium Backup и любыми другими бэкаперами.
Ссылка где вы можете подробнее узнать о работе патчера R LuckyPatcher by ChelpuS
добавил
голос
компонент
модуль
кто не может скачать через Маркет

Способ установки через Titanium Backup

[b]Нужен Root и Titanium Backup Pro . Сначала удаляем все свои svox-ы, в том числе папку svox на SD-карте (опять-таки пункт 1 инструкция по удалению вам в помощь).

Установка Кати — Скачиваем архив ниже, открываем архив , жмем на любое место (в частности белое) правой кнопки мыши, далее жмем в открывшемся окне Извлечь в указанную папку , выбираем куда «вытащить» содержимое архива.
Далее копируем папки TitaniumBackup и svox на корень карты памяти (/sdcard).
Далее устанавливаем Titanium Backup (Pro) из ссылки выше, открываем TitaniumBackup, далее в TitaniumBackup жмем Меню>Обновить список, затем >Меню>Обработки>Восстановить ПО с данными и ставим галочки на SVOXClassic и SVOXRussianKatja , а также Lucky Patcher >Запустить пакетную обработку.. Все.
[attachment=»1735640:Katya.rar»] — Катя

Установка Юры — Скачиваем архив ниже, открываем архив , жмем на любое место (в частности белое) правой кнопки мыши, далее жмем в открывшемся окне Извлечь в указанную папку , выбираем куда «вытащить» содержимое архива.
Далее копируем папки TitaniumBackup и svox на корень карты памяти (/sdcard).
Далее устанавливаем Titanium Backup (Pro) из ссылки выше, открываем TitaniumBackup, далее в TitaniumBackup жмем Меню>Обновить список, затем >Меню>Обработки>Восстановить ПО с данными и ставим галочки на SVOXClassic и SVOXRussianYuri , а также Lucky Patcher >Запустить пакетную обработку.. Все.
[attachment=»1743930:Yuri.rar»]

Внимание! В данном бэкапе (ниже) находятся голос Юры, Кати, движка SVOX, кэш от них, а также Lucky Patcher! Бэкап от under_oid. В архив входит : Бэкап Кати, Юры, Бэкап Svox-а (движка), Бэкап Lucky Patcher-а , кэш.
Разархивируем архив в любую папку на компьютере, кидаем все файлы кроме папки svox в Titanium Backup на карте. Потом кидаем папку svox — в корень карты памяти (или память телефона если она есть) Далее в TitaniumBackup Pro жмем Меню>Обновить список, затем >Меню>Обработки>Восстановить ПО с данными и ставим галочки на SVOXClassic ,SVOXRussianKatja ,SVOX Russian Male Voice , Lucky Patcher затем >Запустить пакетную обработку.
http://narod.ru/disk/53641091001.475d2086d. er_oid.rar.html

Бэкап версии движка 3.1.1 I + Lucky Patcher 1.1.10 + кеш для версии Android 4.0.X (ICS) от comps, за что ему огромное спасибо.
Разархивируем архив в любую папку на компьютере, кидаем все файлы кроме папку Titanium Backup на карту. Потом кидаем папку svox — в корень карты памяти (или память телефона если она есть) Далее в TitaniumBackup Pro жмем Меню>Обновить список, затем >Меню>Обработки>Восстановить ПО с данными и ставим галочки на SVOXClassic ,SVOXRussianKatja ,SVOX Russian Male Voice , Lucky Patcher затем >Запустить пакетную обработку.
Скачать: http://narod.ru/disk/46024046001.6f546b0aa. x.7z.html»

Если у вас не получается купить программу, ломанную версию которой уже установили ранее, то:
Для тех у кого есть Root

1) Очень важно, чтобы приложение не было установлено на вашем телефоне (инструкция по удалению в спойлере из спойлера выше)
2) С помощью Titanium Backup Pro преобразовываете маркет в пользовательское приложение!
(долгий тап на приложении -> преобразовать в пользовательское)
3) Удаляйте данные маркета и удаляйте маркет к чертям, и ставьте старую версию маркета.
P.S. Иногда может потребоваться переделать старый маркет в системное приложение
4) Дальше очень быстро заходите в маркет и находите свое приложение (очень быстро, т.к. маркет быстро обновится и вылетет, а после уже будет последней версии)
P.S . Если у вас маркет обновился, то опять устанавливаем старую версию и повторяем процесс
5) Теперь есть цена и можно купить!
6) Теперь можно обратно сделать маркет системным приложением через Titanium Backup.

Для тех у кого нет Root

1)Устанавливаем ломанный движок SVOX.
2)Удаляем хвосты Настройки —> Управление приложениями—> Тап по приложению —>Очистить данные.
3)Удаляем хвосты способом который указан вначале (пункт первый инструкция по удалению)
4)Чистим кэш Маркета через Управление приложениями. (Кэш Маркета также чистится:Настройки(телефона)>Управление приложениями>Маркет>Очистить данные.)
Из списка «библиотеки», приложение никуда не денется. Зато появиться возможность приобрести(кнопка с ценой).
Далее заходим в Маркет с телефона>Через «Поиск» находим SVOX Russian Katja Voice.
Если цена не появилась,значит- что-то с кэшем или «хвосты».
Если все сделано правильно,на кнопке должна появиться цена.Выставляем флажок «Я согласен с условиями Google Play»,активируем кнопку.Если качать не начинает(во-многом зависит от версии Маркета)-отменяем заказ.Покупать можно будет через 5-7 дней(точнее в Чекауте написано,про состояние заказа).Эти 5-7 дней,ломаную прогу-НЕ УСТАНАВЛИВАТЬ.
Сервер обрабатывает отмену заказа,и приложение удаляется из «Библиотеки приложений»,как-будто она никогда не была установлена на телефоне.Через 5-7 дней спокойно можно покупать

У вас что-то не работает с программой SVOX или не работает сама программа

Модель вашего аппарата и версия Android.
Версия движка SVOX и версия голоса.
Наличие Root прав (да/нет)
Что, именно у вас не работает (постарайтесь подробно описать)?
Опишите схему, по которой устанавливали/пытались решить ту или иную проблему

————————————————————-
при установке программа установки голоса проверяет наличие 40 метров памяти телефона (не путать с картой памяти) — заложено разработчиком. Зачем — не знаю.
Знаю это потому что когда-то пробовал перевести для себя программу голоса или программу движка, но так и не закончил. Так что освободите место в телефоне.
————————————————————-
GrAnd1, русские голоса брать тут: SVOX Classic Text To Speech Engine (Пост #10966507)

Сам там брал ещё в январе. Движок брал в маркете и всем советую там брать ( он там бесплатный).
На всякий случай выкладываю те, которые у меня:
com.svox.classic.langpack.rus_rus_fem.apk ( 252.94 КБ )

По поводу патчера советую глянуть ® LuckyPatcher by ChelpuS
Кратко напишу ещё раз действия в нём: длинный тап по SVOX Katja Russian -> выбираешь Пользовательский патч -> ждёш пока не выдаст результат.

Сообщение отредактировал alsv70 — 15.11.14, 09:12

03.04.12, 11:59 | #14
●

Активный
Реп: ( 10 )

Кому хочется, можете попробовать мой словарь: SvoxPron.zip ( 25.91 КБ )
Разархивировать и импортировать в программе.

Держите ppru_RU1.txt ( 156.44 КБ )

Нижнее подчеркивание в названии на дефис нужно заменить, вот так чтобы было ppru-RU1.txt
Или вот то же самое, только в архиве ppru_RU1.zip ( 30.73 КБ )
Разархивировать в папку /svox/classic/ru-RU

Сообщение отредактировал apokrifX — 31.05.13, 02:57

03.04.12, 23:38 | #15
●

Постоянный
Реп: ( 328 )

Проверил с выложенным выше словарем SvoxPron.zip — файл с какой-то ошибкой, не импортируется. я экспортировал свой словарь, открыл редактором и скопировал содержимое из выложенного, начиная со слова «sms эсэм эс», а потом импортировал файл обратно — проблем не возникло.

Warsik @ 03.04.2012, 22:16
Наверное, навалившись всем миром на словарь произношений, можно довести
этот голос до ума.

Разбухшие словари тормозят svox, по крайней мере китайский планшет Ainol Novo 7 Advanced это чувствует и напряжно долго продумывает каждое предложение. ИМХО лучше подбирать часто встречающиеся слова самому — у всех профиль использования разный

splavon @ 04.04.2012, 00:25
надо чтобы кто то их обьеденил.

Вот, у себя на HTC Sensation проверил — затянулось

Прикрепленные файлы

Сообщение отредактировал apokrifX — 31.03.13, 02:44

Как сделать говорящую программу на Python самостоятельно?

Озвучиваем системное время и любой текст в Windows и Linux. Используем pytts3, espeak, RHVoice, gTTS, Speech dispatcher.

29 августа 2019 10 минут 123925

Автор статьи
Мария Лисянская

Автор статьи
Мария Лисянская
https://gbcdn.mrgcdn.ru/uploads/post/1991/og_image/84f8204b6001e08386ade835e344324a.png

Синтез речи может пригодиться вам в работе над мобильным помощником, умным домом на Raspberry Pi, искусственным интеллектом, игрой, системой уведомлений и звуковым интерфейсом. Голосовые сообщения донесут информацию до пользователя, которому некогда читать текст. Кроме того, если программа умеет озвучивать свой интерфейс, она доступна незрячим и слабовидящим. Есть системы управления компьютером без опоры на зрение. Одна из самых популярных — NVDA (NonVisual Desktop Access) — написана на Python с добавлением C++.

Давайте посмотрим, как использовать text-to-speech (TTS) в Python и подключать синтезаторы голоса к вашей программе. Эту статью я хотела назвать «Говорящая консоль», потому что мы будем писать консольное приложение для Windows, Linux, а потенциально — и MacOS. Потом решила выбрать более общее название, ведь от наличия GUI суть не меняется. На всякий случай поясню: консоль в данном случае — терминал Linux или знакомая пользователям Windows командная строка.

Цель выберем очень скромную: создадим приложение, которое будет каждую минуту озвучивать текущее системное время.

Готовим поляну

Прежде чем писать и тестировать код, убедимся, что операционная система готова к синтезу речи, в том числе на русском языке.

Чтобы компьютер заговорил, нужны:

голосовой движок (синтезатор речи) с поддержкой нужных нам языков,
голоса дикторов для этого движка.

В Windows есть штатный речевой интерфейс Microsoft Speech API (SAPI). Голоса к нему выпускают, помимо Microsoft, сторонние производители: Nuance Communications, Loquendo, Acapela Group, IVONA Software.

Есть и свободные кроссплатформенные голосовые движки:

RHVoice от Ольги Яковлевой — имеет четыре голоса для русского языка (один мужской и три женских), а также поддерживает татарский, украинский, грузинский, киргизский, эсперанто и английский. Работает в Windows, GNU/Linux и Android.
eSpeak и его ответвление — eSpeak NG — c поддержкой более 100 языков и диалектов, включая даже латынь. NG означает New Generation — «новое поколение». Эта версия разрабатывается сообществом с тех пор, как автор оригинальной eSpeak перестал выходить на связь. Система озвучит ваш текст в Windows, Android, Linux, Mac, BSD. При этом старый eSpeak стабилен в ОС Windows 7 и XP, а eSpeak NG совместим с Windows 8 и 10.

В статье я ориентируюсь только на перечисленные свободные синтезаторы, чтобы мы могли писать кроссплатформенный код и не были привязаны к проприетарному софту.

По качеству голоса RHVoice неплох и к нему быстро привыкаешь, а вот eSpeak очень специфичен и с акцентом. Зато eSpeak запускается на любом утюге и подходит как вариант на крайний случай, когда ничто другое не работает или не установлено у пользователя.

Установка речевых движков, голосов и модулей в Windows

С установкой синтезаторов в Windows проблем возникнуть не должно. Единственный нюанс — для русского голоса eSpeak и eSpeak NG нужно скачать расширенный словарь произношения. Распакуйте архив в подкаталог espeak-data или espeak-ng-data в директории программы. Теперь замените старый словарь новым: переименуйте ru_dict-48 в ru_dict, предварительно удалив имеющийся файл с тем же именем (ru_dict).

Теперь установите модули pywin32, python-espeak и py-espeak-ng, которые потребуются нам для доступа к возможностям TTS:

pip install pywin32 python-espeak pyttsx3 py-espeak-ng

Если у вас на компьютере соседствуют Python 2 и 3, здесь и далее пишите «pip3», а при запуске скриптов — «python3».

Установка eSpeak(NG) в Linux

Подружить «пингвина» с eSpeak, в том числе NG, можно за минуту:

sudo apt-get install espeak-ng python-espeak

pip3 install py-espeak-ng pyttsx3

Дальше загружаем и распаковываем словарь ru_dict с официального сайта:

Теперь ищем адрес каталога espeak-data (или espeak-ng-data) где-то в /usr/lib/ и перемещаем словарь туда. В моем случае команда на перемещение выглядела так:

sudo mv ru_dict-48 /usr/lib/i386-linux-gnu/espeak-data/ru_dict

Обратите внимание: вместо «i386» у вас в системе может быть «x86_64. » или еще что-то. Если не уверены, воспользуйтесь поиском:

find /usr/lib/ -name «espeak-data»

RHVoice в Linux

Инструкцию по установке RHVoice в Linux вы найдете, например, в начале этой статьи. Ничего сложного, но времени занимает больше, потому что придется загрузить несколько сотен мегабайт.

Смысл в том, что мы клонируем git-репозиторий и собираем необходимые компоненты через scons.

Для экспериментов в Windows и Linux я использую одни и те же русские голоса: стандартный ‘ru’ в eSpeak и Aleksandr в RHVoice.

Как проверить работоспособность синтезатора

Прежде чем обращаться к движку, убедитесь, что он установлен и работает правильно.

Проверить работу eSpeak в Windows проще всего через GUI — достаточно запустить TTSApp.exe в папке с программой. Дальше открываем список голосов, выбираем eSpeak-RU, вводим текст в поле редактирования и жмем на кнопку Speak.

Обратиться к espeak можно и из терминала. Базовые консольные команды для eSpeak и NG совпадают — надо только добавлять или убирать «-ng» после «espeak»:

espeak -v ru -f D:\my.txt

espeak-ng -v en «The Cranes are Flying»

echo «Да, это от души. Замечательно. Достойно восхищения» |RHVoice-test -p Aleksandr

Как нетрудно догадаться, первая команда с ключом -f читает русский текст из файла. Чтобы в Windows команда espeak подхватывалась вне зависимости от того, в какой вы директории, добавьте путь к консольной версии eSpeak (по умолчанию — C:\Program Files\eSpeak\command_line) в переменную окружения Path. Вот как это сделать.

Библиотека pyttsx3

PyTTSx3 — удобная кроссплатформенная библиотека для реализации TTS в приложениях на Python 3. Использует разные системы синтеза речи в зависимости от текущей ОС:

в Windows — SAPI5,
в Mac OS X — nsss,
в Linux и на других платформах — eSpeak.

Это очень удобно: пишете код один раз и он работает везде. Кстати, eSpeak NG поддерживается наравне с исходной версией.

А теперь примеры!

Просмотр голосов

У каждого голоса есть несколько параметров, с которыми можно работать:

id (идентификатор в операционной системе),
name (имя),
languages (поддерживаемые языки),
gender (пол),
age (возраст).

Первый вопрос всегда в том, какие голоса установлены на стороне пользователя. Поэтому создадим скрипт, который покажет все доступные голоса, их имена и ID. Назовем файл, например, list_voices.py:

tts = pyttsx3.init() # Инициализировать голосовой движок.

У активного движка есть стандартный параметр ‘voices’, где содержится список всех доступных этому движку голосов. Это нам и нужно:

# Перебрать голоса и вывести параметры каждого

for voice in voices:

print(‘Имя: %s’ % voice.name)

print(‘ID: %s’ % voice.id)

print(‘Язык(и): %s’ % voice.languages)

print(‘Пол: %s’ % voice.gender)

print(‘Возраст: %s’ % voice.age)

Теперь открываем терминал или командную строку, переходим в директорию, куда сохранили скрипт, и запускаем list_voices.py.

Результат будет примерно таким:

В Linux картина будет похожей, но с другими идентификаторами.

Как видите, в Windows для большинства установленных голосов MS SAPI заполнены только «Имя» и ID. Однако этого хватит, чтобы решить следующую нашу задачу: написать код, который выберет русский голос и что-то им произнесет.

Например, у голоса RHVoice Aleksandr есть преимущество — его имя уникально, потому что записано транслитом и в таком виде не встречается у других известных производителей голосов. Но через pyttsx3 этот голос будет работать только в Windows. Для воспроизведения в Linux ему нужен Speech Dispatcher (подробнее чуть позже), с которым библиотека взаимодействовать не умеет. Как общаться с «диспетчером» еще обсудим, а пока разберемся с доступными голосами.

Как выбрать голос по имени

В Windows голос удобно выбирать как по ID, так и по имени. В Linux проще работать с именем или языком голоса. Создадим новый файл set_voice_and_say.py:

# Задать голос по умолчанию

# Попробовать установить предпочтительный голос

for voice in voices:

if voice.name == ‘Aleksandr’:

tts.say(‘Командный голос вырабатываю, товарищ генерал-полковник!’)

В Windows вы услышите голос Aleksandr, а в Linux — стандартный русский eSpeak. Если бы мы вовсе не указали голос, после запуска нас ждала бы тишина, так как по умолчанию синтезатор говорит по-английски.

Обратите внимание: tts.say() не выводит реплики мгновенно, а собирает их в очередь, которую затем нужно запустить на воспроизведение командой tts.runAndWait().

Выбор голоса по ID

Часто бывает, что в системе установлены голоса с одинаковыми именами, поэтому надежнее искать необходимый голос по ID.

Заменим часть написанного выше кода:

for voice in voices:

ru = voice.id.find(‘RHVoice\Anna’) # Найти Анну от RHVoice

if ru > -1: # Eсли нашли, выбираем этот голос

Теперь в Windows мы точно не перепутаем голоса Anna от Microsoft и RHVoice. Благодаря поиску в подстроке нам даже не пришлось вводить полный ID голоса.

Но когда мы пишем под конкретную машину, для экономии ресурсов можно прописать голос константой. Выше мы запускали скрипт list_voices.py — он показал параметры каждого голоса в ОС. Тогда-то вы и могли обратить внимание, что в Windows идентификатором служит адрес записи в системном реестре:

# Использовать английский голос

tts.say(«Can you hear me say it’s a lovely day?»)

tts.say(«А напоследок я скажу»)

Как озвучить системное время в Windows и Linux

Это крошечное приложение каждую минуту проговаривает текущее время по системным часам. Точнее, оно сообщает время при каждой смене минуты. Например, если вы запустите скрипт в 14:59:59, программа заговорит через секунду.

Создадим новый файл с именем time_tts.py. Всего, что мы разобрали выше, должно хватить, чтобы вы без проблем прочли и поняли следующий код:

# «Говорящие часы» — программа озвучивает системное время

from datetime import datetime, date, time

import pyttsx3, time

tts.setProperty(‘voice’, ‘ru’) # Наш голос по умолчанию

tts.setProperty(‘rate’, 150) # Скорость в % (может быть > 100)

tts.setProperty(‘volume’, 0.8) # Громкость (значение от 0 до 1)

def set_voice(): # Найти и выбрать нужный голос по имени

for voice in voices:

if voice.name == ‘Aleksandr’:

def say_time(msg): # Функция, которая будет называть время в заданном формате

set_voice() # Настроить голос

tts.runAndWait() # Воспроизвести очередь реплик и дождаться окончания речи

time_checker = datetime.now() # Получаем текущее время с помощью datetime

if time_checker.second == 0:

say_time(‘ ‘.format(h=time_checker.hour, m=time_checker.minute))

Программа будет отслеживать и называть время, пока вы не остановите ее сочетанием клавиш Ctrl+Break или Ctrl+C (в Windows и Linux соответственно).

Посмотрите на алгоритм: чтобы уловить смену минуты, следим за значением секунд и ждем, когда оно будет равно нулю. После этого объявляем время и, чтобы поберечь оперативную память, отправляем программу спать на 55 секунд. После этого она снова начнет проверять текущее время и ждать нулевой секунды.

Для дальнейшего изучения библиотеки pyttsx3 вы можете заглянуть в англоязычную документацию, в том числе справку по классу и примеры. А пока посмотрим на другие инструменты.

Обертка для eSpeak NG

Модуль называется py-espeak-ng. Это альтернатива pyttsx3 для случаев, когда вам нужен или доступен только один синтезатор — eSpeak NG. Не дай бог, конечно. Впрочем, для быстрых экспериментов с голосом очень даже подходит. Принцип использования покажется вам знакомым:

from espeakng import ESpeakNG

engine.say(«I’d like to be under the sea. In an octopus’s garden, in the shade!», sync=True)

engine.say(‘А теперь Горбатый!’, sync=True)

Обратите внимание на параметр синхронизации реплик sync=True. Без него синтезатор начнет читать все фразы одновременно — вперемешку. В отличие от pyttsx3, обертка espeakng не использует команду runAndWait(), и пропуск параметра sync сбивает очередь чтения.

Озвучиваем текст из файла

Не будем довольствоваться текстами в коде программы — пора научиться брать их извне. Тем более, это очень просто. В папке, где хранится только что рассмотренный нами скрипт, создайте файл test.txt с текстом на русском языке и в кодировке UTF-8. Теперь добавьте в конец кода такой блок:

text_file = open(«test.txt», «r»)

Открываем файл на чтение, передаем содержимое в переменную data, затем воспроизводим голосом все, что в ней оказалось, и закрываем файл.

Управляем речью через Speech Dispatcher в Linux

До сих пор по результатам работы нашего кода в Linux выводился один суровый eSpeak. Пришло время позаботиться о друзьях Tux’а и порадовать их сравнительно реалистичными голосами RHVoice. Для этого нам понадобится Speech Dispatcher — аналог MS SAPI. Он позволяет управлять всеми установленными в системе голосовыми движками и вызывать любой из них по необходимости.

Скорее всего Speech Dispatcher есть у вас в системе по умолчанию. Чтобы обращаться к нему из кода Python, надо установить модуль speechd:

sudo apt install python3-speechd

Пробуем выбрать синтезатор RHVoice с помощью «диспетчера» и прочесть текст:

tts_d.speak(‘И нежный вкус родимой речи так чисто губы холодит’)

Ура! Наконец-то наше Linux-приложение говорит голосом, похожим на человеческий. Обратите внимание на метод .set_output_module() — он позволяет выбрать любой установленный движок, будь то espeak, rhvoice или festival. После этого синтезатор прочтет текст голосом, предписанным для данного движка по умолчанию. Если задан только язык — голосом по умолчанию для данного языка.

Получается, чтобы сделать кроссплатформенное приложение с поддержкой синтезатора RHVoice, нужно совместить pyttsx3 и speechd: проверить, в какой системе работает наш код, и выбрать SAPI или Speech Dispatcher. А в любой непонятной ситуации — откатиться на неказистый, но вездеходный eSpeak.

Однако для этого программа должна знать, где работает. Определить текущую ОС и ее разрядность очень легко! Лично я предпочитаю использовать для этого стандартный модуль platform, который не нужно устанавливать:

system = platform.system() # Вернет тип системы.

bit = platform.architecture() # Вернет кортеж, где разрядность — нулевой элемент

Кстати, не обязательно решать все за пользователя. На базе pyttsx3 вы при желании создадите меню выбора голоса с возможностью управлять такими параметрами, как высота голоса, громкость и скорость речи.

Модуль Google TTS — голоса из интернета

Google предлагает онлайн-озвучку текста с записью результата в mp3-файл. Это не для каждой задачи:

постоянно нужен быстрый интернет;
нельзя воспроизвести аудио средствами самого gtts;
скорость обработки текста ниже, чем у офлайн-синтезаторов.

Что касается голосов, английский и французский звучат очень реалистично. Русский голос Гугла — девушка, которая немного картавит и вдобавок произносит «ц» как «ч». По этой причине ей лучше не доверять чтение аудиокниг, имен и топонимов.

Еще один нюанс. Когда будете экспериментировать с кодом, не называйте файл «gtts.py» — он не будет работать! Выберите любое другое имя, например use_gtts.py.

Простейший код, который сохраняет текст на русском в аудиофайл:

from gtts import gTTS

tts = gTTS(‘Иван Федорович Крузенштерн. Человек и пароход!’, lang=’ru’)

После запуска этого кода в директории, где лежит скрипт, появится запись. Чтобы воспроизвести файл «не отходя от кассы», придется использовать еще какой-то модуль или фреймворк. Годится pygame или pyglet.

Вот листинг приложения, которое построчно читает txt-файлы с помощью связки gtts и PyGame. Я заметила, что для нормальной работы этого скрипта текст из text.txt должен быть в кодировке Windows-1251 (ANSI).

Выводим текст через NVDA

Мы научились озвучивать приложение с помощью установленных в системе синтезаторов. Но что если большинству пользователей эта фишка не нужна, и мы хотим добавить речь исключительно как опцию для слабовидящих? В таком случае не обязательно писать код озвучивания: достаточно передать текст интерфейса другому приложению — экранному диктору.

Одна из самых популярных программ экранного доступа в Windows — бесплатная и открытая NVDA. Для связи с ней к нашему приложению нужно привязать библиотеку nvdaControllerClient (есть варианты для 32- и 64-разрядных систем). Узнавать разрядность системы вы уже умеете.

Еще для работы с экранным диктором нам понадобятся модули ctypes и time. Создадим файл nvda.py, где напишем модуль связи с NVDA:

import time, ctypes, platform

# Загружаем библиотеку клиента NVDA

elif bit[0] == ’64bit’:

ctypes.windll.user32.MessageBoxW(0,u»Ошибка! Не удалось определить разрядность системы!»,0)

# Проверяем, запущен ли NVDA

ctypes.windll.user32.MessageBoxW(0,u»Ошибка: %s»%errorMessage,u»нет доступа к NVDA»,0)

Теперь эту заготовку можно применить в коде основной программы:

# … другие реплики или сон

Если NVDA неактивна, после запуска кода мы увидим окошко с сообщением об ошибке, а если работает — услышим от нее заданный текст.

Плюс подхода в том, что незрячий пользователь будет слышать тот голос, который сам выбрал и настроил в NVDA.

Заключение

Ваша программа уже глаголет устами хотя бы одного из установленных синтезаторов? Поздравляю! Как видите, это не слишком сложно и «в выигрыше даже начинающий». Еще больше радуют перспективы использования TTS в ваших проектах. Все, что можно вывести как текст, можно и озвучить.

Представьте утилиту, которая при внезапной проблеме с экраном телефона или монитора сориентирует пользователя по речевым подсказкам, поможет спокойно сохранить данные и штатно завершить работу. Или как насчет прослушивания входящей почты, когда вы не за монитором? Напишите, когда, на ваш взгляд, TTS полезна, а когда только раздражает. Говорящая программа с какими функциями пригодилась бы вам?

Многоязычный синтез речи с клонированием

Хотя нейронные сети стали использоваться для синтеза речи не так давно (например), они уже успели обогнать классические подходы и с каждым годам испытывают на себе всё новые и новый задачи.

Например, пару месяцев назад появилась реализация синтеза речи с голосовым клонированием Real-Time-Voice-Cloning. Давайте попробуем разобраться из чего она состоит и реализуем свою многоязычную (русско-английскую) фонемную модель.

Строение

Наша модель будет состоять из четырёх нейронных сетей. Первая будет преобразовывать текст в фонемы (g2p), вторая — преобразовывать речь, которую мы хотим клонировать, в вектор признаков (чисел). Третья — будет на основе выходов первых двух синтезировать Mel спектрограммы. И, наконец, четвертая будет из спектрограмм получать звук.

Наборы данных

Для этой модели нужно много речи. Ниже базы, которые в этом помогут.

Имя	Язык	Ссылка	Комментарии	Моя ссылка	Комментарии
Словарь фонем	En, Ru	En,Ru	link	Совместил русский и английский фонемный словарь
LibriSpeech	En	link	300 голосов, 360ч чистой речи
VoxCeleb	En	link	7000 голосов, много часов плохого звука
M-AILABS	Ru	link	3 голоса, 46ч чистой речи
open_tts, open_stt	Ru	open_tts, open_stt	много голосов, много часов плохого звука	link	Почистил 4 часа речи одного спикера. Поправил аннотацию, разбил на отрезки до 7 секунд
Voxforge+audiobook	Ru	link	много голосов, 25ч разного качества	link	Выбрал хорошие файлы. Разбил на отрезки. Добавил аудиокниг из интернета. Получилось 200 спикеров по паре минут на каждого
RUSLAN	Ru	link	Один голос, 40ч чистой речи	link	Перекодировал в 16кГц
Mozilla	Ru	link	50 голосов, 30ч нормального качества	link	Перекодировал в 16кГц, Раскидал разных пользователей по папкам
Russian Single	Ru	link	Один голос, 9ч чистой речи	link

Обработка текста

Первой задачей будет обработка текста. Представим текст в том виде, в котором он будет в дальнейшем озвучен. Числа представим прописью, а сокращения раскроем. Подробнее можно почитать в статье посвященной синтезу. Это тяжелая задача, поэтому предположим, что к нам поступает уже обработанный текст (в базах выше он обработан).

Следующим вопросом, которым следуют задаться, это использовать ли графемную, или фонемную запись. Для одноголосного и одноязычного голоса подойдет и буквенная модель. Если хотите работать с многоголосой многоязычной моделью, то советую использовать транскрипцию (Гугл тоже).

G2P

Для русского языка существует реализация под названием russian_g2p. Она построена на правилах русского языка и хорошо справляется с задачей, но имеет минусы. Не для всех слов расставляет ударения, а также не подходит для многоязычной модели. Поэтому возьмём созданный ей словарь, добавим словарь для английского языка и скормим нейронной сети (например этим 1, 2)

Прежде чем обучать сеть, стоит подумать, какие звуки из разных языков звучат похоже, и можно им выделить один символ, а для каких нельзя. Чем больше будет звуков, тем сложнее модели учиться, а если их будет слишком мало, то у модели появиться акцент. Не забудьте ударным гласным выделять отдельные символы. Для английского языка вторичное ударение играет малую роль, и я бы его не выделял.

Кодирование спикеров

Сеть схожа с задачей идентификации пользователя по голосу. На выходе у разных пользователей получаются разные вектора с числами. Предлагаю использовать реализацию самого CorentinJ, которая основана на статье. Модель представляет собой трехслойный LSTM с 768 узлами, за которыми следует полносвязный слой из 256 нейронов, дающие вектор из 256 чисел.

Опыт показал, что сеть, обученная на английской речи, хорошо справляется и с русской. Это сильно упрощает жизнь, так как для обучения требуется очень много данных. Рекомендую взять уже обученную модель и дообучить на английской речи из VoxCeleb и LibriSpeech, а также всей русской речи, что найдёте. Для кодера не нужна текстовая аннотация фрагментов речи.

Тренировка

Запустите python encoder_preprocess.py для обработки данных
Запустите «visdom» в отдельном терминале.
Запустите python encoder_train.py my_run для тренировки кодировщика

Синтез

Перейдём к синтезу. Известные мне модели не получают звук напрямую из текста, так как, это сложно (слишком много данных). Сначала из текста получается звук в спектральной форме, а уже потом четвертая сеть будет переводить в привычный голос. Поэтому сначала поймём, как спектральное вид связанна с голосом. Проще разобраться в обратной задаче, как из звука получить спектрограмму.

Звук разбивается на отрезки длинной 25 мс с шагом 10 мс (по умолчанию в большинстве моделей). Далее с помощью преобразования Фурье для каждого кусочка вычисляется спектр (гармонические колебания, сумма которых даёт исходный сигнал) и представляется в виде графика, где вертикальная полоса — это спектр одного отрезка (по частоте), а по горизонтальной — последовательность отрезков (по времени). Этот график называется спектрограммой. Если же частоту закодировать нелинейно (нижние частоты качественнее, чем верхние), то изменится масштаб по вертикали (нужно для уменьшения данных) то такой график называют Mel спектрограммой. Так устроен человеческий слух, что небольшое отклонение на нижних частотах мы слышим лучше, чем на верхних, поэтому качество звука не пострадает

Существует несколько хороших реализаций синтеза спектрограмм, такие как Tacotron 2 и Deepvoice 3. У каждой из этих моделей есть свои реализации, например 1, 2, 3, 4. Будем использовать(как и CorentinJ) модель Tacotron от Rayhane-mamah.

Tacotron основан на сети seq2seq с механизмом внимания. Ознакомитесь с подробностями в статье.

Тренировка

Не забудьте отредактировать utils/symbols.py, если будете синтезировать не только английскую речь, hparams.pу, а так же preprocess.py.

Для синтеза нужно много чистого, хорошо размеченного звука разных спикеров. Здесь чужой язык не поможет.

Запустите python synthesizer_preprocess_audio.py для создания обработанного звука и спектрограмм
Запустите python synthesizer_preprocess_embeds.py для кодирования звука (получения признаков голоса)
Запустите python synthesizer_train.py my_run для тренировки синтезатора

Вокодер

Теперь осталось только преобразовать спектрограммы в звук. Для этого служит последняя сеть — вокодер. Возникает вопрос, если спектрограммы получаются из звука с помощью преобразования Фурье, нельзя ли с помощью обратного преобразования получить снова звук? Ответ и да, и нет. Гармонические колебания, из которых состоит исходный сигнал, содержат как амплитуду, так и фазу, а наши спектрограммы содержат информацию только об амплитуде (ради сокращения параметров и работаем со спекрограммами), поэтому если мы сделаем обратное преобразование Фурье, то получим плохой звук.

Для решения этой проблемы придумали быстрый алгоритм Гриффина-Лима. Он делает обратное преобразование Фурье спектрограммы, получая «плохой» звук. Далее делает прямое преобразования этого звука и получают спектр, в котором уже содержится немножко информации о фазе, причём амплитуда в процессе не меняется. Далее берётся еще раз обратное преобразование и получается уже более чистый звук. К сожалению, качество сгенерированной таким алгоритмом речи оставляет желать лучшего.

На его смену пришли нейронные вокодеры, такие как WaveNet, WaveRNN, WaveGlow и другие. CorentinJ использовал модель WaveRNN за авторством fatchord

Для предобработки данных используется два подхода. Либо получить спектрограммы из звука (с помощью преобразования Фурье), или из текста (с помощью модели синтеза). Google рекомендует второй подход.

Тренировка

Запустите python vocoder_preprocess.py для синтеза спектрограмм
Запустите python vocoder_train.py для вокодера

Итого

Мы получили модель многоязычного синтеза речи, умеющей клонировать голос.
Запустите toolbox: python demo_toolbox.py -d
Примеры можно послушать тут

Советы и выводы

Нужно много данных (>1000 голосов, >1000 часов)
Скорость работы сравнима с реальным временем только при синтезе минимум 4 предложений
Для кодера используйте предобученную модель для английского языка, немножко дообучив. Она справляется хорошо
Синтезатор, обученный на «чистых» данных, работает лучше, но хуже клонирует, чем тот, кто обучался на большем объёме, но грязных данных
Модель хорошо работает только на данных, на которых училась

Можете синтезировать свой голос онлайн с помощью colab, или посмотреть мою реализацию на github и скачать мои веса.

Синтезатор речи google что это за программа и нужна ли она

Синтезатор речи google что это за программа и нужна ли она

Синтезатор речи google что это за программа и нужна ли она

Как сделать говорящую программу на Python самостоятельно?

Готовим поляну

Библиотека pyttsx3

Как озвучить системное время в Windows и Linux

Обертка для eSpeak NG

Управляем речью через Speech Dispatcher в Linux

Модуль Google TTS — голоса из интернета

Выводим текст через NVDA

Заключение

Многоязычный синтез речи с клонированием

Строение

Наборы данных

Обработка текста

G2P

Кодирование спикеров

Тренировка

Синтез

Тренировка

Вокодер

Тренировка

Итого

Советы и выводы

Добавить комментарий Отменить ответ