Как преобразовать текст в речь с помощью командной строки?

Как получить вывод речи из введенного текста с помощью командной строки?

Также возможность изменять скорость речи, высоту тона, громкость и т.Д использование простой команды.

В порядке убывания популярность:

  • сказать преобразует текст в слышимую речь с помощью речевого движка GNUstep.

    sudo apt-get install gnustep-gui-runtimesay "hello"
  • фестиваль Общая система синтеза многоязычной речи.

    sudo apt-get install festivalecho "hello" | festival --tts
  • сдпг - скажи отправляет запрос на преобразование текста в речь в диспетчер речи

    sudo apt-get install speech-dispatcherspd-say "hello"
  • эспик представляет собой многоязычный программный синтезатор речи.

    sudo apt-get install espeakespeak "hello"

espeak это хороший маленький инструмент.

Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что он конфликтует с Pulseaudio, поэтому я использую многословную версию, которая сводит на нет необходимость его правильной настройки.

sudo apt-get install espeakespeak --stdout "this is a test" | paplay

espeak --help покажет вам варианты калибровки скорости чтения, высоты тона, голоса и т.д.

Когда вы будете делать свои заметки, сохраните их в виде текстового файла, а затем:

echo "these are my notes" > text.txtespeak --stdout -f text.txt > text.wavpaplay text.wav # you should hear "these are my notes"

Затем вы можете поиграть с ffmeg и др., чтобы сжать это из PCM во что-то более управляемое, например MP3 или OGG. Но это уже совсем другая история.

От man spd-say:

ИМЯ spd-say - отправить запрос на вывод текста в речь в speech-dispatcherSYNOPSIS spd-say [параметры] "некоторый текст"ОПИСАНИЕ spd-say отправляет запрос на вывод текста в речь в процесс speech-dispatcher, который обрабатывает его и в идеале выводит результат в аудиосистему.ОПЦИИ -r, --rate Задает скорость речи (от -100 до +100, по умолчанию: 0) -p, --pitch Задает высоту речи (от -100 до +100, по умолчанию: 0) -i, --volume Задает громкость (интенсивность) речи (между -100 и +100, по умолчанию: 0)

Следовательно, вы можете преобразовать текст в речь, выполнив следующую команду:

spd-say "<type text>"

От:

spd-say "Welcome to Ubuntu Linux"

Вы также можете установите скорость речи, высоту тона, громкость и т.д. смотрите справочную страницу.

Python Google Speech :

pip install google_speechgoogle_speech "Test the hello world"

Svox С Android :

apt-get install svox-picopico2wave --wave=test.wav "Test the hello world"play test.wav

Нанотрубки Svox :

git clone https://github.com/gmn/nanotts.gitcd nanottsmake./nanotts -v en-US "Test the hello world"

Связанный ресурс: Сравнение синтезаторов речи
Источник сообщения: Linuxhacks.org
Раскрытие информации: Я являюсь владельцем Linuxhacks.org

Mbrola не работает с 11.10.

Инструменты SVOX (pico) просты в установке, просты в использовании и обеспечивают хорошее качество голоса в Ubuntu. Установите его:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Еще проще, вы можете использовать LibreOffice в сочетании с инструментами SVOX (pico), установив Расширение "Чтение текста" и вы получаете "графический интерфейс" для этого превосходного программного обеспечения TTS:

Настройка параметров расширения для чтения текста с помощью инструментов - Дополнений - Выбор чтения.... Используйте /usr/bin/python в качестве внешней программы. Выберите параметр командной строки, который включает маркер (PICO_READ_TEXT_PY).

SVOX pico2wave

Это то, что я использую. И это звучит естественно, это легко понять, и он распознает единицы измерения (м, ° C, кг, ...).

Здесь это мой первый пост о pico2wave.

Все, что вам нужно сделать, это: Перейдите в Центр программного обеспечения Ubuntu и найдите "pico". Вы найдете 4 или 5 записей с "Небольшим следом"...". Установите их.

Возможное использование pico2wave описано в моем первом сообщении (перейдите по ссылке выше).

И еще один графический интерфейс espeak: gespeaker. Он использует оба espeak и mbrola двигатели. Кроме того, у него больше возможностей, чем espeak-gui.

Нижеследующее не является решением для использования зубной нити, но, возможно, оно того стоит. (это - вино решение),

Лично я очень люблю TTS, я использую его довольно часто ... например, слушая бессвязную речь, которую я бы никогда не стал придерживаться в других случаях (потому что мне нужно выпить еще чашку кофе... :)

Несколько вещей, которые я обнаружил на этом пути ... или я должен сказать, вещи, которые я не обнаружил на этом пути... Говоря прямо: каждый кусочек ОКАМЕНЕЛОСТИ TTS голосовое программное обеспечение, которое я пробовал, находится на низком уровне и поэтому не подходит для любого полудлинного прослушивания...

В настоящее время я использую NaturalVoices от ATnT. Он доступен только для Windows (возможно, для Mac), но он работает под wine в Ubuntu .. (у него есть незначительный сбой, когда мне иногда нужно нажимать на панель, когда я отодвигаюсь от считывателя... Это незначительная проблема по сравнению с преимуществом, получаемым за счет качества речи от NatualVoices.

Некоторые другие вещи, которые, как я обнаружил, практически необходимы для полусмысленного прослушивания, следующие:...

  1. Эти прогамы TTS не умны (ну, может быть, так же умны, как молодой бабуин) .. поэтому им нужна любая помощь, которую они могут получить. и есть один (и только один Читатель Я нашел программу, которая очень помогает в этом.. Приложение называется ReadPlease (2003 Pro)... Это позволяет вам специально изменять слова и группы слов, которые будут произноситься как ты хочу их... Это ни в коем случае не идеально, но для меня это сделало разницу между тем, чтобы весь процесс можно было использовать и не использовать...

  2. Речь естественными голосами - это "хорошо", но это немного скучно. Есть и другие хорошие продукты, но, к сожалению, все они предназначены для Windows)..
    Иногда это удивительно хорошо... но БОЖЕ, поначалу это боль! .. итак, №2 - это *терпение... и много раз обновляйте свой список "специальных слов"... Под терпением я подразумеваю, что вы (я) действительно привыкли к особенностям речи моего конкретного бабуина :) ... и, кстати, в настоящее время у меня есть около 3000 слов, которые теперь звучат достаточно "по-человечески", чтобы я больше не съеживался, когда их слышу.

    3.. "Следуй за прыгающим мячом"... Опять же, поскольку голос никогда не бывает таким хорошим, как у настоящего диктора, иногда нужно кое-что уточнить ... Программа для чтения, которую я использую, имеет одну особенность, из-за которой я даже мирился с ее неуклюжим интерфейсом.... В нем есть опция "выбрать слово, которое в данный момент читается".. У многих читателей есть это, но ReadPlease сохраняет текущую строку в центре экрана.. Это бесценно для того, чтобы иметь возможность видеть вперед и назад, чтобы быстро перечитать то, что вы только что пропустили (поэтому автоцентрирование текущей строки полезно)...

Что ж, это мой опыт.. Сейчас я собираюсь приготовить кофе, и пока я это делаю, я буду слушать это, чтобы посмотреть, как это "читается".... TTS удивительно хорош для обнаружения опечаток (я делаю много опечаток)...

Если в репозитории Ubuntu появится что-то столь же хорошее, как ATnT NaturalVoices, я ухватлюсь за это.

Вот ссылка на некоторые образцы Естественные Голоса: Я использую "МАйк".

Для festival (голос кажется мне более естественным):

sudo apt-get install festivalecho "hello" | festival --tts

Настройка высоты тона и скорости:

творить ~/.festivalrc со следующим содержанием:

(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100")(Parameter.set 'Audio_Method 'Audio_Command)

Смотрите также http://www.solomonson.com/content/ubuntu-linux-text-speech

Обновление: попробовал на другом компьютере Ubuntu. Пришлось установить пакет English speech engine для правильной работы с фестивалем:

sudo apt-get install festvox-kallpc16k

Также play это команда cli, которая поставляется с sox пакет:

sudo apt-get install sox

Несмотря на то, что вы уже приняли ответ, я хотел бы упомянуть festival, что мне тоже очень нравится. Этот сообщение на форумах Ubuntu содержит много информации о том, как настроить для этого очень красивые голоса.

Возможный дубликат Как я могу установить и использовать программное обеспечение для преобразования текста в речь?