FestivalRTC (音声合成RTC)

概要

Festivalは、英エディンバラ大学の「Centre for Speech Technology Research」で開発された、UNIXプラットホームの英語音声合成エンジンです。オープンソースで開発されており、言語データを用意すれば多言語の音声合成を行うことができる。 本コンポーネントは、受け取ったテキストデータをFestivalを使用して音声データに変換して出力します。

本コンポーネントは、OpenHRIVoiceパッケージに含まれます。

../../_images/festivalrtc.png

動作確認OS

  • Ubuntu Linux 9.10以上を推奨
  • Windows XP以上を推奨

依存ライブラリ

データポート

名前 フローポート データ型 説明
text InPort TimedString 音声合成するテキストデータを入力
result OutPort TimedOctetSeq Festivalにより変換された音声データを出力
status OutPort TimedString 音声合成エンジンの状態 (‘started’か’finished’)
duration OutPort TimedString 変換された音線データの各音韻の時間情報(リップシンクに使用)

コンフィグレーション

名前 データ型 デフォルト値 設定範囲 説明
rate int 16000 16000 出力される音声の周波数(16kHzに固定)
character string male male 音声のキャラクタ(男性に固定)
format string int16 int16 出力される音声のフォーマット(16bitに固定)

Table Of Contents

Previous topic

JuliusRTC (音声認識RTC)

Next topic

OpenJTalkRTC (音声合成RTC)

This Page