コミュニケーション知能モジュールパッケージ OpenHRI >> FestivalRTC (音声合成RTC)
FestivalRTC (音声合成RTC)
概要
Festivalは、英エディンバラ大学の「Centre for Speech Technology Research」で開発された、UNIXプラットホームの英語音声合成エンジンです。オープンソースで開発されており、言語データを用意すれば多言語の音声合成を行うことができる。 本コンポーネントは、受け取ったテキストデータをFestivalを使用して音声データに変換して出力します。
本コンポーネントは、OpenHRIVoiceパッケージに含まれます。
動作確認OS
- Ubuntu Linux 14.04以上を推奨
- Windows 7以上 (Windows10 を推奨)
依存ライブラリ
- OpenRTM-aist : OpenRTM-aist-1.1.2-RELEASE(C++)
- Festival : Festival-2.4以上を推奨
- sox : sox-14.4.2
データポート
名前 | フローポート | データ型 | 説明 |
---|---|---|---|
text | InPort | TimedString |
音声合成するテキストデータを入力
|
result | OutPort | TimedOctetSeq |
Festivalにより変換された音声データを出力
|
status | OutPort | TimedString |
音声合成エンジンの状態 (‘started’か’finished’)
|
duration | OutPort | TimedString |
変換された音線データの各音韻の時間情報(リップシンクに使用)
|
コンフィグレーション
名前 | データ型 | デフォルト値 | 設定範囲 | 説明 |
---|---|---|---|---|
rate | int | 16000 | 16000 |
出力される音声の周波数(16kHzに固定)
|
character | string | male | male |
音声のキャラクタ(男性に固定)
|
format | string | int16 | int16 |
出力される音声のフォーマット(16bitに固定)
|
設定ファイル
以前のFestivalRTCでは、外部音声合成プログラム(Festival)の場所や各種パラメータを固定していましたが、Festivalのインストール場所を設定ファイル(festival.conf)で変更することができます。
設定できる項目は下記の通りです。
- festival.top_dir
- 音声合成プログラム(Festival)のインストールディレクトリ
使用例
資料