JuliusRTC (音声認識RTC)

概要

Juliusは、音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。 本コンポーネントは、受け取った音声データをJuliusを用いて音声認識して認識テキストに変換します。

本コンポーネントは、OpenHRIVoiceパッケージに含まれます。

../../_images/juliusrtc.png

動作確認OS

  • Ubuntu Linux 9.10以上を推奨
  • Windows XP以上を推奨

依存ライブラリ

  • OpenRTM-aist : OpenRTM-aist-1.0.0-RELEASE(Python)
  • Julius : バージョン4.1.2以上を推奨(バージョン4.1.2以前での動作未確認)

データポート

名前 フローポート データ型 説明
data InPort TimedOctetSeq 認識する音声データ(パケット形式)
activegrammar InPort TimedString 有効化する文法ID
status OutPort TimedString 音声認識器の状態(‘LISTEN [音声入力受付中]’, ‘STARTREC [音声認識処理開始]’, ‘ENDREC [音声認識処理終了]’, ‘REJECTED [入力棄却]’)
result OutPort TimedString 音声認識結果(XML形式)
log OutPort TimedOctetSeq 音声データのログ

Configuration Parameters

名前 データ型 デフォルト値 設定範囲 説明
phonemodel string male male 音声認識器で利用する音響モデルを設定(現在は、男性用のみ選択可)
voiceactivitydetection string internal internal 音声活動のトリガーを設定(現在は、internalのみ選択可)
language string japanese japanese,english,german 音声認識する言語を設定