Windows・コマンドラインからGtalk(音声合成)を使う
オープンソースの人化音声対話エージェントのツールキットGalatea Project
の機能の一つであるGtalkのWindowsでの使い方を説明します。
どちからというと専門的な話です。
MS-DOSの知識さえあれば、簡単にできます。
GUIで、音声合成を試したい場合、オープンソースソフト akJ Speechtoolsをお勧めします。
導入
公式な方法を紹介します。
ダウンロード
公式サイトよりダウンロードのところをクリック
後は、承諾書に同意して、ユーザー登録してダウンロードします。
chasenを置き換え
このページより chasen-2.3.3p1.zipをダウンロードして 置き換えます。
実行
まずは、galatea4win\engine\SSM\gtalk-1.0\README.txtを読みましょう。
gtalkは対話型で実行します。
大文字小文字は正確に入力してください。
起動
例えばC:\Program filesにダウンロードしたgalatea4win フォルダーがある場合
C:\Program Files\galatea4win\engine\SSM\gtalk-1.0
そして、以下のようにコマンドを入力します。(-Cは大文字です。)
gtalk -C ssm.conf
話す
テキストを入力
set Text= の後に日本語を入力して改行キーを押します。
set Text=こんにちは
すると画面になにやら表示されます。rep Speak.stat = READY となると完了です。
発音する
以下のように入力します。すると音が鳴ります。
set Speak=NOW
rep Speak.stat =IDLEとなると完了です。
発音者を変更
set Speaker=の後に話者を選択します。
デフォルトはmale01です。male01・male02・female01が選択できます。
ただし、発声する場合、set Textからもう1度やります。
set Speaker=female01
話者を変えて再生する場合以下のようにコマンドを入力していかないといけません。
set Speaker=female01 set Text=こんにちは set Speak=NOW
ファイルに書き出す
set Speaker=のファイル名を選択します。
書き出しが完了しても何も表示されません。
以下の例ですと、
**/galatea4win\engine\SSM\gtalk-1.0/test.rawというファイルができます。
set Save=test.raw
Wav形式に変換
出力されたデーター 16kHz signed 16bit little-endianのRawデーターです。
Wavに変換する場合何らかのソフトを用いる必要があります。
sox -r 16000 -w -c 1 -s C:\tmp\gtalkで出力したファイル名 新しいファイル.wav
IPADICTを使用
よくわかりません。(^o^)
akJ Speechtoolsというプログラムでは
sen(chasenのJava版)からipadictを使用して、カナ変換して、カナ文字をgtalkに渡して再生しています。
このworkは、クリエイティブ・コモンズ・ライセンスの下でライセンスされています。
サイト
Android情報サイト
|
Youtube サイト
| Java サイト
| Google 活用サイト
| Google 情報サイト
| 無料ソフト活用 サイト
|写真活用のPicasa2 サイト
|新サイト
Blog
Android ブログ
Copyright (c)2004 - 2012 Aki. All rights reserved.