このエントリーをはてなブックマークに追加

オープンソースの人化音声対話エージェントのツールキットGalatea Project

の機能の一つであるGtalkのWindowsでの使い方を説明します。


どちからというと専門的な話です。

MS-DOSの知識さえあれば、簡単にできます。


GUIで、音声合成を試したい場合、オープンソースソフト akJ Speechtoolsをお勧めします。


導入

公式な方法を紹介します。

ダウンロード

公式サイトよりダウンロードのところをクリック

後は、承諾書に同意して、ユーザー登録してダウンロードします。

chasenを置き換え

このページより chasen-2.3.3p1.zipをダウンロードして 置き換えます。


実行

まずは、galatea4win\engine\SSM\gtalk-1.0\README.txtを読みましょう。


gtalkは対話型で実行します。

大文字小文字は正確に入力してください。

起動

MS-DOS上でディレクトリーを移動します。

例えばC:\Program filesにダウンロードしたgalatea4win フォルダーがある場合

C:\Program Files\galatea4win\engine\SSM\gtalk-1.0

そして、以下のようにコマンドを入力します。(-Cは大文字です。)

gtalk -C ssm.conf

話す

テキストを入力

set Text= の後に日本語を入力して改行キーを押します。

set Text=こんにちは

すると画面になにやら表示されます。rep Speak.stat = READY となると完了です。

発音する

以下のように入力します。すると音が鳴ります。

set Speak=NOW

rep Speak.stat =IDLEとなると完了です。

発音者を変更

set Speaker=の後に話者を選択します。

デフォルトはmale01です。male01・male02・female01が選択できます。

ただし、発声する場合、set Textからもう1度やります。

set Speaker=female01

話者を変えて再生する場合以下のようにコマンドを入力していかないといけません。

set Speaker=female01
set Text=こんにちは
set Speak=NOW

ファイルに書き出す

set Speaker=のファイル名を選択します。

書き出しが完了しても何も表示されません。

以下の例ですと、

**/galatea4win\engine\SSM\gtalk-1.0/test.rawというファイルができます。

set Save=test.raw

Wav形式に変換

出力されたデーター 16kHz signed 16bit little-endianのRawデーターです。

Wavに変換する場合何らかのソフトを用いる必要があります。

オープンソースソフト soxならば

sox -r 16000 -w -c 1 -s C:\tmp\gtalkで出力したファイル名 新しいファイル.wav

IPADICTを使用

よくわかりません。(^o^)

akJ Speechtoolsというプログラムでは

sen(chasenのJava版)からipadictを使用して、カナ変換して、カナ文字をgtalkに渡して再生しています。


クリエイティブ・コモンズ・ライセンス
このworkは、クリエイティブ・コモンズ・ライセンスの下でライセンスされています。

サイト
Android情報サイト | Youtube サイト | Java サイト | Google 活用サイト | Google 情報サイト | 無料ソフト活用 サイト |写真活用のPicasa2 サイト |新サイト

Blog
Android ブログ


Copyright (c)2004 - 2012 Aki. All rights reserved.