音声認識できたんなら音声合成もできるじゃろーつうことで、オープンソースの日本語音声合成エンジンの Open JTalk ていうのを Alchemy つかって Flash に移植してみました。音声合成のコアである hts_engine (+Flite) を移植したやつは発見したけど日本語ダメだったのでやってみましたえ。まあ、やっぱり遅いけど、ちゃんと動いてる、けど、日本語対応のために内部でつかわれてる MeCab 用の辞書ファイルがでかすぎるのなー。。
- ロード待つ。(辞書ファイルが 60MB ぐらいある)
- テキストエリアに入力する。
- パラメータの意味はあましよくわかてないけれども、”FRAME PERIOD” はしゃべるスピード(でかい=ゆっくり)、”ALL-PASS CONST” 声質?、”SPECTRUM WEIGHT” 音量が変わってるようにしか?、”LOG F0 WEIGHT” イントネーション?、”LOW-PASS FILT WEIGHT” 変化なし?
- “SYNTHESIS” クリックして待つ。
- ベースの音声ファイル?は MMDAgent に含まれる Mei (normal) を使ってます。
- ソース一式こちら。
副産物で MeCab が Flash オンリーで使えるようになった、辞書ファイルでかすぎるから実用むずいけど。