Raspberry Piで文章読み上げ
久しぶりにRaspberry Piで遊んでみました。
先日滑らかな話口調がすごい無料の音声合成ソフト”CeVIO Creative Studio FREE”というWindows版の音声合成ソフトの紹介をしましたが、ここまでの滑らかさはないもののRaspberry Piでもできると聞いてやってみました。
参考にしたサイトはこちら。
Homebrew.JP:Raspberry Piでテキスト読み上げ
まずRaspberry Piを起動。SSH対応版Tera Termなどでログインします。
Open JTalkというソフトをインストールします。以下の3つのコマンドを順次実行。
sudo apt-get install open-jtalk
sudo apt-get install hts-voice-nitech-jp-atr503-m001
sudo apt-get install open-jtalk-mecab-naist-jdic
続いてviエディタなどで”ojt”という名前のスクリプト(名前はなんでもいいです)を作成。
#!/bin/bash
VOICE=/usr/share/hts-voice/nitech-jp-atr503-m001
DIC=/var/lib/mecab/dic/open-jtalk/naist-jdic
open_jtalk \
-td $VOICE/tree-dur.inf \
-tf $VOICE/tree-lf0.inf \
-tm $VOICE/tree-mgc.inf \
-md $VOICE/dur.pdf \
-mf $VOICE/lf0.pdf \
-mm $VOICE/mgc.pdf \
-df $VOICE/lf0.win1 \
-df $VOICE/lf0.win2 \
-df $VOICE/lf0.win3 \
-dm $VOICE/mgc.win1 \
-dm $VOICE/mgc.win2 \
-dm $VOICE/mgc.win3 \
-ef $VOICE/tree-gv-lf0.inf \
-em $VOICE/tree-gv-mgc.inf \
-cf $VOICE/gv-lf0.pdf \
-cm $VOICE/gv-mgc.pdf \
-k $VOICE/gv-switch.inf \
-s 48000 \
-a 0.56 \
-p 220 \
-x $DIC \
-ow /tmp/ojtalktmpvoice.wav \
$1
aplay /tmp/ojtalktmpvoice.wav
rm /tmp/ojtalktmpvoice.wav
上のスクリプトをそのまま貼り付けて保存。
このスクリプトを実行形式にします。
sudo chmod +x ojt
適当に日本語の書かれたテキストファイルを準備します。
そして先ほどのスクリプト(ojt)を実行。
./ojt test.txt (読み上げる文章が書かれたテキストファイル名)
自分のブログの記事の適当な一文を取り出して使ってみました。
あっさりと成功。ちゃんと読み上げてくれます。
ただ、これ以上長い文章だとうまく読めませんでした。あまり大きいとだめみたいです。
半角文字が入っていてもNG。改行があると、そこで読み上げ終了です。
百均のカナル式ヘッドフォンを挿して聞いてみたんですが、はっきり聞き取れます。
しゃべってる声ですが、関西なまりの標準語を話す30代の男性のようなしゃべり口調です。うまくいえませんが、そんな感じです。
いくつか試してみましたが、ときどき漢字の読みを間違えることもありますね。そのときはひらがなに直した方がよいかと。
先のCeVIOと同様、展示会などでの説明文読み上げに使えそうですね。
それ以外の使い道としては遠隔操作可能なIPカメラ”IPC100”で外から家の中を監視し、もし不審者を見つけたときはRaspberry Piにログイン、警告音声を流すスクリプトを起動させるというものでしょうか?
「室内の人影は侵入者と判定、これより監視モードから自衛モードに移行、○○○(やばそうな物質名)散布まであと10秒、9、8、・・・」などとハッタリ臭い文章を読み上げさせれば、声がいかにも合成音声だけに何か得体の知れないことが起こりそうな雰囲気でかえってびびるんじゃないでしょうか?
ところでこのソースとなったサイトですが、これがなかなか気になる記事をたくさん書いておられます。
Raspberry Piだけでなく、LaFoneraをカメラサーバー化したり、動体検知ソフトを作ってたりとかなり精力的にいろいろなものを作っているようです。
私が断念したRaspberry Piの遠隔操作リモコンまで・・・ただし赤外線センサーは自作でした。やはり敷居は高いですね。
« マクドナルドのポテトホルダーはスマートフォン用ケースに使えるか? | トップページ | オリジナルのセーラー戦士を作れるサイト »
「Raspberry Pi・Arduino・電子工作」カテゴリの記事
- 名古屋 大須へ行ってきました(2024.04.28)
- Raspberry Pi 5用電源購入(2024.04.19)
- Interface 2024年5月号はRaspberry Pi 5特集(2024.03.26)
- Raspberry Pi 5とPCがつながらなかった理由は「プライバシーセパレーター機能」のせいでした(2024.03.12)
- Raspberry Pi 5に日本語LLM(ELYZA-Japanese-Llama-2-7b-fast-Instruct)を入れてみた(2024.03.10)
コメント
« マクドナルドのポテトホルダーはスマートフォン用ケースに使えるか? | トップページ | オリジナルのセーラー戦士を作れるサイト »
うーん、30代のオッサンの声を四六時中聞いて居たくはないなぁ(笑)
出来れば耳ざわりの良い声が…。
まあ、しかし廉価なボードPCが喋るんですからあんまり贅沢も言えない訳で。
投稿: enutea | 2013年5月 4日 (土) 22時28分
こんにちは、enuteaさん。
オープンソースらしいので、別の声もあるかもしれません。声の質はCeVIOよりも劣りますが、テキストファイルをバッチ処理できるのと、もしかしたら音声もWAVファイルではけるかもしれません。そうするとサーバーで処理できるため、業務用に使うには便利かもしれませんね。
投稿: arkouji | 2013年5月 5日 (日) 11時13分