« マクドナルドのポテトホルダーはスマートフォン用ケースに使えるか? | トップページ | オリジナルのセーラー戦士を作れるサイト »

2013年5月 3日 (金)

Raspberry Piで文章読み上げ

久しぶりにRaspberry Piで遊んでみました。

先日滑らかな話口調がすごい無料の音声合成ソフト”CeVIO Creative Studio FREE”というWindows版の音声合成ソフトの紹介をしましたが、ここまでの滑らかさはないもののRaspberry Piでもできると聞いてやってみました。

参考にしたサイトはこちら。

Homebrew.JP:Raspberry Piでテキスト読み上げ

まずRaspberry Piを起動。SSH対応版Tera Termなどでログインします。

Open JTalkというソフトをインストールします。以下の3つのコマンドを順次実行。

sudo apt-get install open-jtalk

sudo apt-get install hts-voice-nitech-jp-atr503-m001

sudo apt-get install open-jtalk-mecab-naist-jdic

続いてviエディタなどで”ojt”という名前のスクリプト(名前はなんでもいいです)を作成。

#!/bin/bash

VOICE=/usr/share/hts-voice/nitech-jp-atr503-m001

DIC=/var/lib/mecab/dic/open-jtalk/naist-jdic

open_jtalk \

-td $VOICE/tree-dur.inf \

-tf $VOICE/tree-lf0.inf \

-tm $VOICE/tree-mgc.inf \

-md $VOICE/dur.pdf \

-mf $VOICE/lf0.pdf \

-mm $VOICE/mgc.pdf \

-df $VOICE/lf0.win1 \

-df $VOICE/lf0.win2 \

-df $VOICE/lf0.win3 \

-dm $VOICE/mgc.win1 \

-dm $VOICE/mgc.win2 \

-dm $VOICE/mgc.win3 \

-ef $VOICE/tree-gv-lf0.inf \

-em $VOICE/tree-gv-mgc.inf \

-cf $VOICE/gv-lf0.pdf \

-cm $VOICE/gv-mgc.pdf \

-k $VOICE/gv-switch.inf \

-s 48000 \

-a 0.56 \

-p 220 \

-x $DIC \

-ow /tmp/ojtalktmpvoice.wav \

$1

aplay /tmp/ojtalktmpvoice.wav

rm /tmp/ojtalktmpvoice.wav

上のスクリプトをそのまま貼り付けて保存。

このスクリプトを実行形式にします。

sudo chmod +x ojt

適当に日本語の書かれたテキストファイルを準備します。

そして先ほどのスクリプト(ojt)を実行。

./ojt test.txt (読み上げる文章が書かれたテキストファイル名)

Ojt01

自分のブログの記事の適当な一文を取り出して使ってみました。

あっさりと成功。ちゃんと読み上げてくれます。

ただ、これ以上長い文章だとうまく読めませんでした。あまり大きいとだめみたいです。

半角文字が入っていてもNG。改行があると、そこで読み上げ終了です。

Img_2878

百均のカナル式ヘッドフォンを挿して聞いてみたんですが、はっきり聞き取れます。

しゃべってる声ですが、関西なまりの標準語を話す30代の男性のようなしゃべり口調です。うまくいえませんが、そんな感じです。

いくつか試してみましたが、ときどき漢字の読みを間違えることもありますね。そのときはひらがなに直した方がよいかと。

先のCeVIOと同様、展示会などでの説明文読み上げに使えそうですね。

それ以外の使い道としては遠隔操作可能なIPカメラ”IPC100”で外から家の中を監視し、もし不審者を見つけたときはRaspberry Piにログイン、警告音声を流すスクリプトを起動させるというものでしょうか?

室内の人影は侵入者と判定、これより監視モードから自衛モードに移行、○○○(やばそうな物質名)散布まであと10秒、9、8、・・・」などとハッタリ臭い文章を読み上げさせれば、声がいかにも合成音声だけに何か得体の知れないことが起こりそうな雰囲気でかえってびびるんじゃないでしょうか?

ところでこのソースとなったサイトですが、これがなかなか気になる記事をたくさん書いておられます。

Homebrew.JP

Raspberry Piだけでなく、LaFoneraをカメラサーバー化したり、動体検知ソフトを作ってたりとかなり精力的にいろいろなものを作っているようです。

私が断念したRaspberry Piの遠隔操作リモコンまで・・・ただし赤外線センサーは自作でした。やはり敷居は高いですね。

« マクドナルドのポテトホルダーはスマートフォン用ケースに使えるか? | トップページ | オリジナルのセーラー戦士を作れるサイト »

Raspberry Pi・Arduino・電子工作」カテゴリの記事

コメント

うーん、30代のオッサンの声を四六時中聞いて居たくはないなぁ(笑)
出来れば耳ざわりの良い声が…。
まあ、しかし廉価なボードPCが喋るんですからあんまり贅沢も言えない訳で。

こんにちは、enuteaさん。

オープンソースらしいので、別の声もあるかもしれません。声の質はCeVIOよりも劣りますが、テキストファイルをバッチ処理できるのと、もしかしたら音声もWAVファイルではけるかもしれません。そうするとサーバーで処理できるため、業務用に使うには便利かもしれませんね。

コメントを書く

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/510034/57282676

この記事へのトラックバック一覧です: Raspberry Piで文章読み上げ:

« マクドナルドのポテトホルダーはスマートフォン用ケースに使えるか? | トップページ | オリジナルのセーラー戦士を作れるサイト »

当ブログ内検索

  • カスタム検索

スポンサード リンク

ブログ村

無料ブログはココログ