「砲撃手の妻は呪術師(シャーマン)」を使ってRNNによる文章自動作成してみた
毎年夏は、チャレンジの夏として何か仕掛けるのが通例です。というわけで、ずっと以前からやってみたいテーマに取り組んでみます。
ずばり文章自動作成です。
と言っても、ネット上にあるコードを流用しただけですけど。チャレンジと呼べるものにするには、これを今後、発展させられるかどうかが次第です。
参考サイトはこちら。
Keras LSTMでサクッと文章生成をしてみる | cedro-blog
こちらにあるコード(少し下の方にあるプログラム全体)を、ほぼそのまま使ってます。
が、こちらの事情に合わせ、ちょっと変えております。
まず教師データですが、「砲撃手の妻は呪術師(シャーマン)」をKH Coderの「共起ネットワーク」で分析してみた: EeePCの軌跡で用いたデータをそのまま使いました。
なにせ自分で作ったオリジナル文章、文章生成がうまくいけば、PCによるゴーストライターも夢ではありません(大げさ)。
リンク元にあるプログラムの15行目「path = ~」のところに、上の文章データのファイル名を指定します。
それ以外にも、71行目「start_index = 0 」の0を5にしたり(”#1 ”という不要な文字を取り除くため)、100行目「batch_size=128, 」の128を64に変えたりしてます(うちのGTX1050Tiのメモリ不足のため)。
と、これだけやったところで、レッツ機械学習!
1エポック目の文章です。「ああ、そんなことはない。」を連発。うるさいですね。
初期のころはこんな文章ばかり・・・「あの……僕は、~~」って、何なのですか!?
不安は募るばかりですが、学習を続行します。
よく見ると支離滅裂ですが、10エポック目くらいから、なんとなく文章っぽいものが出始めます。
にしても、砲撃長が多いですね。3話しか出ていない人物なのに・・・
学習は、続きます。
60エポック目は、こんな文章です。
ところでこの文書生成コードは、いわゆる形態素分析後の単語ごとのつながりを学習しているわけではなく、文字単位のつながりを学習しているようです。このため、JanomeやMeCabなどを使ってません。
にしては、意外に体裁を整えてきてますね。よく見ると支離滅裂ですが、なかなかです。
しかし、ゴーストライターとするにはいささか頼りなさすぎですね。
もう少し意味の通る文章を作れるコードを手に入れたいものです。
![]() |
« イスラエルのスタートアップがブレーキやセンシング機器も載せたインホイールモーターを発表 | トップページ | AIな女子高生巫女「出逢 蒔奈」と話せる!?立体サイネージ発売 »
「数値解析系」カテゴリの記事
- 「DXに挑む!はじめの一歩 ~デジタルリテラシーを身につけよう~」にて登壇(2022.12.16)
- Interface 2023年1月号を買った(2022.12.04)
- 2022年まとめ(2022.12.31)
- ロビ君再始動!等(2022.11.13)
- 話題のAI迷彩セーターは本当に物体検出をだませているのか!?(2022.10.29)
« イスラエルのスタートアップがブレーキやセンシング機器も載せたインホイールモーターを発表 | トップページ | AIな女子高生巫女「出逢 蒔奈」と話せる!?立体サイネージ発売 »
コメント