« GEOの激安イヤホン「SWE100QT13」を買ってみた | トップページ | ある意味「AI」の正しい使い道!? 味の素のAIによるパッケージデザイン »

2022年10月24日 (月)

画像生成AIは人類を脅かすほどの存在となりうるか?(いや、そうはならんやろ)

昨今、Midjournyを始め、Stable Diffusion、NobelAIなどの画像生成AIが話題沸騰中です。

で、そのあまりの高クオリティな画像に、絵師さん廃業か?などと言われたり、おそらくは作者に無断で漫画やイラストを教師データとして用いたことへの倫理的な問題点が指摘されております。

が、今回はそれらとは別の視点で、画像生成AIの欠点ともいうべき部分をまとめてみたいと思います。

話の発端は、こちら。NobelAIに「ラーメンを食べる」というイラストを要求すると、おかしな画像ばかりが返ってくるという話題をまとめたサイトです。

【AI画像生成】お絵描きAIでラーメンを食べる絵が描けないと話題だったので、Novel AIを使って試してみたら、想像以上にヤバかった件・・・!#NovelAI #NovelAIDiffusion : 超絶"厳選"ニュースまとめch

なんていうか、手づかみだったりスイーツやドリンク風にラーメンを摂取?する画像が出てきます。

うーん、これはちょっとシュール過ぎる。

これ以外にも、画像生成AIが苦手なジャンルというのがあるようです。

考えてみれば、ラーメンを食べるイラスト画像ってあまりないですよね。教師データの少なさが、この悲劇?を招いているものと思います。

私などは銀河英雄伝説風の宇宙戦艦などを描かせたいんですが、これも教師データとなりうる画像が少ないジャンルのためか、あまりいい絵ができたためしがありません。なんだか古臭いタイプの宇宙船ばかりが出てきます。

202210231254092a_space_battleship_that_f

さて、綺麗な画像ができたからと言って、細部を見るとやっぱりどこか不自然というのが、画像生成AIの特徴でもあるようです。

イラスト系でかなり高精度な画像を返すNobelAIでも、よくできたイラストであっても細かく見るとどこか変、というのがあって、それをまとめた記事は以下。

 画像生成AIによって生成されたイラストの見分け方 | おいもログ

で、Stable Diffusionで実写系の画像を作らせても、なんだかおかしな画像を返してくることもあります。

例えばステーキ肉のような画像は相当数の教師画像があるためか、わりと高クオリティな画像が生成されます。

20220922194025191662340333scale1000ddim1 

ですが、やはり欠点も見えてきます。

例えば、この画像。

20220922193131121662340326scale1000ddim1

一見すると悪くない画像に見えますが、よく見ると変です。

一枚肉なのに、焦げ目が不連続です。

おそらく、カットステーキの画像が一枚肉として表現されてしまったものと思われます。

AIはカット肉と一枚肉との区別が付けられないため、こういうことが起きるのでしょう。

似たような事例として、文字表記がおかしいというのもありますね。

202209201429531331126655scale1000ddim1

特に日本語は酷いものです。ひらがな、カタカナ、漢字とは似ても似つかないものが出てきます。

これは文字を「模様」としてしか認識しておらず、それっぽい見た目のものを返した結果、こうなるのでしょう。

ところで、画像生成AIに対して一つ、理解されていないかなぁと思うことがあるんですが。

よく「AIに作らせてみた」系の投稿がTwitterなどで見られますが、あの画像を一枚作り上げるために、数枚ほど作って良いものをチョイスしていることはよくあることです。

例えば最近、「飲み会」の画像を作らせてみたんですが、

202210102029565a_scene_of_the_movie_that

一見すると悪くなさそうですが、よく見ると右側の男性の顎がちょっと怖い。不自然すぎます。

ランダムノイズを付加してそこからデコードした信号を画像として整えていくようなアルゴリズムですから、不自然なものが出てきてもおかしくないです。

こういうものを何枚か出力させてみて、まともな奴をチョイスして表示させていることが多い、というのが現状かと思います。

(NobelAIは試してませんが、ラーメンの画像を見る限りは、やはりまだまだ失敗作も多いんじゃないかと推測してます)

正直言って、人類を脅かす(?)ほどの存在にはまだまだ遠く及びませんね。

今後改善されることを期待はしたいですが、教師データとなる既存のものを参考に画像を生み出しているという性格上、人間の想像力を超えるものを作り出すことは不可能です。

ゆえに、絵師さんの役割が消えることはないと考えます。

この画像生成AIですが、例えばアニメやイラストを描く人の負担低減としてベース絵や背景画像を作らせるのに使うという活用法が、もっとも良いAIとの付き合い方になるのではないか、と個人的には考えてます。


MSI GeForce RTX 3050 VENTUS 2X 8G OC グラフィックスボード VD7986

« GEOの激安イヤホン「SWE100QT13」を買ってみた | トップページ | ある意味「AI」の正しい使い道!? 味の素のAIによるパッケージデザイン »

数値解析系」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

« GEOの激安イヤホン「SWE100QT13」を買ってみた | トップページ | ある意味「AI」の正しい使い道!? 味の素のAIによるパッケージデザイン »