画像生成ができるAIとは
AIはいまやさまざまな局面で我々を支え、生活に欠かせないものとなってきています。AIが活用されている身近なものといえば、Googleの検索エンジンや動画のレコメンド機能が挙げられます。
特に画像に関するAIの技術においては、画像認識が深層学習(ディープラーニング)によって大きな進歩を遂げてきました。画像認識とは、簡単に言えば、「画像」から対象が何かを判別するための技術です。AIによる画像認識は、車の自動運転やスマホの顔認証などに応用されています。
さて2022年は、キーワードから「画像」を生成する、画像生成AIが相次いで登場しました。「誰でもキーワードから絵を作ることができる」という機能が、多くのユーザーに衝撃を与えています。
例えば、画像生成AI「Stable Diffusion」で「落穂拾い、ミレー」というキーワードを入れると、以下のような画像が出力されます。実物とは全く違う構図ですが、穂を拾っている様子が油彩画風のタッチで描かれています。
このような完成度の高い絵は、誰でも描けるわけではありません。しかし、今やAIの力を借りることでアート作品の制作も可能になってきたということです。今回はそんな画像生成AIの中でも、特に有名である「Midjourney」、「Stable Diffusion」について、調査します。
手軽にすごい絵がつくれる画像生成AI「Midjourney」「Stable Diffusion」
「Midjourney」、「Stable Diffusion」はそれぞれ2022年6月、8月に公開された、画像生成ができるAIです。当時はすでに、Googleによって開発された「Imagen」や、OpenAIが発表した「DALL·E」などの画像生成AIがありました。
それにも関わらず、「Midjourney」や「Stable Diffusion」は、「DALL・E2」とともに画像生成AIの御三家と呼ばれるほどに注目を浴びています。その背景にあるのは、「人間が書いたものと遜色のないアートを生成できる」という性能の高さと、「誰でも使うことができる」という手軽さです。
画像生成AIの性能の高さを象徴するエピソードとしては、「Midjourney」で描いた絵「Theatre D'opera Spatial」がある美術コンテストで優勝したことが挙げられます。この作品は受賞決定後、作者が画像生成AIによって制作したことを公表し、賛否両論を呼びました。
ほかにも、「Midjourney」と「Stable Diffusion」によって生成されたイラストのみを掲載したイラスト集「 Artificial Images」が2022年9月に発売されるなど、”AI絵画”の勢いは衰えを知りません。
日本初のオールAI生成画像を元にしたイラストレーション集『Artificial Images』
検索者数が急上昇する「Stable Diffusion」「Midjourney」
では、「Stable Diffusion」「Midjourney」はどんなユーザーが検索・利用しているのでしょうか。毎月更新される行動データから、競合サイト分析やトレンド調査を行うことができるヴァリューズのWeb行動ログ分析ツール「Dockpit」を用いて、ユーザー属性の分析を行いました。
まず、これらAI名の検索はどれくらい起こっているのでしょうか。
マナミナでは、週次で検索が急上昇していたワードをランキング化し、毎週月曜日に配信しています(祝日の場合を除く)。2022年7月31日~8月6日の当ランキングには「Midjourney」、2022年8月21日~8月27日分には「Stable Diffusion」がランクインしていました。
このように、検索急上昇ワードを週次で追っていくと、トレンドをいち早く把握することができます。
検索者数の推移を見てみると、実際にこの2ワードの検索者数は2022年8月に爆発的に増えており、「Midjourney」は55万人もの人が検索しています。一方で、「Midjourney」に関しては9月の検索者数は減少しており、情報感度が高く新しいもの好きのユーザーには急速に広まったものの、新規ユーザーへの認知はまだ進んでいないことが予想されます。
『「Stable Diffusion」「Midjourney」検索者数の推移』
(「Dockpit」画面キャプチャ)
期間:2022年6月〜2022年9月
デバイス:スマートフォン、PC
若者男性のTwitter利用者に人気の絵画生成AI
では、「Stable Diffusion」「Midjourney」というキーワードはどのようなユーザーに認知されているのかについて見てみましょう。
『「Stable Diffusion」「Midjourney」検索者の性別割合』
(「Dockpit」画面キャプチャ)
期間:2022年6月〜2022年9月
デバイス:スマートフォン、PC
「Stable Diffusion」「Midjourney」はともに男性による検索の割合が多くなっています。特に「Stable Diffusion」は男性の検索割合が7割強となっており、より男性人気度が高いことがわかります。
『「Stable Diffusion」「Midjourney」検索者の年代別割合』
(「Dockpit」画面キャプチャ)
期間:2022年6月〜2022年9月
デバイス:スマートフォン、PC
また、これらのキーワードの年代別の検索状況を見ると、両者ともに20代、30代がボリュームゾーンであることがわかります。「Stable Diffusion」の方がより若年層にウケているといえそうです。
ここから、「Stable Diffusion」「Midjourney」はともに、「20代、30代の男性」に多く検索されていると言えるでしょう。では、これらのユーザーには他にどういった特徴があるのでしょうか。更なる分析のために、行動分析ツール「story bank」を用いました。
まず特徴として挙げられるのは、「Twitterの利用時間」の長さです。
『「Stable Diffusion」検索者の「Twitterの利用時間」の長さ』
(「story bank」画面キャプチャ)
期間:2022年6月〜2022年9月
デバイス: スマートフォン、PC
『「Midjourney」検索者の「Twitterの利用時間」の長さ』
(「story bank」画面キャプチャ)
期間:2022年6月〜2022年9月
デバイス: スマートフォン、PC
このグラフから、「Twitterを利用している人の割合」は、ネット利用者全体では半数に満たないのに対し、「Stable Diffusion」や「Midjourney」と検索したユーザーのTwitter利用率は80%以上に。1時間以上の利用者も、ネット利用者全体より顕著に多いことがわかります。
このことから、これらの画像生成AIはTwitterで認知されたケースが多いのではないか、と考えることができます。また、各AIの利用者が、Twitterのハッシュタグ検索から理想の画像を生成するためのキーワードを探している、自分で生成した画像を共有している、といったケースもあると考えられます。こうした「SNSで共有したくなる要素」が、ブームの要因となっているのかもしれません。
絵画生成AI「Midjourney」に求めるものはアートなのか?
ユーザー理解を深めるため、「Stable Diffusion」「Midjourney」を検索した人の関心を、上記同様「story bank」で調べました。
『「Stable Diffusion」検索者の興味・関心についてのチャート』
(「story bank」画面キャプチャ/縦軸はリーチ率、横軸は特徴値)
期間:2022年6月〜2022年9月
デバイス: スマートフォン、PC
『「Midjourney」検索者の興味・関心についてのチャート』
(「story bank」画面キャプチャ/縦軸はリーチ率、横軸は特徴値)
期間:2022年6月〜2022年9月
デバイス: スマートフォン、PC
「Stable Diffusion」と「Midjourney」検索者では、両者ともに「マンガ」「アニメ」「ゲーム」への関心は高く、画像生成AIが若者の男性に人気であることの影響があると考えられます。
一方で、「Midjourney」検索者の方が「アート・芸術」への関心が高いことがわかりました。「アート・芸術」の特徴値は、「Midjourney」28.60pt、「Stable Diffusion」6.81ptとなっています。
二つの絵画生成AIの間で、なぜこのような違いが出るのか、実際に「Stable Diffusion」「Midjourney」を使うことで、その原因を探ってみました。
「Stable Diffusion」「Midjourney」を使ってみた感想
「Stable Diffusion」を簡単に使用する方法は主に2通りで、「Demo用のサイト」を使用するか、「お絵描きばりぐっどくん」というLINEのサービスを用いる方法です。
1.「Demo用のサイト」を使用する
「Demo用のサイト」の使用は、一度使用感を味わいたい人や、面倒な導入をしたくない人などにはおすすめな方法です。一方で、作成に数分の時間を要することや、混雑時にはエラーが出るなどのデメリットもあります。
2.「お絵描きばりぐっどくん」を使用する
こちらの方法については、「お絵描きばりぐっどくん」のLINEのフレンド登録をすることで、1日10回まで無料で利用することができます。
こちらは画像生成にかかる時間が短く、日本語入力にも対応している手軽さが魅力である一方で、無料での利用制限がある点には留意しましょう。
また、「Midjourney」を使用するためには、主に「Discord」を用います。
「Discord」にログインした上で、Midjourneyのサイトで「Join the beta」を押すことで、Midjourneyを利用することができます。この場合、無料利用は1アカウントあたり25枚ほどまでに制限されており、それ以上の画像を生成する場合は有料プランに登録する必要があります。
ここまでで準備は完了です。あとは作成したい絵のキーワード、いわゆるプロンプトや呪文を入力したら、AIによって絵画が生成されます。
ここからは、実際にAIによって生成された絵画をご紹介します。
■「Stable Diffusion」は写実的、「Midjourney」は抽象的
左から、プロンプト(キーワード)として、「monkey, banana peel(猿、バナナの皮)」、「Researcher spills reagent(試薬をこぼす研究者)」、「board game(ボードゲーム)」と入力した時の生成画像
「Stable Diffusion」と「Midjourney」を比較すると、「Stable Diffusion」は写実的な表現が多く、現実ではおこり得ないような描写が混じることの面白さがある一方で、「Midjourney」は人物画や生き物の絵を生成することに長けていないが、背景などの世界観を作り出すことには長けていると感じました。
「Stable Diffusion」は写実的であるため、芸術的な思考を膨らます余地が少ないという点において、先程の興味・関心チャートで「アート・芸術」への関心が低めに出ていた可能性があるのではないでしょうか。
また、「Stable Diffusion」の非現実的な表現や「Midjourney」の抽象的な表現が、画家の想像力を刺激し、手書きの絵へのインスピレーションを与える可能性を考えると、一概に画家の仕事が奪われるとは言えないと感じました。一方で、AIの学習用に用いられた絵画の画家・絵師の人たちにとって、AIがそれに類似した画像を生成することには否定的な感情を抱くことも理解しなければなりません。
絵画生成AIの問題点の一つとして、「ストーリー性を持った画像群の生成を苦手としている」ことが挙げられます。AIが画像を生成する原理は、入力されたキーワード(プロンプト)に対して、試行画像が似ているかどうかを判定して出力画像に近づけるという作業を何度も行っています。つまり、プロンプトが同一でも生成される画像は同一ではありません。つまり、以下のような「ある同一の男の子が喜怒哀楽の表情をした画像4枚組」を生成することは不可能です。ここから、画像に「ストーリー性」を持たせることは難しく、断片的な一つの状況を生み出すことしかできないのはAIの一つの欠点でしょう。
【まとめ】若者に人気の画像生成AI。その市場は拡大するのか
画像生成AIについて、「Stable Diffusion」と「Midjourney」を調査しました。
調査の結果、
・画像生成AIを検索する人は20代、30代の男性が多く、Twitterの利用時間が多い。
・「Stable Diffusion」は写実的な表現を得意とする一方で、「Midjourney」は人物画の生成に長けておらず、抽象的な表現が多かった。
・画像生成AIはストーリー性のある画像群を作り出すことが難しい。
の3点がわかりました。
今後、画像生成AIを用いた市場が整備されてくるでしょう。画像生成AIに関する認知をより広げていくためには、「若者のみをターゲットにしないモデルを作ること」が重要な鍵のひとつとなります。AIへの興味が薄い年代に、いかにしてAIが生成した絵画を受け入れてもらうかを検討することが、市場の拡大において不可欠となるでしょう。
▼今回の調査にはWeb行動ログ調査ツール『Dockpit』を使用しています。『Dockpit』では毎月更新される行動データを用いて、手元のブラウザで競合サイト分析やトレンド調査を行えます。Dockpitには無料版もありますので、興味のある方は下記よりぜひご登録ください。
『story bank』は、Web行動データとアンケートデータを用いて、ターゲットユーザーにおける特定の Web 行動の前後の動きと属性を集計できるツールです。詳しくはこちらをご覧ください。
2023年の4月に新卒として入社予定で、現在はヴァリューズの内定者アルバイトとして働いています。現在は、大学院にて金属クラスターについての研究を行っています。