画像生成AIとは?
画像生成AIとは、AIにテキストや画像を読み込むことで、入力した情報から自動で画像・イラストを作成するAIサービスの総称です。
昨今Twitterなどで「誰でも簡単に神絵が作成できる」といわれている、あれです。
英語が読めないと操作がやや難しいですが、翻訳アプリ(「DeepL翻訳」おすすめ)を使えばクリアできます。
実際にMidjourneyを使って作成した画像は記事後半で紹介しています。
▶画像生成AIが作ったクリエイティブの著作権問題
勘の良い方は気付いていると思いますが、画像生成AIは「デザインの常識」や「アーティストの領域」を脅かす存在として危惧されています。
そこで「作成された画像の著作権は誰に帰属するのか?」という問題が浮上します。
結論からいうと、現状では多くの画像生成AIサービスが「著作権はその画像・イラストをアップロードしたクリエイターに帰属する」としています(利用時はしっかりとその画像生成AIサービスのポリシーを確認してください)。
ただし、画像生成AIの利用にもモラルが適用されるべきで、例えばリリース後わずか1日でサービスを停止したAIイラストメーカー「mimic」をめぐっては、アップロード素材として用いるイラストに「他人が作成したイラスト」を使用した際の著作権の問題、それを用いた商用利用の問題で話題になりました。
当然イラストを作成するクリエイターは自身の作品がアップロード素材として利用されることを危惧し、反対の声が挙がっています。
また、AIイラストメーカーのmimicが炎上し、画像生成AIのMidjourneyがもの凄い勢いで浸透している現状に対して分析を行っている記事もありますので、興味ある方はこちらもどうぞ。
画像生成AIが「脅威」なのは果たしてデザイナーだけか?
ここで考えたいのは、画像生成AIの影響が果たしてデザイナーだけに及ぶものなのか?ということ。
そこでヒントとなるのが、Midjourney以外の画像生成AIとして有名な「Stable Diffusion」。
Stable DiffusionはMidjourneyよりも綺麗で緻密な画像が作成できると知られていますが、そのStable Diffusionの開発元「Stability.AI」は、「AIは全世界の人が平等に使えるようになるべきだ」と考えているそう。
つまり、今後画像・イラストだけでなく、様々な創作物にAI生成の波が押し寄せ、イラストレーターが危惧しているような状況が他のクリエイターにも訪れるかもしれない。
その時クリエイターはどうやって創作物を生み出していくのだろうか?
あるいは、どうやって自分の仕事を奪ったAIと仲良くしていくのだろうか?
「ライター」は、すなわち「テキスト」は最後の砦となり得るか?
やはり考えたいのは、自身が生計を立てている「ライター」という仕事。
ライターは複雑多彩な表現が可能な言語活動によって、現状のAIでは代替されないような価値を提供している(と思う)。
しかし、いわゆる「こたつ記事」のように、SEOだけを目的とした文章には一定のパターンがあるように思えて、書く身としても将来AIに代替されるのでは?という漠然とした予想もある。
実際、条件分岐的なパターンの連鎖で書かれる文章は現段階でも「誰が書いても良くない?」という意見を耳にする。
おそらく実態としては、ライターという職業が無くなるか?というよりも、いわゆる「どんなテキスト」が今後生き残るのか?なのだと思う。
そして、AIとどんな協働体制(AIが創作できなかった、バグが発生したテキストに対して人間が手を加えて直すといった具合)が築かれるのか?に焦点が当たると思う。
もちろんAIにも能力差・汎用性の差があるので、全現場・業界において同様の状況になるとは思えないけど、スマホが普及していったように、徐々にAIが書ける領域が広がっていくのかもしれない。
▶THE GUILDの深津貴之氏は「画像生成AIの普及によって、クリエイターはディレクターに移行する」と見解を述べている
ちなみにTHE GUILDの深津貴之氏は、画像生成AIの普及(AI画像の洪水)によって、ユーザーへの価値提供についてサービス提供側は考える必要に迫られる、とした上で、以下のようにコメントしています。
また、「AIが画像を生成できるのであればイラストレーターやそのアシスタントが不要になる」という未来を想像しがちですが、私はそうは思いません。むしろその逆で、イラストレーターやアシスタントといった役割の方々が全員、アートディレクターのような役割を求められるようになるのではないでしょうか。
実は僕もそう思っています。急な後付け感。笑
でも多くのWebライターが感じている「こたつ記事への危機感」は、深津氏が言及した内容とリンクしてくると思います。
例えば、RPA(ロボティクス・プロセス・オートメーション)の分野では、「転記・抽出作業」を行う作業者のマウスの動き、画面上の動きをRPAシステムが記憶し、それを再生することで業務の自動化を図るサービスが展開されていますが、これも以前は人間が行っていた業務です。
※RPAが登場する前から、Excelのマクロ機能のようにPC作業を自動化するシステムは存在していましたが、RPAは複数のアプリケーションを越境して作業を行うため(PC単位で動くため)、汎用性の高い自動化システムとして注目を集めています。
人間が行っていた転記・抽出作業をRPAが行うようになると、人間はどうするか?
「......早く帰れる!」
それも正解ですが、以下のような成果が得られます。
- 業務の省力化
- 捻出した時間をコア業務に充てる
- 作業者の負担軽減(残業時間も減りますね)
つまり、他の仕事が出来るようになるんです。
SEO記事に疲弊しているライターが少なからずいますが、もしかしたらAIが代替するような未来がくるかもしれませんね。
ただSEO記事でも「記事制作の上位工程は人間が関わる可能性が高い」と僕は思います。
- 暗黙知を考慮した企画・構成が作れるか?
- 類似率・一致率などの条件を設定すれば、AIは人間が納得する構成を作れるか?
- テキスト一致率を回避するだけで、自然な文章(自然言語)は作成できるのか?
- 予期せぬ事態が発生した場合、動作を停止しないか?(フレーム問題)
現状のAIのレベルを鑑みると、テキストはAIに書かせても、企画や構成、編集作業は人間が行う方が品質面で担保されるのではないでしょうか?
話を戻して、先ほどのRPAの例だと、RPA運用で最も危惧すべきは、「RPAの動作停止による、実質的な業務停止」です。
RPAは仮想知的労働者ともよばれ、単純作業を24時間365日繰り返し実行しますが、その特徴から放置されるロボットも出てきます。
そしていつの間にか管理者の居ない「暴走ロボット」も生まれます。
そうした状況が企業活動の至るところで発生していた場合に何が起こるか?
想像しただけで冷や汗ものですね。
決してRPA導入・運用が悪いと言いたいのではなく、AIやシステムの自動化によって人間は一時的に楽になる一方で、メンテナンス・保守といった別の業務負荷が増える、ということ。
これはおそらくSEO記事、ライティングの分野でも起こってくるものだと思うので、ディレクションの役回り、管理者が増えていく、というのはあり得る話だと感じています。
同時並行的に生まれるクリエイティブの可能性は?
そうこう考えているうちに、ある日の出来事を思い出しました。
Web3が騒がれた時(僕がSEO案件で「web3.0」というキーワードで対策していた頃:その当時はまだWeb3よりはWeb3.0の方が浸透していた、と思う。)、僕はすぐに知り合いのNFTクリエイターにアイデアを伝えました。
(僕のインスピレーションの源泉なので、本当は誰にも教えたくない...会員特典?笑)
しかも「p5.js」とかいう言語を使ってオブジェクトを動かすので、文章しか書けない僕にとっては大変な衝撃でした。
彼らは天才で(学歴も日本トップの大学・大学院卒だから疑う余地無く天才なんだけど)、そういう創造性に慣れてしまっているようでした^^;
僕にとってはそこから「同時並行的に生まれるクリエイティブ」あるいは「同時多発的に生じる現実」について(勝手に)考えるようになったんです。
例えば「p5.js」とかいう言語の「オブジェクトを動かす」というイメージだけ取り出してみて、日本語や通常書かれるデジタル文章と同時に画像や動画が並行的に生み出されるとしたら、ライターは文章を書きながら、デザイナー顔負けのアート作品を生み出し、動画クリエイターが閉口する程の動画クリエイティブを作り出せるかもしれない。そしたらライターはそのまま文章を書きながら、様々なクリエイティブを作ることができる。しかも何倍も高速に、高品質で。(僕の未来の著作から引用)
こういう視点は、時間が逆行する映画「TENET」の反粒子の対消滅の話や、未知との遭遇を言語学・物理学の観点から紐解く映画『メッセージ―Arrival』の未来予知の能力が備わる話(おそらくベンジャミン・ウォーフの『言語・思考・現実』に書かれていた「時制のない言語を話す人々」の話から着想を得ているだろう)からイメージを得ました。
哲学的な問いが好きな方は是非見てみてください。
実際に画像を作ってみた!
神絵が作れる!と話題になっていたので、Midjourneyを使って実際に画像を作成してみました!
画像を作成するにはMidjourneyのホームから、Discordへと遷移してサインアップを済ます必要があります。その後、MidjourneyのQuick Start Guideを参考に、「/imagine」と打ち込んで、適当に好きな単語を入れていくと作れます(ポリシーもあるので確認してね)。
ちなみに僕は「Tokyo in 2049」と入力(『ブレードランナー2049』が好きなので)。
すると以下のような画像が作成されました!(祝)
スカイツリー×富士山...他にも塔っぽいものも...
都市の荒廃感と塵、電気街の発展...
こちらは空飛ぶ物体がチラホラ...思ったより低い位置飛んでる?
みんなもやってみてね~