フューチャー・ビジョン・ラボ

進化する画像生成AI

主任研究員  内田 真穂

AIが絵を描く能力が飛躍的に向上し、テキストを入力するだけで高精度の画像を作成できる画像生成AIが次々と登場している。その能力は驚くほど高く、人間の創作に代わるコンテンツ生成ツールとして発展していくだろう。他方、AIでなく人間にしか生み出せない価値は何か、改めて考え直すべき時期にきている。

1.はじめに

テキストを入力するだけで高精度な画像を生成するAIが世界中で話題になっている。AIの能力が飛躍的に向上したことに加えて、誰でも簡単に利用できるAI画像生成サービスが2022年夏以降、次々とリリースされているためだ。AIによる創作はどこまで進化していくのだろうか。急速に進化する画像生成AIの現在地を概観し、これからのAIについて考える。

2.美術コンテストでAIアートが優勝、急速に進化する画像生成AI

画像生成AIとは、作成したい画像のイメージをテキストで指示すると、大量の画像や写真を学習したAIがその指示をもとに絵画やイラストを生成してくれるソフトウェアである。生成される画像はフォトリアルなものから水彩画風、油絵風、アニメ画風のものまで幅広く、画風や色味などもテキストで指示すればAIがそれに応えてくれる。 

画像生成AIの進化は目覚ましく、AIが創作した絵は今やAIが描いたのか人間が描いたのか判別できないレベルになってきている。2022年8月に米コロラド州で開催された美術コンテストでは、AIが描いた絵画がデジタルアート部門の最優秀作品に選出された。受賞決定後にAIによる創作物であることを制作者が明かし、アートとは何かを巡る論争にまで発展した

AIが画像を生成する能力は、2014年に登場した「GAN(敵対的生成ネットワーク)」(訓練用データから特徴を学習してそれと似たデータを生成できる生成モデルの一種)の発展によって大きく向上した。また、近年、自然言語処理分野の技術(AIがテキストを分析する技術)が格段に上がっていることも、画像生成AIの性能向上の要因である。特に米Open AIが2020年に公開した巨大言語モデル「GPT-3」の登場後、画像生成AIは急速に進化している。Open AIは2022年4月、研究者向けに高性能画像生成AI「DALL・E(ダリ)2」を公開(その後9月に一般公開)している。

3.Midjourneyの登場でAIお絵描きブームに

画像生成AIブームの端緒となったのは「Midjourney」である。Midjourneyは米国のスタートアップ企業Midjourneyが2022年6月にリリースしたAI画像生成サービスで、その画力の高さに加えて、誰でも簡単に利用できるサービスとして登場したのが画期的だった。

使い方は簡単で、専用サイト上で「プロンプト」と呼ばれる指示文を入力すると、AIが高品質の画像を数パターン生成してくれる。出来上がった画像を高解像度にしたり、追加の指示を与えて加工したりすることも可能である。画力の高さと簡単な操作方法、無料で試せる手軽さなどがSNSで広まり、MidjourneyはAIお絵描きブームを巻き起こした。SNSにはAI生成画像が多数投稿され、完成度の高い画像を産み出すプロンプトは「呪文」と呼ばれて広まった。

筆者も試しにMidjourneyを利用してみたところ、数十秒で期待以上の絵が完成した。図表1左は「a kitten reading a book(本を読んでいる猫)」、同右は「a girl standing in the mystic forest(神秘の森に立つ少女)」と入力して出力された画像である。上述の美術コンテストの優勝作品もMidjourneyによる創作物だという。

4.Stable Diffusionが加速させた画像生成AIブーム

Midjourneyに続いて注目を集めたのが、英Stability AIが8月に公表した「Stable Diffusion」である。Stable Diffusionは、膨大なデータを学習したモデルのソースコードを無償公開しており、商用利用も制限していないため、誰でも自由に拡張機能の追加が可能である。その反響は大きく、Stable Diffusionの公開後、世界中の開発者によってさまざまな拡張機能が追加された画像生成ソフトが次々とリリースされている。

Stability AIによると、8月の公表から2か月余りで、世界中の20万人以上の開発者がStable Diffusionをダウンロードした。また、同社の一般向けサービス「DreamStudio」には50カ国以上の100万人を超えるユーザー登録があり、1億7000万枚以上の画像が生成されたという

図表2は、そのDreamStudioを利用して筆者が作成した画像である。上2つは「artistic beautiful cat among red roses(薔薇の中にいる芸術的で美しい猫)」、下2つは「small dog surfing on a surfboard wearing sunglasses at the ocean(サングラスをかけて海でサーフィンをしている小さな犬)」と入力して出力されたものである。わずか数秒でこれらは完成した。画力だけでなく、生産性もかなり高い。

なお、現時点の画像生成AIは、入力するプロンプトによって出力される画像のクオリティが左右される。満足いく画像を作成するにはプロンプトの修正を重ね、繰り返し出力してみることが必要だ。同じプロンプトでも出力される画像は都度変わる。図表2の画像を作成した際も、猫のボディラインが不自然な画像や、いかにも合成写真といった感じの画像が出力されるなどした。ただ、この点はAIのさらなる進化によって今後改善されていくはずだ。

画像生成AIは人間が何時間もかけて描くような絵を数秒で生成できるため、汎用化が進めば無数の画像が世の中に出回るようになると予想される。AIの創作による画像はほぼ無料で手に入るようになっていくだろう。一方、独創的なものを生成しようと思えば、絵心とプロンプト作成センスがより必要になっていくと考えられる。

5.著作権やフェイク画像の課題も

画像生成AIの急速な進化に伴い、著作権や著作物の定義という新たな課題も浮かび上がっている。日本では、AIに学習させるために著作物を使うことは認められている。また、AIが自律的に生成した生成物(AI創作物)は著作物に該当せず、著作権も発生しない。しかし、AIを道具として利用し、その創作過程において人間の「創作的寄与」がある場合には、著作物として認められる可能性があるとされている。つまり、プロのイラストレーターが画像生成AIを利用し、テキストの修正を重ね、試行錯誤して生成・加工した画像であれば、著作権が発生する可能性があるということだ。

著作権の課題以外にも、フェイク画像や倫理的に好ましくない画像の作成など、画像生成AIの悪用問題がある。DALL-E2(2022年9月一般公開)は倫理的に許容し難い画像が生成されないようにフィルターを実装している。Stable Diffusionも同様のフィルターを実装しているが、ソースコードを公開している影響で、フィルターを除去する技術が流布する事態となっている。

画像生成AIに限らず、AIを巡る法的・倫理的課題は多い。健全なAIの発展のためには、法整備とともに使用する側にもAIリテラシーが求められる。

6.これからのAI

画像生成AIはこれから先どこまで進化するのだろうか。現時点では、画像生成AIはまだ個人の遊びや趣味としての利用に留まっている。しかし、数年もすれば、プロのクリエイターに頼らずとも高品質のイラストやデザインの創作が可能になり、企業での利用も広がるだろう。世界的ベンチャーキャピタルのセコイアは、2022年9月に公表したレポートの中で画像生成AIの進化について、2025年には実用に耐えうるレベルのプロダクトデザインが可能となり、2030年にはプロのデザイナーに匹敵するプロダクトデザインが可能になると予測している

AIが創造する領域は画像だけでなく、文章、音楽、動画などにも広がっている。これまでAIができる処理は単純作業に限られ、人間の創造的活動(絵や小説の制作など)や知的労働(コンサルティングなど)は苦手とされてきた。しかし、その仮説は覆されつつある。AIに奪われない職業の代表格とされてきたクリエイティブな職業さえも、AIに奪われる兆しが見えつつある。人間にしか生み出せない価値は何か、改めて考え直すべき時期にきている。

PDF書類をご覧いただくには、Adobe Readerが必要です。
右のアイコンをクリックしAcrobet(R) Readerをダウンロードしてください。

この記事に関するお問い合わせ

お問い合わせ
TOPへ戻る