話題となった画像生成AIから紐とく、AIと共創する時代に必要なクリエイターのスキルとは

話題となった画像生成AIから紐とく、AIと共創する時代に必要なクリエイターのスキルとは
  • X
  • Facebook
  • note
  • hatena
  • Pocket
2022/10/03 08:00

 2022年7月には「Midjourney」、翌月には「Stable Diffusion」など、この夏話題を集めた画像生成AI。公式のDiscordに参加し、生成したいモノや風景の特徴、テイストなどを打ち込むとAIがそれに合った画像を自動生成してくれるMidjourneyは、Discordへ登録すればだれでも試すことができる点が、そしてStable Diffusionにおいてはオープンソース化されていることなどが、トレンドとなった一因かもしれない。ではなぜ今、画像生成AIが注目されているのか。この流れは、クリエイターやクリエイティブ制作にどのような変化をもたらすのか。AIを活用したマーケター向けクリエイティブデザイン提供サービス「AIR Design」を展開するガラパゴスの代表取締役・中平健太さんに話を聞いた。

ビジネス活用は難しかった2016年から振り返る、画像生成AIの進化

――ガラパゴスを創業した経緯から教えてください。なぜAI×クリエイティブの事業に辿り着いたのでしょうか。

もともと創業メンバーの3人は、インクス(現ソライズ)という製造業のコンサルで一緒に働いていたメンバーです。ガラパゴスは、インクスで3年働いたあとに創業しました。

やはり製造業は日本が非常に進んでいるため、効率的なものづくりをしています。一方ガラパゴスを立ち上げてから、ウェブサイトやアプリの受託開発、いわゆるデジタルのモノづくりを生業とし始めましたが、デジタルのものづくりの非効率さを痛感したんです。コミュニケーションの仕方もとても感覚的なケースが多かったり、非常にアナログな世界だなということを2009年の創業時から感じていました。

僕らはスマホアプリの開発で事業を成長させていき、2015年にディープラーニングの技術「GAN(Generative Adversarial Network[敵対的生成ネットワーク])と出会いました。そのときに、AIがイラストや写真を自動で生成する未来がくるかもしれないと実感したんです。そして、正直このままいくと僕らの仕事はなくなるのではないかという危機感と同時に、AIが作り出す未来にワクワクしました。そんな背景もあり、2016年からAIの研究開発を開始。2016年から2018年まで、ロゴを自動生成するAIを開発し、事業を推進していました。ですが、収益的にあまり上手くいかなかったためピボット。2019年からはウェブ広告のデザインをサブスクで提供する「AIR Design for Marketing」の提供を開始し、今に至ります。

――2015年からAI×クリエイティブの領域に携わるなかで、変化は感じていますか? 

とても実感しています。2015年~2016年ごろにAIができたことは、いわゆるスタイルトランスファーと言われるもの。馬をシマウマにする、ライオンをパンダ風にするといった見た目を少し変えるような技術です。

出典:iMagazine「GAN:敵対的生成ネットワークとは何か~『教師なし学習』による画像生成」
出典:iMagazine「GAN:敵対的生成ネットワークとは何か~『教師なし学習』による画像生成

当時、我々もそういった研究開発を進めていました。それが次の画像です。これは2016年ごろに自分たちでソースコードを実装し、ロゴデータを集めて加工したものに情報を付与し、そのデータを学習させ、「こういう画像を生成しなさい」と指示をした結果、AIがオリジナルで描画したものです。

自動生成初期のロゴ(出典:note「AIR Design誕生秘話 Part1」)
自動生成初期のロゴ(出典:note「AIR Design誕生秘話 Part1」)

ご覧のとおり、当時はこのレベルだったんです。生成はしているものの、このままビジネスで活用することは難しい状態でした。

それから2017年~2021年とGANを研究し、最先端の技術も追ってきましたが、あまり大きな進化はなかったように思います。僕らも、意外とGANは上手くいかないのかもしれないと思っていた矢先、MidjourneyやStable Diffusionが登場。イラストや写真のような、広告クリエイティブのパーツであればAIが書くことができる時代がとうとうやってきたなという印象です。

クリエイターの価値の重心は「なにをつくるか」に

――今、画像生成AIがトレンドになっている背景についてどのようにお考えですか?

技術のトレンドがブレイクスルーしたのにはふたつのポイントがあると考えています。ひとつは、人間が入力した言語と画像が正しくつながるようになったこと。今までは「cat」と入力しても、「cat」に近い画像をAIが結びつける力が弱かったのですが、今は「black cat」とテキストを入れると「black cat」の画像と正しくつながるようになった。これがひとつのブレイクスルーです。もうひとつは、以前は低解像度でしか生成できなかったものが、いったん低解像度のものを生成したうえで、それを高解像度に変える技術が進化したこと。これにより、ビジネスシーンにも耐えうる画像になった点が、技術的なブレイクスルーだと考えています。

このブレイクスルーにより、クリエイターの価値は「なにをつくるか」に移っていくと思います。たとえばバナーの価値とはなにかを考えると、必要としているユーザーに正しくクリックをしてもらうことですよね。バナーで伝えたいサービスのユーザーは誰で、どのような特徴があり、それをどんな風に表現すれば良いのか。つまり、いかに設計するのかということです。その設計のもとで、たとえばMidjourneyやStable Diffusionを使ったウェブサービス「DreamStudio」に入力して生成した画像を活用するなど、なにかを具現化する部分はだんだんとAIに置き換わっていく可能性が高いでしょう。ただ、最後の1ピクセルの調整など、細かいこだわりの部分はやはり人がやっていかなければいけない。はじめの設計と最後のこだわりに、価値の比重が移っていくのではないでしょうか。

たとえば当社のサービス「AIR Design for Marketing」では、マーケティングのプランニングとクリエイティブ制作、運用結果のデータをふまえた分析と改善のサイクルを、企業のマーケターに伴走し高速で提供するものです。そのため社内には、LPやバナーを制作するデザイナーが多く在籍しているのですが、こういった画像生成AI技術を活用し、より設計の部分に集中してデザインを制作できるよう、今まさに体制を整えているところです。

※この続きは、会員の方のみお読みいただけます(登録無料)。