Stability AI、ラフスケッチをダイナミックなイメージに変換するツール「Stable Doodle」をリリース

  • このエントリーをはてなブックマークに追加
2023/07/14 07:00

 Stability AIは、簡単なラフスケッチをダイナミックなイメージに変換するスケッチ・トゥ・イメージツール「Stable Doodle」をリリースし、さまざまなプロフェッショナルや趣味愛好者に無限のイメージングの可能性を提供する。

 ラフスケッチに命を吹き込むことが、かつてないほどシンプルになった。Stability AIによるClipdropのこの新しいツールは、教育、クリエイティブデザイン、ファッション、芸術など、さまざまな業界を飛躍的に向上させる能力を備えている。 Stable Doodleは、最新のStable diffusion model SDXL 0.9とともに、Stability AIのウェブサイト「Clipdrop」で無料で試すことができる。

 Stable Doodleは、AIツールに慣れているかどうかにかかわらず、専門家と初心者の両方を対象としている。Stable Doodleでは、基本的な描画スキルとオンラインアクセスがあれば、数秒で高品質のオリジナル画像を作成できる。

 デザイナーやイラストレーターなどのプロフェッショナルな人々が、貴重な時間をよりクリエイティブな方面に有効活用し、作業効率を最大化するためのユーザーフレンドリーなアプリケーション。ラフスケッチとして描いたアイディアをすぐ作品に反映させ、クライアントのためのデザイン、プレゼン用資料やウェブサイトの素材、さらにはロゴを作成することも可能。

プロンプト: A comfy chair, ‘Isometric’ style
プロンプト: A comfy chair, ‘Isometric’ style
プロンプト: Cat with a jeans jacket, ‘Digital Art’ Style
プロンプト: Cat with a jeans jacket, ‘Digital Art’ Style
プロンプト: Castle on a hill, winter, ‘Anime’ Styl
プロンプト: Castle on a hill, winter, ‘Anime’ Styl
プロンプト: Living room, ‘Comic Book’ Style
プロンプト: Living room, ‘Comic Book’ Style
プロンプト: Cute owl, ‘Origami’ Style
プロンプト: Cute owl, ‘Origami’ Style

詳細情報

 Stable Doodleは、Stability AIのStable Diffusion XLの高度な画像生成技術と、強力なT2I-Adapterを組み合わせたもの。T2I-Adapterは、Tencent ARCによって開発されたコンディションコントロールソリューション。AI画像生成の精密な制御を可能にする。

 T2I-Adapterは、既存の大規模な事前学習拡散モデルに学習可能なパラメータを追加することで、スケッチ、セグメンテーションマップ、キーポーズなどの入力条件を追加することができる。このフレームワークは、入力ガイダンスのための複数のモデルを同時にサポートし、生成プロセスの制御を強化する。

 Stable Doodleのユースケースにおいて、T2I-Adapterは、事前に学習されたText-to-imageモデル(SDXL)にラフスケッチのような追加ガイダンスを条件付け、ラフスケッチのアウトラインを理解し、モデルによって定義されたアウトラインと組み合わされたプロンプトにもとづいて画像を生成できるようにする。

 T2I-Adapterネットワークは約77Mのパラメータで構成されている。T2I-Adapterネットワークは、事前に学習されたText-to-imageモデルは一切変えず、ラフスケッチなどの追加ガイダンスを考慮した生成が可能になる。

出典:Github T2I-Adapter documentation
出典:Github T2I-Adapter documentation

動作環境

 Stable Doodleは、Clipdrop by Stability AIのウェブサイトおよびアプリ(iOSおよびGoogle Play)で利用できる。ログインする必要はなく、1日の制限時間内にツールを使って気軽に始められる。ユーザーフレンドリーなインターフェースは、直感的に操作できるように設計されており、マウスで基本的なスケッチを作成し、アートスタイルを選択して「生成」をクリックする使いかたである。

 Stable Doodleでは、アーティスティックなカスタマイズも可能で、Stable Diffusion XLを介して14種類のスタイルから選択することができる。スタイルには、リアルなもの(写真風)から映画のようなもの、クリエイティブなもの(ファンタジーアートや折り紙)もある。