D-ID、テキスト・画像・動画をひとつのプラットフォームで融合するジェネレーティブAI発表

  • このエントリーをはてなブックマークに追加
2022/12/16 13:00

 ジェネレーティブ AIとクリエイティブメディアを提供するD-IDは、画像とテキストの両方をアニメーションとともに生成できる、マルチモーダルジェネレーティブAIにもとづくビデオプラットフォームを発表した。

 同社独自のジェネレーティブAI技術とOpen AIの「GPT-3」、Stability AIの「Stable Diffusion」を統合した次世代のセルフサービス型動画プラットフォーム「Creative Reality Studio」は、深層学習モデルを使って、ユーザーの記述をもとに顔や文章を自動合成し、その顔をアニメーションとして動かしながら119の言語でテキストを読み上げるコンテンツを生成することが可能。

 同プラットフォームは、クリエイター、マーケティング担当者、トレーニングチームが、AIの生成するカスタマイズされたビデオナレーターを使用して魅力的なコンテンツを開発することを可能に。GPT-3やStable DiffusionなどのジェネレーティブAI技術と、同社のディープラーニング技術を統合したことで、動画コンテンツ制作のコストと手間の根本的削減を目指す。1枚の画像を使って魅力的な動画を容易に作成し、その画像に生命を吹き込んで、数百万人に提供することができる。同社のジェネレーティブAIを搭載した動画技術は、企業ユーザーと個人ユーザーの両方が利用できる。