AIの活用による創造性の発展に取り組む社Qosmoは、音楽・サウンド分野において当社が蓄積してきたノウハウ・モデル・アルゴリズムを用いた製品群「Qosmo Music and Sound AI」の新たなラインナップとして「Video2Music(ビデオtoミュージック)」の提供を開始する。本製品はコズモが独自に開発した深層学習型AIモデルが、入力された動画の内容に合った曲の候補をリストアップしてくれる技術を使用しており、BGMの選択をAIが大幅に時間短縮する。なお、本製品はBtoBでの提供を目的としている。
同製品は、同社が独自に開発した深層学習型AIモデルが、入力された動画の内容に合った曲の候補をリストアップしてくれる技術を使用しており、これまでに多くのビデオクリエーターが長い時間を費やしてきたBGMの選択を大幅に時間短縮する。
感覚的にしか評価できない選曲作業を大幅に短縮
動画の雰囲気にピッタリなBGMやシーンの感情をうまく表現した楽曲を選曲するには、幅広い音楽に関する知識が必要となる。また、映像に音楽が合っているかどうかは感覚的にしか評価できないため、個人個人による捉えかたの差も大きく、多くの候補曲のなかからさまざまな人の意見をもとに選曲を行う必要があった。そのため、これまでビデオディレクターやクリエイターたちは、BGMの選曲に多くの時間を費やしており、同社のユーザーヒアリングによると、発表作品の中では数秒しか使われない音楽の選曲に何時間もの時間が使われてしまうことも指摘されている。
同製品は、ユーザーが動画をアップロードするだけで、瞬時に複数の選曲候補を見つける。候補曲数は自由に決めることができ、それぞれの候補曲はマッチ度でランク付けされる。これらの候補曲には一定の類似性がある一方で、ある程度のばらつきも存在するため、最終的には製作者のセンスや意図も加味した選曲を行うことができるようになっている。
同製品のおもな特徴は次のとおり。
- 同社が独自に開発したAIモデルが、与えられた動画に「合った」音楽を対象音楽ライブラリの中から短時間(数秒以内)で抽出。対象音楽のジャンルや形態などに制限はない。
- 「ビデオ→音楽」に加え「音楽→ビデオ」の検索もできるので、クロスメディア情報検索の実装によりユーザーエクスペリエンスを向上することが可能。
- 同社の音楽検索アルゴリズムを合わせて使うことで、類似曲候補の提案など、幅広い検索サービスの構築が可能。
- 同製品の提供は、APIもしくはオンプレ環境での実行が可能で。同製品は一般ユーザーへの直接提供ではなくB2Bでの提供を前提としている。