NTTドコモ、AIで実在人物や架空キャラクターのような受け答えを可能にする「キャラクタ雑談技術」開発

  • このエントリーをはてなブックマークに追加
2021/03/18 06:00

 NTTドコモは、対話型AIサービスに実在の人物や架空のキャラクターのような受け答えを可能にする「キャラクタ雑談技術」を開発。同技術を使用したスマートフォン・タブレット向けアプリ「携帯人間AIジミー」を、ラフ&ピース マザー(以下、LPM)が2021年3月20日(土)から提供開始する。

 同技術は、あらゆる対話型AIサービスにさまざまなキャラクター性を付与することができる技術。再現したい人やキャラクターの対話データ(質問、応答)を学習することで、まるでその人やキャラクターと会話しているような高精度な対話型AIが作成できる。

 従来の対話型AIでは対話のルールを作成する方法が一般的だったが、同技術ではキャラクターの対話データを用意するだけで、ユーザーの入力に応じた適切な応答を出力することが可能に。さらに、NTTグループのAI「corevo」の一部でありドコモが提供する対話型AIサービス「ドコモAIエージェントAPI」と組み合わせることで、音声認識・音声合成による音声対話を実現することができる。

 なお、同技術はNTTメディアインテリジェンス研究所の技術にもとづいているとのこと。

 同技術を活用した商用サービスであるAIジミーは、LPMが提供する教育系コンテンツ配信サービス「ラフ&ピース マザー」のコンテンツのひとつ。ユーザーは人気お笑い芸人のジミー大西さんを再現したAIとの対話を楽しむことができる。同コンテンツでは、ジミー大西さん本人が作成した対話データをもとに学習したAIを構築することで、よりジミー大西さんらしい対話を実現している。

携帯⼈間AIジミーの技術内容

 同コンテンツでは音声対話を実現するために、キャラクタ雑談技術に加えてドコモAIエージェントAPIを使用している。同APIは、音声認識・音声合成機能を有しており、ユーザーと音声での対話が可能となる。

 同APIの音声合成には、NTTメディアインテリジェンス研究所の協力のもとで開発した、ジミー大西さんの音声から作成したオリジナル音声合成モデルを使用。再現性の高い音声合成モデルを作成するためには本人の特徴をとらえた音声収録が重要となるが、ジミー大西さんの音声の特徴を分析し、分析に基づいてジミー大西さんらしい収録原稿を作成することで、より再現性の高い音声合成を実現している。