オトバンク、AI音声合成サービス開始 PKSHAの自然な発音を再現するアクセント推定技術を実用化

  • このエントリーをはてなブックマークに追加
2021/07/23 05:00

 音声配信サービス「audiobook.jp」を運営するオトバンクは、PKSHA Technology(以下、PKSHA)の音声関連技術をもとに、急激な需要拡大が見込まれるコンテンツの音声化に対応すべく、独自のAI音声合成サービス「カタリテ」を開発したことを発表した。同サービスでは、PKSHAが開発した自然な発音を再現するアクセント推定技術「tdmelodic」を実用化。また、『日経電子版』と連携して、活字コンテンツの音声化に関する実証実験を行う。

AI音声合成サービス「カタリテ」について

 同サービスは、PKSHAの開発する最先端の音声合成技術に、オトバンクの保有するオーディオブック音声データベースを学習させることで実現したAI音声合成サービス。音声合成技術を活用して、収録から編集に必要な制作時間を短縮し、即時性の高いコンテンツも適時に音声化し提供できる環境の実現を目指す。同サービスの特徴は、次のとおり。

  • 独自の音声関連技術に強みを持つPKSHAが開発した音声合成プラットフォーム「PKSHA Phonetics(フォネティクス)」を採用。さらにオトバンクのオーディオブックディレクターがチューニングを実施することで、より自然で聴き心地のいい音声を実現している。
  • 「PKSHA Phonetics」独自のアクセント推定技術「tdmelodic」などにより、一般的な音声合成ソフトウェアでは難しいアクセントの制御が可能。
  • オトバンクが制作したオーディオブックをデータベースとし、抑揚や音色も人が聞き取りやすく長時間聞いても疲れにくいようにチューニングを行っている。
  • 語り手(朗読者)には、アニメーション作品や報道番組のナレーションなど幅広い作品で活躍する人気声優の浅野真澄さんを起用。落ち着いた安定感のある声で音声化される。

『日本経済新聞社』との実証実験について

 オトバンクは、『日経電子版』と連携して同サービスの実証実験を開始。『日経電子版』の速報コーナーで配信された記事の一部を抽出し、その見出しから生成した音声コンテンツを、オトバンクが運営する「audiobook.jp」の聴き放題プランにて配信する。

『AIナレータが読む、日経電子版 きょうの速報ニュース』

  • 配信内容:AIナレーターのカタリテによる実証実験として、日経電子版で配信された速報ニュースの見出しを読み上げる。
  • 配信日:毎週月曜~金曜日の平日18時に更新。
  • 配信場所:「audiobook.jp」聴き放題プランでの配信から開始。

 なお、今後も「聴くも選べる時代へ」をコンセプトに、実証実験の状況に応じて、連携媒体を増やしていく予定だという。